1. 启动训练(后台运行)

先进入脚本所在目录,然后使用 nohup 启动。注意加上 -u 参数,否则日志会有严重延迟(写不进文件)。

1
2
3
4
5
6
# 进入目录
cd /root/autodl-fs/

# 启动命令 (解释:python -u 禁用缓存,> 输出到日志,2>&1 包含报错,& 后台运行)
nohup python -u ultralytics-yolo11-main/train_queue.py > train.log 2>&1 &
nohup python -u ultralytics-main/train_queue.py > train.log 2>&1 &

看见 [1] xxxxx 提示即表示启动成功。

2. 查看日志(实时监控)

训练在后台跑,你想看进度时:

1
tail -f train.log

退出查看:按 Ctrl + C(放心,这只会退出日志查看,不会停止训练)。

3. 管理进程(查杀)

检查还在不在跑:

1
2
3
4
5
# 方法A:看显卡有没有在转
nvidia-smi

# 方法B:搜进程号
ps -ef | grep train_queue.py

停止训练(杀进程):

1
2
# 假设上面查到的进程号是 12345
kill -9 12345

终止所有 Python 进程:

1
pkill -9 python

4. 学术资源加速

1
source /etc/network_turbo