rename train_fleet config files ()

* rename train_fleet config file

* polish test_train_fleet_inference_python.md doc
pull/2017/head
HydrogenSulfate 2022-06-10 17:08:58 +08:00 committed by GitHub
parent a00291fec2
commit f4a1469397
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
5 changed files with 3 additions and 3 deletions

View File

@ -34,7 +34,7 @@ Linux GPU/CPU 多机多卡训练推理测试的主程序为`test_train_inference
#### 2.1.1 修改配置文件
首先,修改配置文件`test_tipc/config/PPLCNet/PPLCNet_x1_0_train_fleet_infer_python.txt`中的`gpu_list`设置:假设两台机器的`ip`地址分别为`192.168.0.1`和`192.168.0.2`,则对应的配置文件`gpu_list`字段需要修改为`gpu_list:192.168.0.1,192.168.0.2;0,1`。
首先,修改配置文件`test_tipc/config/PPLCNet/PPLCNet_x1_0_train_linux_gpu_fleet_normal_infer_python_linux_gpu_cpu.txt`中的`gpu_list`设置:假设两台机器的`ip`地址分别为`192.168.0.1`和`192.168.0.2`,则对应的配置文件`gpu_list`字段需要修改为`gpu_list:192.168.0.1,192.168.0.2;0,1`。
**`ip`地址查看命令为`ifconfig`,在`inet addr:`字段后的即为ip地址**。
@ -44,7 +44,7 @@ Linux GPU/CPU 多机多卡训练推理测试的主程序为`test_train_inference
运行`prepare.sh`准备数据和模型,数据准备命令如下所示。
```shell
bash test_tipc/prepare.sh test_tipc/config/PPLCNet/PPLCNet_x1_0_train_fleet_infer_python.txt lite_train_lite_infer
bash test_tipc/prepare.sh test_tipc/config/PPLCNet/PPLCNet_x1_0_train_linux_gpu_fleet_normal_infer_python_linux_gpu_cpu.txt lite_train_lite_infer
```
**注意:** 由于是多机训练,这里需要在所有节点上都运行一次启动上述命令来准备数据。
@ -60,7 +60,7 @@ export FLAGS_START_PORT=17000
接下来就可以开始执行测试,命令如下所示。
```shell
bash test_tipc/test_train_inference_python.sh test_tipc/config/PPLCNet/PPLCNet_x1_0_train_fleet_infer_python.txt
bash test_tipc/test_train_inference_python.sh test_tipc/config/PPLCNet/PPLCNet_x1_0_train_linux_gpu_fleet_normal_infer_python_linux_gpu_cpu.txt
```
**注意:** 由于是多机训练,这里需要在所有的节点上均运行启动上述命令进行测试。