mmpretrain/docs/zh_CN/useful_tools/verify_dataset.md

29 lines
1.0 KiB
Markdown
Raw Normal View History

# 数据集验证
在 MMPretrain 中,`tools/misc/verify_dataset.py` 脚本会检查数据集的所有图片,查看是否有**已经损坏**的图片。
## 工具介绍
```shell
python tools/print_config.py \
${CONFIG} \
[--out-path ${OUT-PATH}] \
[--phase ${PHASE}] \
[--num-process ${NUM-PROCESS}]
[--cfg-options ${CFG_OPTIONS}]
```
**所有参数说明**:
- `config` : 配置文件的路径。
- `--out-path` : 输出结果路径,默认为 brokenfiles.log
- `--phase` : 检查哪个阶段的数据集,可用值为 “train” 、”test” 或者 “val” 默认为 “train”。
- `--num-process` : 指定的进程数默认为1。
- `--cfg-options`: 额外的配置选项,会被合入配置文件,参考[教程 1如何编写配置文件](https://mmclassification.readthedocs.io/zh_CN/latest/tutorials/config.html)。
## 示例:
```shell
python tools/misc/verify_dataset.py configs/t2t_vit/t2t-vit-t-14_8xb64_in1k.py --out-path broken_imgs.log --phase val --num-process 8
```