1.0 KiB
1.0 KiB
数据集验证
在 MMPretrain 中,tools/misc/verify_dataset.py
脚本会检查数据集的所有图片,查看是否有已经损坏的图片。
工具介绍
python tools/print_config.py \
${CONFIG} \
[--out-path ${OUT-PATH}] \
[--phase ${PHASE}] \
[--num-process ${NUM-PROCESS}]
[--cfg-options ${CFG_OPTIONS}]
所有参数说明:
config
: 配置文件的路径。--out-path
: 输出结果路径,默认为 ‘brokenfiles.log’。--phase
: 检查哪个阶段的数据集,可用值为 “train” 、”test” 或者 “val”, 默认为 “train”。--num-process
: 指定的进程数,默认为 1。--cfg-options
: 额外的配置选项,会被合入配置文件,参考教程 1:如何编写配置文件。
示例:
python tools/misc/verify_dataset.py configs/t2t_vit/t2t-vit-t-14_8xb64_in1k.py --out-path broken_imgs.log --phase val --num-process 8