mirror of
https://github.com/open-mmlab/mmselfsup.git
synced 2025-06-03 14:59:38 +08:00
* [Fix]: Set qkv bias to False for cae and True for mae (#303) * [Fix]: Add mmcls transformer layer choice * [Fix]: Fix transformer encoder layer bug * [Fix]: Change UT of cae * [Feature]: Change the file name of cosine annealing hook (#304) * [Feature]: Change cosine annealing hook file name * [Feature]: Add UT for cosine annealing hook * [Fix]: Fix lint * read tutorials and fix typo (#308) * [Fix] fix config errors in MAE (#307) * update readthedocs algorithm readme (#310) * [Docs] Replace markdownlint with mdformat (#311) * Replace markdownlint with mdformat to avoid installing ruby * fix typo * add 'ba' to codespell ignore-words-list * Configure Myst-parser to parse anchor tag (#309) * [Docs] rewrite install.md (#317) * rewrite the install.md * add faq.md * fix lint * add FAQ to README * add Chinese version * fix typo * fix format * remove modification * fix format * [Docs] refine README.md file (#318) * refine README.md file * fix lint * format language button * rename getting_started.md * revise index.rst * add model_zoo.md to index.rst * fix lint * refine readme Co-authored-by: Jiahao Xie <52497952+Jiahao000@users.noreply.github.com> * [Enhance] update byol models and results (#319) * Update version information (#321) Co-authored-by: Yuan Liu <30762564+YuanLiuuuuuu@users.noreply.github.com> Co-authored-by: Yi Lu <21515006@zju.edu.cn> Co-authored-by: RenQin <45731309+soonera@users.noreply.github.com> Co-authored-by: Jiahao Xie <52497952+Jiahao000@users.noreply.github.com>
3.5 KiB
3.5 KiB
准备数据集
MMSelfSup 支持多个数据集。请遵循相应的数据准备指南。建议将您的数据集根目录软链接到 $MMSELFSUP/data
。如果您的文件夹结构不同,您可能需要更改配置文件中的相应路径。
mmselfsup
├── mmselfsup
├── tools
├── configs
├── docs
├── data
│ ├── imagenet
│ │ ├── meta
│ │ ├── train
│ │ ├── val
│ ├── places205
│ │ ├── meta
│ │ ├── train
│ │ ├── val
│ ├── inaturalist2018
│ │ ├── meta
│ │ ├── train
│ │ ├── val
│ ├── VOCdevkit
│ │ ├── VOC2007
│ ├── cifar
│ │ ├── cifar-10-batches-py
准备 ImageNet 数据集
对于 ImageNet,它有多个版本,但最常用的是 ILSVRC 2012。可以通过以下步骤得到:
- 注册账号并登录 下载页面
- 找到 ILSVRC2012 的下载链接,下载以下两个文件
- ILSVRC2012_img_train.tar (~138GB)
- ILSVRC2012_img_val.tar (~6.3GB)
- 解压下载的文件
- 使用这个 脚本 下载元数据
准备 Places205 数据集
对于 Places205,您需要:
- 注册账号并登录 下载页面
- 下载 Places205 经过缩放的图片以及训练集和验证集的图片列表
- 解压下载的文件
准备 iNaturalist2018 数据集
对于 iNaturalist2018,您需要:
- 从 下载页面 下载训练集和验证集图像及标注
- 解压下载的文件
- 使用脚本
tools/data_converters/convert_inaturalist.py
将原来的 json 标注格式转换为列表格式
准备 PASCAL VOC 数据集
假设您通常将数据集存储在 $YOUR_DATA_ROOT
中。下面的命令会自动将 PASCAL VOC 2007 下载到 $YOUR_DATA_ROOT
中,准备好所需的文件,在 $MMSELFSUP
下创建一个文件夹 data
,并制作一个软链接 VOCdevkit
。
bash tools/data_converters/prepare_voc07_cls.sh $YOUR_DATA_ROOT
准备 CIFAR10 数据集
如果没有找到 CIFAR10 系统将会自动下载。此外,由 MMSelfSup
实现的 dataset
也会自动将 CIFAR10 转换为适当的格式。
准备检测和分割数据集
检测
您可以参考 mmdet 来准备 COCO,VOC2007 和 VOC2012 检测数据集。
分割
您可以参考 mmseg 来准备 VOC2012AUG 和 Cityscapes 分割数据集。