add commonly_used_dataset.md

This commit is contained in:
stephon 2021-10-23 06:50:29 +00:00 committed by Tingquan Gao
parent b17e346dc3
commit 94d9465d3b

View File

@ -0,0 +1,55 @@
# 常用数据集介绍
这里整理了常用的图像分类和图像识别数据集,持续更新中,欢迎各位小伙伴补充完善~
* [图像分类数据集]("图像分类")
* [图像识别数据集]("图像识别")
<a name="图像分类"></a>
## 1. 图像分类:
- ImageNet-1kImageNet项目是一个大型视觉数据库用于视觉目标识别研究任务该项目已手动标注了1400多万张图像。ImageNet-1k是ImageNet数据集的子集其包含1000个类别。训练集包含1281167个图像数据验证集包含50000个图像数据。2010年以来ImageNet项目每年举办一次图像分类竞赛即ImageNet大规模视觉识别挑战赛ILSVRC。挑战赛使用的数据集即为ImageNet-1k。到目前为止ImageNet-1k已经成为计算机视觉领域发展的最重要的数据集之一其促进了整个计算机视觉的发展很多计算机视觉下游任务的初始化模型都是基于该数据集训练得到的。
地址: https://image-net.org/
- CIFAR10 / CIFAR100CIFAR-10数据集由10个类的60000个彩色图像组成图像分辨率为32x32每个类有6000个图像其中训练集5000张验证集1000张10个不同的类代表飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、轮船和卡车。CIFAR-100数据集是CIFAR-10的扩展由100个类的60000个彩色图像组成图像分辨率为32x32每个类有600个图像其中训练集500张验证集100张。
地址: http://www.cs.toronto.edu/~kriz/cifar.html
- MNISTMMNIST是一个非常有名的手写体数字识别数据集在很多资料中这个数据集都会被用作深度学习的入门样例。其包含60000张图片数据50000张作为训练集10000张作为验证集每张图片的大小为28 * 28
地址:http://yann.lecun.com/exdb/mnist/
- NUS-WIDE 这是一个多分类数据集。该数据集包含269648张图片, 81个类别 每张图片被标记为该81个类别中的某一类或某几类
地址https://lms.comp.nus.edu.sg/wp-content/uploads/2019/research/nuswide/NUS-WIDE.html
<a name="图像识别"></a>
## 2. 图像识别:
### 2.1 通用图像识别数据集
- SOP
- Cars196
- CUB_200_2011
- Clothes
### 2.2 垂类图像识别数据集
#### 2.2.1 动漫人物识别
+ CartoonFace
+ Manga109
+ IIT-CFW
#### 2.2.4 商品识别
+ AliProduct
+ Product-10k
+ DeepFashion-Inshop
#### 2.2.2 车辆识别
+ CompCars
+ BoxCars
+ PKU-VD
#### 2.2.3 Logo识别
+ Logo2K+
+ Tsinghua-Tencent 100K
+ LogoDet-3K