PaddleClas/docs/zh_CN/models/EfficientNet_and_ResNeXt101...

57 lines
5.6 KiB
Markdown
Raw Normal View History

2020-04-10 00:45:02 +08:00
# EfficientNet与ResNeXt101_wsl系列
## 概述
2020-04-14 22:00:44 +08:00
EfficientNet是Google于2019年发布的一个基于NAS的轻量级网络其中EfficientNetB7刷新了当时ImageNet-1k的分类准确率。在该文章中作者指出传统的提升神经网络性能的方法主要是从网络的宽度、网络的深度、以及输入图片的分辨率入手但是作者通过实验发现平衡这三个维度对精度和效率的提升至关重要于是作者通过一系列的实验中总结出了如何同时平衡这三个维度的放缩与此同时基于这种放缩方法作者在EfficientNet_B0的基础上构建了EfficientNet系列中B1-B7共7个网络并在同样FLOPS与参数量的情况下精度达到了state-of-the-art的效果。
2020-04-14 21:36:02 +08:00
2020-04-14 22:00:44 +08:00
ResNeXt是facebook于2016年提出的一种对ResNet的改进版网络。在2019年facebook通过弱监督学习研究了该系列网络在ImageNet上的精度上限为了区别之前的ResNeXt网络该系列网络的后缀为wsl其中wsl是弱监督学习weakly-supervised-learning的简称。为了能有更强的特征提取能力研究者将其网络宽度进一步放大其中最大的ResNeXt101_32x48d_wsl拥有8亿个参数将其在9.4亿的弱标签图片下训练并在ImageNet-1k上做finetune最终在ImageNet-1k的top-1达到了85.4%这也是迄今为止在ImageNet-1k的数据集上以224x224的分辨率下精度最高的网络。Fix-ResNeXt中作者使用了更大的图像分辨率针对训练图片和验证图片数据预处理不一致的情况下做了专门的Fix策略并使得ResNeXt101_32x48d_wsl拥有了更高的精度由于其用到了Fix策略故命名为Fix-ResNeXt101_32x48d_wsl。
2020-04-14 21:36:02 +08:00
2020-04-13 23:49:37 +08:00
2020-04-14 00:28:15 +08:00
该系列模型的FLOPS、参数量以及FP32预测耗时如下图所示。
2020-04-13 23:49:37 +08:00
![](../../images/models/EfficientNet.png.flops.png)
![](../../images/models/EfficientNet.png.params.png)
![](../../images/models/EfficientNet.png.fp32.png)
2020-04-10 00:45:02 +08:00
2020-04-14 22:00:44 +08:00
目前PaddleClas开源的这两类模型的预训练模型一共有14个。从上图中可以看出EfficientNet系列网络优势非常明显ResNeXt101_wsl系列模型由于用到了更多的数据最终的精度也更高。EfficientNet_B0_Small是去掉了SE_block的EfficientNet_B0其具有更快的推理速度。
2020-04-10 00:45:02 +08:00
## 精度、FLOPS和参数量
| Models | Top1 | Top5 | Reference<br>top1 | Reference<br>top5 | FLOPS<br>(G) | Parameters<br>(M) |
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
| ResNeXt101_<br>32x8d_wsl | 0.826 | 0.967 | 0.822 | 0.964 | 29.140 | 78.440 |
| ResNeXt101_<br>32x16d_wsl | 0.842 | 0.973 | 0.842 | 0.972 | 57.550 | 152.660 |
| ResNeXt101_<br>32x32d_wsl | 0.850 | 0.976 | 0.851 | 0.975 | 115.170 | 303.110 |
| ResNeXt101_<br>32x48d_wsl | 0.854 | 0.977 | 0.854 | 0.976 | 173.580 | 456.200 |
| Fix_ResNeXt101_<br>32x48d_wsl | 0.863 | 0.980 | 0.864 | 0.980 | 354.230 | 456.200 |
| EfficientNetB0 | 0.774 | 0.933 | 0.773 | 0.935 | 0.720 | 5.100 |
| EfficientNetB1 | 0.792 | 0.944 | 0.792 | 0.945 | 1.270 | 7.520 |
| EfficientNetB2 | 0.799 | 0.947 | 0.803 | 0.950 | 1.850 | 8.810 |
| EfficientNetB3 | 0.812 | 0.954 | 0.817 | 0.956 | 3.430 | 11.840 |
| EfficientNetB4 | 0.829 | 0.962 | 0.830 | 0.963 | 8.290 | 18.760 |
| EfficientNetB5 | 0.836 | 0.967 | 0.837 | 0.967 | 19.510 | 29.610 |
| EfficientNetB6 | 0.840 | 0.969 | 0.842 | 0.968 | 36.270 | 42.000 |
| EfficientNetB7 | 0.843 | 0.969 | 0.844 | 0.971 | 72.350 | 64.920 |
| EfficientNetB0_<br>small | 0.758 | 0.926 | | | 0.720 | 4.650 |
## FP32预测速度
2020-04-13 22:43:27 +08:00
| Models | Crop Size | Resize Short Size | Batch Size=1<br>(ms) |
|-------------------------------|-----------|-------------------|--------------------------|
| ResNeXt101_<br>32x8d_wsl | 224 | 256 | 19.127 |
| ResNeXt101_<br>32x16d_wsl | 224 | 256 | 23.629 |
| ResNeXt101_<br>32x32d_wsl | 224 | 256 | 40.214 |
| ResNeXt101_<br>32x48d_wsl | 224 | 256 | 59.714 |
| Fix_ResNeXt101_<br>32x48d_wsl | 320 | 320 | 82.431 |
| EfficientNetB0 | 224 | 256 | 2.449 |
| EfficientNetB1 | 240 | 272 | 3.547 |
| EfficientNetB2 | 260 | 292 | 3.908 |
| EfficientNetB3 | 300 | 332 | 5.145 |
| EfficientNetB4 | 380 | 412 | 7.609 |
| EfficientNetB5 | 456 | 488 | 12.078 |
| EfficientNetB6 | 528 | 560 | 18.381 |
| EfficientNetB7 | 600 | 632 | 27.817 |
| EfficientNetB0_<br>small | 224 | 256 | 1.692 |