PaddleClas/docs/zh_CN/models/EfficientNet_and_ResNeXt101...

5.6 KiB
Raw Blame History

EfficientNet与ResNeXt101_wsl系列

概述

EfficientNet是Google于2019年发布的一个基于NAS的轻量级网络其中EfficientNetB7刷新了当时ImageNet-1k的分类准确率。在该文章中作者指出传统的提升神经网络性能的方法主要是从网络的宽度、网络的深度、以及输入图片的分辨率入手但是作者通过实验发现平衡这三个维度对精度和效率的提升至关重要于是作者通过一系列的实验中总结出了如何同时平衡这三个维度的放缩与此同时基于这种放缩方法作者在EfficientNet_B0的基础上构建了EfficientNet系列中B1-B7共7个网络并在同样FLOPS与参数量的情况下精度达到了state-of-the-art的效果。

ResNeXt是facebook于2016年提出的一种对ResNet的改进版网络。在2019年facebook通过弱监督学习研究了该系列网络在ImageNet上的精度上限为了区别之前的ResNeXt网络该系列网络的后缀为wsl其中wsl是弱监督学习weakly-supervised-learning的简称。为了能有更强的特征提取能力研究者将其网络宽度进一步放大其中最大的ResNeXt101_32x48d_wsl拥有8亿个参数将其在9.4亿的弱标签图片下训练并在ImageNet-1k上做finetune最终在ImageNet-1k的top-1达到了85.4%这也是迄今为止在ImageNet-1k的数据集上以224x224的分辨率下精度最高的网络。Fix-ResNeXt中作者使用了更大的图像分辨率针对训练图片和验证图片数据预处理不一致的情况下做了专门的Fix策略并使得ResNeXt101_32x48d_wsl拥有了更高的精度由于其用到了Fix策略故命名为Fix-ResNeXt101_32x48d_wsl。

该系列模型的FLOPS、参数量以及FP32预测耗时如下图所示。

目前PaddleClas开源的这两类模型的预训练模型一共有14个。从上图中可以看出EfficientNet系列网络优势非常明显ResNeXt101_wsl系列模型由于用到了更多的数据最终的精度也更高。EfficientNet_B0_Small是去掉了SE_block的EfficientNet_B0其具有更快的推理速度。

精度、FLOPS和参数量

Models Top1 Top5 Reference
top1
Reference
top5
FLOPS
(G)
Parameters
(M)
ResNeXt101_
32x8d_wsl
0.826 0.967 0.822 0.964 29.140 78.440
ResNeXt101_
32x16d_wsl
0.842 0.973 0.842 0.972 57.550 152.660
ResNeXt101_
32x32d_wsl
0.850 0.976 0.851 0.975 115.170 303.110
ResNeXt101_
32x48d_wsl
0.854 0.977 0.854 0.976 173.580 456.200
Fix_ResNeXt101_
32x48d_wsl
0.863 0.980 0.864 0.980 354.230 456.200
EfficientNetB0 0.774 0.933 0.773 0.935 0.720 5.100
EfficientNetB1 0.792 0.944 0.792 0.945 1.270 7.520
EfficientNetB2 0.799 0.947 0.803 0.950 1.850 8.810
EfficientNetB3 0.812 0.954 0.817 0.956 3.430 11.840
EfficientNetB4 0.829 0.962 0.830 0.963 8.290 18.760
EfficientNetB5 0.836 0.967 0.837 0.967 19.510 29.610
EfficientNetB6 0.840 0.969 0.842 0.968 36.270 42.000
EfficientNetB7 0.843 0.969 0.844 0.971 72.350 64.920
EfficientNetB0_
small
0.758 0.926 0.720 4.650

FP32预测速度

Models Crop Size Resize Short Size Batch Size=1
(ms)
ResNeXt101_
32x8d_wsl
224 256 19.127
ResNeXt101_
32x16d_wsl
224 256 23.629
ResNeXt101_
32x32d_wsl
224 256 40.214
ResNeXt101_
32x48d_wsl
224 256 59.714
Fix_ResNeXt101_
32x48d_wsl
320 320 82.431
EfficientNetB0 224 256 2.449
EfficientNetB1 240 272 3.547
EfficientNetB2 260 292 3.908
EfficientNetB3 300 332 5.145
EfficientNetB4 380 412 7.609
EfficientNetB5 456 488 12.078
EfficientNetB6 528 560 18.381
EfficientNetB7 600 632 27.817
EfficientNetB0_
small
224 256 1.692