mirror of
https://github.com/PaddlePaddle/PaddleClas.git
synced 2025-06-03 21:55:06 +08:00
update PP-LCNet.md
This commit is contained in:
parent
237c1bc3bf
commit
59e5f7c606
@ -72,7 +72,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
|
||||
|
||||
|
||||
| SE Location | Top-1 Acc(\%) | Latency(ms) |
|
||||
|-------------------|---------------|-------------|
|
||||
|:--:|:--:|:--:|
|
||||
| 1100000000000 | 61.73 | 2.06 |
|
||||
| 0000001100000 | 62.17 | 2.03 |
|
||||
| <b>0000000000011<b> | <b>63.14<b> | <b>2.05<b> |
|
||||
@ -88,7 +88,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
|
||||
在 MixNet 的论文中,作者分析了卷积核大小对模型性能的影响,结论是在一定范围内大的卷积核可以提升模型的性能,但是超过这个范围会有损模型的性能,所以作者组合了一种 split-concat 范式的 MixConv,这种组合虽然可以提升模型的性能,但是不利于推理。我们通过实验总结了一些更大的卷积核在不同位置的作用,类似 SE 模块的位置,更大的卷积核在网络的中后部作用更明显,下表展示了 5x5 卷积核的位置对精度的影响:
|
||||
|
||||
| large-kernel Location | Top-1 Acc(\%) | Latency(ms) |
|
||||
|-------------------|---------------|-------------|
|
||||
|:--:|:--:|:--:|
|
||||
| 1111111111111 | 63.22 | 2.08 |
|
||||
| 1111111000000 | 62.70 | 2.07 |
|
||||
| <b>0000001111111<b> | <b>63.14<b> | <b>2.05<b> |
|
||||
@ -104,7 +104,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
|
||||
BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步说明了每个方案对结果的影响:
|
||||
|
||||
| Activation | SE-block | Large-kernel | last-1x1-conv | Top-1 Acc(\%) | Latency(ms) |
|
||||
|------------|----------|--------------|---------------|---------------|-------------|
|
||||
|:--:|:--:|:--:|:--:|:--:|:--:|
|
||||
| 0 | 1 | 1 | 1 | 61.93 | 1.94 |
|
||||
| 1 | 0 | 1 | 1 | 62.51 | 1.87 |
|
||||
| 1 | 1 | 0 | 1 | 62.44 | 2.01 |
|
||||
@ -122,7 +122,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
|
||||
图像分类我们选用了 ImageNet 数据集,相比目前主流的轻量级网络,PP-LCNet 在相同精度下可以获得更快的推理速度。当使用百度自研的 SSLD 蒸馏策略后,精度进一步提升,在 Intel cpu 端约 5ms 的推理速度下 ImageNet 的 Top-1 Acc 超过了 80%。
|
||||
|
||||
| Model | Params(M) | FLOPs(M) | Top-1 Acc(\%) | Top-5 Acc(\%) | Latency(ms) | 预训练模型下载地址 | inference模型下载地址 |
|
||||
|-------|-----------|----------|---------------|---------------|-------------|---------------|-------------|
|
||||
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
|
||||
| PPLCNet_x0_25 | 1.5 | 18 | 51.86 | 75.65 | 1.74 | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_25_pretrained.pdparams) | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_25_infer.tar) |
|
||||
| PPLCNet_x0_35 | 1.6 | 29 | 58.09 | 80.83 | 1.92 | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_35_pretrained.pdparams) | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_35_infer.tar) |
|
||||
| PPLCNet_x0_5 | 1.9 | 47 | 63.14 | 84.66 | 2.05 | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_5_pretrained.pdparams) | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_5_infer.tar) |
|
||||
@ -140,7 +140,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
|
||||
与其他轻量级网络的性能对比:
|
||||
|
||||
| Model | Params(M) | FLOPs(M) | Top-1 Acc(\%) | Top-5 Acc(\%) | Latency(ms) |
|
||||
|-------|-----------|----------|---------------|---------------|-------------|
|
||||
|:--:|:--:|:--:|:--:|:--:|:--:|
|
||||
| MobileNetV2_x0_25 | 1.5 | 34 | 53.21 | 76.52 | 2.47 |
|
||||
| MobileNetV3_small_x0_35 | 1.7 | 15 | 53.03 | 76.37 | 3.02 |
|
||||
| ShuffleNetV2_x0_33 | 0.6 | 24 | 53.73 | 77.05 | 4.30 |
|
||||
@ -161,7 +161,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
|
||||
目标检测的方法我们选用了百度自研的 PicoDet,该方法主打轻量级目标检测场景,下表展示了在 COCO 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的结果的比较,无论在精度还是速度上,PP-LCNet 的优势都非常明显。
|
||||
|
||||
| Backbone | mAP(%) | Latency(ms) |
|
||||
|-------|-----------|----------|
|
||||
|:--:|:--:|:--:|
|
||||
MobileNetV3_large_x0_35 | 19.2 | 8.1 |
|
||||
<b>PPLCNet_x0_5<b> | <b>20.3<b> | <b>6.0<b> |
|
||||
MobileNetV3_large_x0_75 | 25.8 | 11.1 |
|
||||
@ -174,7 +174,7 @@ MobileNetV3_large_x0_75 | 25.8 | 11.1 |
|
||||
语义分割的方法我们选用了 DeeplabV3+,下表展示了在 Cityscapes 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的比较,在精度和速度方面,PP-LCNet 的优势同样明显。
|
||||
|
||||
| Backbone | mIoU(%) | Latency(ms) |
|
||||
|-------|-----------|----------|
|
||||
|:--:|:--:|:--:|
|
||||
MobileNetV3_large_x0_5 | 55.42 | 135 |
|
||||
<b>PPLCNet_x0_5<b> | <b>58.36<b> | <b>82<b> |
|
||||
MobileNetV3_large_x0_75 | 64.53 | 151 |
|
||||
@ -189,7 +189,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
|
||||
#### 1.4.1 基于Intel Xeon Gold 6148 的预测速度
|
||||
|
||||
| Model | Intel Xeon Gold 6148 time(ms)<br/>bs=1, thread=10 |
|
||||
|-------|-------------|
|
||||
|:--:|:--:|
|
||||
| PPLCNet_x0_25 | 1.74 |
|
||||
| PPLCNet_x0_35 | 1.92 |
|
||||
| PPLCNet_x0_5 | 2.05 |
|
||||
@ -206,7 +206,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
|
||||
#### 1.4.2 基于 V100 GPU 的预测速度
|
||||
|
||||
| Models | FP32<br>Batch Size=1<br>(ms) | FP32<br/>Batch Size=1\4<br/>(ms) | FP32<br/>Batch Size=8<br/>(ms) |
|
||||
| ------------- | ---------------------------- | -------------------------------- | ------------------------------ |
|
||||
| :--: | :--:| :--: | :--: |
|
||||
| PPLCNet_x0_25 | 0.72 | 1.17 | 1.71 |
|
||||
| PPLCNet_x0_35 | 0.69 | 1.21 | 1.82 |
|
||||
| PPLCNet_x0_5 | 0.70 | 1.32 | 1.94 |
|
||||
@ -222,7 +222,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
|
||||
#### 1.4.3 基于 SD855 的预测速度
|
||||
|
||||
| Models | SD855 time(ms)<br>bs=1, thread=1 | SD855 time(ms)<br/>bs=1, thread=2 | SD855 time(ms)<br/>bs=1, thread=4 |
|
||||
| ------------- | -------------------------------- | --------------------------------- | --------------------------------- |
|
||||
| :--: | :--: | :--: | :--: |
|
||||
| PPLCNet_x0_25 | 2.30 | 1.62 | 1.32 |
|
||||
| PPLCNet_x0_35 | 3.15 | 2.11 | 1.64 |
|
||||
| PPLCNet_x0_5 | 4.27 | 2.73 | 1.92 |
|
||||
|
Loading…
x
Reference in New Issue
Block a user