PaddleClas/docs/zh_CN/models/ImageNet1k/Twins.md

2.4 KiB
Raw Blame History

Twins


目录

1. 概述

Twins 网络包括 Twins-PCPVT 和 Twins-SVT其重点对空间注意力机制进行了精心设计得到了简单却更为有效的方案。由于该体系结构仅涉及矩阵乘法而目前的深度学习框架中对矩阵乘法有较高的优化程度因此该体系结构十分高效且易于实现。并且该体系结构在图像分类、目标检测和语义分割等多种下游视觉任务中都能够取得优异的性能。论文地址

2. 精度、FLOPs 和参数量

Models Top1 Top5 Reference
top1
Reference
top5
FLOPs
(G)
Params
(M)
pcpvt_small 0.8115 0.9567 0.812 - 3.7 24.1
pcpvt_base 0.8268 0.9627 0.827 - 6.4 43.8
pcpvt_large 0.8306 0.9659 0.831 - 9.5 60.9
alt_gvt_small 0.8177 0.9557 0.817 - 2.8 24
alt_gvt_base 0.8315 0.9629 0.832 - 8.3 56
alt_gvt_large 0.8364 0.9651 0.837 - 14.8 99.2

3. 基于 V100 GPU 的预测速度

Models Crop Size Resize Short Size FP32
Batch Size=1
(ms)
FP32
Batch Size=4
(ms)
FP32
Batch Size=8
(ms)
pcpvt_small 224 256 7.32 10.51 15.27
pcpvt_base 224 256 12.20 16.22 23.16
pcpvt_large 224 256 16.47 22.90 32.73
alt_gvt_small 224 256 6.94 9.01 12.27
alt_gvt_base 224 256 9.37 15.02 24.54
alt_gvt_large 224 256 11.76 22.08 35.12