PaddleClas/docs/zh_CN/models/DLA.md

1.8 KiB
Raw Blame History

DLA系列

概述

DLA (Deep Layer Aggregation)。 视觉识别需要丰富的表示形式其范围从低到高范围从小到大分辨率从精细到粗糙。即使卷积网络中的要素深度很深仅靠隔离层还是不够的将这些表示法进行复合和聚合可改善对内容和位置的推断。尽管已合并了残差连接以组合各层但是这些连接本身是“浅”的并且只能通过简单的一步操作来融合。作者通过更深层的聚合来增强标准体系结构以更好地融合各层的信息。Deep Layer Aggregation 结构迭代地和分层地合并了特征层次结构以使网络具有更高的准确性和更少的参数。跨体系结构和任务的实验表明与现有的分支和合并方案相比Deep Layer Aggregation 可提高识别和分辨率。论文地址

精度、FLOPS和参数量

Model Params (M) FLOPs (G) Top-1 (%) Top-5 (%)
DLA34 15.8 3.1 76.03 92.98
DLA46_c 1.3 0.5 63.21 85.30
DLA46x_c 1.1 0.5 64.36 86.01
DLA60 22.0 4.2 76.10 92.92
DLA60x 17.4 3.5 77.53 93.78
DLA60x_c 1.3 0.6 66.45 87.54
DLA102 33.3 7.2 78.93 94.52
DLA102x 26.4 5.9 78.10 94.00
DLA102x2 41.4 9.3 78.85 94.45
DLA169 53.5 11.6 78.09 94.09