2021-11-26 19:28:16 +08:00
|
|
|
|
# HarDNet 系列
|
2021-11-25 15:40:40 +08:00
|
|
|
|
---
|
|
|
|
|
## 目录
|
2021-06-10 23:54:00 +08:00
|
|
|
|
|
2021-11-25 15:40:40 +08:00
|
|
|
|
* [1. 概述](#1)
|
|
|
|
|
* [2. 精度、FLOPS 和参数量](#2)
|
2021-12-13 20:42:03 +08:00
|
|
|
|
* [3. 基于 V100 GPU 的预测速度](#3)
|
2021-06-10 23:54:00 +08:00
|
|
|
|
|
2021-11-25 15:40:40 +08:00
|
|
|
|
<a name='1'></a>
|
|
|
|
|
## 1. 概述
|
2021-06-10 23:54:00 +08:00
|
|
|
|
|
2021-11-25 15:40:40 +08:00
|
|
|
|
HarDNet(Harmonic DenseNet)是 2019 年由国立清华大学提出的一种全新的神经网络,在低 MAC 和内存流量的条件下实现了高效率。与 FC-DenseNet-103,DenseNet-264,ResNet-50,ResNet-152 和 SSD-VGG 相比,新网络的推理时间减少了 35%,36%,30%,32% 和 45%。我们使用了包括 Nvidia Profiler 和 ARM Scale-Sim 在内的工具来测量内存流量,并验证推理延迟确实与内存流量消耗成正比,并且所提议的网络消耗的内存流量很低。[论文地址](https://arxiv.org/abs/1909.00948)。
|
|
|
|
|
|
|
|
|
|
<a name='2'></a>
|
|
|
|
|
|
|
|
|
|
## 2. 精度、FLOPS 和参数量
|
2021-06-10 23:54:00 +08:00
|
|
|
|
|
|
|
|
|
| Model | Params (M) | FLOPs (G) | Top-1 (%) | Top-5 (%) |
|
|
|
|
|
|:---------------------:|:----------:|:---------:|:---------:|:---------:|
|
|
|
|
|
| HarDNet68 | 17.6 | 4.3 | 75.46 | 92.65 |
|
|
|
|
|
| HarDNet85 | 36.7 | 9.1 | 77.44 | 93.55 |
|
|
|
|
|
| HarDNet39_ds | 3.5 | 0.4 | 71.33 | 89.98 |
|
|
|
|
|
| HarDNet68_ds | 4.2 | 0.8 | 73.62 | 91.52 |
|
2021-12-13 20:42:03 +08:00
|
|
|
|
|
|
|
|
|
<a name='3'></a>
|
|
|
|
|
|
|
|
|
|
## 3. 基于 V100 GPU 的预测速度
|
|
|
|
|
|
|
|
|
|
| Models | Crop Size | Resize Short Size | FP32<br/>Batch Size=1<br/>(ms) | FP32<br/>Batch Size=4<br/>(ms) | FP32<br/>Batch Size=8<br/>(ms) |
|
|
|
|
|
| ------------ | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
|
|
|
|
|
| HarDNet68 | 224 | 256 | 3.58 | 8.53 | 11.58 |
|
|
|
|
|
| HarDNet85 | 224 | 256 | 6.24 | 14.85 | 20.57 |
|
|
|
|
|
| HarDNet39_ds | 224 | 256 | 1.40 | 2.30 | 3.33 |
|
|
|
|
|
| HarDNet68_ds | 224 | 256 | 2.26 | 3.34 | 5.06 |
|
|
|
|
|
|