191 lines
6.6 KiB
Markdown
191 lines
6.6 KiB
Markdown
# 如何写模型转换配置
|
||
|
||
<!-- This tutorial describes how to write a config for model conversion and deployment. A deployment config includes `onnx config`, `codebase config`, `backend config`. -->
|
||
|
||
这篇教程介绍了如何编写模型转换和部署的配置文件。部署配置文件由`ONNX配置`, `代码库配置`, `推理框架配置`组成。
|
||
|
||
<!-- TOC -->
|
||
|
||
- [如何写模型转换配置](#如何写模型转换配置)
|
||
- [1. 如何编写ONNX配置](#1-如何编写onnx配置)
|
||
- [ONNX配置参数说明](#onnx配置参数说明)
|
||
- [示例](#示例)
|
||
- [动态尺寸输入和输出配置](#动态尺寸输入和输出配置)
|
||
- [示例](#示例-1)
|
||
- [2. 如何编写代码库配置](#2-如何编写代码库配置)
|
||
- [代码库配置参数说明](#代码库配置参数说明)
|
||
- [示例](#示例-2)
|
||
- [3. 如何编写推理框架配置](#3-如何编写推理框架配置)
|
||
- [示例](#示例-3)
|
||
- [4. 部署配置完整示例](#4-部署配置完整示例)
|
||
- [5. 部署配置文件命名规则](#5-部署配置文件命名规则)
|
||
- [示例](#示例-4)
|
||
- [6. 如何编写模型配置文件](#6-如何编写模型配置文件)
|
||
|
||
<!-- TOC -->
|
||
|
||
## 1. 如何编写ONNX配置
|
||
|
||
ONNX 配置描述了如何将PyTorch模型转换为ONNX模型。
|
||
|
||
### ONNX配置参数说明
|
||
|
||
- `type`: 配置类型。 默认为 `onnx`。
|
||
|
||
- `export_params`: 如果指定,将导出模型所有参数。如果您只想导出未训练模型将此项设置为 False。
|
||
|
||
- `keep_initializers_as_inputs`:
|
||
如果为 True,则所有初始化器(通常对应为参数)也将作为输入导出,添加到计算图中。 如果为 False,则初始化器不会作为输入导出,不添加到计算图中,仅将非参数输入添加到计算图中。
|
||
|
||
- `opset_version`: ONNX的算子集版本,默认为11。
|
||
|
||
- `save_file`: 输出ONNX模型文件。
|
||
|
||
- `input_names`: 模型计算图中输入节点的名称。
|
||
|
||
- `output_names`: 模型计算图中输出节点的名称。
|
||
|
||
- `input_shape`: 模型输入张量的高度和宽度。
|
||
|
||
#### 示例
|
||
|
||
```python
|
||
onnx_config = dict(
|
||
type='onnx',
|
||
export_params=True,
|
||
keep_initializers_as_inputs=False,
|
||
opset_version=11,
|
||
save_file='end2end.onnx',
|
||
input_names=['input'],
|
||
output_names=['output'],
|
||
input_shape=None)
|
||
```
|
||
|
||
### 动态尺寸输入和输出配置
|
||
|
||
如果模型要求动态尺寸的输入和输出,您需要在ONNX配置中加入dynamic_axes配置。
|
||
|
||
- `dynamic_axes`: 描述输入和输出的维度信息。
|
||
|
||
#### 示例
|
||
|
||
```python
|
||
dynamic_axes={
|
||
'input': {
|
||
0: 'batch',
|
||
2: 'height',
|
||
3: 'width'
|
||
},
|
||
'dets': {
|
||
0: 'batch',
|
||
1: 'num_dets',
|
||
},
|
||
'labels': {
|
||
0: 'batch',
|
||
1: 'num_dets',
|
||
},
|
||
}
|
||
```
|
||
|
||
## 2. 如何编写代码库配置
|
||
|
||
代码库主要指OpenMMLab 系列模型代码库,代码库配置由OpenMMLab 系列模型代码库的简称和OpenMMLab 系列模型任务类型组成。
|
||
|
||
### 代码库配置参数说明
|
||
|
||
- `type`: OpenMMLab 系列模型代码库的简称, 包括 `mmpretrain`, `mmdet`, `mmseg`, `mmocr`, `mmagic`。
|
||
- `task`: OpenMMLab 系列模型任务类型, 具体请参考 [OpenMMLab 系列模型任务列表](#list-of-tasks-in-all-codebases)。
|
||
|
||
#### 示例
|
||
|
||
```python
|
||
codebase_config = dict(type='mmpretrain', task='Classification')
|
||
```
|
||
|
||
## 3. 如何编写推理框架配置
|
||
|
||
推理框架配置主要用于指定模型运行在哪个推理框架,并提供模型在推理框架运行时所需的信息,具体参考 [ONNX Runtime](../05-supported-backends/onnxruntime.md), [TensorRT](../05-supported-backends/tensorrt.md), [ncnn](../05-supported-backends/ncnn.md), [PPLNN](../05-supported-backends/pplnn.md)。
|
||
|
||
- `type`: 模型推理框架, 包括 `onnxruntime`, `ncnn`, `pplnn`, `tensorrt`, `openvino`。
|
||
|
||
#### 示例
|
||
|
||
```python
|
||
backend_config = dict(
|
||
type='tensorrt',
|
||
common_config=dict(
|
||
fp16_mode=False, max_workspace_size=1 << 30),
|
||
model_inputs=[
|
||
dict(
|
||
input_shapes=dict(
|
||
input=dict(
|
||
min_shape=[1, 3, 512, 1024],
|
||
opt_shape=[1, 3, 1024, 2048],
|
||
max_shape=[1, 3, 2048, 2048])))
|
||
])
|
||
```
|
||
|
||
## 4. 部署配置完整示例
|
||
|
||
这里我们提供了一个以TensorRT为推理框架的基于mmpretrain图像分类任务的完整部署配置示例。
|
||
|
||
```python
|
||
|
||
codebase_config = dict(type='mmpretrain', task='Classification')
|
||
|
||
backend_config = dict(
|
||
type='tensorrt',
|
||
common_config=dict(
|
||
fp16_mode=False,
|
||
max_workspace_size=1 << 30),
|
||
model_inputs=[
|
||
dict(
|
||
input_shapes=dict(
|
||
input=dict(
|
||
min_shape=[1, 3, 224, 224],
|
||
opt_shape=[4, 3, 224, 224],
|
||
max_shape=[64, 3, 224, 224])))])
|
||
|
||
onnx_config = dict(
|
||
type='onnx',
|
||
dynamic_axes={
|
||
'input': {
|
||
0: 'batch',
|
||
2: 'height',
|
||
3: 'width'
|
||
},
|
||
'output': {
|
||
0: 'batch'
|
||
}
|
||
},
|
||
export_params=True,
|
||
keep_initializers_as_inputs=False,
|
||
opset_version=11,
|
||
save_file='end2end.onnx',
|
||
input_names=['input'],
|
||
output_names=['output'],
|
||
input_shape=[224, 224])
|
||
```
|
||
|
||
## 5. 部署配置文件命名规则
|
||
|
||
我们遵循以下样式来命名配置文件。建议贡献者遵循相同的风格。
|
||
|
||
```bash
|
||
(task name)_(backend name)_(dynamic or static).py
|
||
```
|
||
|
||
- `task name`: 模型任务类型。
|
||
- `backend name`: 推理框架名称。注意:如果您使用了量化,您需要指出量化类型。例如 `tensorrt-int8`。
|
||
- `dynamic or static`: 动态或者静态尺寸导出。 注意:如果推理框架需要明确的形状信息,您需要添加输入大小的描述,格式为`高度 x 宽度`。 例如 `dynamic-512x1024-2048x2048`, 这意味着最小输入形状是`512x1024`,最大输入形状是`2048x2048`。
|
||
|
||
#### 示例
|
||
|
||
```bash
|
||
detection_tensorrt-int8_dynamic-320x320-1344x1344.py
|
||
```
|
||
|
||
## 6. 如何编写模型配置文件
|
||
|
||
请根据模型具体任务的代码库,编写模型配置文件。 模型配置文件用于初始化模型,详情请参考[MMPretrain](https://github.com/open-mmlab/mmpretrain/blob/main/docs/zh_CN/user_guides/config.md),[MMDetection](https://github.com/open-mmlab/mmdetection/blob/3.x/docs/zh_cn/user_guides/config.md), [MMSegmentation](https://github.com/open-mmlab/mmsegmentation/blob/main/docs/zh_cn/user_guides/1_config.md), [MMOCR](https://github.com/open-mmlab/mmocr/blob/main/docs/en/user_guides/config.md),[MMagic](https://github.com/open-mmlab/mmagic/blob/main/docs/en/user_guides/config.md)。
|