PaddleClas/docs/zh_CN/deployment/PP-ShiTu/shitu_deploy.md

6.3 KiB
Raw Blame History

PP-ShiTu迁移应用及调优

目录

PP-ShiTu快速开始中,主要展示了PP-ShiTu的快速开始demo。那么本文档主要介绍如何将PP-ShiTu应用到自己的需求中,及如何继续调优,优化识别效果。具体可以分成以下三种情况

  • 直接使用官方模型
  • 根据需求对模型进行调优
  • 模型加速

以下分别对上面三种情况进行具体讲解。

1. 使用官方模型

对于其他的应用首先建议使用此种方法因为PaddleClas官方模型是经过大量数据训练得到的具有强大泛化性能的轻量级通用模型。其速度较快、精度较高在Intel cpu上直接部署也能快速得到结果。同时直接使用官方模型则无需训练新的模型节约时间方便快速部署。

使用官方模型具体步骤如下:

  • 下载模型及数据准备
  • 检索库更新
  • 精度测试

1.1 下载官方模型及数据准备

模型下载及pipline 运行详见图像识别快速开始

下载模型后要准备相应的数据即所迁移应用的具体数据数据量根据实际情况自行决定但是不能太少会影响精度。将准备的数据分成两部分1建库图像gallery2测试图像。其中建库数据无需过多但需保证每个类别包含此类别物体不同角度的图像建议每个类别至少5张图请根据实际情况具体调节。

数据标注工具可以使用lebalme。标注数据时。请标注待识别物体的的包围框BoundingBox注意只需要标注建库图像。。

建议一个类别一共准备30张图左右其中约至少5张图作为建库图像剩下的作为测试图像。

对于加入检索的数据每个类别尽量准备此类别的各角度的图像丰富类别信息。准备的图像只能包含此类别同时图像背景尽可能的少、简单。即将要加入检索根据标注的包围框信息裁剪出bbox图像作为新的要加入的图像以提高检索库的图像质量。

收集好图像后,数据整理及建库流程详见图像识别快速开始3.2 建立新的索引库

1.3 精度测试

使用测试图像对整个pipline进行简单的精度测试。如发现类别不正确则需对gallery进行调整将不正确的测试图像的相似图片标注并裁剪出没有背景的物体加入gallery中反复迭代。经过调整后可以测试出整个pipeline的精度。如果精度能够满足需求则可继续使用。若精度不达预期则需对模型进行调优参考下面文档。

2. 模型调优

在使用官方模型之后,如果发现精度不达预期,则可对模型进行训练调优。同时,根据官方模型的结果,需要进一步大概判断出 检测模型精度、还是识别模型精度问题。不同模型的调优,可参考以下文档。

2.1 检测模型调优

PP-ShiTu中检测模型采用的 PicoDet 算法,具体算法请参考此文档。检测模型的训练及调优,请参考此文档

对模型进行训练的话需要自行准备数据并对数据进行标注建议一个类别至少准备200张标注图像并将标注图像及groudtruth文件转成coco文件格式以方便使用PaddleDetection进行训练。主体检测的预训练权重及相关配置文件相见主体检测文档。训练的时候,请加载主体检测的预训练权重。

2.2 识别模型调优

在使用官方模型后,如果不满足精度需求,则可以参考此部分文档,进行模型调优

因为要对模型进行训练,所以收集自己的数据集。数据准备及相应格式请参考:特征提取文档4.1数据准备部分、识别数据集说明。值得注意的是,此部分需要准备大量的数据,以保证识别模型效果。训练配置文件参考:通用识别模型配置文件,训练方法参考:识别模型训练

  • 数据增强:根据实际情况选择不同数据增强方法。如:实际应用中数据遮挡比较严重,建议添加RandomErasing增强方法。详见数据增强文档
  • 换不同的backbone,一般来说,越大的模型,特征提取能力更强。不同backbone详见模型介绍
  • 选择不同的Metric Learning方法。不同的Metric Learning方法,对不同的数据集效果可能不太一样,建议尝试其他Loss,详见Metric Learning
  • 采用蒸馏方法,对小模型进行模型能力提升,详见模型蒸馏
  • 增补数据集。针对错误样本添加badcase数据

模型训练完成后,参照1.2 检索库更新进行检索库更新。同时对整个pipeline进行测试如果精度不达预期则重复此步骤。

3. 模型加速

模型加速主要以下几种方法:

  • 替换小模型:一般来说,越小的模型预测速度相对越快
  • 模型裁剪、量化:请参考文档模型压缩,压缩配置文件修改请参考slim相关配置文件