docs: fix

2022-06-13 07:30:45 +00:00 · 2022-06-13 07:30:45 +00:00 · 5b116f4c19
parent e19731a36a
commit 5b116f4c19
3 changed files with 14 additions and 44 deletions
--- a/deploy/configs/PULC/car_exists/inference_person_exists.yaml
+++ b/deploy/configs/PULC/car_exists/inference_person_exists.yaml
@ -1,36 +0,0 @@
-Global:
-  infer_imgs: "./images/PULC/car_exists/objects365_00001507.jpeg"
-  inference_model_dir: "./models/car_exists_infer"
-  batch_size: 1
-  use_gpu: True
-  enable_mkldnn: False
-  cpu_num_threads: 10
-  enable_benchmark: True
-  use_fp16: False
-  ir_optim: True
-  use_tensorrt: False
-  gpu_mem: 8000
-  enable_profile: False
-
-PreProcess:
-  transform_ops:
-    - ResizeImage:
-        resize_short: 256
-    - CropImage:
-        size: 224
-    - NormalizeImage:
-        scale: 0.00392157
-        mean: [0.485, 0.456, 0.406]
-        std: [0.229, 0.224, 0.225]
-        order: ''
-        channel_num: 3
-    - ToCHWImage:
-
-PostProcess:
-  main_indicator: ThreshOutput
-  ThreshOutput:
-    threshold: 0.5
-    label_0: nocar
-    label_1: contains_car
-  SavePreLabel:
-    save_dir: ./pre_label/
--- a/docs/zh_CN/PULC/PULC_car_exists.md
+++ b/docs/zh_CN/PULC/PULC_car_exists.md
@ -1,4 +1,4 @@
-# PULC 有人/无人分类模型
+# PULC 有车/无车分类模型

 ------

@ -40,7 +40,7 @@

 ## 1. 模型和应用场景介绍

-该案例提供了用户使用 PaddleClas 的超轻量图像分类方案（PULC，Practical Ultra Lightweight Classification）快速构建轻量级、高精度、可落地的有人/无人的分类模型。该模型可以广泛应用于如监控场景、人员进出管控场景、海量数据过滤场景等。
+该案例提供了用户使用 PaddleClas 的超轻量图像分类方案（PULC，Practical Ultra Lightweight Classification）快速构建轻量级、高精度、可落地的有车/无车的分类模型。该模型可以广泛应用于如监控场景、海量数据过滤场景等。

 下表列出了判断图片中是否有车的二分类模型的相关指标，前两行展现了使用 SwinTranformer_tiny 和 MobileNetV3_small_x0_35 作为 backbone 训练得到的模型的相关指标，第三行至第六行依次展现了替换 backbone 为 PPLCNet_x1_0、使用 SSLD 预训练模型、使用 SSLD 预训练模型 + EDA 策略、使用 SSLD 预训练模型 + EDA 策略 + SKL-UGI 知识蒸馏策略训练得到的模型的相关指标。

@ -58,7 +58,7 @@

 **备注：**

-* `Tpr`指标的介绍可以参考 [3.2 小节](#3.2)的备注部分，延时是基于 Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz 测试得到，开启 MKLDNN 加速策略，线程数为10。
+* `Tpr`指标的介绍可以参考 [3.3节](#3.3)的备注部分，延时是基于 Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz 测试得到，开启 MKLDNN 加速策略，线程数为10。
 * 关于PP-LCNet的介绍可以参考[PP-LCNet介绍](../models/PP-LCNet.md)，相关论文可以查阅[PP-LCNet paper](https://arxiv.org/abs/2109.15099)。
    
    
@ -160,7 +160,7 @@ print(next(result))

 - 训练集合，本案例处理了 Objects365 数据训练集的标注文件，如果某张图含有“car”的标签，且这个框的面积在整张图中的比例大于 10%，即认为该张图中含有车，如果某张图中没有任何与交通工具，例如car、bus等相关的的标签，则认为该张图中不含有车。经过处理后，得到 108629 条可用数据，其中有车的数据有 27422 条，无车的数据 81207 条。

- 验证集合，处理方法与训练集相同，数据来源与 Objects365 数据集的验证集。为了测试结果准确，验证集经过人工校正，去除了一些可能存在标注错误的图像。
+- 验证集合，处理方法与训练集相同，数据来源于 Objects365 数据集的验证集。为了测试结果准确，验证集经过人工校正，去除了一些可能存在标注错误的图像。

 * 注：由于objects365的标签并不是完全互斥的，例如F1赛车可能是 "F1 Formula"，也可能被标称"car"。为了减轻干扰，我们仅保留"car"标签作为有车，而将不含任何交通工具的图作为无车。

@ -265,7 +265,7 @@ python3 tools/infer.py \
 输出结果如下：

 ```
-[{'class_ids': [1], 'scores': [0.9871138], 'label_names': ['contains_vehicle'], 'filename': 'deploy/images/PULC/car_exists/objects365_00001507.jpeg'}]
+[{'class_ids': [1], 'scores': [0.9871138], 'label_names': ['contains_car'], 'filename': 'deploy/images/PULC/car_exists/objects365_00001507.jpeg'}]
 ```

 **备注：**
@ -274,7 +274,7 @@ python3 tools/infer.py \

 * 默认是对 `deploy/images/PULC/car_exists/objects365_00001507.jpeg` 进行预测，此处也可以通过增加字段 `-o Infer.infer_imgs=xxx` 对其他图片预测。

-* 二分类默认的阈值为0.5， 如果需要指定阈值，可以重写 `Infer.PostProcess.threshold` ，如`-o Infer.PostProcess.threshold=0.9794`，该值需要根据实际场景来确定，此处的 `0.9794` 是在该场景中的 `val` 数据集在千分之一 Fpr 下得到的最佳 Tpr 所得到的。
+* 二分类默认的阈值为0.5， 如果需要指定阈值，可以重写 `Infer.PostProcess.threshold` ，如`-o Infer.PostProcess.threshold=0.9794`，该值需要根据实际场景来确定，此处的 `0.9794` 是在该场景中的 `val` 数据集在百分之一 Fpr 下得到的最佳 Tpr 所得到的。


 <a name="4"></a>
@ -417,7 +417,7 @@ objects365_00001507.jpeg:       class id(s): [1], score(s): [0.99], label_name(s
 ```


-**备注：** 二分类默认的阈值为0.5， 如果需要指定阈值，可以重写 `Infer.PostProcess.threshold` ，如`-o Infer.PostProcess.threshold=0.9794`，该值需要根据实际场景来确定，此处的 `0.9794` 是在该场景中的 `val` 数据集在千分之一 Fpr 下得到的最佳 Tpr 所得到的。该阈值的确定方法可以参考[3.3节](#3.3)备注部分。
+**备注：** 二分类默认的阈值为0.5， 如果需要指定阈值，可以重写 `Infer.PostProcess.threshold` ，如`-o Infer.PostProcess.threshold=0.9794`，该值需要根据实际场景来确定，此处的 `0.9794` 是在该场景中的 `val` 数据集在百分之一 Fpr 下得到的最佳 Tpr 所得到的。该阈值的确定方法可以参考[3.3节](#3.3)备注部分。

 <a name="6.2.2"></a>  

--- a/docs/zh_CN/advanced_tutorials/ssld.md
+++ b/docs/zh_CN/advanced_tutorials/ssld.md
@ -6,7 +6,7 @@
 - [1. 算法介绍](#1)
    - [1.1 知识蒸馏简介](#1.1)
    - [1.2 SSLD蒸馏策略](#1.2)
-    - [1.2 SKL-UGI蒸馏策略](#1.3)
+    - [1.3 SKL-UGI蒸馏策略](#1.3)
 - [2. SSLD预训练模型库](#2)
 - [3. SSLD使用](#3)
    - [3.1 加载SSLD模型进行微调](#3.1)
@ -19,6 +19,8 @@

 ## 1. 算法介绍

+<a name="1.1"></a>
+
 ### 1.1 简介

 PaddleClas 融合已有的知识蒸馏方法 [2,3]，提供了一种简单的半监督标签知识蒸馏方案(SSLD，Simple Semi-supervised Label Distillation)，基于 ImageNet1k 分类数据集，在 ResNet_vd 以及 MobileNet 系列上的精度均有超过 3% 的绝对精度提升，具体指标如下图所示。
@ -27,6 +29,8 @@ PaddleClas 融合已有的知识蒸馏方法 [2,3]，提供了一种简单的半
 <img src="../../images/distillation/distillation_perform_s.jpg"  width = "800" />
 </div>

+<a name="1.2"></a>
+
 ### 1.2 SSLD蒸馏策略

 SSLD 的流程图如下图所示。
@ -72,6 +76,8 @@ SSLD 蒸馏方案的一大特色就是无需使用图像的真值标签，因此

 <a name="1.3"></a>

+## 1.3 SKL-UGI蒸馏策略
+
 此外，在无标注数据选择的过程中，我们发现使用更加通用的数据，即使不需要严格的数据筛选过程，也可以帮助知识蒸馏任务获得稳定的精度提升，因而提出了SKL-UGI (Symmetrical-KL Unlabeled General Images distillation)知识蒸馏方案。

 通用数据可以使用ImageNet数据或者与场景相似的数据集。更多关于SKL-UGI的应用，请参考：[超轻量图像分类方案PULC使用教程](../PULC/PULC_train.md)。