rm QR code (#11533)
parent
1bc5500644
commit
0525f6bb01
|
@ -206,11 +206,11 @@ Eval.dataset.transforms.DetResizeForTest: 尺寸
|
|||
limit_type: 'min'
|
||||
```
|
||||
|
||||
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型评估。
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型推理
|
||||
|
||||
|
||||
```python
|
||||
|
|
|
@ -409,10 +409,10 @@ python tools/train.py -c rec_svtr_tiny_none_ctc_ch_train/rec_svtr_tiny_6local_6g
|
|||
|
||||
### 3.4 验证效果
|
||||
|
||||
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型推理
|
||||
|
||||
* 指标评估
|
||||
|
|
|
@ -441,10 +441,9 @@ sprider
|
|||
|
||||
首先下载预训练模型,PP-OCRv3检测模型下载链接:https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
|
||||
|
||||
如需获取svtr-tiny高精度中文识别预训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
|
||||
完成下载后,可将模型存储于如下位置:
|
||||
|
|
|
@ -279,11 +279,10 @@ LayoutXLM与VI-LayoutXLM针对该场景的训练结果如下所示。
|
|||
|
||||
可以看出,对于VI-LayoutXLM相比LayoutXLM的Hmean高了1.3%。
|
||||
|
||||
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
<div align="center">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
|
||||
|
||||
#### 4.4.3 模型评估
|
||||
|
|
|
@ -226,7 +226,7 @@ tar -xf ch_PP-OCRv2_det_distill_train.tar && rm -rf ch_PP-OCRv2_det_distill_trai
|
|||
% cd ..
|
||||
```
|
||||
|
||||
**2)模型评估**
|
||||
**2)模型评估**
|
||||
|
||||
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/75b0e977dfb74a83851f8828460759f337b1b7a0c33c47a08a30f3570e1e2e74"></center>
|
||||
<center>图6 文本检测方案1-模型评估</center>
|
||||
|
@ -311,16 +311,16 @@ CUDA_VISIBLE_DEVICES=0 python tools/train.py \
|
|||
-c configs/det/ch_PP-OCRv2/ch_PP-OCRv2_det_student.yml
|
||||
```
|
||||
|
||||
**2)模型评估**
|
||||
**2)模型评估**
|
||||
|
||||
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/5a75137c5f924dfeb6956b5818812298cc3dc7992ac84954b4175be9adf83c77"></center>
|
||||
<center>图8 文本检测方案2-模型评估</center>
|
||||
|
||||
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`。如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`。
|
||||
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型评估
|
||||
|
||||
|
@ -461,9 +461,9 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
|
|||
|
||||
使用预训练模型进行评估,指标如下所示:
|
||||
|
||||
| 方案 | acc |
|
||||
| -------- | -------- |
|
||||
| PP-OCRv2中英文超轻量识别预训练模型 | 67.48% |
|
||||
| 方案 | acc |
|
||||
| -------- | -------- |
|
||||
| PP-OCRv2中英文超轻量识别预训练模型 | 67.48% |
|
||||
|
||||
使用文本预训练模型在XFUND验证集上评估,acc达到67%左右,充分说明ppocr提供的预训练模型具有泛化能力。
|
||||
|
||||
|
@ -528,9 +528,9 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
|
|||
|
||||
使用预训练模型进行评估,指标如下所示:
|
||||
|
||||
| 方案 | acc |
|
||||
| -------- | -------- |
|
||||
| XFUND数据集+finetune | 72.33% |
|
||||
| 方案 | acc |
|
||||
| -------- | -------- |
|
||||
| XFUND数据集+finetune | 72.33% |
|
||||
|
||||
使用XFUND数据集+finetune训练,在验证集上评估达到72%左右,说明 finetune会提升垂类场景效果。
|
||||
|
||||
|
@ -644,7 +644,7 @@ wget https://paddleocr.bj.bcebos.com/pplayout/re_LayoutXLM_xfun_zh.tar && tar -x
|
|||
|
||||
### 5.1 SER
|
||||
|
||||
SER: 语义实体识别 (Semantic Entity Recognition), 可以完成对图像中的文本识别与分类。
|
||||
SER: 语义实体识别 (Semantic Entity Recognition), 可以完成对图像中的文本识别与分类。
|
||||
|
||||
<center><img src='https://ai-studio-static-online.cdn.bcebos.com/a3b25766f3074d2facdf88d4a60fc76612f51992fd124cf5bd846b213130665b' width='700'></center>
|
||||
<center>图19 SER测试效果图</center>
|
||||
|
@ -871,7 +871,7 @@ with open('output/re/infer_results.txt', 'r', encoding='utf-8') as fin:
|
|||
img_path, result = line.strip().split('\t')
|
||||
result_key = json.loads(result)
|
||||
# 写入Excel
|
||||
row_data = [result_key['姓名'], result_key['性别'], result_key['民族'], result_key['文化程度'], result_key['身份证号码'],
|
||||
row_data = [result_key['姓名'], result_key['性别'], result_key['民族'], result_key['文化程度'], result_key['身份证号码'],
|
||||
result_key['联系电话'], result_key['通讯地址']]
|
||||
row = 'A' + str(i)
|
||||
worksheet1.write_row(row, row_data, format1)
|
||||
|
@ -896,4 +896,3 @@ workbook.close()
|
|||
- microsoft/unilm/layoutxlm, https://github.com/microsoft/unilm/tree/master/layoutxlm
|
||||
|
||||
- XFUND dataset, https://github.com/doc-analysis/XFUND
|
||||
|
||||
|
|
|
@ -189,11 +189,11 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml -o
|
|||
[2022/07/14 10:54:06] ppocr INFO: fps:928.948733797251
|
||||
```
|
||||
|
||||
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型推理。
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型推理
|
||||
|
||||
## 8. 模型导出推理
|
||||
训练完成后,可以将训练模型转换成inference模型。inference 模型会额外保存模型的结构信息,在预测部署、加速推理上性能优越,灵活方便,适合于实际系统集成。
|
||||
|
|
|
@ -300,11 +300,11 @@ python tools/eval.py -c configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml -o Globa
|
|||
| 3 | PP-OCRv3中英文超轻量检测预训练模型fintune教师模型 |84.80%|
|
||||
| 4 | 基于2和3训练好的模型fintune |82.70%|
|
||||
|
||||
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型推理。
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
将下载或训练完成的模型放置在对应目录下即可完成模型推理
|
||||
|
||||
#### 4.3.6 模型导出推理
|
||||
训练完成后,可以将训练模型转换成inference模型。inference 模型会额外保存模型的结构信息,在预测部署、加速推理上性能优越,灵活方便,适合于实际系统集成。
|
||||
|
|
|
@ -433,10 +433,10 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec.yml -o \
|
|||
Eval.dataset.label_file_list=[/home/aistudio/data/CCPD2020/PPOCR/test/rec.txt]
|
||||
```
|
||||
|
||||
如需获取已训练模型,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="left">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
|
||||
|
||||
评估部分日志如下:
|
||||
|
|
|
@ -44,10 +44,10 @@ pip install -r PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simpl
|
|||
|
||||
### 快速使用
|
||||
|
||||
获取SVTR中文模型文件,请扫码填写问卷,加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
|
||||
<div align="center">
|
||||
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
|
||||
</div>
|
||||
获取SVTR中文模型文件,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
|
||||
|
||||
- PaddleX官方交流频道:https://aistudio.baidu.com/community/channel/610
|
||||
|
||||
|
||||
```bash
|
||||
# 解压模型文件
|
||||
|
|
Loading…
Reference in New Issue