rm QR code (#11533)

pull/11556/head
xiaoting 2024-01-24 11:54:03 +08:00 committed by GitHub
parent 1bc5500644
commit 0525f6bb01
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
9 changed files with 47 additions and 50 deletions

View File

@ -206,11 +206,11 @@ Eval.dataset.transforms.DetResizeForTest: 尺寸
limit_type: 'min'
```
如需获取已训练模型,请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型评估。
如需获取已训练模型,请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
将下载或训练完成的模型放置在对应目录下即可完成模型推理
```python

View File

@ -409,10 +409,10 @@ python tools/train.py -c rec_svtr_tiny_none_ctc_ch_train/rec_svtr_tiny_6local_6g
### 3.4 验证效果
如需获取已训练模型,请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
如需获取已训练模型,请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
将下载或训练完成的模型放置在对应目录下即可完成模型推理
* 指标评估

View File

@ -441,10 +441,9 @@ sprider
首先下载预训练模型PP-OCRv3检测模型下载链接https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
如需获取svtr-tiny高精度中文识别预训练模型请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
如需获取已训练模型请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
完成下载后,可将模型存储于如下位置:

View File

@ -279,11 +279,10 @@ LayoutXLM与VI-LayoutXLM针对该场景的训练结果如下所示。
可以看出对于VI-LayoutXLM相比LayoutXLM的Hmean高了1.3%。
如需获取已训练模型请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
如需获取已训练模型请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
<div align="center">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
#### 4.4.3 模型评估

View File

@ -226,7 +226,7 @@ tar -xf ch_PP-OCRv2_det_distill_train.tar && rm -rf ch_PP-OCRv2_det_distill_trai
% cd ..
```
**2模型评估**
**2模型评估**
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/75b0e977dfb74a83851f8828460759f337b1b7a0c33c47a08a30f3570e1e2e74"></center>
<center>图6 文本检测方案1-模型评估</center>
@ -311,16 +311,16 @@ CUDA_VISIBLE_DEVICES=0 python tools/train.py \
-c configs/det/ch_PP-OCRv2/ch_PP-OCRv2_det_student.yml
```
**2模型评估**
**2模型评估**
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/5a75137c5f924dfeb6956b5818812298cc3dc7992ac84954b4175be9adf83c77"></center>
<center>图8 文本检测方案2-模型评估</center>
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`。如需获取已训练模型请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`。
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
如需获取已训练模型请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
将下载或训练完成的模型放置在对应目录下即可完成模型评估
@ -461,9 +461,9 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
使用预训练模型进行评估,指标如下所示:
| 方案 | acc |
| -------- | -------- |
| PP-OCRv2中英文超轻量识别预训练模型 | 67.48% |
| 方案 | acc |
| -------- | -------- |
| PP-OCRv2中英文超轻量识别预训练模型 | 67.48% |
使用文本预训练模型在XFUND验证集上评估acc达到67%左右充分说明ppocr提供的预训练模型具有泛化能力。
@ -528,9 +528,9 @@ CUDA_VISIBLE_DEVICES=0 python tools/eval.py \
使用预训练模型进行评估,指标如下所示:
| 方案 | acc |
| -------- | -------- |
| XFUND数据集+finetune | 72.33% |
| 方案 | acc |
| -------- | -------- |
| XFUND数据集+finetune | 72.33% |
使用XFUND数据集+finetune训练在验证集上评估达到72%左右,说明 finetune会提升垂类场景效果。
@ -644,7 +644,7 @@ wget https://paddleocr.bj.bcebos.com/pplayout/re_LayoutXLM_xfun_zh.tar && tar -x
### 5.1 SER
SER: 语义实体识别 (Semantic Entity Recognition, 可以完成对图像中的文本识别与分类。
SER: 语义实体识别 (Semantic Entity Recognition, 可以完成对图像中的文本识别与分类。
<center><img src='https://ai-studio-static-online.cdn.bcebos.com/a3b25766f3074d2facdf88d4a60fc76612f51992fd124cf5bd846b213130665b' width='700'></center>
<center>图19 SER测试效果图</center>
@ -871,7 +871,7 @@ with open('output/re/infer_results.txt', 'r', encoding='utf-8') as fin:
img_path, result = line.strip().split('\t')
result_key = json.loads(result)
# 写入Excel
row_data = [result_key['姓名'], result_key['性别'], result_key['民族'], result_key['文化程度'], result_key['身份证号码'],
row_data = [result_key['姓名'], result_key['性别'], result_key['民族'], result_key['文化程度'], result_key['身份证号码'],
result_key['联系电话'], result_key['通讯地址']]
row = 'A' + str(i)
worksheet1.write_row(row, row_data, format1)
@ -896,4 +896,3 @@ workbook.close()
- microsoft/unilm/layoutxlm, https://github.com/microsoft/unilm/tree/master/layoutxlm
- XFUND dataset, https://github.com/doc-analysis/XFUND

View File

@ -189,11 +189,11 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml -o
[2022/07/14 10:54:06] ppocr INFO: fps:928.948733797251
```
如需获取已训练模型,请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型推理
如需获取已训练模型,请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
将下载或训练完成的模型放置在对应目录下即可完成模型推理
## 8. 模型导出推理
训练完成后可以将训练模型转换成inference模型。inference 模型会额外保存模型的结构信息,在预测部署、加速推理上性能优越,灵活方便,适合于实际系统集成。

View File

@ -300,11 +300,11 @@ python tools/eval.py -c configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml -o Globa
| 3 | PP-OCRv3中英文超轻量检测预训练模型fintune教师模型 |84.80%|
| 4 | 基于2和3训练好的模型fintune |82.70%|
如需获取已训练模型,请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
将下载或训练完成的模型放置在对应目录下即可完成模型推理
如需获取已训练模型,请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
将下载或训练完成的模型放置在对应目录下即可完成模型推理
#### 4.3.6 模型导出推理
训练完成后可以将训练模型转换成inference模型。inference 模型会额外保存模型的结构信息,在预测部署、加速推理上性能优越,灵活方便,适合于实际系统集成。

View File

@ -433,10 +433,10 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec.yml -o \
Eval.dataset.label_file_list=[/home/aistudio/data/CCPD2020/PPOCR/test/rec.txt]
```
如需获取已训练模型,请扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="left">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
如需获取已训练模型,请加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
评估部分日志如下:

View File

@ -44,10 +44,10 @@ pip install -r PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simpl
### 快速使用
获取SVTR中文模型文件扫码填写问卷加入PaddleOCR官方交流群获取全部OCR垂类模型下载链接、《动手学OCR》电子书等全套OCR学习资料🎁
<div align="center">
<img src="https://ai-studio-static-online.cdn.bcebos.com/dd721099bd50478f9d5fb13d8dd00fad69c22d6848244fd3a1d3980d7fefc63e" width = "150" height = "150" />
</div>
获取SVTR中文模型文件加入PaddleX官方交流频道获取20G OCR学习大礼包内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
- PaddleX官方交流频道https://aistudio.baidu.com/community/channel/610
```bash
# 解压模型文件