fix some error of paddlex docs (#13987)

* fix some error of paddlex docs

* fix some error of paddlex docs

* fix some error of paddlex docs

* fix some error of paddlex docs
This commit is contained in:
dyning 2024-10-14 18:14:28 +08:00 committed by GitHub
parent 270ce8aa79
commit af75f436a3
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
7 changed files with 41 additions and 33 deletions

View File

@ -31,12 +31,12 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
- 🔥🔥《PaddleX文档信息个性化抽取新升级》PP-ChatOCRv3创新性提供了基于数据融合技术的OCR模型二次开发功能具备更强的模型微调能力。百万级高质量通用OCR文本识别数据按特定比例自动融入垂类模型训练数据破解产业垂类模型训练导致通用文本识别能力减弱难题。适用自动化办公、金融风控、医疗健康、教育出版、法律党政等产业实际场景。**10月17日周四1900**直播为您详细解读数据融合技术以及如何利用提示词工程实现更好的信息抽取效果。 [报名链接](https://www.wjx.top/vm/mFhGfwx.aspx?udsid=772552)
- **🔥2024.10.1 添加OCR领域低代码开发能力**:
* 飞桨低代码开发工具PaddleX依托于PaddleOCR的先进技术支持了OCR领域的低代码开发能力
* 🎨 [**模型丰富一键调用**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html)将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为5条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀[**提高效率降低门槛**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html):提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能部署、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
- **🔥2024.10.1 添加OCR领域低代码全流程开发能力**:
* 飞桨低代码开发工具PaddleX依托于PaddleOCR的先进技术支持了OCR领域的低代码全流程开发能力:
* 🎨 [**模型丰富一键调用**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html)将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为6条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀[**提高效率降低门槛**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html):提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能推理、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
* 支持文档场景信息抽取v3([PP-ChatOCRv3](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR和PicoDet的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、版面矫正预测模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
* 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)和PicoDet的[高效率版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
- **🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案**
- 赛题一OCR 端到端识别任务冠军方案——[场景文本识别算法-SVTRv2](https://paddlepaddle.github.io/PaddleOCR/latest/algorithm/text_recognition/algorithm_rec_svtrv2.html)
@ -53,7 +53,7 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
## ⚡ [快速开始](https://paddlepaddle.github.io/PaddleOCR/latest/quick_start.html)
## 🔥 [低代码开发](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html)
## 🔥 [低代码全流程开发](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html)
## 📝 文档

View File

@ -31,12 +31,12 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
## 📣 近期更新
- **🔥2024.10.1 发布PaddleOCR release/2.9**:
* 飞桨低代码开发工具PaddleX依托于PaddleOCR的先进技术支持了OCR领域的低代码开发能力
* 🎨 [**模型丰富一键调用**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html)将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为5条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀[**提高效率降低门槛**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html):提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能部署、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
- **🔥2024.10.1 添加OCR领域低代码全流程开发能力**:
* 飞桨低代码开发工具PaddleX依托于PaddleOCR的先进技术支持了OCR领域的低代码全流程开发能力:
* 🎨 [**模型丰富一键调用**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html)将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为6条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀[**提高效率降低门槛**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html):提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能推理、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
* 支持文档场景信息抽取v3([PP-ChatOCRv3](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR和PicoDet的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、版面矫正预测模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
* 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)和PicoDet的[高效率版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
- **🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案**
- 赛题一OCR 端到端识别任务冠军方案——[场景文本识别算法-SVTRv2](https://paddlepaddle.github.io/PaddleOCR/latest/algorithm/text_recognition/algorithm_rec_svtrv2.html)
@ -47,7 +47,7 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
## 🌟 特性
支持多种 OCR 相关前沿算法在此基础上打造产业级特色模型PP-、PP-Structure和PP-ChatOCR并打通数据生产、模型训练、压缩、预测部署全流程。
支持多种 OCR 相关前沿算法在此基础上打造产业级特色模型PP-OCR、PP-Structure和PP-ChatOCR并打通数据生产、模型训练、压缩、预测部署全流程。
<img src="./images/ppocrv4.png" width="600" />

View File

@ -1,17 +1,17 @@
## 1. 低代码开发简介
## 1. 低代码全流程开发简介
飞桨低代码开发工具[PaddleX](https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta1)依托于PaddleOCR的先进技术支持了OCR领域的**低代码**开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。这将显著**减少模型开发的时间消耗****降低其开发难度**,大大加快模型在行业中的应用和推广速度。特色如下:
飞桨低代码开发工具[PaddleX](https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta1)依托于PaddleOCR的先进技术支持了OCR领域的**低代码全流程**开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。这将显著**减少模型开发的时间消耗****降低其开发难度**,大大加快模型在行业中的应用和推广速度。特色如下:
* 🎨 **模型丰富一键调用**将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为5条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🎨 **模型丰富一键调用**将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为6条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀 **提高效率降低门槛**:提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能部署、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
* 🚀 **提高效率降低门槛**:提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能推理、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
>**说明**PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程其中包含能够独立完成某类任务的单模型单功能模块组合。
## 2. OCR相关能力支持
PaddleX中OCR相关的5条产线均支持本地**快速推理**,部分产线支持**在线体验**,您可以快速体验各个产线的预训练模型效果,如果您对产线的预训练模型效果满意,可以直接对产线进行[高性能部署](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/high_performance_deploy.md)/[服务化部署](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/service_deploy.md)/[端侧部署](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/lite_deploy.md),如果不满意,您也可以使用产线的**二次开发**能力,提升效果。完整的产线开发流程请参考[PaddleX产线使用概览](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/pipeline_develop_guide.md)或各产线使用教程。
PaddleX中OCR相关的6条产线均支持本地**快速推理**,部分产线支持**在线体验**,您可以快速体验各个产线的预训练模型效果,如果您对产线的预训练模型效果满意,可以直接对产线进行[高性能推理](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/high_performance_deploy.md)/[服务化部署](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/service_deploy.md)/[端侧部署](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/lite_deploy.md),如果不满意,您也可以使用产线的**二次开发**能力,提升效果。完整的产线开发流程请参考[PaddleX产线使用概览](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/pipeline_develop_guide.md)或各产线使用教程。
此外PaddleX为开发者提供了基于[云端图形化开发界面](https://aistudio.baidu.com/pipeline/mine)的全流程开发工具, 详细请参考[教程《零门槛开发产业级AI模型》](https://aistudio.baidu.com/practical/introduce/546656605663301)
@ -21,7 +21,7 @@ PaddleX中OCR相关的5条产线均支持本地**快速推理**,部分产线
<td></td>
<td>在线体验</td>
<td>快速推理</td>
<td>高性能部署</td>
<td>高性能推理</td>
<td>服务化部署</td>
<td>端侧部署</td>
<td>二次开发</td>
@ -57,6 +57,16 @@ PaddleX中OCR相关的5条产线均支持本地**快速推理**,部分产线
<td></td>
<td></td>
</tr>
<tr>
<td>通用版面解析</td>
<td>🚧</td>
<td>🚧</td>
<td>🚧</td>
<td>🚧</td>
<td>🚧</td>
<td>🚧</td>
<td>🚧</td>
</tr>
<tr>
<td>公式识别</td>
<td>🚧</td>

View File

@ -2,9 +2,9 @@
>**说明:**
>* 飞桨低代码开发工具[PaddleX](https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta1)依托于PaddleOCR的先进技术支持了OCR领域的**低代码**开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。
>* 飞桨低代码开发工具[PaddleX](https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta1)依托于PaddleOCR的先进技术支持了OCR领域的**低代码全流程**开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。
>* PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程其中包含能够独立完成某类任务的单模型单功能模块组合。本文档提供**OCR相关产线**的快速使用,单功能模块的快速使用以及更多功能请参考[PaddleOCR低代码开发](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html)中相关章节。
>* PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程其中包含能够独立完成某类任务的单模型单功能模块组合。本文档提供**OCR相关产线**的快速推理使用,单功能模块的快速使用以及更多功能请参考[PaddleOCR低代码全流程开发](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html)中相关章节。
### 🛠️ 安装
@ -59,6 +59,7 @@ for res in output:
| 文档场景信息抽取v3 | `PP-ChatOCRv3-doc` | [文档场景信息抽取v3产线Python脚本使用说明](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md#22-本地体验) |
| 通用OCR | `OCR` | [通用OCR产线Python脚本使用说明](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/OCR.md#222-python脚本方式集成) |
| 通用表格识别 | `table_recognition` | [通用表格识别产线Python脚本使用说明](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/ocr_pipelines/table_recognition.md#22-python脚本方式集成) |
| 通用版面解析 | coming soon | coming soon |
| 印章识别 | coming soon | coming soon |
| 公式识别 | coming soon | coming soon |
@ -101,6 +102,7 @@ paddlex --pipeline OCR --input https://paddle-model-ecology.bj.bcebos.com/paddle
| 产线名称 | 使用命令 |
|-----------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 通用表格识别 | `paddlex --pipeline table_recognition --input https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg --device gpu:0` |
|文档场景信息抽取v3 | coming soon |
|文档场景信息抽取v3 | coming soon |
| 通用版面解析 | coming soon |
| 印章识别 | coming soon |
| 公式识别 | coming soon |

View File

@ -7,9 +7,9 @@ hide:
- 在线免费体验:
- PP-OCRv4 在线体验地址:<https://aistudio.baidu.com/community/app/91660>
- SLANet 在线体验地址:<https://aistudio.baidu.com/community/app/91661>
- PP-ChatOCRv3-doc 在线体验地址:<https://aistudio.baidu.com/community/app/182491>
- PP-ChatOCRv2-common 在线体验地址:<https://aistudio.baidu.com/community/app/91662>
- PP-ChatOCRv2-doc 在线体验地址:<https://aistudio.baidu.com/community/app/70303>
- PP-ChatOCRv3-doc 在线体验地址:<https://aistudio.baidu.com/community/app/182491>
- [一键调用17个PaddleOCR核心模型](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html)
- 一行命令快速使用:[文本检测识别(中英文/多语言)](https://paddlepaddle.github.io/PaddleOCR/latest/ppocr/overview.html)

View File

@ -7,21 +7,17 @@ hide:
### 更新
#### **🔥2024.10.1 发布PaddleOCR 2.9**
* 飞桨低代码开发工具PaddleX依托于PaddleOCR的先进技术支持了OCR领域的低代码开发能力
* 🎨 [**模型丰富一键调用**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.md)将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为5条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀[**提高效率降低门槛**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.md):提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能部署、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
#### **🔥2024.10.1 添加OCR领域低代码全流程开发能力**
* 飞桨低代码开发工具PaddleX依托于PaddleOCR的先进技术支持了OCR领域的低代码全流程开发能力:
* 🎨 [**模型丰富一键调用**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html)将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的**17个模型**整合为6条模型产线,通过极简的**Python API一键调用**快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计**200+模型**形成20+单功能模块,方便开发者进行**模型组合**使用。
* 🚀[**提高效率降低门槛**](https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html):提供基于**统一命令**和**图形界面**两种方式,实现模型简洁高效的使用、组合与定制。支持**高性能推理、服务化部署和端侧部署**等多种部署方式。此外,对于各种主流硬件如**英伟达GPU、昆仑芯、昇腾、寒武纪和海光**等,进行模型开发时,都可以**无缝切换**。
* 支持文档场景信息抽取v3([PP-ChatOCRv3](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR和PicoDet的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、版面矫正预测模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
* 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的[高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)和PicoDet的[高效率版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型[UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
#### 🔥 2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案:
- 赛题一OCR 端到端识别任务冠军方案——[场景文本识别算法-SVTRv2](https://paddlepaddle.github.io/PaddleOCR/latest/algorithm/text_recognition/algorithm_rec_svtrv2.html)
- 赛题二:通用表格识别任务冠军方案——[表格识别算法-SLANet-LCNetV2](https://paddlepaddle.github.io/PaddleOCR/latest/algorithm/table_recognition/algorithm_table_slanet.html)。
#### 2024.6.6 **📚直播和OCR实战打卡营预告**
《PP-ChatOCRv2赋能金融报告信息智能化抽取新金融效率再升级》课程上线破解复杂版面、表格识别、信息抽取OCR解析难题直播时间6月6日周四1900。并于6月11日启动【政务采购合同信息抽取】实战打卡营。报名链接<https://www.wjx.top/vm/eBcYmqO.aspx?udsid=197406>
#### **🔥2024.5.10 上线星河零代码产线(OCR 相关)**

View File

@ -256,7 +256,7 @@ nav:
- Home: index.md
- 快速开始: quick_start.md
- 近期更新: update.md
- 一站式全流程开发:
- 低代码全流程开发:
- 概述: paddlex/overview.md
- 快速开始: paddlex/quick_start.md
- 模型: