PaddleOCR

6.3 KiB

Raw Blame History

comments

typora-copy-images-to

hide

true

images

navigation

toc

简介

PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库，助力开发者训练出更好的模型，并应用落地。

🚀 社区

PaddleOCR 由 PMC 监督。Issues 和 PRs 将在尽力的基础上进行审查。欲了解 PaddlePaddle 社区的完整概况，请访问 community。

⚠️注意：Issues模块仅用来报告程序🐞Bug，其余提问请移步Discussions模块提问。如所提Issue不是Bug，会被移到Discussions模块，敬请谅解。

📣 近期更新

🔥2024.10.1 发布PaddleOCR release/2.9:
- 飞桨一站式全流程开发工具PaddleX，依托于PaddleOCR的先进技术，支持了OCR领域的一站式全流程开发能力：
  - 🎨 模型丰富一键调用：将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的17个模型整合为5条模型产线，通过极简的Python API一键调用，快速体验模型效果。此外，同一套API，也支持图像分类、目标检测、图像分割、时序预测等共计200+模型，形成20+单功能模块，方便开发者进行模型组合使用。
  - 🚀提高效率降低门槛：提供基于统一命令和图形界面两种方式，实现模型简洁高效的使用、组合与定制。支持高性能部署、服务化部署和端侧部署等多种部署方式。此外，对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等，进行模型开发时，都可以无缝切换。
- 支持文档场景信息抽取v3(PP-ChatOCRv3)、基于RT-DETR和PicoDet的高精度版面区域检测模型、高精度表格结构识别模型SLANet_Plus、版面矫正预测模型UVDoc、公式识别模型LatexOCR、基于PP-LCNet的文档图像方向分类模型
🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案：
- 赛题一：OCR 端到端识别任务冠军方案——场景文本识别算法-SVTRv2；
- 赛题二：通用表格识别任务冠军方案——表格识别算法-SLANet-LCNetV2。