From 8be51f79e6844e33a4c037a67c89e98e69a00f93 Mon Sep 17 00:00:00 2001
From: openvino-book <180585215@qq.com>
Date: Tue, 20 May 2025 17:40:57 +0800
Subject: [PATCH] Update README.md (#15232)
---
README.md | 72 +++++++++++++------------------------------------------
1 file changed, 16 insertions(+), 56 deletions(-)
diff --git a/README.md b/README.md
index ceeed95ab7..d70d48c2a2 100644
--- a/README.md
+++ b/README.md
@@ -10,10 +10,7 @@
[](https://github.com/PaddlePaddle/PaddleOCR)
-[](./LICENSE)
[](https://pypi.org/project/PaddleOCR/)
-[](https://discord.gg/z9xaRVjdbD)
-[](https://x.com/PaddlePaddle)


@@ -21,19 +18,18 @@
[](https://aistudio.baidu.com/community/app/91660/webUI)
[](https://aistudio.baidu.com/community/app/518494/webUI)
[](https://aistudio.baidu.com/community/app/518493/webUI)
-[](https://huggingface.co/PaddlePaddle)
-[](https://www.modelscope.cn/organization/PaddlePaddle)
+
## 🚀 简介
-PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,例如:Umi-OCR、OmniParser、MinerU、RAGFlow等,已成为广大开发者心中的开源OCR领域的首选工具。2025年5月20日,飞桨团队发布**PaddleOCR 3.0**,全面适配[飞桨框架3.0](https://github.com/PaddlePaddle/Paddle)正式版,进一步**提升文字识别精度**,支持**多文字类型识别**和**手写体识别**,满足大模型应用对**复杂文档高精度解析**的旺盛需求,结合**文心大模型4.5 Turbo**显著提升关键信息抽取精度,并新增**对昆仑芯、昇腾等国产硬件**的支持。
+PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,例如:Umi-OCR、OmniParser、MinerU、RAGFlow等,已成为广大开发者心中的开源OCR领域的首选工具。2025年5月20日,飞桨团队发布**PaddleOCR 3.0**,全面适配**飞桨框架3.0正式版**,进一步**提升文字识别精度**,支持**多文字类型识别**和**手写体识别**,满足大模型应用对**复杂文档高精度解析**的旺盛需求,结合**文心大模型4.5 Turbo**显著提升关键信息抽取精度,并新增**对昆仑芯、昇腾等国产硬件**的支持。
PaddleOCR 3.0**新增**三大特色能力::
- 🖼️全场景文字识别模型[PP-OCRv5](docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md):单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代**提升13个百分点**。
- 🧮通用文档解析方案[PP-StructureV3](docs/version3.x/algorithm/PP-StructureV3/PP-StructureV3.md):支持多场景、多版式 PDF 高精度解析,在公开评测集中**领先众多开源和闭源方案**。
-- 📈智能文档理解方案[PP-ChatOCRv4](docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md):原生支持文心大模型4.5 Turbo,精度相比上一代**提升15.7个百分点**。
+- 📈智能文档理解方案[PP-ChatOCRv4](docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md):原生支持文心大模型4.5 Turbo,精度相比上一代**提升15个百分点**。
PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具,覆盖模型训练、推理和服务化部署,方便开发者快速落地AI应用。
@@ -43,8 +39,6 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
-您可直接[快速开始](#-快速开始),或查阅完整的 [PaddleOCR 文档](https://paddlepaddle.github.io/PaddleOCR/main/index.html),或通过 [Github Issues](https://github.com/PaddlePaddle/PaddleOCR/issues) 获取支持,或在 [AIStudio 课程平台](https://aistudio.baidu.com/course/introduce/25207) 探索我们的 OCR 课程。
-
## 📣 最新动态
🔥🔥2025.05.20: **PaddleOCR 3.0** 正式发布,包含:
@@ -61,9 +55,9 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
- **PP-ChatOCRv4**: 智能文档理解方案
- 1. 🔥 文档文件(PDF/PNG/JPG)关键信息提取精度相比上一代**提升15.7%**!
- 2. 💻 原生支持**文心大模型4.5 Turbo**,还兼容 [PaddleNLP](https://github.com/PaddlePaddle/PaddleNLP)、Ollama、vLLM 等工具部署的大模型。
- 3. 🤝 集成 [PP-DocBee2](https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/ppdocbee),支持印刷文字、手写体文字、印章信息、表格、图表等常见的复杂文档信息抽取和理解的能力。
+ 1. 🔥 文档文件(PDF/PNG/JPG)关键信息提取精度相比上一代**提升15个百分点**!
+ 2. 💻 原生支持**文心大模型4.5 Turbo**,还兼容 PaddleNLP、Ollama、vLLM 等工具部署的大模型。
+ 3. 🤝 集成 [PP-DocBee2](https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/ppdocbee2),支持印刷文字、手写体文字、印章信息、表格、图表等常见的复杂文档信息抽取和理解的能力。
历史更新记录
@@ -84,12 +78,10 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
[](https://aistudio.baidu.com/community/app/91660/webUI)
[](https://aistudio.baidu.com/community/app/518494/webUI)
[](https://aistudio.baidu.com/community/app/518493/webUI)
-[](https://huggingface.co/PaddlePaddle)
-[](https://www.modelscope.cn/organization/PaddlePaddle)
### 2. 本地安装指南
-首先,请参考[PaddlePaddle框架安装指南](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)完成**PaddlePaddle 3.0**的安装。
+首先,请参考[安装指南](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)完成**PaddlePaddle 3.0**的安装。
然后,安装paddleocr
```bash
@@ -99,37 +91,7 @@ pip install paddleocr
paddleocr --version
```
-### 3 🔥 **国产化硬件支持**
-- [昆仑芯安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html)
-- [昇腾安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html)
-
-
- 模型 |
- 昇腾 |
- 昆仑芯 |
- 更多建设中 |
-
-
- PP-OCRv5 |
- ✅ |
- ✅ |
- |
-
-
- PP-StructureV3 |
- ✅ |
- ✅ |
- |
-
-
- PP-ChatOCRv4 |
- ✅ |
- ✅ |
- |
-
-
-
-### 4. 命令行方式推理
+### 3. 命令行方式推理
```bash
# 运行 PP-OCRv5 推理
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png
@@ -143,9 +105,9 @@ paddleocr pp_chatocrv4_doc -i https://paddle-model-ecology.bj.bcebos.com/paddlex
# 查看 "paddleocr ocr" 详细参数
paddleocr ocr --help
```
-### 5. API方式推理
+### 4. API方式推理
-**5.1 PP-OCRv5 示例**
+**4.1 PP-OCRv5 示例**
```python
from paddleocr import PaddleOCR
# 初始化 PaddleOCR 实例
@@ -160,7 +122,7 @@ for res in result:
```
- 5.2 PP-StructureV3 示例
+ 4.2 PP-StructureV3 示例
```python
from pathlib import Path
@@ -211,7 +173,7 @@ for item in markdown_images:
- 5.3 PP-ChatOCRv4 示例
+ 4.3 PP-ChatOCRv4 示例
```python
from paddleocr import PPChatOCRv4Doc
@@ -278,7 +240,10 @@ print(chat_result)
-
+### 5. **国产化硬件支持**
+- [昆仑芯安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_XPU.html)
+- [昇腾安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_NPU.html)
+
## 😃 使用 PaddleOCR 的优秀项目
💗 PaddleOCR 的发展离不开社区贡献!衷心感谢所有开发者、合作伙伴与贡献者!
| 项目名称 | 简介 |
@@ -309,11 +274,6 @@ print(chat_result)
## 👩👩👧👦 开发者社区
-* 👫 加入 [PaddlePaddle 开发者社区](https://github.com/PaddlePaddle/community),与全球开发者、研究人员互动交流
-* 🎓 通过 AI Studio 的 [技术研讨会](https://aistudio.baidu.com/learn/center) 学习前沿技术
-* 🏆 参与 [黑客马拉松](https://aistudio.baidu.com/competition) 展示才能,赢取奖励
-* 📣 关注 [微信公众号](https://mp.weixin.qq.com/s/MAdo7fZ6dfeGcCQUtRP2ag) 获取最新动态
-让我们共同构建 AI 未来!🚀
## 📄 许可协议
本项目采用 [Apache 2.0 协议](./LICENSE) 开源发布。