mirror of
https://github.com/PaddlePaddle/PaddleOCR.git
synced 2025-06-03 21:53:39 +08:00
Update README.md (#15232)
This commit is contained in:
parent
9e57e611e0
commit
8be51f79e6
72
README.md
72
README.md
@ -10,10 +10,7 @@
|
||||
<!-- icon -->
|
||||
|
||||
[](https://github.com/PaddlePaddle/PaddleOCR)
|
||||
[](./LICENSE)
|
||||
[](https://pypi.org/project/PaddleOCR/)
|
||||
[](https://discord.gg/z9xaRVjdbD)
|
||||
[](https://x.com/PaddlePaddle)
|
||||

|
||||

|
||||
|
||||
@ -21,19 +18,18 @@
|
||||
[](https://aistudio.baidu.com/community/app/91660/webUI)
|
||||
[](https://aistudio.baidu.com/community/app/518494/webUI)
|
||||
[](https://aistudio.baidu.com/community/app/518493/webUI)
|
||||
[](https://huggingface.co/PaddlePaddle)
|
||||
[](https://www.modelscope.cn/organization/PaddlePaddle)
|
||||
|
||||
|
||||
</div>
|
||||
<br>
|
||||
|
||||
## 🚀 简介
|
||||
PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,例如:Umi-OCR、OmniParser、MinerU、RAGFlow等,已成为广大开发者心中的开源OCR领域的首选工具。2025年5月20日,飞桨团队发布**PaddleOCR 3.0**,全面适配[飞桨框架3.0](https://github.com/PaddlePaddle/Paddle)正式版,进一步**提升文字识别精度**,支持**多文字类型识别**和**手写体识别**,满足大模型应用对**复杂文档高精度解析**的旺盛需求,结合**文心大模型4.5 Turbo**显著提升关键信息抽取精度,并新增**对昆仑芯、昇腾等国产硬件**的支持。
|
||||
PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,例如:Umi-OCR、OmniParser、MinerU、RAGFlow等,已成为广大开发者心中的开源OCR领域的首选工具。2025年5月20日,飞桨团队发布**PaddleOCR 3.0**,全面适配**飞桨框架3.0正式版**,进一步**提升文字识别精度**,支持**多文字类型识别**和**手写体识别**,满足大模型应用对**复杂文档高精度解析**的旺盛需求,结合**文心大模型4.5 Turbo**显著提升关键信息抽取精度,并新增**对昆仑芯、昇腾等国产硬件**的支持。
|
||||
|
||||
PaddleOCR 3.0**新增**三大特色能力::
|
||||
- 🖼️全场景文字识别模型[PP-OCRv5](docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md):单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代**提升13个百分点**。
|
||||
- 🧮通用文档解析方案[PP-StructureV3](docs/version3.x/algorithm/PP-StructureV3/PP-StructureV3.md):支持多场景、多版式 PDF 高精度解析,在公开评测集中**领先众多开源和闭源方案**。
|
||||
- 📈智能文档理解方案[PP-ChatOCRv4](docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md):原生支持文心大模型4.5 Turbo,精度相比上一代**提升15.7个百分点**。
|
||||
- 📈智能文档理解方案[PP-ChatOCRv4](docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md):原生支持文心大模型4.5 Turbo,精度相比上一代**提升15个百分点**。
|
||||
|
||||
PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具,覆盖模型训练、推理和服务化部署,方便开发者快速落地AI应用。
|
||||
<div align="center">
|
||||
@ -43,8 +39,6 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
|
||||
</p>
|
||||
</div>
|
||||
|
||||
您可直接[快速开始](#-快速开始),或查阅完整的 [PaddleOCR 文档](https://paddlepaddle.github.io/PaddleOCR/main/index.html),或通过 [Github Issues](https://github.com/PaddlePaddle/PaddleOCR/issues) 获取支持,或在 [AIStudio 课程平台](https://aistudio.baidu.com/course/introduce/25207) 探索我们的 OCR 课程。
|
||||
|
||||
|
||||
## 📣 最新动态
|
||||
🔥🔥2025.05.20: **PaddleOCR 3.0** 正式发布,包含:
|
||||
@ -61,9 +55,9 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
|
||||
|
||||
|
||||
- **PP-ChatOCRv4**: 智能文档理解方案
|
||||
1. 🔥 文档文件(PDF/PNG/JPG)关键信息提取精度相比上一代**提升15.7%**!
|
||||
2. 💻 原生支持**文心大模型4.5 Turbo**,还兼容 [PaddleNLP](https://github.com/PaddlePaddle/PaddleNLP)、Ollama、vLLM 等工具部署的大模型。
|
||||
3. 🤝 集成 [PP-DocBee2](https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/ppdocbee),支持印刷文字、手写体文字、印章信息、表格、图表等常见的复杂文档信息抽取和理解的能力。
|
||||
1. 🔥 文档文件(PDF/PNG/JPG)关键信息提取精度相比上一代**提升15个百分点**!
|
||||
2. 💻 原生支持**文心大模型4.5 Turbo**,还兼容 PaddleNLP、Ollama、vLLM 等工具部署的大模型。
|
||||
3. 🤝 集成 [PP-DocBee2](https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/ppdocbee2),支持印刷文字、手写体文字、印章信息、表格、图表等常见的复杂文档信息抽取和理解的能力。
|
||||
|
||||
<details>
|
||||
<summary><strong>历史更新记录</strong></summary>
|
||||
@ -84,12 +78,10 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
|
||||
[](https://aistudio.baidu.com/community/app/91660/webUI)
|
||||
[](https://aistudio.baidu.com/community/app/518494/webUI)
|
||||
[](https://aistudio.baidu.com/community/app/518493/webUI)
|
||||
[](https://huggingface.co/PaddlePaddle)
|
||||
[](https://www.modelscope.cn/organization/PaddlePaddle)
|
||||
|
||||
### 2. 本地安装指南
|
||||
|
||||
首先,请参考[PaddlePaddle框架安装指南](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)完成**PaddlePaddle 3.0**的安装。
|
||||
首先,请参考[安装指南](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)完成**PaddlePaddle 3.0**的安装。
|
||||
|
||||
然后,安装paddleocr
|
||||
```bash
|
||||
@ -99,37 +91,7 @@ pip install paddleocr
|
||||
paddleocr --version
|
||||
```
|
||||
|
||||
### 3 🔥 **国产化硬件支持**
|
||||
- [昆仑芯安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html)
|
||||
- [昇腾安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html)
|
||||
<table>
|
||||
<tr>
|
||||
<th>模型 </th>
|
||||
<th>昇腾 </th>
|
||||
<th>昆仑芯 </th>
|
||||
<th>更多建设中 </th>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>PP-OCRv5</td>
|
||||
<td>✅</td>
|
||||
<td>✅</td>
|
||||
<td> </td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>PP-StructureV3</td>
|
||||
<td>✅</td>
|
||||
<td>✅</td>
|
||||
<td> </td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>PP-ChatOCRv4</td>
|
||||
<td>✅</td>
|
||||
<td>✅</td>
|
||||
<td> </td>
|
||||
</tr>
|
||||
</table>
|
||||
|
||||
### 4. 命令行方式推理
|
||||
### 3. 命令行方式推理
|
||||
```bash
|
||||
# 运行 PP-OCRv5 推理
|
||||
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_002.png
|
||||
@ -143,9 +105,9 @@ paddleocr pp_chatocrv4_doc -i https://paddle-model-ecology.bj.bcebos.com/paddlex
|
||||
# 查看 "paddleocr ocr" 详细参数
|
||||
paddleocr ocr --help
|
||||
```
|
||||
### 5. API方式推理
|
||||
### 4. API方式推理
|
||||
|
||||
**5.1 PP-OCRv5 示例**
|
||||
**4.1 PP-OCRv5 示例**
|
||||
```python
|
||||
from paddleocr import PaddleOCR
|
||||
# 初始化 PaddleOCR 实例
|
||||
@ -160,7 +122,7 @@ for res in result:
|
||||
```
|
||||
|
||||
<details>
|
||||
<summary><strong>5.2 PP-StructureV3 示例</strong></summary>
|
||||
<summary><strong>4.2 PP-StructureV3 示例</strong></summary>
|
||||
|
||||
```python
|
||||
from pathlib import Path
|
||||
@ -211,7 +173,7 @@ for item in markdown_images:
|
||||
|
||||
|
||||
<details>
|
||||
<summary><strong>5.3 PP-ChatOCRv4 示例</strong></summary>
|
||||
<summary><strong>4.3 PP-ChatOCRv4 示例</strong></summary>
|
||||
|
||||
```python
|
||||
from paddleocr import PPChatOCRv4Doc
|
||||
@ -278,7 +240,10 @@ print(chat_result)
|
||||
|
||||
</details>
|
||||
|
||||
|
||||
### 5. **国产化硬件支持**
|
||||
- [昆仑芯安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_XPU.html)
|
||||
- [昇腾安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_NPU.html)
|
||||
|
||||
## 😃 使用 PaddleOCR 的优秀项目
|
||||
💗 PaddleOCR 的发展离不开社区贡献!衷心感谢所有开发者、合作伙伴与贡献者!
|
||||
| 项目名称 | 简介 |
|
||||
@ -309,11 +274,6 @@ print(chat_result)
|
||||
</div>
|
||||
|
||||
## 👩👩👧👦 开发者社区
|
||||
* 👫 加入 [PaddlePaddle 开发者社区](https://github.com/PaddlePaddle/community),与全球开发者、研究人员互动交流
|
||||
* 🎓 通过 AI Studio 的 [技术研讨会](https://aistudio.baidu.com/learn/center) 学习前沿技术
|
||||
* 🏆 参与 [黑客马拉松](https://aistudio.baidu.com/competition) 展示才能,赢取奖励
|
||||
* 📣 关注 [微信公众号](https://mp.weixin.qq.com/s/MAdo7fZ6dfeGcCQUtRP2ag) 获取最新动态
|
||||
让我们共同构建 AI 未来!🚀
|
||||
|
||||
## 📄 许可协议
|
||||
本项目采用 [Apache 2.0 协议](./LICENSE) 开源发布。
|
||||
|
Loading…
x
Reference in New Issue
Block a user