PaddleOCR/ppstructure/pdf2word/README.md

29 lines
1.4 KiB
Markdown
Raw Normal View History

2022-08-24 08:44:43 +08:00
# PDF2WORD
2022-08-24 16:46:25 +08:00
PDF2WORD是PaddleOCR社区开发者[whjdark](https://github.com/whjdark) 基于PP-Structure智能文档分析模型实现的PDF转换Word应用程序提供可直接安装的exe方便windows用户运行
2022-08-24 16:34:36 +08:00
2022-08-24 08:44:43 +08:00
## 1.使用
### 应用程序
1. 下载与安装针对Windows用户根据[软件下载]()一节下载软件后,运行 `pdf2word.exe` 。若您下载的是lite版本安装过程中会在线下载环境依赖、模型等必要资源安装时间较长请确保网络畅通。serve版本打包了相关依赖安装时间较短可按需下载。
2. 转换由于PP-Structure根据中英文数据分别进行适配在转换相应文件时可**根据文档语言进行相应选择**。
### 脚本运行
2022-08-24 16:34:36 +08:00
首次运行需要将切换路径到 `/ppstructure/pdf2word` ,然后运行代码
2022-08-24 08:44:43 +08:00
```
python pdf2word.py
```
2022-08-24 16:46:25 +08:00
## 2.软件下载
2022-08-24 08:44:43 +08:00
如需获取已打包程序可以扫描下方二维码关注公众号填写问卷后加入PaddleOCR官方交流群免费获取20G OCR学习大礼包内含OCR场景应用集合包含数码管、液晶屏、车牌、高精度SVTR模型等7个垂类模型、《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料
2022-08-24 16:34:36 +08:00
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/186369636-35f2008b-df5a-4784-b1f5-cebebcb2b7a5.jpg" width = "150" height = "150" />
</div>