PaddleOCR/ppstructure/pdf2word
jzhang533 ddaa85ddaf
Prepare 2.7.3 release (#11826)
* fix: Correct misuse of `try_import` from `paddle.utils` (#11820)

This commit addresses the incorrect usage of the `try_import` function from `paddle.utils` in both `ppocr/utils/utility.py` and `ppstructure/pdf2word/pdf2word.py`.

* bump version to 2.7.3

---------

Co-authored-by: NeterOster <neteroster@gmail.com>
2024-03-28 11:43:15 +08:00
..
icons Add pdf2word exe 2022-08-24 16:34:36 +08:00
README.md Update README.md 2023-12-11 11:41:57 +08:00
pdf2word.py Prepare 2.7.3 release (#11826) 2024-03-28 11:43:15 +08:00

README.md

PDF2WORD

PDF2Word是PaddleOCR社区开发者 whjdark 基于PP-StructureV2版面分析与恢复模型实现的PDF转换Word应用程序提供可直接安装的exe应用程序方便Windows用户免环境配置运行

1.使用

应用程序

  1. 下载与安装针对Windows用户根据软件下载一节下载软件后运行 pdf2word.exe 。若您下载的是lite版本安装过程中会在线下载环境依赖、模型等必要资源安装时间较长请确保网络畅通。serve版本打包了相关依赖安装时间较短可按需下载。

  2. 转换由于PP-Structure根据中英文数据分别进行适配在转换相应文件时可根据文档语言进行相应选择

脚本运行

  1. 打开结果:点击显示结果,即可打开转换完成后的文件夹

注意:

  • 初次安装程序根据不同设备需要等待1-2分钟不等
  • 使用Office与WPS打开的Word结果会出现不同推荐以Office为准
  • 本程序使用 QPT 进行应用程序打包,感谢 GT-ZhangAcer 对打包过程的支持
  • 应用程序仅支持正版win1011系统不支持盗版Windows系统若在安装过程中出现报错或缺少依赖推荐直接使用 paddleocr whl包应用PDF2Word功能详情可查看链接

脚本启动界面

首次运行需要将切换路径到PaddleOCR文件目录 ,然后运行代码

cd ./ppstructure/pdf2word
python pdf2word.py

PaddleOCR whl包

针对Linux、Mac用户或已经拥有Python环境的用户推荐安装 paddleocr whl包直接应用PDF2Word功能,详情可查看链接

2.软件下载

如需获取已打包程序,可以扫描下方二维码或者点击链接 进入AI Studio【PaddleX社区频道】免费获取20G OCR学习大礼包内含OCR场景应用集合包含数码管、液晶屏、车牌、高精度SVTR模型等7个垂类模型、《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料

飞桨AI套件【PaddleX】社区频道二维码

3.版本说明

v0.2版新加入PDF解析功能仅提供full版本打包了所有依赖包与模型文件尽可能避免安装失败问题。若仍然安装失败推荐使用 paddleocr whl包