# 一、PP-ChatOCRV4简介 **PP-ChatOCRv4**是飞桨特色的文档图像智能分析解决方案,结合了 LLM、MLLM 和 OCR 等技术,一站式解决版面分析、生僻字识别、多页 PDF 文件批量解析、复杂表格识别、印章识别等常见的复杂文档信息抽取难点问题,结合文心大模型将海量数据和知识相融合,信息抽取准确率高且应用广泛。本产线同时提供了灵活的服务化部署方式,支持在多种硬件上部署。不仅如此,本产线也提供了二次开发的能力,您可以基于本产线在您自己的数据集上训练调优,训练后的模型也可以无缝集成。
Solution | Avg Recall |
---|---|
GPT-4o | 63.47% |
PP-ChatOCRv3 | 70.08% |
Qwen2.5-VL-72B | 80.26% |
PP-ChatOCRv4 | 85.55% |