PP-Structure 系列模型列表
1. 版面分析模型
模型名称 |
模型简介 |
下载地址 |
label_map |
ppyolov2_r50vd_dcn_365e_publaynet |
PubLayNet 数据集训练的版面分析模型,可以划分文字、标题、表格、图片以及列表5类区域 |
推理模型 / 训练模型 |
{0: "Text", 1: "Title", 2: "List", 3:"Table", 4:"Figure"} |
ppyolov2_r50vd_dcn_365e_tableBank_word |
TableBank Word 数据集训练的版面分析模型,只能检测表格 |
推理模型 |
{0:"Table"} |
ppyolov2_r50vd_dcn_365e_tableBank_latex |
TableBank Latex 数据集训练的版面分析模型,只能检测表格 |
推理模型 |
{0:"Table"} |
2. OCR和表格识别模型
2.1 OCR
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
en_ppocr_mobile_v2.0_table_det |
PubLayNet数据集训练的英文表格场景的文字检测 |
4.7M |
推理模型 / 训练模型 |
en_ppocr_mobile_v2.0_table_rec |
PubLayNet数据集训练的英文表格场景的文字识别 |
6.9M |
推理模型 / 训练模型 |
如需要使用其他OCR模型,可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir
, rec_model_dir
两个字段即可。
2.2 表格识别模型
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
en_ppocr_mobile_v2.0_table_structure |
基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型 |
18.6M |
推理模型 / 训练模型 |
en_ppstructure_mobile_v2.0_SLANet |
基于SLANet在PubTabNet数据集上训练的英文表格识别模型 |
9M |
推理模型 / 训练模型 |
ch_ppstructure_mobile_v2.0_SLANet |
基于SLANet在PubTabNet数据集上训练的中文表格识别模型 |
9.3M |
推理模型 / 训练模型 |
3. KIE模型
在XFUND_zh数据集上,不同模型的精度与V100 GPU上速度信息如下所示。
模型名称 |
模型简介 |
推理模型大小 |
精度(hmean) |
预测耗时(ms) |
下载地址 |
ser_VI-LayoutXLM_xfund_zh |
基于VI-LayoutXLM在xfund中文数据集上训练的SER模型 |
1.1G |
93.19% |
15.49 |
推理模型 / 训练模型 |
re_VI-LayoutXLM_xfund_zh |
基于VI-LayoutXLM在xfund中文数据集上训练的RE模型 |
1.1G |
83.92% |
15.49 |
推理模型 coming soon / 训练模型 |
ser_LayoutXLM_xfund_zh |
基于LayoutXLM在xfund中文数据集上训练的SER模型 |
1.4G |
90.38% |
19.49 |
推理模型 / 训练模型 |
re_LayoutXLM_xfund_zh |
基于LayoutXLM在xfund中文数据集上训练的RE模型 |
1.4G |
74.83% |
19.49 |
推理模型 coming soon / 训练模型 |
ser_LayoutLMv2_xfund_zh |
基于LayoutLMv2在xfund中文数据集上训练的SER模型 |
778M |
85.44% |
31.46 |
推理模型 / 训练模型 |
re_LayoutLMv2_xfund_zh |
基于LayoutLMv2在xfun中文数据集上训练的RE模型 |
765M |
67.77% |
31.46 |
推理模型 coming soon / 训练模型 |
ser_LayoutLM_xfund_zh |
基于LayoutLM在xfund中文数据集上训练的SER模型 |
430M |
77.31% |
- |
推理模型 / 训练模型 |
- 注:上述预测耗时信息仅包含了inference模型的推理耗时,没有统计预处理与后处理耗时,测试环境为
V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4
。
在wildreceipt数据集上,SDMGR模型精度与下载地址如下所示。
模型名称 |
模型简介 |
模型大小 |
精度 |
下载地址 |
SDMGR |
关键信息提取模型 |
78M |
86.70% |
推理模型 coming soon / 训练模型 |