PP-Structure 系列模型列表
1. LayoutParser 模型
模型名称 |
模型简介 |
下载地址 |
ppyolov2_r50vd_dcn_365e_publaynet |
PubLayNet 数据集训练的版面分析模型,可以划分文字、标题、表格、图片以及列表5类区域 |
PubLayNet |
ppyolov2_r50vd_dcn_365e_tableBank_word |
TableBank Word 数据集训练的版面分析模型,只能检测表格 |
TableBank Word |
ppyolov2_r50vd_dcn_365e_tableBank_latex |
TableBank Latex 数据集训练的版面分析模型,只能检测表格 |
TableBank Latex |
2. OCR和表格识别模型
2.1 OCR
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
en_ppocr_mobile_v2.0_table_det |
PubLayNet数据集训练的英文表格场景的文字检测 |
4.7M |
推理模型 / 训练模型 |
en_ppocr_mobile_v2.0_table_rec |
PubLayNet数据集训练的英文表格场景的文字识别 |
6.9M |
推理模型 / 训练模型 |
如需要使用其他OCR模型,可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir
, rec_model_dir
两个字段即可。
2.2 表格识别模型
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
en_ppocr_mobile_v2.0_table_structure |
PubLayNet数据集训练的英文表格场景的表格结构预测 |
18.6M |
推理模型 / 训练模型 |
3. VQA模型
模型名称 |
模型简介 |
推理模型大小 |
下载地址 |
ser_LayoutXLM_xfun_zh |
基于LayoutXLM在xfun中文数据集上训练的SER模型 |
1.4G |
推理模型 coming soon / 训练模型 |
re_LayoutXLM_xfun_zh |
基于LayoutXLM在xfun中文数据集上训练的RE模型 |
1.4G |
推理模型 coming soon / 训练模型 |
ser_LayoutLMv2_xfun_zh |
基于LayoutLMv2在xfun中文数据集上训练的SER模型 |
778M |
推理模型 coming soon / 训练模型 |
re_LayoutLMv2_xfun_zh |
基于LayoutLMv2在xfun中文数据集上训练的RE模型 |
765M |
推理模型 coming soon / 训练模型 |
ser_LayoutLM_xfun_zh |
基于LayoutLM在xfun中文数据集上训练的SER模型 |
430M |
推理模型 coming soon / 训练模型 |
4. KIE模型
模型名称 |
模型简介 |
模型大小 |
下载地址 |
SDMGR |
关键信息提取模型 |
78M |
推理模型 coming soon / 训练模型 |