---
comments: true
---
# 表格单元格检测模块使用教程
## 一、概述
表格单元格检测模块是表格识别任务的关键组成部分,负责在表格图像中定位和标记每个单元格区域,该模块的性能直接影响到整个表格识别过程的准确性和效率。表格单元格检测模块通常会输出各个单元格区域的边界框(Bounding Boxes),这些边界框将作为输入传递给表格识别相关产线进行后续处理。
## 二、支持模型列表
参数 |
参数说明 |
参数类型 |
可选项 |
默认值 |
model_name |
模型名称 |
str |
无 |
无 |
model_dir |
模型存储路径 |
str |
无 |
无 |
device |
模型推理设备 |
str |
支持指定GPU具体卡号,如“gpu:0”,其他硬件具体卡号,如“npu:0”,CPU如“cpu”。 |
gpu:0 |
use_hpip |
是否启用高性能推理插件 |
bool |
无 |
False |
hpi_config |
高性能推理配置 |
dict | None |
无 |
None |
img_size |
输入图像大小 |
int/list |
- int, 如 640 , 表示将输入图像resize到640x640大小
- 列表, 如 [640, 512] , 表示将输入图像resize到宽为640,高为512大小
|
无 |
threshold |
用于过滤掉低置信度预测结果的阈值。在表格单元格检测任务中,适当降低阈值可能有助于获得更准确的结果 |
float/dict |
- float,如 0.2, 表示过滤掉所有阈值小于0.2的目标框
- 字典,字典的key为int类型,代表
cls_id ,val为float类型阈值。如 {0: 0.45, 2: 0.48, 7: 0.4} ,表示对cls_id为0的类别应用阈值0.45、cls_id为1的类别应用阈值0.48、cls_id为7的类别应用阈值0.4
|
无 |
* 其中,`model_name` 必须指定,在此基础上,指定 `model_dir` 时,使用用户自定义的模型。
* 调用表格单元格检测模型的 `predict()` 方法进行推理预测,该方法会返回一个结果列表。另外,本模块还提供了 `predict_iter()` 方法。两者在参数接受和结果返回方面是完全一致的,区别在于 `predict_iter()` 返回的是一个 `generator`,能够逐步处理和获取预测结果,适合处理大型数据集或希望节省内存的场景。可以根据实际需求选择使用这两种方法中的任意一种。`predict()` 方法参数有 `input`、`batch_size`和`threshold`,具体说明如下: