From b9272c66d49cf8a5e3016ca53b1c7b067ecae7be Mon Sep 17 00:00:00 2001 From: Bin Lu Date: Tue, 29 Jun 2021 14:35:36 +0800 Subject: [PATCH] Update FAQ.md --- doc/doc_ch/FAQ.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/doc/doc_ch/FAQ.md b/doc/doc_ch/FAQ.md index 588931b08b..5f7bbfd24e 100755 --- a/doc/doc_ch/FAQ.md +++ b/doc/doc_ch/FAQ.md @@ -776,7 +776,7 @@ linux系统共享内存位于/dev/shm目录下,如果内存不足,可以清 **A**: 在线demo目前只支持中英文, 多语言的都需要通过whl包自行处理 #### Q3.1.79: 某个类别的样本比较少,通过增加训练的迭代次数或者是epoch,变相增加小样本的数目,这样能缓解这个问题么? -**A**: 尽量保证类别均衡, 某些类别样本少,可以通过补充合成数据的方式处理;实验证明训练集中出现频次较少的字符,识别效果会很差,增加迭代次数不能改变频率低的问题。 +**A**: 尽量保证类别均衡, 某些类别样本少,可以通过补充合成数据的方式处理;实验证明训练集中出现频次较少的字符,识别效果会比较差,增加迭代次数不能改变样本量少的问题。 #### Q3.1.80: 想把简历上的文字识别出来后,能够把关系一一对应起来,比如姓名和它后面的名字组成一对,籍贯、邮箱、学历等等都和各自的内容关联起来,这个应该如何处理,PPOCR目前支持吗? **A**: 这样的需求在企业应用中确实比较常见,但往往都是个性化的需求,没有非常规整统一的处理方式。常见的处理方式有如下两种: