Open UDshadow opened 3 years ago
@UDshadow ,是否方便将识别错误的原始图片发给我们呢?
欢迎您反馈PaddleHub使用问题,非常感谢您对PaddleHub的贡献! 在留下您的问题时,辛苦您同步提供如下信息:
- 版本、环境信息 1)PaddleHub2.1 2)Windows,python3.7.3 3)Module: chinese_ocr_db_crnn_mobile, chinese_ocr_db_crnn_server
- Module parameters: results = ocr.recognize_text( images=np_images, # 图片数据,ndarray.shape 为 [H, W, C],BGR格式; use_gpu=False, # 是否使用 GPU;若使用GPU,请先设置CUDA_VISIBLE_DEVICES环境变量 output_dir='ocr_result', # 图片的保存路径,默认设为 ocr_result; visualization=False, # 是否将识别结果保存为图片文件; box_thresh=0.5, # 检测文本框置信度的阈值; text_thresh=0.5) # 识别中文文本置信度的阈值;
- 复现信息:直接使用上述预训练模型识别中文文本时, 经常将“贮” 识别为 “购”。
这个可能是因为模型训练的时候见到数据中购的词频远高于贮,建议(1)MLP后处理,(2)使用PaddleOCR项目在自己的数据集下重新训一下
谢谢Daniel的建议,出问题的例子如下。因为文件保密的原因,只截取一小部分供参考。 [cid:c44d7814-732f-4a68-bbe0-0cba3c7f343a]
From: wuzewu @.> Sent: Monday, June 28, 2021 4:28 PM To: PaddlePaddle/PaddleHub @.> Cc: Ray @.>; Mention @.> Subject: Re: [PaddlePaddle/PaddleHub] OCR chinese_ocr_db_crnn_mobile Bug (#1495)
@UDshadowhttps://github.com/UDshadow ,是否方便将识别错误的原始图片发给我们呢?
― You are receiving this because you were mentioned. Reply to this email directly, view it on GitHubhttps://github.com/PaddlePaddle/PaddleHub/issues/1495#issuecomment-869483936, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AJQBJGLMX7R4YIGY73QQMATTVAXELANCNFSM47HFA43Q.
欢迎您反馈PaddleHub使用问题,非常感谢您对PaddleHub的贡献! 在留下您的问题时,辛苦您同步提供如下信息:
版本、环境信息 1)PaddleHub2.1 2)Windows,python3.7.3 3)Module: chinese_ocr_db_crnn_mobile, chinese_ocr_db_crnn_server 4) Module parameters: results = ocr.recognize_text( images=np_images, # 图片数据,ndarray.shape 为 [H, W, C],BGR格式; use_gpu=False, # 是否使用 GPU;若使用GPU,请先设置CUDA_VISIBLE_DEVICES环境变量 output_dir='ocr_result', # 图片的保存路径,默认设为 ocr_result; visualization=False, # 是否将识别结果保存为图片文件; box_thresh=0.5, # 检测文本框置信度的阈值; text_thresh=0.5) # 识别中文文本置信度的阈值;
复现信息:直接使用上述预训练模型识别中文文本时, 经常将“贮” 识别为 “购”。