Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
🔎 Search before asking
🐛 Bug (问题描述)
使用今天最新的main代码测试表格识别,使用官方的配置文件:SLANet_ch.yml,预训练模型ch_ppstructure_mobile_v2.0_SLANet_train.tar,进行推理测试时,发现推理的bbox坐标不对 推理命令: python tools/infer_table.py -c configs/table/SLANet_ch.yml -o Global.pretrained_model=./ppmodel/ch_ppstructure_mobile_v2.0_SLANet_train/best_accuracy.pdparams Global.infer_img=./data/table_rec_dataset/images/border_71_DQM5BMO3XYTFPBEX63FO.jpg 推理的结果如图,原图是856143,resize和padding后是488488,但是推理解码后的bbox y居然到了800多: 画出来的图:
而当我修改了bbox解码,直接乘 原图的w和h,居然是对的,但是原来的代码没发现什么错误...
还请各位大佬们帮忙解答一下
🏃♂️ Environment (运行环境)
10.15 github最新PaddleOCR代码
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
python tools/infer_table.py -c configs/table/SLANet_ch.yml -o Global.pretrained_model=./ppmodel/ch_ppstructure_mobile_v2.0_SLANet_train/best_accuracy.pdparams Global.infer_img=./data/table_rec_dataset/images/border_71_DQM5BMO3XYTFPBEX63FO.jpg