Closed mikiihuang closed 1 year ago
标注格式不同 PaddleOCR发布的PP-OCR系列模型的检测识别是以『行』为单位的,icdar的是『word』为单位检测识别的
如果需要在开源数据集上的模型,可以去翻翻文档,比如DRRG的 https://github.com/PaddlePaddle/PaddleOCR/blob/release%2F2.6/doc/doc_ch/algorithm_det_drrg.md
如果需要在开源数据集上的模型,可以去翻翻文档,比如DRRG的 https://github.com/PaddlePaddle/PaddleOCR/blob/release%2F2.6/doc/doc_ch/algorithm_det_drrg.md
请问大佬有没有什么公开的数据集是和PP-OCR系列模型的检测识别使用的一样的标注格式呀?
请问大佬有没有什么公开的数据集是和PP-OCR系列模型的检测识别使用的一样的标注格式呀?
LSVT CTW MTWI 这些都是,句子级别标注的都可以
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem
系统环境/System Environment:bclinux 7.6
版本号/Version:Paddle:release-2.5版本 PaddleOCR: 问题相关组件/Related components:
运行指令/Command Code: python3 tools/eval.py -c configs/det/ch_PP-OCRv2/ch_PP-OCRv2_det_distill.yml -o Global.checkpoints="pretrain_models/ch_PP-OCRv2_det_distill_train/best_accuracy"
完整报错/Complete Error Message: [2023/02/02 08:10:16] ppocr INFO: resume from pretrain_models/ch_PP-OCRv2_det_distill_train/best_accuracy eval model:: 100%|█████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:35<00:00, 14.09it/s] [2023/02/02 08:10:52] ppocr INFO: metric eval *** [2023/02/02 08:10:52] ppocr INFO: precision:0 [2023/02/02 08:10:52] ppocr INFO: recall:0.0 [2023/02/02 08:10:52] ppocr INFO: hmean:0 [2023/02/02 08:10:52] ppocr INFO: fps:15.99793361651514
yml配置文件没有做任何改动,如下:
在icdar2015数据集上做的评估.help!