MhLiao / DB

A PyTorch implementation of "Real-time Scene Text Detection with Differentiable Binarization".
2.11k stars 480 forks source link

recall in mlt dataset trainingis lower than paper #196

Open wendychina opened 4 years ago

wendychina commented 4 years ago

老师您好,我之前用您的代码训练过icdar15的数据集,因为没有使用deformable conv,所以效果比论文上提到的要低一点,大概四个点。然后我用相同的代码和配置ymal文件训练MLT的数据集,但是效果差了很多。论文上提到的precision有83.1,recall67.9.但是我训练之后的模型precision0.857,recall0.512,recall低了10个点。 能帮我看一下问题出在哪里了吗? 训练数据使用了icdar13、icdar15以及mlt的数据 测试数据使用的1800张的MLT验证数据 预训练模型使用的是您提供的MLT_Pretrain_ResNet50. 训练的ymal文件是ic15_resnet50_deform_thre.yaml,唯一修改的是backbone:resnet50 训练到第337轮,显示的loss为0.77686 测试的命令如下: CUDA_VISIBLE_DEVICES=2 python eval.py experiments/seg_detector/mlt_resnet50.yaml --num_gpus 1 --resume /home/DB_pytorch/outputs_ic15/workspace_ic15/DB_pytorch/SegDetectorModel-seg_detector/resnet50/L1BalanceCELoss/real_model/model_epoch_337_minibatch_347602 --box_thresh 0.55

非常期待有训练过MLT的同学或者老师给我提出建议或者参考意见

shaohailin commented 4 years ago

您好!你是怎么设置才可以不使用deformable conv?我需要修改代码的哪一部分才可以不使用deformable conv? @wendychina