WenmuZhou / PSENet.pytorch

A pytorch re-implementation of PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network
GNU General Public License v3.0
463 stars 138 forks source link

模型在SCUT-CTW1500数据集上的效果怎么样? #36

Closed FanShuixing closed 5 years ago

FanShuixing commented 5 years ago

你好,我想请教下这个代码在scut数据集上的效果怎么样,我用这个代码在icdar15数据集上测试过,效果能达到precision:0.8212,recall:0.7694,hmean:0.7944。 有一点不太明白的是论文中提出psenet可以痛过分割检测出任意形状的文字,但是我在看代码中生成mask的时候,是通过边框的四点坐标将原来的边框整个转换为了mask,是否对于scut数据集有不同的处理方式?(或者是大体都是将边框转换为mask的形式)

WenmuZhou commented 5 years ago

我这个没有支持弯曲的文本,目前只支持四边形这种,不过弯曲的也是把标注转成mask

FanShuixing commented 5 years ago

好的,非常感谢

shaohailin commented 5 years ago

@FanShuixing 你测试的scut数据集结果是多少?在icdar15数据集是多少?

shaohailin commented 4 years ago

我根据作者在config.py里面设置scale=1,在eval.py中设置scale=4运行的结果 图片 效果比你的低很多@FanShuixing ,请问你有没有改过上述scale? precision:0.8212,recall:0.7694,hmean:0.7944。

我改了一下在config.py里面仍设置scale=1,在eval.py中设置scale=1运行的结果 图片 我想问一下为什么作者在config.py里面设置scale=1,在eval.py中设置scale=4? @WenmuZhou

WenmuZhou commented 4 years ago

因为eval中设置scale可以在预测的时候提速,降低一点点精度

shaohailin commented 4 years ago

1.仅仅在config.py里面仍设置scale=2,是不是对应PSE2s ? 其他地方还需要改动吗?

2.我的测试结果与你的相差很大啊 求指点 如何改进提升一下 图片

图片 @WenmuZhou