Open eragonruan opened 6 years ago
mark
博主复现了他们的结果吗?看到博主做了一些改进,问下会有论文或者arxiv么
@argman 模型基本能复现,但是文章有一部分没讲清楚或者说是我没理解吧(主要是真值的标定那部分),除开这部分,测试部分也没有按照文章里提的,用sliding windows的策略,当时直接整图测试的,其他完全按照文章的话离文章里的结果还是有差距的。F-measure可能差了10个点吧。论文暂时没有
直接回归的方法 ,对于长文本行,是乏力的吧,博主有没有测试过?
对的,对尺度比较敏感
EAST和这篇论文思路简直就是一模一样的。。。
我最近在复现这篇论文,想请教一下博主对真值标定的具体形式,特别是回归的标注这部分的理解。另外博主有没有已复现的程序放在github上,想学习一下
@ZhuanDJ 回归这部分我的理解是每个像素点都预测8个距离,分别是距离左上,右上,右下,左下文本角点的水平位移和竖直位移。就是直接回归。
http://slade-ruan.me/2017/10/24/text-detection-ddr/