eragonruan / eragonruan.github.io

1 stars 3 forks source link

论文阅读与实现--DDR - 阮少辉的博客 | Slade Blog #1

Open eragonruan opened 6 years ago

eragonruan commented 6 years ago

http://slade-ruan.me/2017/10/24/text-detection-ddr/

ilovin commented 6 years ago

mark

argman commented 6 years ago

博主复现了他们的结果吗?看到博主做了一些改进,问下会有论文或者arxiv么

eragonruan commented 6 years ago

@argman 模型基本能复现,但是文章有一部分没讲清楚或者说是我没理解吧(主要是真值的标定那部分),除开这部分,测试部分也没有按照文章里提的,用sliding windows的策略,当时直接整图测试的,其他完全按照文章的话离文章里的结果还是有差距的。F-measure可能差了10个点吧。论文暂时没有

xiaomaxiao commented 6 years ago

直接回归的方法 ,对于长文本行,是乏力的吧,博主有没有测试过?

eragonruan commented 6 years ago

对的,对尺度比较敏感

ihollywhy commented 6 years ago

EAST和这篇论文思路简直就是一模一样的。。。

ZhuanDJ commented 6 years ago

我最近在复现这篇论文,想请教一下博主对真值标定的具体形式,特别是回归的标注这部分的理解。另外博主有没有已复现的程序放在github上,想学习一下

eragonruan commented 6 years ago

@ZhuanDJ 回归这部分我的理解是每个像素点都预测8个距离,分别是距离左上,右上,右下,左下文本角点的水平位移和竖直位移。就是直接回归。