论文阅读与实现--DDR - 阮少辉的博客

eragonruan / eragonruan.github.io

1 stars 3 forks source link

论文阅读与实现--DDR - 阮少辉的博客 | Slade Blog #1

Open eragonruan opened 6 years ago

eragonruan commented 6 years ago

http://slade-ruan.me/2017/10/24/text-detection-ddr/

ilovin commented 6 years ago

mark

argman commented 6 years ago

博主复现了他们的结果吗?看到博主做了一些改进，问下会有论文或者arxiv么

eragonruan commented 6 years ago

@argman 模型基本能复现，但是文章有一部分没讲清楚或者说是我没理解吧（主要是真值的标定那部分），除开这部分，测试部分也没有按照文章里提的，用sliding windows的策略，当时直接整图测试的，其他完全按照文章的话离文章里的结果还是有差距的。F-measure可能差了10个点吧。论文暂时没有

xiaomaxiao commented 6 years ago

直接回归的方法，对于长文本行，是乏力的吧，博主有没有测试过？

eragonruan commented 6 years ago

对的，对尺度比较敏感

ihollywhy commented 6 years ago

EAST和这篇论文思路简直就是一模一样的。。。

ZhuanDJ commented 6 years ago

我最近在复现这篇论文，想请教一下博主对真值标定的具体形式，特别是回归的标注这部分的理解。另外博主有没有已复现的程序放在github上，想学习一下

eragonruan commented 6 years ago

@ZhuanDJ 回归这部分我的理解是每个像素点都预测8个距离，分别是距离左上，右上，右下，左下文本角点的水平位移和竖直位移。就是直接回归。