Sanster / tf_ctpn

Tensorflow CTPN
MIT License
39 stars 16 forks source link

咨询一下关于mobilenet的训练结果 #3

Open zjchuyp opened 6 years ago

zjchuyp commented 6 years ago

作者您好,您mobilenet v2的模型训练成功了吗?我用您的程序和您提供的数据训练mobilenet,好像没有成功收敛。测试结果也比vgg16要差很多,而且mobilenet v2模型的前向速度比vgg16的模型好像也没快多少,不知是哪儿弄错了。

zjchuyp commented 6 years ago

qq 20180827141729

Sanster commented 6 years ago

是用新的那个数据集吗?在 icdar13 上面跑出来多少? mobilenet v2 我只用 text-detect-ctpn 的数据集练过,不过没在 icdar13 测过。速度上,我在移动端测下来是比 vgg16 快很多的,PC 端都用 gpu 跑的话速度可能是快不了多少

zjchuyp commented 6 years ago

是的,用的是您加了mlt17的数据集,没跑icdar13呢,我只测了十几张自己的证件图像,vgg16的结果很好,而mobilenet很多文字没检测出来。是不是训练了50k轮还不够,我训练训练看看效果。谢谢您回复啊。

Sanster commented 6 years ago

不客气。你有加载 ImageNet pretrain 模型来 fine turning 吗? vgg16 我训练的时候是有的

zjchuyp commented 6 years ago

是finetune的方式的,是根据您readme里讲的train的方法,只是下载

MobileNet_v2_1.4_224^*  

这个模型, 把vgg16相关的改成这个来训练。

Sanster commented 6 years ago

原版的 mobilenet_v2 我记得 total stride 是 32,CTPN 要求是 16,所以我该了下 V2_DEF -> CTPN_DEF,使得 total stride 变成 16,不确定这会不会影响 pretrain model 的加载。

zjchuyp commented 6 years ago

我估计有影响

Nic-Ma commented 5 years ago

Hi @zjchuyp @Sanster

请问现在训练成功MobileNet v2版本了吗? 我在Caffe上尝试训练MobileNet版本的CTPN。 Thanks.

zjchuyp commented 5 years ago

@toxic2m 现在没在搞ctpn了,用了其他的网络结构了

Nic-Ma commented 5 years ago

@zjchuyp 你后面也没搞定把卷积换成MobileNet v2? 请问你现在用的什么网络做文字检测? Thanks.

zhcheng26 commented 5 years ago

Hi @toxic2m 你实现了在caff下的细节训练了吗?我实现过程中一直碰到了问题,想请教下?

Nic-Ma commented 5 years ago

Hi @zhcheng26 VGG的能跑训练了,MobileNet还在搞,我是基于https://github.com/zhouyoulie/ctpn_train

zhcheng26 commented 5 years ago

Hi @toxic2m 正在做MobileNet v2的改善,基于的也是同一个demo训练,结果出来了,但是https://github.com/zhouyoulie/ctpn_train 他其中包含的xside 主要是针对长文本做出的改善吗? 没有深入理解它改善的地方?能简单说说你的理解吗?

zjchuyp commented 5 years ago

@toxic2m yolo3

Nic-Ma commented 5 years ago

@zjchuyp yolo3不太适合做文本检测吧?你测过和CTPN对比准确度、速度吗? Thanks.

Nic-Ma commented 5 years ago

@zhcheng26 Github比较少上,邮件沟通吧:nma@nvidia.com CTPN作者田值博士让我不要用xside,注释掉了。 Thanks.

zjchuyp commented 5 years ago

@toxic2m 用yolo3替换ctpn中的faster-rcnn部分,后处理还是一样。效果很好,速度也飞快。

Sanster commented 5 years ago

@zjchuyp 用 yolo3 训练,训练集的 label 还是从大 box split 出来的小 box?

kasyoukin commented 5 years ago

在用vgg16在预测的时候,速度很不稳定,不知道大家是不是也一样,https://github.com/tensorflow/tensorflow/issues/22369

为了模型能块一点,我也练过resnet101,和 mobilenetv2,但效果都与VGG16有一定的差距,难以实用。

edis219 commented 5 years ago

@zjchuyp yolo3 对于非常小的文字区域 识别怎么样?