how about 5000 alphabet?

Aurora11111 commented 6 years ago

hello,have you tried use more alphabet? I have followed your ways to trianed rcnn model with just 10 numbers,10 chinese chars,10 mixed chinese chars and numbers and lower alpha,these model all perform well.but,when I try to trained a 5000 alphabet model ,the loss can't converge,it's about 75,do you know how to solve it?

ZJU-PLP commented 6 years ago

@Aurora11111 您好,请问一下你的10 numbers,10 chinese chars,10 mixed chinese chars and numbers and lower alpha是怎样训练的啊?制作数据集是用的哪个文件,我数据集做好了,但是感觉有问题,你能不能帮我看一下啊,谢谢啦?另外方便留一下您的邮箱或者其他联系方式吗,感激不尽!

Aurora11111 commented 6 years ago

@ZJU-PLP refference: https://github.com/Aurora11111/TextRecognitionDataGenerator

ZJU-PLP commented 6 years ago

@Aurora11111 感谢回复,请问您最后数据集是做成ldmb格式吗?具体是路径--图片名--lable的格式吗?

Aurora11111 commented 6 years ago

@ZJU-PLP yes. 生成lmdb的参数需是:图片路径list,标签list 且一一对应

ZJU-PLP commented 6 years ago

@Aurora11111 我做好数据集后训练时出现了这个问题,请问你有遇到过嘛,在网上查不到这个问题 selection_029

ZJU-PLP commented 6 years ago

@Aurora11111 这上面写着是python3.x啊 selection_030

ZJU-PLP commented 6 years ago

@Aurora11111 谢谢提醒,按照你建议的方法,用Python2.x生成的数据集,但是训练的时候出现了这个问题,请问你训练的时候也是配置的python2.x的环境吗?

Aurora11111 commented 6 years ago

只有生成lmdb用的python2.x 你的datasets.py和utils.py也需要参照https://github.com/Aurora11111/crnn-train-pytorch 链接里的改一下

ZJU-PLP commented 6 years ago

@Aurora11111 好的,非常感谢,目前已经跑通了,开始正常训练了,请问你0~9数字最后的准确率达到了多少呢?迭代了多少个epoch啊?

Aurora11111 commented 6 years ago

我的也就一个迭代不到就到1了

ZJU-PLP commented 6 years ago

@Aurora11111 这么快嘛,我目前跑了14个epoch,arc为0.53,不过数据集做的2W,估计没有你的多

Aurora11111 commented 6 years ago

@ZJU-PLP 恩,你的数据集应该弄多一些

ZJU-PLP commented 6 years ago

@Aurora11111 run demo.py出现这个问题.但是用之前下载的模型跑没问题,你跑的时候有遇到过吗?

Aurora11111 commented 6 years ago

@ZJU-PLP 需要修改demo.py中的参数与训练中的参数一致!

ZJU-PLP commented 6 years ago

@Aurora11111 训练时隐藏层数为128,demo.py中的参数也为128,其他参数都一样啊

Aurora11111 commented 6 years ago

@ZJU-PLP 这个问题issue里有:

reference:https://github.com/Aurora11111/crnn-train-pytorch/blob/master/demo.py

ZJU-PLP commented 6 years ago

@Aurora11111 你说的是这个吧,按这个方法来试过,并没有解决

ZJU-PLP commented 6 years ago

@Aurora11111 ok,按你最新的代码可以跑通,谢谢!

ZJU-PLP commented 6 years ago

@Aurora11111 您好,请教您最后有测过其他图片吗?我训练的时候模型显示准确率到了90%多,用测试集的图片去做测试,发现准确率也还OK,我数据集是train(20万)和val(5wan).但是用现实场景中的图片做测试,测试了好几张,完全是错的,请问你有遇到过这个问题嘛?感觉这两张图片也很相似啊,左边是数据集(都是电子字体)中的图片,右边是真实图片截取的一部分,完全检测不出来,放一大张图片就更检测不出来了检测结果:

liuyiyiyiyi commented 6 years ago

请问所有的类别都要用alphabet列出来吗，比如说中文常见字有上千个，那是不是得在设置alphabet参数时将这些都列出来？数目这么多如果都要列出来的话需要用什么方法呢？

Aurora11111 commented 6 years ago

@liuyiyiyiyi 是的，https://github.com/Aurora11111/TextRecognitionDataGenerator/blob/master/TextRecognitionDataGenerator/dicts/cn.txt 这里面修改

liuyiyiyiyi commented 6 years ago

使用你提供的样本自动生成代码，https://github.com/Aurora11111/TextRecognitionDataGenerator，是否可以将字体改成想要的形式，比如说：白色正楷粗体

Aurora11111 commented 6 years ago

你要改里面的font吧

helium390 commented 6 years ago

@Aurora11111 Thank you for DataGenerator. Is it possible to change color of fonts?

liuyiyiyiyi commented 6 years ago

如果我是要对自然场景下的中文字进行识别，那我生成的数据是不是要尽量与该自然场景下的中文字相似，比如说：背景和字体，if I want to recognize Chineses character in natural scene,should I keep the generated data,like background and fonts,more similar to the data in natural scene?

Aurora11111 commented 6 years ago

是的

liuyiyiyiyi commented 6 years ago

你好，我用从自然场景下抠下来的文本进行预测，预测出来的标签序列有我的alphabet中不包含的字符，我感觉这个很奇怪，请问你有碰到过这个问题吗

Aurora11111 commented 6 years ago

@liuyiyiyiyi 那你要自己做一个dictionary了

liuyiyiyiyi commented 6 years ago

请问这个跟dictionary有什么关系

HouBiaoLiu commented 5 years ago

@Aurora11111 请教一下如果我想c++借口调用这个模型应该怎么做

Aurora11111 commented 5 years ago

@HouBiaoLiu 没试过,但是我觉得可以写个C++调用python的接口

Giggledefy commented 5 years ago

@Aurora11111 我遇到了之前 @ZJU-PLP 遇到的那几个问题，我直接用了你的crnn-train-pytorch,但是我对数据集的数据结构表示迷惑。我通过你的getLmdb.py写出的数据list是类似于： /home/users/Desktop/data/img/IMG_3222.JPG 图片3222文本内容 是这样么？可以给我一个样例么？

Aurora11111 commented 5 years ago

@Giggledefy 是的这是python3与python2的unicode编码问题,你用python2.x调用getlmdb就可以了.其他还是用你python3

Pratyeka commented 5 years ago

@Aurora11111 您好,请教您最后有测过其他图片吗?我训练的时候模型显示准确率到了90%多,用测试集的图片去做测试,发现准确率也还OK,我数据集是train(20万)和val(5wan).但是用现实场景中的图片做测试,测试了好几张,完全是错的,请问你有遇到过这个问题嘛?感觉这两张图片也很相似啊,左边是数据集(都是电子字体)中的图片,右边是真实图片截取的一部分,完全检测不出来,放一大张图片就更检测不出来了检测结果:

您好，我也碰到了这样的问题，请指点对应的解决办法

Aurora11111 commented 5 years ago

@Pratyeka reference :https://github.com/Aurora11111/TextRecognitionDataGenerator

meijieru / crnn.pytorch

how about 5000 alphabet? #159