Open Aurora11111 opened 6 years ago
@Aurora11111 您好,请问一下你的10 numbers,10 chinese chars,10 mixed chinese chars and numbers and lower alpha是怎样训练的啊?制作数据集是用的哪个文件,我数据集做好了,但是感觉有问题,你能不能帮我看一下啊,谢谢啦?另外方便留一下您的邮箱或者其他联系方式吗,感激不尽!
@ZJU-PLP refference: https://github.com/Aurora11111/TextRecognitionDataGenerator
@Aurora11111 感谢回复,请问您最后数据集是做成ldmb格式吗?具体是路径--图片名--lable的格式吗?
@ZJU-PLP yes. 生成lmdb的参数需是:图片路径list,标签list 且一一对应
@Aurora11111 我做好数据集后训练时出现了这个问题,请问你有遇到过嘛,在网上查不到这个问题 selection_029
@Aurora11111 这上面写着是python3.x啊
@Aurora11111 谢谢提醒,按照你建议的方法,用Python2.x生成的数据集,但是训练的时候出现了这个问题,请问你训练的时候也是配置的python2.x的环境吗?
只有生成lmdb用的python2.x 你的datasets.py和utils.py也需要参照https://github.com/Aurora11111/crnn-train-pytorch 链接里的改一下
@Aurora11111 好的,非常感谢,目前已经跑通了,开始正常训练了,请问你0~9数字最后的准确率达到了多少呢?迭代了多少个epoch啊?
我的也就一个迭代不到就到1了
@Aurora11111 这么快嘛,我目前跑了14个epoch,arc为0.53,不过数据集做的2W,估计没有你的多
@ZJU-PLP 恩,你的数据集应该弄多一些
@Aurora11111 run demo.py出现这个问题.但是用之前下载的模型跑没问题,你跑的时候有遇到过吗?
@ZJU-PLP 需要修改demo.py中的参数与训练中的参数一致!
@Aurora11111 训练时隐藏层数为128,demo.py中的参数也为128,其他参数都一样啊
@ZJU-PLP 这个问题issue里有:
reference:https://github.com/Aurora11111/crnn-train-pytorch/blob/master/demo.py
@Aurora11111 你说的是这个吧,按这个方法来试过,并没有解决
@Aurora11111 ok,按你最新的代码可以跑通,谢谢!
@Aurora11111 您好,请教您最后有测过其他图片吗?我训练的时候模型显示准确率到了90%多,用测试集的图片去做测试,发现准确率也还OK,我数据集是train(20万)和val(5wan).但是用现实场景中的图片做测试,测试了好几张,完全是错的,请问你有遇到过这个问题嘛?感觉这两张图片也很相似啊,左边是数据集(都是电子字体)中的图片,右边是真实图片截取的一部分,完全检测不出来,放一大张图片就更检测不出来了 检测结果:
请问所有的类别都要用alphabet列出来吗,比如说中文常见字有上千个,那是不是得在设置alphabet参数时将这些都列出来?数目这么多如果都要列出来的话需要用什么方法呢?
你要改里面的font吧
@Aurora11111 Thank you for DataGenerator. Is it possible to change color of fonts?
如果我是要对自然场景下的中文字进行识别,那我生成的数据是不是要尽量与该自然场景下的中文字相似,比如说:背景和字体,if I want to recognize Chineses character in natural scene,should I keep the generated data,like background and fonts,more similar to the data in natural scene?
是的
你好,我用从自然场景下抠下来的文本进行预测,预测出来的标签序列有我的alphabet中不包含的字符,我感觉这个很奇怪,请问你有碰到过这个问题吗
@liuyiyiyiyi 那你要自己做一个dictionary了
请问这个跟dictionary有什么关系
@Aurora11111 请教一下如果我想c++借口调用这个模型 应该怎么做
@HouBiaoLiu 没试过,但是我觉得可以写个C++调用python的接口
@Aurora11111 我遇到了之前 @ZJU-PLP 遇到的那几个问题,我直接用了你的crnn-train-pytorch,但是我对数据集的数据结构表示迷惑。我通过你的getLmdb.py写出的数据list是类似于:
/home/users/Desktop/data/img/IMG_3222.JPG 图片3222文本内容
是这样么?可以给我一个样例么?
@Giggledefy 是的 这是python3与python2的unicode编码问题,你用python2.x调用getlmdb就可以了.其他还是用你python3
@Aurora11111 您好,请教您最后有测过其他图片吗?我训练的时候模型显示准确率到了90%多,用测试集的图片去做测试,发现准确率也还OK,我数据集是train(20万)和val(5wan).但是用现实场景中的图片做测试,测试了好几张,完全是错的,请问你有遇到过这个问题嘛?感觉这两张图片也很相似啊,左边是数据集(都是电子字体)中的图片,右边是真实图片截取的一部分,完全检测不出来,放一大张图片就更检测不出来了 检测结果:
您好,我也碰到了这样的问题,请指点对应的解决办法
@Pratyeka reference :https://github.com/Aurora11111/TextRecognitionDataGenerator
hello,have you tried use more alphabet? I have followed your ways to trianed rcnn model with just 10 numbers,10 chinese chars,10 mixed chinese chars and numbers and lower alpha,these model all perform well.but,when I try to trained a 5000 alphabet model ,the loss can't converge,it's about 75,do you know how to solve it?