使用作者的pytorch-train/crnn.main.py训练，accuracy一直为0

yyyyykp commented 3 years ago

使用作者的数据集源代码训练的，使用的环境配置为：python3.6+pytorch1.3 中间调了三个bug

由于在'cpu_texts = [clean_txt(tx.decode('utf-8')) for tx in cpu_texts]'这句时会报错str没有decode的方法，查询资料后感觉是python2和python3的区别，便把代码改成了'cpu_texts = [clean_txt(tx.encode('utf-8').decode('utf-8')) for tx in cpu_texts]'；
在clean_texts函数中，作者是将在字典中找不到的字用空格代替了，但是这样在查询时会报错误，因此将该函数中的newTxt += u' '改成了newTxt += u''，即直接去掉了找不到的字；
由于预测出来的preds在后续处理中会报错：IndexError: Dimension out of range (expected to be in range of [-2, 1], but got 2)，因此将‘preds = preds.squeeze(2)’这句代码删除了；不知道是我修改的代码导致特征的维度发生了问题还是什么，模型训练过程中得到的accuracy一直为0，有没有大佬可以帮忙解答一下~感激不尽！ https://imgtu.com/i/hy8weP

yyyyykp commented 3 years ago

作者放的训练数据集 data/lmdb/train 数据有200条，val是72条，不知道是不是因为数据量太小了，导致网络学不起来-_-

yyyyykp commented 3 years ago

终于发现了一个问题 CHINESE-OCR/train/pytorch-train/crnn_main.py Line 271 应该是 optimizer.zero_grad() 啊~

xiaofengShi / CHINESE-OCR