Sierkinhane / CRNN_Chinese_Characters_Rec

(CRNN) Chinese Characters Recognition.
1.81k stars 537 forks source link

关于训练LOSS出现NAN的情况 #281

Open ingale726 opened 3 years ago

ingale726 commented 3 years ago

使用pytorch自带的CTCLOSS,pytorh版本1.7.1,训练自己的数据集,出现了NAN,将训练集中标签长度大于40的剔除,并删除对应的图片后,训练正常,没有出现NAN 使用第三方CTCLOSS也可以解决NAN的情况 https://github.com/SeanNaren/warp-ctc 我用的这个,没有出现NAN,但是GIT主的预处理模型似乎没用了,LOSS很大,不如用自带的LOSS配合GIT主的预处理模型,LOSS下降的快

ingale726 commented 3 years ago

至于GIT主说的用pytorch1.2版本训练没有出现NAN,我猜应该是GIT主的训练集里没有字数特别多的图片和标签,比如说字数大于40个,应该pytorch各个版本都有这样的问题

arnozeng commented 3 years ago

你是pytorh版本1.7.1下安装了第三方CTCLOSS的吗? 我在1.6版面下安装不成功第三方CTCLOSS, 提示ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 运行python setup install, 报的错误

ingale726 commented 3 years ago

你是pytorh版本1.7.1下安装了第三方CTCLOSS的吗? 我在1.6版面下安装不成功第三方CTCLOSS, 提示ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 运行python setup install, 报的错误

百度一下就找到答案了 https://blog.csdn.net/ShuqiaoS/article/details/88420326 网上有安装第三方CTCLOSS的博客,就是安装过程是坑较多,多看看issues

ingale726 commented 3 years ago

你是pytorh版本1.7.1下安装了第三方CTCLOSS的吗? 我在1.6版面下安装不成功第三方CTCLOSS, 提示ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead. 运行python setup install, 报的错误

https://blog.csdn.net/xiao13mm/article/details/112426460