MaybeShewill-CV / CRNN_Tensorflow

Convolutional Recurrent Neural Networks(CRNN) for Scene Text Recognition
MIT License
1.03k stars 388 forks source link

用自己的数据运行train以后 程序被killed 并非代码报错会是什么原因呢 #348

Closed GreenTree1990 closed 5 years ago

MaybeShewill-CV commented 5 years ago

@GreenTree1990 可能是tensorflow安装的问题吧:)

GreenTree1990 commented 5 years ago

感谢! 但我装的也是tensorflow1.12.0 而且tfrecords也跑完了

是运行第一个epoch的时候 到trainshadownet的这一句 进程就被killed了 , train_ctc_loss_value, merge_summary_value = sess.run( [optimizer, train_ctc_loss, merge_summary_op])

和机器或是gpu的内存有没有关系呢?

MaybeShewill-CV commented 5 years ago

@GreenTree1990 如果是显存问题应该是OOM 一般不会被直接kill掉:)

LJXLJXLJX commented 5 years ago

被kill是因为内存占用过多,我也遇到了这个问题,不知道该怎么解决。

GreenTree1990 commented 5 years ago

@LJXLJXLJX 我后来解决了 发现我这里被kill不是因为内存问题 而是我装的cudnn版本不太对,一定要参照tensorflow推荐的版本安装,你可以再检查一下定位一下问题