DeniJsonC / WaveNet

[PG 2023] WaveNet: Wave-Aware Image Enhancement
Other
78 stars 14 forks source link

训练报错及断点续训 #14

Closed Solitude1024 closed 3 months ago

Solitude1024 commented 3 months ago

作者你好,我最近几天对WaveNet进行训练,出现了一些问题,未能解决,特来请教 1.训练报错 423941dd908d0397dc48229a6539b2b9 053f010961adb3383aefaf344ba5cd29 在两次训练中均出现此问题(都在第979个epoch) 2.在出现问题1后,尝试了手动和自动断点续训两种方法 45e171db6cdc6c13540da8395924b8ba 是文件名引起的bug吗?

DeniJsonC commented 3 months ago

作者你好,我最近几天对WaveNet进行训练,出现了一些问题,未能解决,特来请教 1.训练报错 423941dd908d0397dc48229a6539b2b9 053f010961adb3383aefaf344ba5cd29 在两次训练中均出现此问题(都在第979个epoch) 2.在出现问题1后,尝试了手动和自动断点续训两种方法 45e171db6cdc6c13540da8395924b8ba 是文件名引起的bug吗?

你好,A1:建议你检查训练的epoch 和学习率,还有scheduler的设置是否正确 A2:配置文件resume_state这项设置成"resume_state:~",如果你要手动加载指定state,可以在train.py 178行手动指定“max_state_file='xxx.state'”,报错是因为 train.py默认是加载最新的"迭代次数.state"文件,所以是int类型,如:'5000.state'。

Solitude1024 commented 3 months ago

好的,感谢  

鉁惜ღ壅有 @.***

 

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2024年6月3日(星期一) 上午10:29 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [DeniJsonC/WaveNet] 训练报错及断点续训 (Issue #14)

作者你好,我最近几天对WaveNet进行训练,出现了一些问题,未能解决,特来请教 1.训练报错 在两次训练中均出现此问题(都在第979个epoch) 2.在出现问题1后,尝试了手动和自动断点续训两种方法 是文件名引起的bug吗?

你好,A1:建议你检查训练的epoch 和学习率,还有scheduler的设置是否正确 A2:配置文件resume_state这项设置成"resume_state:~",如果你要手动加载指定state,可以在train.py 178行手动指定“max_state_file='xxx.state'”,报错是因为 train.py默认是加载最新的"迭代次数.state"文件,所以是int类型,如:'5000.state'。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>