Open Yikai-Liao opened 1 year ago
可以先把Nan过滤加上
如果按照你的需求,你直接设置stateful_metrics=['loss', 'pos', 'pitch']等等就可以了啊,这个时候进度条只是显示当前batch的loss,后续不会再显示nan了,而且感觉loss出现nan也是不太正常的
这里出现Nan的原因还我没搞清楚。但是我记得有一种情况是,amp混合精度的scale会引起Nan,然后它会自动跳过这次更新,并调整scale,不影响后续训练。
安装bert4torch==0.3.3, 可以通过设置os.environ['IGNORE_NAN_VALUES'] = 'true'
来跳过nan的指标显示
基本信息
问题反馈
当loss 出现一次Nan之后,即使后续没有Nan, 进度条也会因为平滑机制一直显示Nan
根据WandB中的记录,实际上只有一个step出现了Nan
并且进度条中的loss感觉有些平滑过度,希望能与WandB一样,自由选择平滑方式和平滑的程度。
注:训练中开启混合精度