Closed yangsuxia closed 1 week ago
单独使用6000w条基础数据训练模型没有问题,单独使用1200w条新增数据训练模型没有问题,但是将这些数据合在一起之后训练的模型loss值很高,看音频后验,全部都是空的,可能会是什么问题呢?
Try reducing learning rate to 1/2, or increasing accum_grad to twice from current configuration.
单独使用6000w条基础数据训练模型没有问题,单独使用1200w条新增数据训练模型没有问题,但是将这些数据合在一起之后训练的模型loss值很高,看音频后验,全部都是空的,可能会是什么问题呢?