Closed bfloat16 closed 1 year ago
如果要自己训练底模
1.数据集是不是最好要做到音域覆盖广,语言类型多,语气语调丰富,男女都要有这类的?
2.训练参数有没有要求(比如batchsize,lr等等 训练是直接将几个开源数据集混合走单人流程训练还是区分speaker走多人流程?
3.评价底模质量是看训练时长,步数,epoch还是看loss值?
主要是想知道diffsvc,sovits这些项目底模的通用训练方法
好的,我去试试看
如果要自己训练底模
1.数据集是不是最好要做到音域覆盖广,语言类型多,语气语调丰富,男女都要有这类的?
2.训练参数有没有要求(比如batchsize,lr等等 训练是直接将几个开源数据集混合走单人流程训练还是区分speaker走多人流程?
3.评价底模质量是看训练时长,步数,epoch还是看loss值?
主要是想知道diffsvc,sovits这些项目底模的通用训练方法