Closed WangGewu closed 7 months ago
我用aishell1+aishell3重新训练了lamma,top5准确率在90%以上。但在推理时,合成音频的内容与text完全不同,且内容是没有意义的
生成的音频质量还可以,也没有噪音。音色和prompt wav也比较像。就是读的内容很奇怪,没有按照text读,像是在读一段乱码。请问,是不是g2p这里的问题?
数据太少过拟合了
集内合成也不对啊,确认是过拟合吗
我用aishell1+aishell3重新训练了lamma,top5准确率在90%以上。但在推理时,合成音频的内容与text完全不同,且内容是没有意义的