RVC-Boss / GPT-SoVITS

1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
MIT License
35.82k stars 4.09k forks source link

如何自定义读音,例如AI、BI读音奇怪问题 #1231

Open zhouxuan-home opened 4 months ago

zhouxuan-home commented 4 months ago

tts推理的时候,AI、BI等英文缩写读音很别扭,有开发优化解决的办法吗?

Separatee commented 4 months ago

可以尝试通过谐音解决 或者采用英文逗号例如:

,A,I,
laishujie commented 4 months ago

加了热词的配置,读音还是时好时坏。

KamioRinn commented 4 months ago

最新版本的代码应该不存在这个问题了(主分支下)

jasonzhang761213 commented 4 months ago

最新版本的代码应该不存在这个问题了(主分支下)

试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

Separatee commented 4 months ago

最新版本的代码应该不存在这个问题了(主分支下)

试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

那这就是你的训练数据的时长问题了,增加到10min以上有改善,30min-60min范围内效果最好

jasonzhang761213 commented 4 months ago

最新版本的代码应该不存在这个问题了(主分支下)

试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

那这就是你的训练数据的时长问题了,增加到10min以上有改善,30min-60min范围内效果最好

我用默认的底模和声音库