Closed MaxMax2016 closed 2 years ago
歌声合成中,通过midi获得每个发音单元对应的时长和基音,通过时长进行长度归整获得每个语音帧对应的发音单元和基音,两路独立编码然后合并,这不就是PPG+F0的变声方案么?原谅我的英语太差了。
主要差异类似于VC和TTS,信息本身相对精简,而且比较fix,需要一些灵活的调整。不过确实有一些思路可以复用
歌声合成中,通过midi获得每个发音单元对应的时长和基音,通过时长进行长度归整获得每个语音帧对应的发音单元和基音,两路独立编码然后合并,这不就是PPG+F0的变声方案么?原谅我的英语太差了。