innnky / so-vits-svc

基于vits与softvc的歌声音色转换模型
GNU Affero General Public License v3.0
3.57k stars 1 forks source link

训练数据大概要多少,对长度要求吗? #164

Open JidaDiao opened 1 year ago

JidaDiao commented 1 year ago

对音频了解不多,请问训练数据集大概需要多少,对长度要求吗?

Misaka17032 commented 1 year ago

一般大概需要2个小时左右的音频,并且每条在5到15秒之间。

NaruseMioShirakana commented 1 year ago

总时长尽量大于半小时(如果实在提不出来数据集也请想办法尽量大于半小时) 每条的长度不宜过长或过短 最好输入较高音质的音频