Open ifreecoding opened 1 year ago
魔塔,貌似有这个数据,但是不确定。
开发可不可以像百度一样,用户只需要提供一百句语音文件,就可以训练出模型。做一个批处理,让用户自己做模型。这样版权问题就可以分割开来,先让软件发展起来,快速吸引用户群
还差中英混合就完美了
开发可不可以像百度一样,用户只需要提供一百句语音文件,就可以训练出模型。做一个批处理,让用户自己做模型。这样版权问题就可以分割开来,先让软件发展起来,快速吸引用户群
这样作是可行的,不过算法和代码的改动要大一点,后面考虑作吧。
中英文混合需要有较高质量的中英文混合的数据用于模型的训练,现在没有这样的开源数据,所以比较难。需要同一个人的中英文混合的语音和标注数据,并且要达到一定的时长足够训练才行,否则若使用拼接的方式,韵律过渡会不自然。当然,我会进一步留意这样的数据集和思考新的方案,谢谢你的关注和使用。