babysor / MockingBird

🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
Other
34.57k stars 5.15k forks source link

预处理训练集需要优化logmmse中的denoise函数 #911

Open 0warning0error opened 1 year ago

0warning0error commented 1 year ago

Summary[问题简述(一句话)] 经过我的profile,我发现预处理训练集并不是因为IO慢,而是因为denoise拖慢了整个过程。我并不懂信号处理方面的知识,仅从我的专业知识来看,一是循环拖慢了速度,二是计算 广义指数积分(也就是denoise里用到的expn)的代价比较大。希望作者能优化denoise函数。

Env & To Reproduce[复现与环境] 描述你用的环境、代码版本、模型 我自己的仓库中https://github.com/0warning0error/MockingBird 修改了一点地方,为了找到拖慢预处理速度的原因做了profile。

Screenshots[截图(如有)] If applicable, add screenshots to help image

babysor commented 1 year ago

denoise 可以改为optional,但有没有更高效的 方式推荐?

0warning0error commented 1 year ago

我并不懂这声音信号处理的相关知识,不过我认为这里的预处理应该选择能够并行分块处理的算法。像现在的算法后一个块依赖前一个的计算结果,无法批量处理,速度自然慢