Open knok opened 3 years ago
Vadim Popov, Ivan Vovk, Vladimir Gogoryan, Tasnima Sadekova, Mikhail Kudinov, Jiansheng Wei
https://arxiv.org/abs/2109.13821v1
非パラレルデータに基づいた声質変換手法の提案。Diffusion Probalistic Model (DPM)に基づく。 たくさんの話者による発話のメル特徴の平均に基づいた AutoEncoder ベースのモデルを採用。
プロジェクトページ https://diffvc-fast-ml-solver.github.io/
Vadim Popov, Ivan Vovk, Vladimir Gogoryan, Tasnima Sadekova, Mikhail Kudinov, Jiansheng Wei
https://arxiv.org/abs/2109.13821v1
概要
非パラレルデータに基づいた声質変換手法の提案。Diffusion Probalistic Model (DPM)に基づく。 たくさんの話者による発話のメル特徴の平均に基づいた AutoEncoder ベースのモデルを採用。
プロジェクトページ https://diffvc-fast-ml-solver.github.io/