knok / arxiv-memo

My arxiv papers memo
0 stars 0 forks source link

Diffusion-Based Voice Conversion with Fast Maximum Likelihood Sampling Scheme #153

Open knok opened 3 years ago

knok commented 3 years ago

Vadim Popov, Ivan Vovk, Vladimir Gogoryan, Tasnima Sadekova, Mikhail Kudinov, Jiansheng Wei

https://arxiv.org/abs/2109.13821v1

概要

非パラレルデータに基づいた声質変換手法の提案。Diffusion Probalistic Model (DPM)に基づく。 たくさんの話者による発話のメル特徴の平均に基づいた AutoEncoder ベースのモデルを採用。 image

プロジェクトページ https://diffvc-fast-ml-solver.github.io/