Hiroshiba / become-yukarin

Convert your voice to favorite voice
https://hiroshiba.github.io/blog/became-yuduki-yukari-with-deep-learning-power/
MIT License
576 stars 88 forks source link

収録データのサンプリング周波数について #56

Closed BURI55 closed 5 years ago

BURI55 commented 5 years ago

ヒホさんが24kHzを選択した理由は何でしょうか? 映像業界で48KHzが基本だからその半分の周波数という説と 音声研究界で16kHzが基本だったからその1.5倍の周波数という説がありますが、 どうなんでしょうか? ちなみにゆかりさんはvoiceroid EX+で、21.5kHzで、Voiceroid2で44.1kHzですから、 soxかなんかでvoiceroid2のものをダウンコンバートして用いているのですか? としたら、その理由は何でしょうか?

Hiroshiba commented 5 years ago

4000Hz程度で区切って試してみて、自分の耳で許せる音質になったのが24000Hzだったためです。