Hiroshiba / become-yukarin

Convert your voice to favorite voice
https://hiroshiba.github.io/blog/became-yuduki-yukari-with-deep-learning-power/
MIT License
576 stars 88 forks source link

ステレオ入力・ステレオ出力 #47

Closed kbkn3 closed 5 years ago

kbkn3 commented 5 years ago

初めまして 質問お願い致します。

学習用の音声データにステレオの音源を使用しても モノラル化して(?)学習し、モノラルで出力されるようになっているようですが

変換結果もステレオにすることはできますでしょうか?

quillkiragimmy commented 5 years ago

Actually the binaural (stereo) voice can be reconstructed by:

  1. difference of amplitude between L/R.
  2. difference of phase between L/R. Basically what you want can be achieved by start one channel 50ms later than the other, that will make it sounds like stereo, and some reverb might help as well.
Hiroshiba commented 5 years ago

モノラル化して学習・変換するようになっています。 現状だと、ステレオ音源のL/Rそれぞれをモノラル音源として2つファイルを書き出したあと、各々で変換し、後にステレオとして結合するなどの方法などがありそうです。