vlomme / Multi-Tacotron-Voice-Cloning

Phoneme multilingual(Russian-English) voice cloning based on
https://github.com/CorentinJ/Real-Time-Voice-Cloning
Other
379 stars 97 forks source link

Не видит dataset #9

Closed videoprice closed 4 years ago

videoprice commented 4 years ago

Привет, у меня не видит dataset RU. LibriSpeech видит, а русский dataset не видит. Что делать? Спасибо

vlomme commented 4 years ago

У разных датасетов разная структура. В synthesizer_preprocess_audio замените preprocess_sst на preprocess_librispeech. Под свой датасет можете настроить \synthesizer\preprocess.py

videoprice commented 4 years ago

Спасибо за помощь, но ничего не выходит, не видит toolbox хоть убей:( Я хочу настроить dataset под RUSLAN https://ruslan-corpus.github.io/ Не покажете, как будет выглядить \synthesizer\preprocess.py под этот конкретный dataset Огромное спасибо Владислав

vlomme commented 4 years ago

toolbox нужен уже для использования. Какой там вообще смысл открывать весь датасет? Можно отдельные файлы. Но если очень надо, можно отредактировать toolbox/init.py И я не правильно прочитал, для тренировки синтезатора голосом RUSLAN нужно в synthesizer_preprocess_audio заменить preprocess_sst на preprocess_book. И тогда а сам датасет поместить в папку book (по умолчанию). Если надо, настраивается сама обработка в \synthesizer\preprocess.py