vlomme / Multi-Tacotron-Voice-Cloning

Phoneme multilingual(Russian-English) voice cloning based on
https://github.com/CorentinJ/Real-Time-Voice-Cloning
Other
379 stars 97 forks source link

pretrained model #11

Closed arahisman closed 4 years ago

arahisman commented 4 years ago

Здравствуйте, экспериментировал с вашей моделью, но лишь некоторые записи дают хороший результат. На Хабре вы писали, что пробовали так же обучать модель только для русского языка и она работала лучше, у вас не осталось натренерованной модели? Если да, не могли бы вы поделиться ей?

vlomme commented 4 years ago

Здравствуйте. Нет, не сохранилась. Но вы можете сами обучить. Причем можно взять двуязычную и дообучить синтезатор, что быстро

arahisman commented 4 years ago

Большое спасибо за ответ. Как я понимаю, есть ограничение на количество символов, ровно как и на длину спектрограммы, оно используется в тексте программы, но я не могу найти его определение, не подскажете, где можно его изменить? Еще одна тонкость: При построении спектрограммы, чем дальше, тем менее выраженной она становится, если даже повторить одну и ту же фразу на повтор, она затухает.

vlomme commented 4 years ago

Модель обучалась на файлах до 7 секунд. Больше не влезало в видеокарту( За это отвечает параметр max_mel_frames в synthesizer\hparams.py Синтезировать можно любой длины, но так как на длинных файлах она не обучалось, то и работать будет хуже. На длину символов тоже ограничений нет. Длинные тексты можно синтезировать,, разбив на отдельные строки. Тогда такой проблемы не будет

arahisman commented 4 years ago

Большое спасибо за ответ, вы очень помогли

пт, 27 мар. 2020 г., 17:22 Kramarenko Vladislav notifications@github.com:

Модель обучалась на файлах до 7 секунд. Больше не влезало в видеокарту( За это отвечает параметр max_mel_frames в synthesizer\hparams.py Синтезировать можно любой длины, но так как на длинных файлах она не обучалось, то и работать будет хуже. На длину символов тоже ограничений нет. Длинные тексты можно синтезировать,, разбив на отдельные строки. Тогда такой проблемы не будет

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/vlomme/Multi-Tacotron-Voice-Cloning/issues/11#issuecomment-604970393, or unsubscribe https://github.com/notifications/unsubscribe-auth/AIWEEKG6KXPHLX5ZPDQMKF3RJSLARANCNFSM4LTXNKHQ .