vlomme / Multi-Tacotron-Voice-Cloning

Phoneme multilingual(Russian-English) voice cloning based on
https://github.com/CorentinJ/Real-Time-Voice-Cloning
Other
385 stars 96 forks source link

Не работает. #16

Open alexgamechan opened 4 years ago

alexgamechan commented 4 years ago

Запустил демо-версию, не работает. image

vlomme commented 4 years ago

Проблема с вашим файлом. Слева вверху есть значок папки, там можно вручную просмотреть(скачать) файл

alexgamechan commented 4 years ago

Может быть в этом ошибка? Если да, то куда перекидывать этот файл? image

vlomme commented 4 years ago

Гугл ругается "В данный момент просмотр и скачивание этого файла недоступны. За последнее время этот файл просматривали или скачивали слишком часто. Повторите попытку позже. Если файл очень большой или открыт для доступа широкому кругу пользователей, возможен отказ в доступе к нему в течение ближайших суток. Если через 24 часа ситуация не изменится, обратитесь к администратору домена."

alexgamechan commented 4 years ago

Если вы про pretrained.zip, то я успел скачать.

vlomme commented 4 years ago

Тогда в чём проблема? на первом скрине ругается на ваш файл на втором, что не может скачать pretrained.zip. Его надо разархивировать в гланой папке

alexgamechan commented 4 years ago

Хорошо, спасибо.

alexgamechan commented 4 years ago

image Всеравно. В какой директории нужно переместить файл?

vlomme commented 4 years ago

В Multi

DenTerNG commented 4 years ago

image А если точнее то куда?

vlomme commented 4 years ago

Копирует репазиторий, создавая папку Multi-Tacotron-Voice-Cloning !git clone https://github.com/vlomme/Multi-Tacotron-Voice-Cloning.git Переместиться в папку Multi-Tacotron-Voice-Cloning cd Multi-Tacotron-Voice-Cloning/ Скачать веса в текущую папку(Multi-Tacotron-Voice-Cloning) !gdown https://drive.google.com/uc?id=1aQBmpflbX_ePUdXTSNE4CfEL9hdG2-O8 Разархивировать веса в текущую папку(Multi-Tacotron-Voice-Cloning) !unzip pretrained.zip

Object21 commented 4 years ago

а мне что делать? Снимок

alexgamechan commented 4 years ago

В Multi

почему-то не работает, всеравно. Не хочет распаковаться.

DenTerNG commented 4 years ago

https://drive.google.com/uc?id=1ks_luZooH9d2K0w3wLKD3kxPKVN1ogc- если надо то вот другая ссылка

vlomme commented 4 years ago

Откуда вас столько взялось? 1) Еще раз, из-за большого наплыва людей, гугл ограничил скачивание весов. Попробуйте по ссылке выше 2) Ошибка could not convert string to float скорее всего вызвана тем, что нет файлы. А файла нет, так как не выполнилась прошлая строчка, а прошлая команда не выполнилась из-за отсутствия весов см пункт 1 Предлагаю сбросить сеанс в колабе, поменять ссылку на веса и заного запустить каждую строчку, наблюдая за результатами работы.

Object21 commented 4 years ago

спасибо большое!

TACHOEBELL commented 4 years ago

eICtV5ocyUU что делать если вставил файл вроде туда, название везде поменял, а результата вообще нет

vlomme commented 4 years ago

Не знаю. Посмотрите папку где вы находитесь. Возможно не в Multi-Tacotron-Voice-Cloning Попробуйте перезапустить ячейку И вы всегда можете просто скачать файл из панели слева. Вам не обязательно его выводить на экран

tg-bomze commented 4 years ago

Ох сколько людей тебе овер нагнал. Исчерпали квоту на скачивание весов) Теперь еще и как тех поддержка тебе сидеть тут) Чтож, крепись, Влад!

vlomme commented 4 years ago

Кружок по DS? Да было бы зачем. Работает сейчас плохо, а судя по вопросам, врядли из них кто-то в ближайшее время возьмётся за улучшение

mib32 commented 4 years ago

Круто конечно, но качество не доставляет( Загрузил свой 5-секундный файл (на английском) - вообще только два слова может выговорить, остальное мясо

mib32 commented 4 years ago

Кстати, вопрос - это важно в каком формате предоставлять файл - я имею в виду sample rate, bit rate, stereo/mono?

vlomme commented 4 years ago

Можно попробовать с разными файлами и по несколько раз, может получиться лучше. Формат не важен, там перевод в мелспектрограмму

VinerX commented 4 years ago

image Добрый вечер! Не подскажите, почему выдает ошибку вот эту?

"Ошибка could not convert string to float скорее всего вызвана тем, что нет файлы. А файла нет, так как не выполнилась прошлая строчка, а прошлая команда не выполнилась из-за отсутствия весов см пункт 1", а что за весы, я не особо понял в данном ответе. Заранее спасибо за ответ.

vlomme commented 4 years ago

Вам нужно последовательно запустить все ячейки, убедившись, что нигде нет ошибок

NeBomj commented 3 years ago

Здравствуйте, у меня проблема с вашим приложением, я использовал онлайн версию на Google Colaboratory по ссылке https://colab.research.google.com/github/vlomme/Multi-Tacotron-Voice-Cloning/blob/master/Multi_Tacotron_Voice_Cloning.ipynb Программа не хочет озвучивать текст предоставленным голосом, вместо него использует голос стандартного мужика. Первые 2 раза я запустил - он озвучил нужным голосом, потом только стандартным, даже смена браузера (и аккаунта) не помогла. Я и на свой гугл диск загружал этот pretrained.zip и названия файлов менял и пытался вообще удалить оттуда изначальный голос, или заменить ex.wav своим, чтобы у него просто выбора не было. Он все равно использует стандартный. Не пробовал разве что использовать формат НЕ .wav image Скриншот - https://prnt.sc/v4rnqr upd. Еще он будто английскую часть озвучивает нужным голосом, а русскую нужным

vlomme commented 3 years ago

Программа не хочет озвучивать текст предоставленным голосом, вместо него использует голос стандартного мужика.

В обучающей выборке было мало голосов, он и не научился

NeBomj commented 3 years ago

Программа не хочет озвучивать текст предоставленным голосом, вместо него использует голос стандартного мужика.

В обучающей выборке было мало голосов, он и не научился

Там 4 минуты было, но всего 1 вид голоса. Надо больше материала тип? И по логике он же вообще только шипение должен выдавать, если не научился

vlomme commented 3 years ago

Вы обучались на 4 минутах? Так это не работает, надо >1000 часов 1000 голосов Или вы во время использования дали 4 минутный образец? В этот момент обучения не происходит. Если вы использовали мои веса модели, то он будет выдавать что-то похожее на голос из обучающей выборки, или шипение, если голос сильно другой.

NeBomj commented 3 years ago

Вы обучались на 4 минутах? Так это не работает, надо >1000 часов 1000 голосов Или вы во время использования дали 4 минутный образец? В этот момент обучения не происходит. Если вы использовали мои веса модели, то он будет выдавать что-то похожее на голос из обучающей выборки, или шипение, если голос сильно другой.

Я не очень вас понимаю, но я добавил свой файл exam.wav (2.wav это тот же самый файл, просто с другим названием) в папку Multi-Tacotron-Voice-Cloning. И вписал его туда вместо ex.wav в скрипт "!python demo_cli.py" . Насколько я слышал из ютуба - туда можно вписать даже 10 секундную запись. Я так понимаю вы это "образец" назвали. image Дак по итогу что мне надо сделать для того, чтобы он заговорил нужным мне голосом? С ваших слов я так понимаю - мне надо "обучающую выборку" изменить на более подходящую? Можно ли это через Colaboratory сделать?

ElliotZeroNull commented 3 years ago

image Пробовал разные версии librosa ставить, там уже проблемы, связанные с другими библиотеками, есть фикс?

ElliotZeroNull commented 3 years ago

Исправил, почитал документацию, открыл demo_cli.py, и поменял файл: Добавил строчку import soundfile as sf image

и заменил librosa.output.write_wav на sf.write image

Теперь сохраняет