karim23657 / Persian-tts-coqui

Persian/Farsi text to speech(TTS) training using coqui tts
MIT License
117 stars 18 forks source link

تولید نویز و زمان طولانی اینفرنس #10

Open MostafaAlaviyan opened 1 year ago

MostafaAlaviyan commented 1 year ago

سلام چرا خروجی نویزه؟ هر بار اینفرنس هم ۱۰ دقسقه طول میکشه؟ اگه امکان داره یه راهنمای اینفرس جامع تر قرار بدید ممنون @karim23657

!tts --text "زندگی فقط یک بار است؛ از آن به خوبی استفاده کن" \ --config_path "/content/persian-tts-female-tacotron2/config-0.json" \ --model_path "/content/persian-tts-female-tacotron2/best_model_305416.pth" \ --vocoder_config_path "/content/persian-tts-female-Hifigan/config.json" \ --vocoder_path "/content/persian-tts-female-Hifigan/best_model_222302.pth" \ --out_path "speech2.wav"

karim23657 commented 1 year ago

سلام ، یک نمونه نوت بوک برای امتحان کردن هر مدل در مخزن قرار دادم

test-glowtts-model.ipynb Open In Colab

ببین بازم همون مشکل رو داری ، اگر بله ، نوت بوک رو با خروجیش بفرست.

MeTRoDevlop commented 1 year ago

این مشکل برای من هم وجود داره، با هر کدوم از مدل ها فقط یه نویز کوتاه تولید میکنه، هیچ اروری هم نمیده، روی گوگل کولب با همون تنظیمات درست خروجی می گیره ولی روی ویندوز نویز تولید میکنه، عجیب تر اینکه با همین مدل فارسی اگه متن انگلسی بهش بدم درست میخونه ولی فارسی رو نویز تولید می کنه فکر می کنم مشکل از خوندن متن فارسی روی ویندوز باشه ولی راه حلی پیدا نکردم. اول کد # This Python file uses the following encoding: utf-8 هم گذاشتم. از فرمت u062F\ استفاده کردم، موقع ران هم هم متن داخل ترمینال درست می نویسه ولی نمی خونه

این مشکل اینجا هم ذکر شده: https://github.com/coqui-ai/TTS/issues/2290