karim23657 / Persian-tts-coqui

Persian/Farsi text to speech(TTS) training using coqui tts
MIT License
114 stars 18 forks source link

مشکل در تبدیل حرف "و" #11

Open safaeean opened 1 year ago

safaeean commented 1 year ago

سلام

من دارم از https://huggingface.co/Kamtera/persian-tts-male-vits استفاده میکنم وقتی فقط "و" رو خروجی میگیرم 8 ثانیه نویز خروجی میده 99d151ef66088fafaa4168dc0f65a878.zip

karim23657 commented 1 year ago

سلام @safaeean ، لطفاً کدی که اجرا کردی ومتنت رو بفرست اگه به صورت colab notebook بفرستی بهتره در ضمن میتونی از این دمو هم به صورت آنلاین استفاده کنی Hugging Face Spaces - مدل vits-male رو انتخاب کن

safaeean commented 1 year ago

بله دقیقا توی دمو هم مشکل وجود داره میتونید "و" رو خروجی بگیرید میبینید که 12 ثانیه خروجی میده براش البته فکر کنم هر چیزی که یک حرف داشته باشه این مشکل براش وجود داره ولی توی فارسی تقریبا فقط "و" یک کلمه مستقل و یک حرفی هست.

همچنین توی مدل های مختلف این مشکل وجود داره و فقط مربوط به vits-male نیست

safaeean commented 1 year ago

حتی دو حرفی ها هم به نظر میاد مشکل داره. کلمه (گل) و (سه) رو تست کردم مشکل داشت

karim23657 commented 1 year ago

باتوجه به این issue به نظر می رسه چون از این نوع دیتا برای آموزش مدل استفاده نشده نمیتونه متن های کوتاه رو به خوبی تبدیل به صوت کنه. اما این تک کلمه ها ، یا تک حرف ها ، فکر نمیکنم خیلی کاربرد داشته باشند.@safaeean