Open safaeean opened 1 year ago
بله دقیقا توی دمو هم مشکل وجود داره میتونید "و" رو خروجی بگیرید میبینید که 12 ثانیه خروجی میده براش البته فکر کنم هر چیزی که یک حرف داشته باشه این مشکل براش وجود داره ولی توی فارسی تقریبا فقط "و" یک کلمه مستقل و یک حرفی هست.
همچنین توی مدل های مختلف این مشکل وجود داره و فقط مربوط به vits-male نیست
حتی دو حرفی ها هم به نظر میاد مشکل داره. کلمه (گل) و (سه) رو تست کردم مشکل داشت
باتوجه به این issue به نظر می رسه چون از این نوع دیتا برای آموزش مدل استفاده نشده نمیتونه متن های کوتاه رو به خوبی تبدیل به صوت کنه. اما این تک کلمه ها ، یا تک حرف ها ، فکر نمیکنم خیلی کاربرد داشته باشند.@safaeean
سلام
من دارم از https://huggingface.co/Kamtera/persian-tts-male-vits استفاده میکنم وقتی فقط "و" رو خروجی میگیرم 8 ثانیه نویز خروجی میده 99d151ef66088fafaa4168dc0f65a878.zip