KL13NT / AIUX

The Arabic Initiative for User Experience (AIUX) is an initiative to provide better User Experience to Arabic-speaking people.
https://kl13nt.github.io/AIUX
15 stars 0 forks source link

[Idea] - Create a plugin for chrome that can read Arabic text for you. #1

Open MohamedAlaa opened 4 years ago

MohamedAlaa commented 4 years ago

Are we able to do a plugin or a service that can read Arabic text?

Todo

KL13NT commented 4 years ago
أظن من الممكن جداً نعمل حاجة زي كده بس آلية العمل هي اللي هتفرق ايه اللي هيكون موجود كا محرك ورا حاجة زي دي؟ حاجة كلاود ولا مدمجة كجزء من البلاجن نفسها؟
KL13NT commented 4 years ago

As a follow up to this I found two extensible open source TTS engines, one of which supports Arabic out of the box.

eSpeak Mary TTS

eSpeak is a cross-platform speech synthesizer that's based on the eSpeak engine and uses a "formant synthesis" method, so smaller size with a slight compromise to how realistic speech is.

There's also the Web Speech API which provides an easy interface for TTS on webpages. This would make the logic behind a plugin way easier, but will depend on the operation system to provide the voices.


Also, I just found out that NVDA uses eSpeak out of the box, but the quality needs a lot of work. This is out of scope for this issue tho. @MohamedAlaa

MohamedAlaa commented 4 years ago
أظن من الممكن جداً نعمل حاجة زي كده بس آلية العمل هي اللي هتفرق ايه اللي هيكون موجود كا محرك ورا حاجة زي دي؟ حاجة كلاود ولا مدمجة كجزء من البلاجن نفسها؟

أظن الاول محتاجين حاجه نعملها تدريب انها تفهم الكلام العربي و بعدها هنقدر نحدد ايه الطريق اللي ممكن نمشي فيه.

KL13NT commented 4 years ago
ده اكيد, و في الوقت الحالي ممكن نحط هدفين, الاول تجميع اكبر قدر من المحتوى العربي الصحيح لغوياً علشان مثلاً يتدرب عليه موديل (لو مفيش) و التاني هي دراسة الخيارات اللي قولتها فوق دي انظمة التشغيل دلوقتي بتيجي بتقنيات مساعدة و بيبقى فيها نطق باللغة العربية من الشركات الكبيرة زي ميكروسوفت و ابل, ممكن نعمل اضافة للمتصفحات تستغل الـ Web Speech API و تاخد الاصوات من نظام التشغيل. تحب اعمل تجربة صغيرة و نشوف النتيجة مع خيار زي ده ولا نستنى شوية؟
abodacs commented 3 years ago

اعتقد الداتا سيت ديه ممكن تساعد https://commonvoice.mozilla.org/en/datasets

أنا مهتم جداجدا بالموضوع ده @KL13NT

KL13NT commented 3 years ago

@abodacs

الداتاسيت بتاعت موزيلا دي فيها تسجيلات كتيرة فعلاً, لكن الربط نفسه مابينها ومابين ال Text To Speech معنديش علم بيه. هل انت على علم بالموضوع او تعرف حد؟