sohaibafifi / languagetool

A fork of languagetool to maintain Arabic
https://languagetool.org
GNU Lesser General Public License v2.1
18 stars 1 forks source link

New feature proposal #21

Closed linuxscout closed 4 years ago

linuxscout commented 4 years ago
ميزة مفيدة وجدت في الإنجليزية ملفا باسم diactritics.txt يمكننا استعماله لتصحيح بعض الحالات التي تحتاج إلى توضيح الحركة مثلا: تصحيح > حراك => حَراك > تجرُبة= تجرِبة يمكننا استعارة هذه الخاصية، لاسيما أنّ هذه الميزة لا يمكن تشغيلها الآن، لأنها تسبب خطأ تراجعيا recursive
linuxscout commented 4 years ago

We can also use files likes

coherency.txt

can be used for words with other spelling, we can use it for words like:

شؤون;شئون الذي;الذى
تركية;تركيا " in Egypt locale they use Alef maqsura instead of Yeh at the word end.

diacritics.txt

Can be used for words which must be disambiguated or have a preferred pronunciation like: تجرُبة => تجرِبة Tajruba => Tajriba** حراك => حَراك Hirak => Harak

redundancies.txt

Used for avoid redundency like

سوف لن => لن

wordiness.txt

A rule that matches words which are complex and suggests easier to understand alternatives.

'$match' is a wordy or complex expression. In some cases, it might be preferable to use $suggestions"; I suggest this for expressions like: وأخيرا وليس آخرا => وأخيرا لأول وهلة=> أول على الرغم من => مع أنّ

wrongWordInContext.txt

we can use it to speed up rules writing, we can use Fareh and convert it into this files for representing some cases, or just test it before implement it on XML

I will prepare some examples of those files.