sohaibafifi / languagetool

A fork of languagetool to maintain Arabic
https://languagetool.org
GNU Lesser General Public License v2.1
18 stars 1 forks source link

قائمة الكلمات المتشابهة لفظا #9

Closed linuxscout closed 3 years ago

linuxscout commented 4 years ago
بعض الكلمات ملتبسة مثل الضن والظن، الأولى للبخل والثانية للشك، ويخلط بينهما الناس بسبب التشابه في النطق، وكلتاهما صحيحة، ولكن علينا توضيح الفرق بينهما في كل مرة، لذا أقترح حلا من اثنين: 1. عمل قائمة للكلمات، مع التوضيح، ثم توليد قواعد لها آليا. 2. عمل طريقة برمجية مع قوائم نصية، هنا تظهر إشكالية التصريف، يعني لا يمكن الإحاطة بكل الحالات .
linuxscout commented 4 years ago

أعتقد أن هذه يمكن عملها بطريقة مشابهة لملف diacrtitcs.txt مع لون أخضر خفيف وتنبيه يقول هل تقصد احدى الكلمتين، لك لابد من إضافة رسالة توضح الفرق بين الكلمتين

linuxscout commented 4 years ago
أقترح ما يلي: إضافة وحدة لمعالجة هذا النوع من الأخطاء الموجودة في ملف خاص: * ملف homophone.txt يحتوي على ثلاث حقول word1|word2| message مثلا ظن|ضن| الضن البخل والظن الشك. كيف يعمل ====== مثال : يضنون أنهم أذكياء إذا كان أصل كلمة "يضنون" موجودا في قائمة المتشابهات، نولّد الكلمة "يظنون، " فإذا كانت موجودة، نعطي اقتراحا مع الرسالة التوضيحية وشكرا
linuxscout commented 4 years ago
صممت نوذجا اوليا لهذا النوع من الالتباس، أسميته homophones.txt استعملت AbstractSimpleRule لأن فيها ميزة جيدة هي setCheckLemmas() وهي مفيدة في التعرف على كل اشكال الكلمة. أحتاج إلى إضافة رسالة توضحية تعطي تعريف كل كلمة ونريد أن يكون الاقتراح ثنائي الاتجاه يعني كلتا الكلمتان تعطيان نفس التنبيه - ظن => ضن - ضن => ظن يمكن أن نفعل ذلك بطرق مختلفة - تكرار المدخل مرتين - اختيار الكلمة الأكثر شيوعا أو الأكثر خطأ - وضع تعريف كل كلمة بين قوسين ;