sohaibafifi / languagetool

A fork of languagetool to maintain Arabic
https://languagetool.org
GNU Lesser General Public License v2.1
18 stars 1 forks source link

Developing a Disambiguator #8

Closed linuxscout closed 4 years ago

linuxscout commented 4 years ago
يمكن تطوير مزيل الالتباس بالاعتماد على بعض القواعد مثلا: ما يأتي بعد حروف الجر ليس فعلا === مثلا " في درس اليوم"، درس لا يكون فعلا. سأستعين ببعض هذه القواعد الموجودة في برنامج[ نفطويه](http://github.com/linuxscout/naftawayh) لتصنيف الكلمات حسب السياق.
linuxscout commented 4 years ago

I succeed to resolve this issue by creating the first disambiguation rule.

   <rule name="Jar" id="Keep_Only_Nouns_after_Jar">
          <!-- work with Prepositions which must precede nouns only -->
          <pattern>
            <token>في</token>
            <marker>
            <token/>
            </marker>
          </pattern>
          <disambig><match no="2" postag="N.*" postag_regexp="yes" /></disambig>
          <example type="ambiguous" inputform="عامل[عامل/NA-;M1--;---,عامل/NA-;M1A-;---,عامل/NA-;M1I-;---,عامل/NA-;M1U-;---,عَامَلَ/VW1;M1A-iaH;---,عَامَلَ/VW1;M1A-ipY;---]" outputform="عامل[عامل/NA-;M1--;---,عامل/NA-;M1A-;---,عامل/NA-;M1I-;---,عامل/NA-;M1U-;---]">
رأيت التفاني في <marker>عامل</marker> النظافة.</example>
        </rule>