LUMII-AILab / CorporaTools

Tools for processsing annotated PML files of Latvian corpora.
2 stars 2 forks source link

Lai TREDā strādā morfoloģijas fīču noteicējs #6

Closed lrituma closed 7 years ago

lrituma commented 7 years ago

Pēc izmaiņām tagsetā jāizmaina arī treda lietas, lai korekti atpazīst tagu izmaiņas: 1) Nelokāmajiem lietvārdiem skaitlisun dzimte tiks likti 0 2) ģenitīveņiem dzimti un skaitli arī norādīs 0, deklinācija būs g 3) divdabjiem tiek pielikta salīdzināmās pakāpes pozīcija taga beigās - p, c, s vai 0. 4) prievārdiem tiek izņemta pēdējā pozīcija par vietas nozīmi, 5) saikļiem tiek noņemta pēdējā pozīcija par uzbūvi, 6) izsauksmes vārdiem tiek noņemta pēdējā pozīcija par vienkāršu vai saliktu, 7) partikulām tiek noņemta pēdējā pozīcija par vienkāršu vai saliktu, 8) saīsinājumiem tiek ieviesta papildus pozīcija par veidu - n, p, v, a, r vai d.

lauma commented 7 years ago

Nulli jau drīkst likt visās pozīcijās, izņemot vārdšķiru.

lauma commented 7 years ago

Jaunajā TrEd moduļu repozitorijā http://sintakse.korpuss.lv/rep/ ir lv-treebank 2.19, kur šim visam vajadzētu strādāt. Ja nestrādā, šo biļeti ar papildus komentāriem var atvērt atkal.