LUMII-AILab / CorporaTools

Tools for processsing annotated PML files of Latvian corpora.
2 stars 2 forks source link

Atjaunoto redukcijas virsotņu lineārais novietojums teikumā #28

Open lrituma opened 5 years ago

lrituma commented 5 years ago

Šobrīd nulles virsotne lineāri tiek novietota aiz tās virsotnes, kas ir vecāks zaram, kas veidojas zem reducētās virsotnes. tas ne vienmēr rezultējas pareizā lineārā novietojumā, piemēri no zēniem: turpmāk tekstā - CCGK [ ] - derētu aiz domuzīmes; Rīt skaidrosies [ ]," un turpināja adīt. - ir iekšā tiešajā runā, bet jābūt ārpusē kā pirmajam kooridnētajam izteicējam.

lauma commented 5 years ago

Ielikt to, ka tukšā UD tokena numuru nosaka pēc redukcijas domuzīmes, izrādījās diezgan viegli. Taču, ja tādas nav, vajag gudrus kritērijus, kur tad likt.

lauma commented 5 years ago

"Rīt skaidrosies" ir īpaši skarbs piemērs, jo vispārējā struktūra patiesībā ir "...teica "Tiešo runu" un turpināja...", kas nozīmē, ka adekvāti būtu reducēto izteicēju atjaunot pirms tiešās runas. Bet tādā gadījumā droši vien izskatītos, ka viņš ir tiešās runas daļa, jo tiešajai runai nav sākuma pieturzīmju.

lauma commented 5 years ago

Vēl viens piemērs, kur pašlaik novietojas zināmā mērā ērmīgi, ir tas par aktieriem Bērziņu un Spanovski a-c68-zeeni-p51s1 - tur sanāk aiz vārda "Bērziņš", tātad pa vidu vienlīdzīgajiem. Varbūt ir jādomā kaut kas par tēmu pirms vai pēc visa apakškoka, ne tikai konkrētā vārda.

lauma commented 3 years ago

Ir pagājis vairāk par gadu un man vēl jo projām nav dzimuši skaisti kritēriji, kā likt gudri.