LUMII-AILab / CorporaTools

Tools for processsing annotated PML files of Latvian corpora.
2 stars 2 forks source link

UD transformatoram pielikt goeswith #9

Closed lauma closed 6 years ago

lauma commented 7 years ago

Vārdiem, kas M līmenī savienoti no diviem ar atstarpi atdalītiem vārdiem, UD jātaisa divi tokeni un jāliek loma goeswith.

lauma commented 7 years ago

Vispār jāpadomā, arī ko darīt, ja ir druķenei mainīga forma.

normundsg commented 7 years ago

Kādas tam ir konsekvences attiecībā uz paralēlo NE, FrameNet u.c. marķēšanu? NE marķējam, balstoties uz tokenizāciju .m failos. FrameNet marķējam, balstoties uz CoNLL-U rezultātu.

lauma commented 6 years ago

Pēdējo mēnešu laikā šis ir ticis darīts, pārdarīts un izdarīts.