LUMII-AILab / CorporaTools

Tools for processsing annotated PML files of Latvian corpora.
2 stars 2 forks source link

N.B. un P.S. tokenizēšana #21

Closed lrituma closed 6 years ago

lrituma commented 6 years ago

Ielikt, ka šos apzīmējumus tokenizē kopā arī tad, ja kāds ir iebāzis pa vidu daļām reālu atstarpi.

lrituma commented 6 years ago

Pieņemu, ka jāparedz arī p.p.s.

lauma commented 6 years ago

Paredzēju arī u.t.t.