Arbaletos / UD_Esperanto-ETB

1 stars 2 forks source link

Parsilo de xml-segmentajxo de tekstaro #3

Open Arbaletos opened 5 years ago

Arbaletos commented 5 years ago

Necesas fari parsilon por xml de Tekstaro, cxar tia estas pli bona esperanto korpuso

Arbaletos commented 5 years ago

Aktualmente, baza importo de xml estis farita; por atingi cxi celon necesas nur realizigi procezadon de xml-segmentajxo pri fremdvortoj, kaj ankaux fini la taskon pri procezado de jam iomete procezita korpuso.

Arbaletos commented 5 years ago

Pri precize, necesas prilabori la tagojn: foreign -> SYM, FOREIGN name -> PROPU, FOREIGN num -> SYM abbr -> SYM hi -> unu okazo! SYM seg -> SYM

ptr (FORIGI!) note -> eltondi enajxon gap+ -> Ne necesas

l por poemoj, item por listoj cell por tables