OpenCorpora / opencorpora

A web-based engine for creating and annotating textual corpora
http://opencorpora.org
GNU General Public License v2.0
241 stars 23 forks source link

научиться разбивать уже выложенные пулы по словам #858

Open Shimorina opened 5 years ago

Shimorina commented 5 years ago

сейчас самый большой выложенный пул на разметку - это красный CONJ@PRCL@ADVB (ок. 13 тыс. примеров). Его гораздо было бы удобнее размечать, если он был бы разбит по словам: отдельно пулы на слово "как", "так", "только" и пр.

То же самое иногда хочется применить и при модерации, т.е. иметь возможность модерировать конкретные слова (например, актуально для служебных слов).