OpenCorpora / opencorpora

A web-based engine for creating and annotating textual corpora
http://opencorpora.org
GNU General Public License v2.0
241 stars 23 forks source link

Где найти объяснение структуры xml дампа корпуса? #899

Open rodion-m opened 3 years ago

rodion-m commented 3 years ago

Ребята, не смог найти документацию к данным XML файла с размеченными текстами. Подскажите, пожалуйста, где искать.

В первую очередь интересуют возможные значения тега v и их расшифровка (пример: NOUN, inan, masc, loct, PNCT и тд).

bzaar commented 3 years ago

http://opencorpora.org/dict.php?act=gram

victorbocharov commented 3 years ago

@grandsbor у нас же только XSD есть для дампа корпуса?

grandsbor commented 3 years ago

Да, документации по экспорту как для словаря - нет.

rodion-m commented 3 years ago

http://opencorpora.org/dict.php?act=gram

Спасибо!

@victorbocharov Да, схему я использую. Возможно тогда имеет смысл оставить этот issue для трекинга задачи по созданию документации для дампа корпуса. Точно резонно хотя бы эту ссылку добавить на страницу закачки дампа корпуса. Вот сюда, рядом со схемой или во вкладку формат.