yandex / tomita-parser

Other
495 stars 112 forks source link

Неопределённость части речи #108

Closed ph1ex0n closed 5 years ago

ph1ex0n commented 5 years ago

Вот тут видно, что в последнем предложении

Хоть бы с концертом в Сухуми приехала , что ли . EOS

слово "ли" даёт три части речи.

Вопрос - какую часть речи выбирать для "ли" при работе скрипта по автоматическому определению части речи конкретного слова?

grandsbor commented 5 years ago

Вы не могли бы подробнее описать свою задачу? Для определения частей речи парсер не особенно подходит.

ph1ex0n commented 5 years ago

какую часть речи выбирать для "ли" после майстема?

grandsbor commented 5 years ago

Понятнее не стало :) Вы хотите выбрать часть речи, чтобы что делать с этой информацией дальше?

ph1ex0n commented 5 years ago

в принципе, не имеет значения что делать дальше, важно - как интерпретировать эту неоднозначность

grandsbor commented 5 years ago

Если неважно, что делать дальше, то можно интерпретировать как угодно, нет?

Но, например, по принципам разметки в Открытом корпусе это частица.

ph1ex0n commented 5 years ago

нет, интерпретация должна быть однозначной, как в открытом корпусе

grandsbor commented 5 years ago

Вопрос - какую часть речи выбирать для "ли" при работе скрипта по автоматическому определению части речи конкретного слова?

интерпретация должна быть однозначной

Если вы пишете такой скрипт, то можете внести условие вида: ли в выражении "что ли" - частица.

ph1ex0n commented 5 years ago

крутое решение