brown-uk / dict_uk

Project to generate POS tag dictionary for Ukrainian language
GNU General Public License v3.0
546 stars 71 forks source link

Родовий відмінок на -а/-у #291

Closed shvedova closed 2 years ago

shvedova commented 2 years ago

В корпусі дуже багато ненормативних форм, вони не тегуються.

arysin commented 2 years ago

На жаль ці форми дуже часто перетинаються з рос. словами, тому тут дуже важко зробити щось швидко

vstarko commented 2 years ago

Якщо є ненормативне -у (замість -а), то не має перетинатися з рос. — можна додати в парадигму з тегом :subst. Зрештою є живомовна тенденція до розширення вживання -у в род.в. Якщо ж є ненормативне -а (замість -у), то справді може перетинатися з рос. — тоді можна додати в парадигму з тегом :bad. Навіть якщо це рос. слово, то воно дістане тег :bad. А на ідентифікацію мови (укр. чи рос.) вплине дуже несуттєво. Якщо це ОК, то можна створити список таких слів.

arysin commented 2 years ago

Duplicate for #113