brown-uk / dict_uk

Project to generate POS tag dictionary for Ukrainian language
GNU General Public License v3.0
546 stars 71 forks source link

Альтернативний р.в. на -у #325

Open arysin opened 1 year ago

arysin commented 1 year ago

Часто вживають банкомату замість банкомата у р.в.

Було б добре, щоб такі форми з -у розпізнавалися й лематизувалися. Найлегший спосіб це зробити — ввести цю форму в парадигму з якимось тегом. Один варіант - :subst (субстандарт, тобто не відповідає мовному стандарту, тобто в цьому випадку правопису й деяким офіційним словникам). Ми вже ввели в парадигми дієслів словоформи з тегом :subst. Інший варіагь - справді варто мати новий тег :alt2 або ж просто старий добрий :alt у звичному сенсі "не відповідає чинному правопису". Перевагою такого тегу :alt чи :alt2 над :subst є те, що ми не даємо негативної оцінки цим формам — і це правильно, бо на відміну субстандартних дієслівних форм ці форми з -у мають право на життя (що підтверджує наведена стаття з академічного РУС 2011-2014). Так ми вбиваємо двох зайців: розпізнаємо ці форми й водночас вказуємо, що вони не відповідають чинним правилам, але не засуджуємо їх. Тобто ми взагалі не "унормовуємо" такі форми, а вводимо їх у парадигми з певним тегом, який вказує на їхнє відношення до Modern Stardard Ukrainian. Це, схоже, дуже хороший баланс між нормою й практикою (вжитком). Так, це створює в цьому випадку омонімію род.в. і дав.в., але наприклад, у випадку з банкомат частотність -у не набагато менша за -а і що форми з -у в текстах — це винятково родовий відмінок. Тобто охопити їх у словнику вкрай потрібно. Інакше ми не покриваємо добрий шмат вживань леми банкомат.

Palindromer commented 23 hours ago

Закінчення у родовому відмінку для наступних слів відрізняється від того, що вказано в академічному словнику https://lcorp.ulif.org.ua/dictua/ Скажіть, будь ласка, це помилка на стороні ulif? Якщо так, то ці слова згодом також додадуться у ВЕСУМ з позначкою subst/alt/bad?

  1. автозчепа
  2. автоконсерванту
  3. автомутагену
  4. автополігону
  5. автоспуску
  6. агранулоциту
  7. агросектору
  8. адресу
  9. азану
  10. айвану
  11. аймака
  12. аквілона
  13. акриліку
  14. алантоїса
  15. Аллена
  16. Амадеуса
  17. амарилісу
  18. аміакату
  19. аміна
  20. аналгетика
  21. аналептика
  22. анальгетика
  23. андарака
  24. Андерлехту
  25. Антареса
  26. антецедента
  27. антигену
  28. антигормону
  29. антимутагену
  30. антипіретика
arysin commented 22 hours ago

р.в. -а/-у ч.р. це дуже складна тема На жаль УЛІФ має багато помилок, а ВЕСУМ на противагу УЛІФу використовується в практичних застосунках, тож там одразу вилазять несумісності з реальним вжитком. Тому у ВЕСУМі з часом такі проблеми добряче аналізувалися й усувалися. Але гамузом сказати що всі ці форми в УЛІФ неправильні не можна, треба розглядати кожен випадок окремо. Напр. Андерлехт - вживають переважно, як клуб, також є комуна, обидва значення матимуть -у. Аллен та Амадеус - ім'я людини, тож там без варіантів -а, хіба що є якесь ще значення, напр. може бути ф/к Аллен або Амадеус але якщо в текстах такого немає (хоча якщо назва клубу від імені людини то навіть там може бути -а), то вводити омонімію не варто. сектор -а якщо геометрична фігура, а якщо (абстрактна) ділянка, то -у, тож агросектору Для загальних назв ми переважно взоруємося на граматичний словник http://www.mova.info/grmasl.aspx (на жаль зараз лежить), але також зазираємо на r2u.org.ua і в тлумачні словники, бо закінчення залежить від значення, тож якщо звіритися нема з чим, треба розглядати тлумачення і вжиток (ГРАК).