bzaar / odict

An open grammatical dictionary of Russian
http://odict.ru
9 stars 2 forks source link

Добавить возможность добавления в словарь аббревиатур #26

Open bzaar opened 9 years ago

bzaar commented 9 years ago

Сейчас невозможно добавлять аббревиатуры, читающиеся "по буквам": КНДР, УФМС, так как невозможно правильно указать ударение. В то же время аббревиатуры, читающиеся как обычные слова, (ФАПСИ, ВНИИ) сейчас можно добавлять без проблем.

Возможное решение: для слов, в которых больше одной заглавной буквы, разрешить ударение на согласную. Это будет означать, что аббревиатура читается "по буквам": КНДР 4 = [ка-эн-дэ-ЭР]. Но из такой записи будет непонятно, как читать, например, НИИ 3: [ниИ] или [эн-и-И]?

Возможное решение №2: ввести новый буквенный символ со значением "аббревиатура" с обязательной "расшифровкой":

НИИ 3 а Научно-исследовательский институт КНДР 4 а Китайская Народно-Демократическая Республика

Однако введение нового буквенного символа является существенным изменением API.

Наиболее оптимальным представляется вариант №1 с дополнительной пометой, означающей, что слово читается по буквам. Помету можно сделать в виде ссылки на параграф. Например:

НИИ 3 м 0, #31 (#ABBR: Научно-исследовательский институт) КНДР 4 ж 0, #31 (#ABBR: Китайская Народно-Демократическая Республика) ФАПСИ 5 с 0 (#ABBR: Федеральное агентство правительственной связи и информации) АвтоВАЗ 6 м 1а

(Обратите внимание на отсутствие пометы #31 у ФАПСИ и АвтоВАЗ, означающее, что они читаются как обычные слова, а АвтоВАЗ еще и склоняется).

Таким образом, изменение сведется в добавлению новой пометы #31 и ее учете в двух местах: 1) в генераторе форм игнорировать ударение при построении форм (наличие пометы #31 по факту означает несклоняемость, но дублируется пометой 0 для единообразия). 2) на странице http://odict.ru/add позволять вводить ударение, падающее на согласную, в присутствие пометы #31. 3) задокументировать новую помету на странице http://odict.ru/pomety.