OpenCorpora / opencorpora

A web-based engine for creating and annotating textual corpora
http://opencorpora.org
GNU General Public License v2.0
241 stars 23 forks source link

добавить несклоняемый вариант Домодедово #35

Closed kmike closed 8 years ago

kmike commented 10 years ago

Привет.

С gramota.ru:

Вопрос № 265259
склоняется ли аэропорт "Домодедово"? Например, в "Домодедове"??? Спасибо! Шаповалова Н.

Ответ справочной службы русского языка

Название не склоняется в сочетании с родовым словом: в аэропорту Домодедово (названия аэропортов рекомендуется писать без кавычек). Если же родового слова нет, то нормативны оба варианта, склоняемый и несклоняемый: в Домодедове и в Домодедово. При этом склоняемый вариант соответствует строгой литературной норме (и рекомендуется, например, для речи дикторов). Подробнее см. в рубрике «Азбучные истины».

В словаре сейчас только склоняемый вариант. Люди жалуются, просят добавить несклоняемое Домодедово.

kmike commented 10 years ago

Хм, там много таких слов. Наверное, имеет смысл просмотреть слова с Geox, которые как-то так похоже оканчиваются, и всем добавить вариант с несклоняемым разбором.

svbichineva commented 10 years ago

Если всем топнимам на -о добавить неизм вариант, то парадигма возрастет в два раза (в каждом падеже неизм вариант), а следовательно и неоднозначность в корпусе. Поэтому я против добавления. Тем более, что в случае с родовым понятием мы размечаем слово на -о как им падеж, этот разбор есть в парадигме: в аэропорту (предлож) Домодедово (им) - плюс по строгой норме, как написано выше, должен быть склоняемый вариант.

kmike commented 10 years ago

Ну да, вырастет, но вроде как оправдано. См., например, статью на gramota.ru.

Мне кажется, для OpenCorpora важно, что

Вот цитата из «Грамматического словаря русского языка» А. А. Зализняка: «...Очень часто встречается – как в устной речи, так и в печати – употребление данного слова [топонима на -ово, -ино] как неизменяемого

а вопрос о том, что является строгой нормой, а что нет - второстепенный.

kmike commented 10 years ago

Речь идет именно о вариантах без родового слова, когда падеж косвенный.

grandsbor commented 10 years ago

Я за добавление, но пусть Света решает

svbichineva commented 10 years ago

Тогда давайте пока добавим топонимам на -о (не Fixd) разговорную (с пометой Infr) форму предложного падежа, совпадающую с им. Но это лучше сделать автоматически, таких слов думаю много

grandsbor commented 10 years ago

Предложный, наверное, самый частый, но всякие "из Домодедово", "перед Домодедово" тоже есть, придётся и эти падежи добавлять

akmetainfo commented 9 years ago

Встречаются, да. "Как представители Аэрофлота общались с людьми из Пулково я опущу" и т.п.

svbichineva commented 9 years ago

нашла еще пример "в случае признания Косово" Я наверное добавляю неизм варианты трех упомянутых слов (Домодедово, Пулково, Косово) в виде разг вариантов внутри парадигмы. Какие слова еще добавить? Лучше бы не все подряд, а которые встречаются в корпусе

akmetainfo commented 9 years ago

Это самые частотные. Скоро буду проходить пул на неизменяемые существительные -- буду иметь ввиду, потом допишу сюда наиболее частотные примеры, может быть что-то ещё встретится из подобных примеров. По факту же: у нас в стране аэропортов много (см. например список на википедии), но из тех, что на слуху в прессе -- не так и уж и много. Это как раз все три московских аэропорта (Шереметьево, Домодедово, Внуково) и один питерский (Пулково). Есть ещё московские аэропорты "Остафьево" и "Раменское", но в корпусе не встречаются (ноль вхождений) и прожив в Москве десяток лет не могу утверждать, что слышал такие название. Их даже на схеме метро не рисуют, только тройку DME-SVO-VKO. Много примеров на слово "Сколково" в корпусе, в словаре присутствует, но глянул -- внутри не прописано. Вот это точно кандидат номер один.

PS Светлана, а если слово встречается в корпусе, но встречается ровно один раз -- имеет смысл его добавлять в словарь проекта? Вот ещё один пример Geox, но не такой частотный, как Косово и московские аэропорты (ровно один раз в корпусе встретилось): В Конаково Конаковского района , начиная с 2002 года , проходят Верхневолжские парусные регаты на приз губернатора Тверской области .

PPS И, я не знаю, насколько можно отойти от изначальной формулировки таска (были конкретно Geox+аэропорт, сейчас я ещё Сколково приплёл). Так вот, в корпусе (как в зерцале русского языка) встречается использование слова "гугл" как несклоняемого. В словаре уже вшиты примеры правильного склонения, в заданиях часто проскальзывает слово как неизменяемое: "Кооперация с гугл" Здесь кем/чем -- творительный падеж, нужно было "с гуглом". Обсуждать насколько это подобное словоупотребление правильно -- я не готов, просто вижу, что есть такое употребление. Аналогично, слово "интернет" постоянно используется как несклоняемое (в косвенных падежах без родового слова): "Мобильные телефоны для Интернет будут производиться фирмой..."

svbichineva commented 9 years ago

Добавила раз варианты для: Пулково, Внуково, Шереметьево, Домодедово, Косово, Гугл, интернет

kmike commented 9 years ago

А там точно Infr?

Поискал новости по Пулково - везде несклоняемый вариант, например http://rusnovosti.ru/posts/361253, http://www.fontanka.ru/2015/01/21/038/ и https://news.mail.ru/inregions/st_petersburg/91/economics/20584748/. Склоняемого варианта как минимум в новостях сейчас нет.

Внуково - тоже самое, везде только несклоняемый вариант: http://www.rg.ru/2015/01/21/tablo-site-anons.html, http://top.rbc.ru/business/17/01/2015/54baa9559a79476aa5b1c24d, http://www.interfax.ru/tourism/tourisminf.asp?sec=1470&id=419646

Косово - встречается оба варианта, но несклоняемый чаще - http://lenta.ru/news/2014/12/26/hitler_from_kosovo, http://24.kz/ru/news/in-the-world/item/46719-shakhtery-kosovo-bastuyut-pod-zemlej, http://ria.ru/world/20141226/1040334947.html

Шереметьево - встречаются оба варианта, несклоняемый вроде чаще - http://www.aif.ru/society/healthcare/1427659, http://www.ntv.ru/novosti/1290818/ (но http://itar-tass.com/ekonomika/1712624)

Домодедово - чаще несклоняемый (склоняемого в новостях не видел) - http://www.kommersant.ru/doc/2651795, http://www.rbc.ru/rbcfreenews/54c2017d9a79477e2c209ca3, http://www.m24.ru/articles/64732?attempt=1

Из личного опыта - у нас в городе аэропорт Кольцово (пятый по обороту после московских и питерских, кстати) и одноименный район. Никогда не слышал, чтоб их кто-то склонял, ни в устной речи, ни в новостях. В словаре OpenCorpora - только склоняемый вариант.

svbichineva commented 9 years ago

У нас в словаре есть ограничение, что в парадигме не может быть двух одинаковых разборов (есть исключения, но это очень маленький список). Пока по справочниках по русской орфографии считается, что склонять надо (строгая норма), поэтому я и поставила infr. Конечно, частотность сейчас в противоположную сторону, тогда тому, что сейчас с infr надо ставить основной, а второму варианту устар. Но как-то это идет в разрез с предписаниями. Чем плохо, что стоит разг. У кого-то генерация работает не как хотелось бы?

23 янв. 2015 г., в 12:34, Mikhail Korobov notifications@github.com написал(а):

А там точно Infr?

Поискал новости по Пулково - везде несклоняемый вариант, например http://rusnovosti.ru/posts/361253, http://www.fontanka.ru/2015/01/21/038/ и https://news.mail.ru/inregions/st_petersburg/91/economics/20584748/. Склоняемого варианта как минимум в новостях сейчас нет.

Внуково - тоже самое, везде только несклоняемый вариант: http://www.rg.ru/2015/01/21/tablo-site-anons.html, http://top.rbc.ru/business/17/01/2015/54baa9559a79476aa5b1c24d, http://www.interfax.ru/tourism/tourisminf.asp?sec=1470&id=419646

Косово - встречается оба варианта, но несклоняемый чаще - http://lenta.ru/news/2014/12/26/hitler_from_kosovo, http://24.kz/ru/news/in-the-world/item/46719-shakhtery-kosovo-bastuyut-pod-zemlej, http://ria.ru/world/20141226/1040334947.html

Шереметьево - встречаются оба варианта, несклоняемый вроде чаще - http://www.aif.ru/society/healthcare/1427659, http://www.ntv.ru/novosti/1290818/ (но http://itar-tass.com/ekonomika/1712624)

Домодедово - чаще несклоняемый (склоняемого в новостях не видел) - http://www.kommersant.ru/doc/2651795, http://www.rbc.ru/rbcfreenews/54c2017d9a79477e2c209ca3, http://www.m24.ru/articles/64732?attempt=1

Из личного опыта - у нас в городе аэропорт Кольцово (пятый по обороту после московских и питерских, кстати) и одноименный район. Никогда не слышал, чтоб их кто-то склонял, ни в устной речи, ни в новостях. В словаре OpenCorpora - только склоняемый вариант.

— Reply to this email directly or view it on GitHub.

grandsbor commented 8 years ago

Кажется, тут всё сделано