Closed kmike closed 8 years ago
Хм, там много таких слов. Наверное, имеет смысл просмотреть слова с Geox, которые как-то так похоже оканчиваются, и всем добавить вариант с несклоняемым разбором.
Если всем топнимам на -о добавить неизм вариант, то парадигма возрастет в два раза (в каждом падеже неизм вариант), а следовательно и неоднозначность в корпусе. Поэтому я против добавления. Тем более, что в случае с родовым понятием мы размечаем слово на -о как им падеж, этот разбор есть в парадигме: в аэропорту (предлож) Домодедово (им) - плюс по строгой норме, как написано выше, должен быть склоняемый вариант.
Ну да, вырастет, но вроде как оправдано. См., например, статью на gramota.ru.
Мне кажется, для OpenCorpora важно, что
Вот цитата из «Грамматического словаря русского языка» А. А. Зализняка: «...Очень часто встречается – как в устной речи, так и в печати – употребление данного слова [топонима на -ово, -ино] как неизменяемого
а вопрос о том, что является строгой нормой, а что нет - второстепенный.
Речь идет именно о вариантах без родового слова, когда падеж косвенный.
Я за добавление, но пусть Света решает
Тогда давайте пока добавим топонимам на -о (не Fixd) разговорную (с пометой Infr) форму предложного падежа, совпадающую с им. Но это лучше сделать автоматически, таких слов думаю много
Предложный, наверное, самый частый, но всякие "из Домодедово", "перед Домодедово" тоже есть, придётся и эти падежи добавлять
Встречаются, да. "Как представители Аэрофлота общались с людьми из Пулково я опущу" и т.п.
нашла еще пример "в случае признания Косово" Я наверное добавляю неизм варианты трех упомянутых слов (Домодедово, Пулково, Косово) в виде разг вариантов внутри парадигмы. Какие слова еще добавить? Лучше бы не все подряд, а которые встречаются в корпусе
Это самые частотные. Скоро буду проходить пул на неизменяемые существительные -- буду иметь ввиду, потом допишу сюда наиболее частотные примеры, может быть что-то ещё встретится из подобных примеров. По факту же: у нас в стране аэропортов много (см. например список на википедии), но из тех, что на слуху в прессе -- не так и уж и много. Это как раз все три московских аэропорта (Шереметьево, Домодедово, Внуково) и один питерский (Пулково). Есть ещё московские аэропорты "Остафьево" и "Раменское", но в корпусе не встречаются (ноль вхождений) и прожив в Москве десяток лет не могу утверждать, что слышал такие название. Их даже на схеме метро не рисуют, только тройку DME-SVO-VKO. Много примеров на слово "Сколково" в корпусе, в словаре присутствует, но глянул -- внутри не прописано. Вот это точно кандидат номер один.
PS Светлана, а если слово встречается в корпусе, но встречается ровно один раз -- имеет смысл его добавлять в словарь проекта? Вот ещё один пример Geox, но не такой частотный, как Косово и московские аэропорты (ровно один раз в корпусе встретилось): В Конаково Конаковского района , начиная с 2002 года , проходят Верхневолжские парусные регаты на приз губернатора Тверской области .
PPS И, я не знаю, насколько можно отойти от изначальной формулировки таска (были конкретно Geox+аэропорт, сейчас я ещё Сколково приплёл). Так вот, в корпусе (как в зерцале русского языка) встречается использование слова "гугл" как несклоняемого. В словаре уже вшиты примеры правильного склонения, в заданиях часто проскальзывает слово как неизменяемое: "Кооперация с гугл" Здесь кем/чем -- творительный падеж, нужно было "с гуглом". Обсуждать насколько это подобное словоупотребление правильно -- я не готов, просто вижу, что есть такое употребление. Аналогично, слово "интернет" постоянно используется как несклоняемое (в косвенных падежах без родового слова): "Мобильные телефоны для Интернет будут производиться фирмой..."
Добавила раз варианты для: Пулково, Внуково, Шереметьево, Домодедово, Косово, Гугл, интернет
А там точно Infr?
Поискал новости по Пулково - везде несклоняемый вариант, например http://rusnovosti.ru/posts/361253, http://www.fontanka.ru/2015/01/21/038/ и https://news.mail.ru/inregions/st_petersburg/91/economics/20584748/. Склоняемого варианта как минимум в новостях сейчас нет.
Внуково - тоже самое, везде только несклоняемый вариант: http://www.rg.ru/2015/01/21/tablo-site-anons.html, http://top.rbc.ru/business/17/01/2015/54baa9559a79476aa5b1c24d, http://www.interfax.ru/tourism/tourisminf.asp?sec=1470&id=419646
Косово - встречается оба варианта, но несклоняемый чаще - http://lenta.ru/news/2014/12/26/hitler_from_kosovo, http://24.kz/ru/news/in-the-world/item/46719-shakhtery-kosovo-bastuyut-pod-zemlej, http://ria.ru/world/20141226/1040334947.html
Шереметьево - встречаются оба варианта, несклоняемый вроде чаще - http://www.aif.ru/society/healthcare/1427659, http://www.ntv.ru/novosti/1290818/ (но http://itar-tass.com/ekonomika/1712624)
Домодедово - чаще несклоняемый (склоняемого в новостях не видел) - http://www.kommersant.ru/doc/2651795, http://www.rbc.ru/rbcfreenews/54c2017d9a79477e2c209ca3, http://www.m24.ru/articles/64732?attempt=1
Из личного опыта - у нас в городе аэропорт Кольцово (пятый по обороту после московских и питерских, кстати) и одноименный район. Никогда не слышал, чтоб их кто-то склонял, ни в устной речи, ни в новостях. В словаре OpenCorpora - только склоняемый вариант.
У нас в словаре есть ограничение, что в парадигме не может быть двух одинаковых разборов (есть исключения, но это очень маленький список). Пока по справочниках по русской орфографии считается, что склонять надо (строгая норма), поэтому я и поставила infr. Конечно, частотность сейчас в противоположную сторону, тогда тому, что сейчас с infr надо ставить основной, а второму варианту устар. Но как-то это идет в разрез с предписаниями. Чем плохо, что стоит разг. У кого-то генерация работает не как хотелось бы?
23 янв. 2015 г., в 12:34, Mikhail Korobov notifications@github.com написал(а):
А там точно Infr?
Поискал новости по Пулково - везде несклоняемый вариант, например http://rusnovosti.ru/posts/361253, http://www.fontanka.ru/2015/01/21/038/ и https://news.mail.ru/inregions/st_petersburg/91/economics/20584748/. Склоняемого варианта как минимум в новостях сейчас нет.
Внуково - тоже самое, везде только несклоняемый вариант: http://www.rg.ru/2015/01/21/tablo-site-anons.html, http://top.rbc.ru/business/17/01/2015/54baa9559a79476aa5b1c24d, http://www.interfax.ru/tourism/tourisminf.asp?sec=1470&id=419646
Косово - встречается оба варианта, но несклоняемый чаще - http://lenta.ru/news/2014/12/26/hitler_from_kosovo, http://24.kz/ru/news/in-the-world/item/46719-shakhtery-kosovo-bastuyut-pod-zemlej, http://ria.ru/world/20141226/1040334947.html
Шереметьево - встречаются оба варианта, несклоняемый вроде чаще - http://www.aif.ru/society/healthcare/1427659, http://www.ntv.ru/novosti/1290818/ (но http://itar-tass.com/ekonomika/1712624)
Домодедово - чаще несклоняемый (склоняемого в новостях не видел) - http://www.kommersant.ru/doc/2651795, http://www.rbc.ru/rbcfreenews/54c2017d9a79477e2c209ca3, http://www.m24.ru/articles/64732?attempt=1
Из личного опыта - у нас в городе аэропорт Кольцово (пятый по обороту после московских и питерских, кстати) и одноименный район. Никогда не слышал, чтоб их кто-то склонял, ни в устной речи, ни в новостях. В словаре OpenCorpora - только склоняемый вариант.
— Reply to this email directly or view it on GitHub.
Кажется, тут всё сделано
Привет.
С gramota.ru:
В словаре сейчас только склоняемый вариант. Люди жалуются, просят добавить несклоняемое Домодедово.