e2yo / eyo

🦔 CLI for restoring the letter «ё» (yo) in russian texts
https://e2yo.github.io/eyo-browser/
MIT License
164 stars 5 forks source link

bug(base): safe replacements errors #24

Closed Kristinita closed 6 years ago

Kristinita commented 6 years ago

1. Summary

В списке ниже собрал все, по моему мнению, ошибочные случаи safe replacements, которые возникли, когда попробовал применить eyo к своим текстам. Считаю, что все случаи необходимо перенести из safe replacements в not safe replacements.

2. Примечания к списку

  1. Если у меня в списке стоит заглавная Е, это означает, что eyo в этом месте произвёл замену е на ё. Например, если в списке ЧЕс, это значит, что eyo заменил Чес на Чёс.
  2. Если для имён нарицательных источник не указан, то это Иванова О. Е., Лопатин В. В. Русский орфографический словарь - Москва, 2004 г.; в остальных случаях для имён нарицательных источник прямо указывается.
  3. Для иноязычных имён собственных (Утер Пендрагон, Ирма Грезе и т. д.) мне не удалось найти специализированных орфографических словарей, показывающих, пишутся ли эти имена собственные через е или ё. При невозможности найти специализированные источники, однако, мне кажется достаточным дать ссылку на употребление рассматриваемого имени собственного в авторитетных источниках, чтобы подтвердить правоту или допустимость написания через е.

3. Список

  1. суперзвЕзды́ — родительный падеж существительного суперзвезда;
  2. лЕвко́йтравянистое растение;
  3. УтЕр Пендрагон — отец короля Артура;
  4. Ки́Ев — столица Украины;
  5. ступнЕ́й — родительный падеж множественного числа слова ступня;
  6. СилЕн — сатир, персонаж древнегреческой мифологии;
  7. ЧЕс Чендлер — менеджер Джими Хендрикса;
  8. берЕзозол — древнерусское название апреля; (источник — этимологический словарь Макса Фасмера);
  9. БерЕзники́ — город Пермского края (источник — словарь имён собственных русского языка Ф. Л. Агеенко);
  10. Бас-ТЕрадминистративный центр Гваделупы (источник — тот же словарь имён собственных);
  11. Уильям ИстЕрли — экономист;
  12. живЕ́те — буква кириллицы;
  13. твЕ́рдо — буква кириллицы;
  14. Ирма ГрЕзе — надзирательница концлагерей, известная своей жестокостью;
  15. Ричард СпЕк — серийный убийца;
  16. БЕлль Ганнесс — женщина — серийный убийца;
  17. разли́чЕн — причастие от различный (источник — Полная акцентуированная парадигма по А. А. Зализняку).

Если с чем-то не согласны, пожалуйста, сообщите.

Спасибо.

Kristinita commented 6 years ago

@hcodes , актуально. Пожалуйста, проверьте список выше.

Спасибо.

hcodes commented 6 years ago

Со всем согласен, нужно поправить.

hcodes commented 6 years ago

Спасибо за помощь, всё поправил. v4.1.1

Kristinita commented 5 years ago

Новые замеченные неточности. Примечания те же, что и в первом сообщении данного issue. Протестировано на eyo 4.2.0.

  1. протЕ́кший — толковый словарь Ушакова допускает написание через «е»;
  2. недрЕма́нное око — см. комментарии в «Словаре ошибок русского языка» Григория Александровича Крылова;
  3. поко́шЕн — краткая форма слова «покошенный»;
  4. замЕ́т — родительный падеж от «замета» — «отметка, знак». Источник — Малый академический словарь Института русского языка Академии наук СССР.
  5. Прочь буйна чернь, непросвещЕ́нна — «е» в контексте стихотворения Державина «О удовольствии»;
  6. Ничтожный призрак, иль ещЕ́ Москвич в Гарольдовом плаще — в данном контексте из «Евгения Онегина» «еще», см. #26;
  7. киЕм — форма с «е» допустима в «Словаре употребления буквы Ё» Чумакова, о котором говорилось в #27;
  8. клешнЕ́й — родительный падеж множественного числа существительного «клешня»;
  9. Костер — «е» в контексте Шарль де КостЕ́р — автор «Легенды об Уленшпигеле…» — и Николай КостЕр-Вальдау — актёр «Игры Престолов»;
  10. ЗуЕв — фамилия; источники — Веселовский С. Б. Ономастикон. Древнерусские имена, прозвища и фамилии. М., 1974; Словарь русских народных говоров. Вып. 12. Л., 1977; Суперанская А. В. Современный словарь русских личных имен. М., 2005; Тупиков Н. М. Словарь древнерусских личных собственных имен. М., 2004.
  11. Гуань МоЕ — настоящее имя писателя Мо Яня, в данном контексте «Мое»;
  12. Никола ТЕ́сла — инженер и изобретатель;
  13. пересЕ́кший — допустимая форма;
  14. прет-а-портЕ́ — в данном слове с дефисами «прет», а не «прёт»;
  15. хай-тЕ́к — в данном слове с дефисом «тек», а не «тёк»;
  16. шрЕ́дер.

Спасибо.

hcodes commented 5 years ago

Эти замечания нужно в новую задачу перенести, иначе они потеряются.

hcodes commented 5 years ago

https://github.com/hcodes/eyo/issues/29

Kristinita commented 5 years ago

Считаю, нужно переоткрыть issue, поскольку не всё из первого поста исправлено. Если изменения не были добавлены не случайно, а по какой-либо аргументации, лучше это обсудить.

1. Данные

+ Бас-Тер
+ из Березников
+ Утер Пендрагон
+ Чес Чендлер

2. Шаги для воспроизведения

eyo --lint --only-safe KiraEyo.md

3. Желаемое поведение

Нет Safe replacements.

4. Актуальное поведение

[ERR] test.md
Safe replacements:
1. Тер → Тёр (1:7)
2. Березников → Берёзников (2:6)
3. Утер → Утёр (3:3)
4. Чес → Чёс (4:3)

5. Примечание

  1. Архангельский областной словарь под редакцией кандидата филологических наук, доцента Оксаны Гецовой; и Новый толково-образовательный словарь русского языка Татьяны Ефремовой допускают обе формы: «березник» и «берёзник». Поэтому, полагаю, данный пример подлежит исключению из словарей eyo.

6. Программное обеспечение

Спасибо.