daria40tim / Transform_Cards

0 stars 0 forks source link

Тема НИР #5

Open wldmr-key opened 5 years ago

wldmr-key commented 5 years ago

По поводу НИРа: я могу сделать сравнительный анализ фреймворков для распознавания печатного текста с изображения, а потом сослаться на эту работу в ВКР в системе оцифровки.

вполне. А в каком виде исходные карты? Бумага? Рукописи? Word?

Распознанные сканы получить нет возможности.

pourquoi?

А еще у меня есть голубая мечта сделать читалку на мобильные платформы со встроенным переводчиком. Для этого понадобится система анализа текста и поиска наименее часто встречающихся слов (как правило, они и есть самые сложные). Могу написать об этом.

хорошая тема, но весьма нетривиальная. Если это художественный текст, то проблема машинного перевода не решена от слова "совсем". Если технический, то голосовой перевод воспринимается очень плохо. И откуда тезис про наименее часто встречающиеся слова? (на все это можно письменно не отвечать - расскажи при встрече)

daria40tim commented 5 years ago

Вы не могли бы помочь сформулировать тему? А то я совсем потерялась

wldmr-key commented 5 years ago

Навскидку - исследование алгоритмов адаптивного подстрочного перевода для программ чтения книг возможно, слово "подстрочного" - лишнее