По поводу НИРа: я могу сделать сравнительный анализ фреймворков для распознавания печатного текста с изображения, а потом сослаться на эту работу в ВКР в системе оцифровки.
вполне. А в каком виде исходные карты? Бумага? Рукописи? Word?
Распознанные сканы получить нет возможности.
pourquoi?
А еще у меня есть голубая мечта сделать читалку на мобильные платформы со встроенным переводчиком. Для этого понадобится система анализа текста и поиска наименее часто встречающихся слов (как правило, они и есть самые сложные). Могу написать об этом.
хорошая тема, но весьма нетривиальная. Если это художественный текст, то проблема машинного перевода не решена от слова "совсем". Если технический, то голосовой перевод воспринимается очень плохо. И откуда тезис про наименее часто встречающиеся слова? (на все это можно письменно не отвечать - расскажи при встрече)
вполне. А в каком виде исходные карты? Бумага? Рукописи? Word?
pourquoi?
хорошая тема, но весьма нетривиальная. Если это художественный текст, то проблема машинного перевода не решена от слова "совсем". Если технический, то голосовой перевод воспринимается очень плохо. И откуда тезис про наименее часто встречающиеся слова? (на все это можно письменно не отвечать - расскажи при встрече)