sokirko74 / aot

Seman is a set of linguistic tools to analyze Russian or German texts, it contains lexicons and grammars. The project is interesting as a base line for many research projects in computer linguistics area.
http://aot.ru
GNU Lesser General Public License v2.1
83 stars 14 forks source link

Assert в морфологии на слове Аэль #1

Open sokirko74 opened 4 years ago

sokirko74 commented 4 years ago

Здравствуйте, Алексей!

Обнаружилось, что код AOT ловит assert() на слове "Аэль". Показалось интересным, потому что это единственное срабатывание после попытки лемматизировать почти 5 млн. слов.

LemmatizerLib/MorphDict.cpp:62: void CMorphDict::GetLemmaInfos(const string&, size_t, std::vector&) const: Assertion `Base == m_Bases[LemmaStrNo].GetString()' failed.

Приветствие из Томского государственного университета! :))

sokirko74 commented 4 years ago

"Яэль", не "Аэль". Я сам в своей суматохе опечатался. Ещё раз простите!

sokirko74 commented 4 years ago

Исправлено