Seman is a set of linguistic tools to analyze Russian or German texts, it contains lexicons and grammars. The project is interesting as a base line for many research projects in computer linguistics area.
Обнаружилось, что код AOT ловит assert() на слове "Аэль". Показалось
интересным, потому что это единственное срабатывание после попытки
лемматизировать почти 5 млн. слов.
Здравствуйте, Алексей!
Обнаружилось, что код AOT ловит assert() на слове "Аэль". Показалось интересным, потому что это единственное срабатывание после попытки лемматизировать почти 5 млн. слов.
LemmatizerLib/MorphDict.cpp:62: void CMorphDict::GetLemmaInfos(const string&, size_t, std::vector&) const: Assertion
`Base == m_Bases[LemmaStrNo].GetString()' failed.
Приветствие из Томского государственного университета! :))