Вопросы - Githubissues

Здравствуйте, спасибо за алгоритм и его описание, отличный труд! В ходе реализации возникли некоторые вопросы:

Используемый придел расстояния Хэмминга, в примерах к HEngine используется 7, и вообще 7 часто встречается, тем не менее в моих тестах более менее удобно получается с +-12, при 7 слишком уж мало совпадений ключевых точек в целом получается. Проблема в моей реализации или можно отнести это к настройке алгоритма?
В ходе небольших тестов мне показалось что, в отличие от sift, хеши очень чувствительны на изменения в цветах (определение дубликатов проблематичнее), так ли это?
В ответах на issues вы пару раз упоминали про последующую обработку, не могли бы вы немного раскрыть тему?
Если заранее известно что изображения в пуле будут не превышать определенный размер и будут довольно маленькими (300х300 например), какое бы минимальное число хешей вы посоветовали?

Здравствуйте, спасибо за вопросы. Извините, если задержался, и в последние годы выпал из темы.

Я использовал 7, после тестов на своих выборках, и достаточный уровень ошибок. Можно и больше, но мне кажется, смысла будет немного, т.к. будет много несовпадений.
Насколько я еще что-то помню, цвет не должен влиять, возможно требуется это проверить и подпиливать.
К сожалению уже не помню сильно про последующую обработку, но помню использовал surf для удаления явного несовпадения. Главное из базы достать "более-менее" релевантные изображения и уже по ним искать. Эти хеши могут пригодиться именно для этого.
Чем больше изображения, тем легче их оценивать. К сожалению не уверен, что могу сказать про количество хешей, видимо требуется проверить на тестовой выборке.

valbok / img.chk