valbok / img.chk

37 stars 13 forks source link

Вопросы #6

Open godzie44 opened 7 years ago

godzie44 commented 7 years ago

Здравствуйте, спасибо за алгоритм и его описание, отличный труд! В ходе реализации возникли некоторые вопросы:

  1. Используемый придел расстояния Хэмминга, в примерах к HEngine используется 7, и вообще 7 часто встречается, тем не менее в моих тестах более менее удобно получается с +-12, при 7 слишком уж мало совпадений ключевых точек в целом получается. Проблема в моей реализации или можно отнести это к настройке алгоритма?
  2. В ходе небольших тестов мне показалось что, в отличие от sift, хеши очень чувствительны на изменения в цветах (определение дубликатов проблематичнее), так ли это?
  3. В ответах на issues вы пару раз упоминали про последующую обработку, не могли бы вы немного раскрыть тему?
  4. Если заранее известно что изображения в пуле будут не превышать определенный размер и будут довольно маленькими (300х300 например), какое бы минимальное число хешей вы посоветовали?
valbok commented 7 years ago

Здравствуйте, спасибо за вопросы. Извините, если задержался, и в последние годы выпал из темы.

  1. Я использовал 7, после тестов на своих выборках, и достаточный уровень ошибок. Можно и больше, но мне кажется, смысла будет немного, т.к. будет много несовпадений.
  2. Насколько я еще что-то помню, цвет не должен влиять, возможно требуется это проверить и подпиливать.
  3. К сожалению уже не помню сильно про последующую обработку, но помню использовал surf для удаления явного несовпадения. Главное из базы достать "более-менее" релевантные изображения и уже по ним искать. Эти хеши могут пригодиться именно для этого.
  4. Чем больше изображения, тем легче их оценивать. К сожалению не уверен, что могу сказать про количество хешей, видимо требуется проверить на тестовой выборке.