cscenter / SInGe

Faster incremental SDCH dictionary generator
6 stars 7 forks source link

изучить open-vcdiff на предмет того, как он кодирует #10

Open baranov1ch opened 9 years ago

baranov1ch commented 9 years ago

надо понять, как правильнее считать баллы для подстрок, тк у vcdiff'а свои секреты. Есть своя минимальная длина, есть всякий меджик, по которому он выбирает, что и на какую длину кодировать.

skipor commented 9 years ago

Минимальная длинна совпадения, с которой начинает кодировать это BlockHash::kBlockSize = 16

skipor commented 9 years ago

open_vcdiff не использует понятие "окна" для сжатия по SDCH, т.к. стандарт запрещает при сжатии использовать информацию из документа, как из словаря, следовательно разбивать документ на окна нет надобности.