Zverik / whodidit

OpenStreetMap Changeset Analyzer
25 stars 16 forks source link

Индикатор потенциальных импортов #3

Closed BushmanK closed 11 years ago

BushmanK commented 11 years ago

Небольшая идея для усовершенствования инструмента. Еще одним видом потенциально подозрительных правок являются те, что содержат только созданные объекты в большом количестве. Потенциально, такая правка может оказаться импортом (хотя, конечно, рисование одних только домов или poi, а также весьма гипотетическое рисование какого-то места с новым Bing'ом тоже может так выглядеть).

См. пример: http://forum.openstreetmap.org/viewtopic.php?pid=296499#p296499

Понимаю, что критерий не абсолютный, однако он ни чуть не хуже уже использующихся.

Предлагаю добавить для областей с такими правками добавить дополнительный цвет индикатора - #00FFCC

Zverik commented 11 years ago

Новые цвета добавлять не буду, а созданием объектов в большой количестве методом многочасового обклацывания бинга занимаются многие участники, включая меня. Наконец, 300 объектов, как в приведённом ченджсете — это не «большое количество»: у меня на ченджсет выходит по 2-3 тысячи, и это без фанатизма.

BushmanK commented 11 years ago

Мда, можно было просто ответить "нет" и сэкономить назидательный тон. Чтобы было понятно, "большое количество" - это не абсолютная характеристика (какого размера changeset'ы бывают - я в курсе), а некий порог, который позволил бы отсечь шум.

Zverik commented 11 years ago

Суть моего ответа в том, что пороги эти для разных частей света разные. Сложная эвристика только вызовет жуткие споры, как уже произошло с потлатчем. Лучше поступать, как я: проверять каждый ченджсет, оповещение о котором приходит.

Здесь могу посоветовать только придумать и описать точный алгоритм детектирования вредоносных правок, и тогда его можно будет внести в скрипт. Несколько критериев там уже присутствуют, но они связаны с изменениями и удалениями.