harmonisch gemiddelde niet geschikt voor data met nullen

ToonHub commented 1 month ago

We gebruiken het harmonisch gemiddelde als een van de manieren om een index te berekenen (per criterium of globaal) op basis van de verschilscores per indicator. De verschilscores (met waarden tussen -1 en 1) worden eerst herschaald tussen 0 en 1, dan bereken je het harmonisch gemiddelde als volgt: gemiddelde_harm = 1 / gemiddelde(1/verschilscore_herschaald) en dan herschaal je terug naar een waarde tussen -1 en 1.

Als er een indicator is met een verschilscore -1, dan zal de globale index altijd -1 zijn ongeacht de verschilscores voor de andere indicatoren (-1 wordt herschaald naar 0, 1/0 = -Inf, gemiddelde = -Inf, 1/-Inf = 0, 0 wordt herschaald naar -1).

In de praktijk kan je dan hebben dat er bv. 0 sleutelsoorten zijn (geeft verschilscore van -1), maar dat alle andere indicatoren goed scoren. Dat meetpunt krijgt dan een globaal gunstige status voor de HRrapportage, maar je krijgt dan een waarde van -1 voor de globale index.

Waarom is er weer juist gekozen voor een harmonisch gemiddelde? En is een gewoon gemiddelde hier niet beter geschikt?

ElsLommelen commented 1 month ago

@hansvancalster, weet jij dit nog?

Sowieso is de rapportageHR-methode een stuk minder streng dan de gewone LSVI-beoordeling (waar de redenering is dat je nooit een habitat in gunstige staat kan hebben als een van de onderdelen slecht scoort), en ik vermoed dat die distance-to-target en scoresom vooral ontwikkeld is vanuit het idee van de gewone LSVI-beoordeling? Achteraf is er dan die rapportageHR-berekening bij gekomen, en hier wordt 'Status' wel op een andere manier berekend, maar ik kan me niet herinneren dat we ook de berekening van distance-to-target hieraan aangepast hebben, mogelijk omdat die scoresom daar aanvankelijk toch niet voor gebruikt ging worden? Het enige issue dat ik in dit verband terugvind, is #124.

hansvancalster commented 1 month ago

Sowieso is de rapportageHR-methode een stuk minder streng dan de gewone LSVI-beoordeling (waar de redenering is dat je nooit een habitat in gunstige staat kan hebben als een van de onderdelen slecht scoort), en ik vermoed dat die distance-to-target en scoresom vooral ontwikkeld is vanuit het idee van de gewone LSVI-beoordeling?

Dat klopt. De distance to target heeft geen relatie met de manier waarop de 'status' voor de rapportageHR berekend wordt.

Achteraf is er dan die rapportageHR-berekening bij gekomen, en hier wordt 'Status' wel op een andere manier berekend, maar ik kan me niet herinneren dat we ook de berekening van distance-to-target hieraan aangepast hebben, mogelijk omdat die scoresom daar aanvankelijk toch niet voor gebruikt ging worden?

Klopt, er is geen aanpassing gemaakt om een soort distance-to-target te berekenen die in lijn is met de Status volgens rapportageHR.

Waarom is er weer juist gekozen voor een harmonisch gemiddelde? En is een gewoon gemiddelde hier niet beter geschikt?

Er bestaat zoiets als een "veralgemeend gemiddelde", waar dit en andere gemiddeldes speciale gevallen van zijn. Je kan deze veralgemeende gemiddeldes rangschikken: minimum < harmonisch gemiddelde < geometrisch gemiddelde < rekenkundig gemiddelde. De originele LSVI bepaling hanteert het one-out-all-out principe: dit komt 1-op-1 overeen met "minimum" gebruiken als aggregatiecriterium in de LSVI distance-to-target berekening. Omdat dit een zeer streng principe is, hebben we ook de optie harmonisch gemiddelde toegelaten. Dit laat beter toe om "verbeteringen" of "verslechtering" in de tijd op te volgen. Je hebt dan ook nog de keus van aggregatie over indicatoren binnen een criterium en dan over criteria om tot globale distance to target te komen. Er worden drie verschillende globale indices berekend waarbij de naamgeving aangeeft welk aggregatie achtereenvolgens gebruikt werd: index_min_min, index_min_harm en index_harm_harm. Een naam met "min" duidt op minimum van de scores als aggregatie; bij "harm" werd het harmonisch gemiddelde berekend. Dus index_min_min < index_min_harm < index_harm_harm. Zo is index_min_harm, een index waar binnen een criterium het harmonische gemiddelde wordt berekend en daarna het minimum van deze harmonische gemiddelde wordt bepaald om tot einduitspraak te komen. Het rekenkundig gemiddelde hebben we niet gekozen omdat dit een te rooskleurige interpretatie geeft.

inbo / LSVI

harmonisch gemiddelde niet geschikt voor data met nullen #229