alhasha001 / thesis

This repository contains the related thesis materials
0 stars 0 forks source link

"witte randjes" #15

Open maartenmarx opened 2 years ago

maartenmarx commented 2 years ago

Hi @alhasha001 ,

Ik las net dit paper en hij beschreef dat verschillende mensen dezelfde webpaginas moesten annoteren op een screenshot, dus ook op pixel nivo, met blokken eromheen. En verdomd, de kappa was niet zo hoog, maar dat lag heel vaak aan de whitespace om een blok heen, de een nam wat meer, de ander deed het heel strak.

Ik moest meteen aan jou denken.

Het punt is dat dat natuurlijk helemaal niet uitmaakt, en dat je score dan eigenlijk "te laag" is.

Ik dacht dat je deze aanpassing makkelijk kunt maken.

$H$ is een predicted segment, en $T$ een gouden standaard segment, beide een verzameling pixels.

Dat "document whitespace" is toch wel netjes te operationaliseren?

Zelfs deze sterkere versie vind ik ook te verdedigen (want het kan ook zijn dat de gold standard juist heel ruim was, en jouw predictor heel sgtrict):

Nou, ik ben benieuwd! Probeer het eens, bekijk wat het oplevert, en check dat er "niks foutgaat" (dus dat het echt alleen om de randjes gaat). Zet het samen in een tabelletje, of grafiekje. En maak hier een nieuwe onderzoeksvraag van natuurlijk! Iets als "Hoe kunnen we corrigeren voor een verschil in granulariteit in annotaties die voor de detectie taak eigenlijk niks uitmaakt?" (Nou mag jij dat mooi in het engels vertalen ;-)

Sterket met de verhuizing terug he! Het is ook altijd wennen om weer even im een nieuw huis te wonen. Ik weet er alles van!

groet maarten

PS Weet jij iemand voor 2e lezer/examinator? Dat kan iedereen zijn die hier wat van afweet. Zelfs iemand uit de literatuur.