DTUComputeCognitiveSystems / deep_detektor

Automated Factual-Claim Detection in Danish Broadcasting
Other
2 stars 0 forks source link

What to do with spurious annonations? #20

Open JesperLH opened 7 years ago

JesperLH commented 7 years ago

Ikke alle annoteringer er skabt lige. Nogle gange er kun en del (eller et ord/bogstav) fremhævet. Nedenfor viser jeg de eksempler jeg har fundet. Nogle har jeg lavet forblive påstande og nogle har jeg fjernet som påstand.

Hvad siger i til det?

Formatet

Program "ID", sentence "sen-ID" "Den fulde paragraf" "Claim index" "Teksten der er blevet annoteret"

Påstande som er behold

Da jeg mener der indgår en påstand. + Obama kommentaren, kan ikke huske hvad vi blev enige om der.

Program 8567181, sentence 32 Det er din fortjeneste, Ninka har skrevet bogen. Mad er vel ikke medicin? Det kan bruges som medicin. [[49, 73]] Mad er vel ikke medicin?

Program 2337314, sentence 82 Min frygt er, at Obama er en sort racist. Læs hans bøger. [[17, 41]] Obama er en sort racist.

Program 8567636, sentence 17 I dag er der over 1 milliard overvægtige i verden. [[0, 1]] I

Program 8635201, sentence 4 Gevinsten ved at tage et arbejde er alt for lille. Det mener LA. [[51, 54]] Det

Program 7308025, sentence 180 Skattely kamuflerer, hvem ejerne er. Det kan være Gazprom, en diktator eller dig, uden at vi ved det. [[0, 20]] Skattely kamuflerer,

Program 9284846, sentence 9 Uenigheden er dyb, når det gælder de her spørgsmål. [[0, 10]] Uenigheden

Program 8665813, sentence 4 De sidste mange årtier har politikerne været enige om at flere skulle have uddannelse. Mere uddannelse var af det gode. [[0, 9]] De sidste

Program 8665813, sentence 6 I går præsenterede regeringen sit udspil til en gymnasiereform. [[0, 1]] I

Program 8665813, sentence 86 Hvis man skal aflevere to, tre, fire afleveringer om ugen så er det vigtigt at have sin faglighed i orden. [[0, 4]] Hvis

Program 8567181, sentence 105 Når man ser på den nyeste forskning om gluten er der cøliaki, der er en tarmsygdom. [[26, 35]] forskning

"Påstande" som er fjernet

Program 7308025, sentence 185 Vi accepterer en struktur, som er designet ... Jeg kan ikke forstå det. Kan du høre, det lyder mærkeligt? Messerschmidt. [[0, 26]] Vi accepterer en struktur,

Program 8567181, sentence 1 Sukker, nej. Mælk, niks. Hvedemel, nul. [[0, 7], [25, 34]] Sukker, [new claim]: Hvedemel,

Program 8567181, sentence 2 I stedet vitamintilskud og valleprotein, soja, kokos og naturmedicin. Holistiske udrensninger og indre oliebade. [[81, 93]] udrensninger

Program 8567181, sentence 12 Men jeg har altid skrantet. Det samme gjorde min søn som fik diagnosen infantil autist. Han var enormt adfærdsvanskelig. [[4, 11]] jeg har

Program 9284846, sentence 14 Paw Karslund er folketingskandidat for DF. [[39, 42]] DF.

Program 8665813, sentence 2 Men nu vil regeringen indføre karakterkrav til gymnasiet så nogle vil måske blive valgt fra. Hvorfor er det i Danmarks interesse at have færre unge med en studentereksamen? [[93, 100]] Hvorfor

Program 8665813, sentence 123 Vil vi opdage, at dem, der ikke får 4-taller, er fra ikke-boglige hjem? [[0, 3]] Vil

Program 8567636, sentence 62 Bente Klarlund, du forsker i fedme. Er det de fedes egen skyld? [[6, 15]] Klarlund,

NorthGuard commented 6 years ago

Jeg har konverteret data-notebooks'ne til scripts og lagt annoteringerne i en database, så nu er de ret lette at inspicerer. Jeg tænker at vi måske kan lave en "black-list"-fil, som indeholder præcist de datapunkter som vi gerne vil ignorerer (hvis det er løsningen selvfølgelig).