holderdeord / hdo-site

Parliamentary monitoring website for Norway
https://data.holderdeord.no/
BSD 3-Clause "New" or "Revised" License
42 stars 16 forks source link

Legge til referater fra Stortinget #653

Open drees123 opened 10 years ago

drees123 commented 10 years ago

Stortinget lager alle referatene fra stortingsmøtene i XML-format. Dette ligger foreløpig ikke i API-et, men administrasjonen har sagt at de som en mellomløsning kan sende oss XML-filer med jevne mellomrom.

I september møtte jeg Tom Steinberg fra MySociety i Storbritannia. De jobber med å lage et system som enkelt kan vise frem referater osv, og ville gjerne at vi skulle bli en prøvekanin på dette. Løsningen heter SayIt og kildekoden ligger her: https://github.com/mysociety/sayit. Kontaktperson i MySociety er Matthew Somerville matthew@mysociety.org som driver utvikligen av SayIt.

Drømmen er at vi kan integrere snutter av referatene på: a) Representantsiden - se siste fem ganger representant X snakket på Stortingets talerstol b) Sakssiden - lenke direkte til riktig sted i referatet fra avstemningene c) Kategorisiden - lenke til siste fem ganger ordet "arbeidsliv" ble nevnt ... og sikkert mange andre!

Hvis det er enkelt å gjenbruke SayIt-koden og tilpasse den våre ønsker, er det interessant. Det kan også hende MySociety kan hjelpe oss med noe av dette arbeidet. Men, det bør integrere godt med vår eksisterende applikasjon, for det har liten hensikt å ha en egen separat side som viser referatene - det har Stortinget selv.

Første steg er å finne ut mer om hvordan XML-formatet fra Stortinget ser ut, og hvordan SayIt fungerer.

drees123 commented 10 years ago

@jarib har allerede sett litt på XML-filen vi fikk fra Stortinget (ligger på Dropbox/Teknisk/Referater fra Stortinget), og her er hans foreløpige vurderinger:

Det burde være mulig for dem å endre navn-feltet slik at det ikke inneholder informasjon som tidspunkt, “Statsråd” osv. Så i stedet for

<navn>Heidi Sørensen (SV) [11:36:48]</navn>

burde man kunne generere:

<navn representantid="HEIS">Heidi Sørensen</navn> (<parti>SV</parti>) [<tidspunkt>11:36:48</tidspunkt]

Det er selvsagt mulig for oss å jobbe med formatet slik det er i dag, og lete opp riktig representant basert på teksten, men vi bør sjekke om det er lett for dem å legge elementer rundt rådataene og legge til "representantid" der det er mulig.

Ellers er det supert at de har med “saksid” i referatet, som stemmer overens med saks-idene i APIet og nettsiden ellers. En forbedring ville vært om <votering>-elementene likeledes var merket med voterings-idene som brukes i APIet.

jarib commented 10 years ago

Tom Steinberg nevnte i en epost at vi burde undersøke muligheten for å konvertere våre data til Akoma Ntoso-standarden, en standard som beskrives som

an XML document schema providing sophisticated description possibilities for several Parliamentary document types (including bills, acts and parliamentary records, etc.). It aims to standardize simple, technology-neutral representations of Parliamentary Documents in order to improve inter-Parliamentary cooperation and reduce the costs of Parliamentary IT support systems.

Foreslår at noen ser litt på denne før vi sender tilbakemelding til Stortinget.

jarib commented 10 years ago

659 - egen sak for å se på XMLen vs SayIt