HS-Datadesk / koronavirus-avoindata

HS julkaisee Suomen koronavirustartunnat avoimena datana.
https://www.hs.fi/aihe/koronavirus/
MIT License
100 stars 27 forks source link

Sairaaladatan ensimmäisen päivän 0-arvot #63

Open tnnmk opened 4 years ago

tnnmk commented 4 years ago

Sairaaladatassa (finnishCoronaHospitalData), pitäisi varmaankin päivän 2020-03-21 tiedoissa kenttien totalHospitalised, inWard ja inIcu arvojen olla null tai nan tai jotain vastaavaa nykyisen arvon 0 sijaan? Ei nimittäin vaikuta uskottavalta, että sairaalahoidossa ei olisi ollut vielä yhtään ihmistä samana päivänä, kun ensimmäinen kuolintapaus ilmoitettiin.

Internet Archiven Wayback Machinen mukaan THL on ilmoittanut sairaala- ja tehohoidossa olevien maanlaajuiset lukumäärät myös 23.3. (sairaala: 50, teho: 13) [lähde] ja 24.3. (sairaala: 73, teho: 17) [lähde]. Nämä puuttuvat nykyisestä sairaaladatasta, mutta ne voisi varmaankin lisätä mukaan?

quarian commented 4 years ago

Joo - toi ensimmäinen data on outlieri siinä mielessä, että se on tosiaan ensimmäisen kuolintapauksen päivämäärä, ja silloin ei ollut ilmoitettu mitään noita muita tapauksia. THL:n ensimmäinen virallinen ilmoitus johon toi data pohjaa alkoi 25.3., ja siinä oli 3 kuollutta, ja koska oli tiedossa että 21.3. oli toi ensimmäinen niin se lisättiin tuohon dataan. On totta että se vois olla semanttisesti null - mutta toisaalta 0 on myös faktuaalinen tieto siitä, mitä tuona päivänä on ilmoitettu (mutta ´null´ vois tosiaan olla parempi).

Nuo kaksi päivää vois lisätä kyllä - kattelen niitä kunhan saadaan tän päivän uutistilannetta rauhoittumaan. Tosiaan tämä nykyinen sairaaladata perustaa tohon 25.3. alkaneeseen ilmoittamiseen jolloin tuli erityisvastuualueet mukaan, mutta ei sinällään ole syytä miksei noita voisi laittaa koko suomelle noille päiville.

Palaan asiaan.