Open juyrjola opened 12 years ago
eikös tässä kannattaisi käyttää näitä yhteen vedettyjä ja siivottuja datoja by Louhos http://louhos.wordpress.com/2012/10/05/kunnallisvaalien-vertailukelpoiset-ehdokasdatat-csv-taulukkoina-2004-2008-2012/
apoikolan linkkaama data on tosiaan siistitty versio tuosta juyrjolan linkkaamasta Tilastokeskuksen datasta (2008). Saman linkin takaa Louhokselta löytyy vastaavat datat myös vuodelle 2004. En filtteröinyt informaatiota, lisäsin selkokielisiä kenttiä, tein etu- ja sukunimille omat kenttänsä, lisäsin otsikot kenttiin jne. Toistettava esikäsittelykoodi löytyy myös mainitun linkin takaa. Veikkaisin, että tuolla Louhokseen siistityllä datalla pääsee nopeammin eteen päin, taikka vaihtoehtoisesti hyödyntällä sitä R-koodia joka hakee datat kannasta ja tekee esikäsittelyn.
antagomir, onko ideoita miten handlattaisiin muuttuneet äänestysalueet ja kuntaliitokset? Ajateltiin että Tilastokeskuksen kuntaliitoslistaa (http://www.stat.fi/meta/luokitukset/kunta/002-2012/luokitusavain_teksti.txt) voisi hyödyntää datan yhdistämisessä.
En näköjään voi/osaa avata uutta issueta, mutta löysin TK:n äänestysalueiden id:t , ne voisi ottaa käyttöön http://www.stat.fi/meta/luokitukset/vaalipiiri/001-2012/luokitusavaimet.html
pitäisi verrata, että onko niillä mitään tekemistä/logiikkaa aikaisempien vuosien vastaavien kanssa
Data Tilastokeskukselta: http://pxweb2.stat.fi/database/StatFin/vaa/kvaa/2008_04/2008_04_fi.asp