Vaalidataa pöyhimään

OKfestivalin aikana Louhoksen Leo Lahti ja Joona Lehtomäki ohjelmoivat datankäsittelyrutiineita Datvaalit.fi -projektiin. Kuva: Daniel Schildt

Kunnallisvaalien lähestyessä alkaa kiinnostus vaalidataa kohtaan nousta. Sunnuntaina 7.10.2012 tasan kolme viikkoa ennen vaaleja järjestetään Datavaalit ohjelmointisessio. Fyysisiä tapaamisia järjestetään ainakin Helsingissä ja Jyväskylässä, lisäksi mukaan voi liittyä virtuaalisesti. Sopivasti Apps4Finland -kilpailun deadline on vaalipäivänä 28.10, joten tämäkin saattanee motivoida ihmisiä tekemään vaaliaiheisia datan möyhennyksiä.
Pari viikkoa sitten Open Knowledge Festivalin yhteydessä julkistettu Datavaalit.fi on avoimen lähdekoodin ja avoimen demokratian hanke, jossa joukkovoimalla tuodaan kaikkea vaaleihin liittyvää dataa yhteen ja tarjotaan sitä edelleen helppokäyttöisten rajapintojen kautta. Hankkeen tavoitteena on luoda Suomeen pysyvää ja sitoutumatonta avoimen päätöksentekodatan infrastruktuuria. Esimerkiksi kuntiin liittyvien tietovarantojen kerääminen kattavasti olisi yksittäiselle toimijalle työlästä tai lähes mahdotonta: – Suomessa on yli 300 kuntaa, joiden kirjanpito ei pääsääntöisesti ole saatavilla yhtenäisessä ja avoimessa koneluettavassa muodossa.


Kuva: Irmeli Aro

Vaaleihin liittyvää dataa pyritään keräämään muun muassa seuraavista aiheista:

  • Ehdokastiedot (ehdokkaita on yli 37 000, heidän perustietonsa, sekä mm. sosiaalisen median profiilit)
  • Vaalitulosdata (aiempien vaalien tulostiedot)
  • Nykyisiin luottamushenkilöihin liittyvää dataa (esim. kuka istuu missäkin lautakunnassa ympäri maan)
  • Vaalikonedataa (HS on jo avannut oman vaalikoneen datansa ja YLE tulee perästä)
  • Kuntiin ja vaaleihin liittyvää perusdataa (kuntakoodit, vaalipiirit, valittavien valtuustojen koot jne.)
  • Kuntiin liittyviä tilastotietoja (verotuksesta, väestöstä, koulutuksesta, työttömyydestä jne.)
  • Kuntien talousdataa (muutamat kunnat ovat jo avanneet tulot ja menot datana)
  • Paikkatietoja (kuntien rajat, äänestysalueiden rajoja)
  • Vaalirahoitusilmoitukset datana
  • Kuntien asianhallinta ja päätösdataa (lautakuntien pöytäkirjoja valtuustojen videointeja)

Avoimesta datasta on hyötyä vain silloin, jos kun myös käytetään. Tämän vuoden presidentinvaalit eivät olleet datamielessä niin kiinnostavat, koska ehdokkaita oli sen verran vähän, mutta vuoden 2011 eduskuntavaalien alla kiinnostus vaalidatan käyttöön oli huima, silloin vain muutaman viikon aikana syntyi lukuisia erilaisia vaaleihin liittyviä visualisointeja, joidenka syntyyn vaikutti erityisesti vaalikonedatan avaaminen laajan joukon käytettäväksi.
Eduskuntavaalien alla kuitenkaan ei ollut vielä yhtenäistä infrastruktuuria, jossa vaalidataa olisi voitu siivota, jalostaa ja julkaista järjestelmällisesti. Datavaalit.fi sivustolla pyritään paikkaamaan tämä aukko. Lisäksi hankkeessa edistetään datan käyttöä käynnistämällä datajournalismin koulutustoimintaa ja tuottamalla tutoriaaleja Datajournalismi.fi -sivustolle kaikkien käytettäväksi. Datan avulla journalistit voivat nostaa lokakuun kunnallisvaalien alla keskusteluun tärkeitä yhteiskunnallisia teemoja. Esimerkiksi keskustelu kunnallisveroasteesta on erilaista, jos ihmiset voivat suhteuttaa veroäyrin sekä omiin tuloihinsa että kunnan talouteen.

Tarttukaamme toimeen

Datavaalit on sitoutumaton ja yhteisövetoinen hanke johon kuka tahansa saa osallistua. Mukaan pääsee liittymällä keskusteluihin Facebook-ryhmässä tai Louhoksen IRC -kanavalla. Yksittäinen journalisti voi vaikka pyytä kotikuntansa luottamushenkilörekisterin tietopyyntönä tai koodari voi tehdä jonkun parannuksen datan esikäsittelyyn tai ohjelmoida niinsanotun screen scrapperin, joka hakee dataa kunnan nettisivuilta. Tärkeintä ja kenties mielekkäintä osallistumista on tietysti datan hyötykäyttö – penkokaamme dataa, tehkäämme sormirajoituksia, analyyseja ja sovelluksia. Suomen itsenäisyyden juhlarahasto Sitra on tukenut Uusi Demokratia -kiihdytysrahoituksella Datavaalit -sivuston pystyttämistä.