Nationale Verjaardagskalender Hackathon #4

Nationale Verjaardagskalender Hackathon #4
© SETUP

Zaterdag 28 november 2015

Nationale Verjaardagskalender Hackathon #4

Tijd
10:00-17:00
Locatie
Utrecht | SETUP HQ
Entree
Gratis

Alle Nederlanders in een database; help ons mee om te onderzoeken hoe we zelf NSA kunnen spelen.

“Hoe moeilijk zou het zijn om een database van alle Nederlanders te bouwen?” - Met deze vraag begon bij SETUP het project De Nationale Verjaardagskalender.

Aangezien overheden en grote bedrijven al op grote schaal data van ons verzamelen, vond SETUP het tijd om zelf een poging te wagen. De Nationale Verjaardagskalender is die poging. Het doel: een database met de namen, adressen en verjaardagen van in elk geval 1% van alle Nederlanders erin. Mét cadeausuggesties op basis van profiling algoritmes. Voor het bouwen van de kalender organiseert SETUP tot en met januari 2016 drie hackathons in de Centrale Bibliotheek Utrecht. De eerste vond plaats op zaterdag 31 oktober, de tweede vindt plaats op 28 november en 30 januari is de laatste.

Waar staan we nu?

We hebben inmiddels nogal wat data binnen. Om je een idee te geven: 5 miljoen telefoonboekrecords, 2 miljoen Schoolbank-accounts, 80.000 vijftigplussers (inclusief hun hobby's en lievelingsboeken), 77.000 amateurvoetballers, 26.000 accountants en 15.000 bekende Nederlanders (wij wisten ook niet dat dat er zoveel waren). Daarnaast hebben we nog een hele berg kleinere datasets met onder andere artsen, filmfiguranten, competitiebiljarters, klarinetspelers uit Moergestel en hockeyers uit Friesland.

We zijn op dit moment druk bezig met het koppelen van de verschillende bronnen, maar we denken dat we ook al wel toe zijn aan die volgende stap: profiling. Van een kleine groep Nederlanders in onze verjaardagskalender weten we al best veel, en op basis daarvan willen we algoritmische profielen gaan maken.

  • Wat is de kans dat een 43-jarige Anja uit Drenthe van borduren en herfstwandelingen houdt?
  • Wat vindt de gemiddelde Hans leuk?
  • Wat geef je een voetballende accountant uit Hendrik-Ido-Ambacht voor zijn verjaardag?

Naast het profilen zijn er ook nog wat andere puzzels die aangepakt kunnen worden. Wat voorbeelden:

  • Hoe gaan we van de voetbalverenigingen waar onze 77.000 amateurvoetballers actief zijn woonplaatsen maken?
  • In sommige databronnen zijn voornamen en achternamen niet gesplitst. Hoe is dat op een goede manier te doen? Je komt dan natuurlijk namen tegen als "Jan Vennegoor of Hesselink", "Thomas Frank" of "Edwin de Roy van Zuydewijn".
  • We hebben ongeveer 80.000 profielen van 50plusser.nl: hoe maken we een goede index van hun hobby's?
  • Als we een Hans de Vries uit Amsterdam hebben in één van onze sets, hoe weten we dan aan welk record uit de Telefoongids we die moeten koppelen? (Is dat R.H. de Vries? Is dat H.G.L. de Vries? Of toch H.H. de Vries?)

Welke skills zijn handig?

Onze belangrijkste focus op 28 november wordt het profilen, maar met zoveel data is er echt voor echt wat wils te doen. Als je handig bent met Django en/of Python ben je van harte welkom, maar ook als je simpele scrapers kunt bouwen of vaardig bent met Excel of statistiek is er genoeg te verzinnen!

Achtergrond

De Nationale Verjaardagskalender is een kunstproject dat de opmaat vormt voor een theatervoorstelling die vanaf april 2016 op tournee gaat langs bibliotheken. Hiermee willen we Big Data begrijpelijker maken voor een groter publiek. Hieraan gekoppeld is een een journalistiek onderzoek naar profiling.

SETUP is het Utrechtse podium voor iedereen die geïnteresseerd is in de fusie van technologie en cultuur. Door onze speelse, laagdrempelige en activistische insteek zijn wij in staat om deze ontwikkelingen voor een breed publiek grijpbaar te maken.

Meedoen?

Stuur een mail naar Ellen Bijsterbosch op ellen@setup.nl om je aan te melden. Vermeld erbij wat je graag zou willen en kunnen doen. Aangezien we met persoonsgegevens werken, is er een protocol voor de omgang met de data. Er zal een Data Protection Officer aanwezig zijn die toeziet op de naleving ervan.