Het woord is aan de Kamer
“Mashup is de term die in de wetenschap gebruikt wordt voor het samenbrengen van meerdere soorten data. Funda.nl is bijvoorbeeld één van de eerste websites die hier op grote schaal gebruik van maakt. Die site brengt adresgegevens uit Google Maps en huizenadvertenties samen.”
Voor het eerst ‘knettergek’
UvA-onderzoeker Maarten Marx is enkele jaren geleden hetzelfde gaan doen. “Er is in Nederland voor 200 jaar aan parlementaire notulen digitaal beschikbaar. In die teksten zit ontzettend veel structuur. Wat ik heb gedaan is een script schrijven om die structuur zichtbaar te maken. Zo kan je makkelijk uitzoeken wanneer, wie, in welke rol en voor welke partij iemand iets heeft gezegd.”
De keuze om politieke documenten hiervoor te gebruiken werd volgens Marx geboren in de periode dat Wilders in de Tweede Kamer Ella Vogelaar ‘knettergek’ noemde. “Ik wilde eigenlijk weten of dat al eerder was gezegd in de Kamer, door wie en in welke context. Maar met de toen bestaande zoekmachines was dat heel erg lastig en ondoorzichtig”
En dat terwijl je volgens de UvA-onderzoeker juist context nodig hebt bij zulke uitspraken. “Je wil weten wie iets heeft gezegd, of dat een interruptie is in een speech in de Tweede Kamer, een Kamervraag of een speech. Je zoekt dus specifiek naar een uitspraak in plaats van het hele document waarin een woord of zoekterm is opgenomen.”
WO II als argument
Als je bijvoorbeeld op de PoliticalMashup de term ‘studiefinanciering’ opzoekt, zie je een grote piek in 1986 bij de invoering van de Wet Studiefinanciering door toenmalig OCW-minister Wim Deetman. Op die manier zijn er natuurlijk vele vragen te beantwoorden door steeds slimmere combinaties van zoektermen te gebruiken. Zowel voor wetenschappers, journalisten en simpelweg geïnteresseerden is het zeer bruikbaar.
“Ik had iemand die was geïnteresseerd in maidenspeeches van nieuwe parlementariërs. In de oude archieven was het daarop moeilijk zoeken, omdat de term maidenspeech wel viel, maar dan niet per se gebruikt werd door de persoon die deze uitsprak. Door te zoeken op de uitspraak maidenspeech, zonder de term ‘bedankt’ en daarbij aan te geven dat het door de Kamervoorzitter werd gezegd, kun je vervolgens aardig deze speeches op een rijtje zetten. En het zijn er nogal wat.”
Ook het NIOD heeft gebruik gemaakt van de Political Mashup. “Zij wilden weten op welke manier de Tweede Wereldoorlog in de Tweede Kamer wordt ingezet als argument. Dat kan op meerdere manieren, als middel om iemand zwart te maken, maar bijvoorbeeld ook als waarschuwing van ‘dat nooit meer’. Door de semantische verrijking van de data kan je die argumenten beter en sneller vinden.”
Verbind data met elkaar
Maarten Marx ontving in 2012 de DANS Dataprijs. De tool werd geprezen omdat het de burger effectief in staat stelt “ofwel voor het verre verleden, als voor de dag van gisteren, het politieke proces beter te doorgronden en ook zijn gekozen volksvertegenwoordigers effectief te controleren.” Marx wil nu de volgende stap zetten, om ook nieuwsberichten aan de data toe te voegen. “Zo kunnen pieken in het gebruik van een term ook direct gelinkt worden aan een nieuwsgebeurtenis.”
Als medewerker van het Instituut voor Informatica onderzoekt Marx het opzoeken van informatie in XML-bestanden, een standaard voor de opbouw van formele opmaaktalen. “Het is die combinatie van tekst en gestructureerde data die zo interessant is. En juist in politieke teksten is dat interessant, omdat daar die onderliggende structuur zo betekenisvol is.”
Op het SURF Research and Innovation Event in Den Haag op 28 februari zal Maarten Marx vertellen over de Political Mashup en het belang van het integreren van verschillende data. “Dat is wel een boodschap die ik wil meegeven. Als je aan de slag gaat met het samenbrengen van die verschillende data, doe het dan alsjeblieft heel netjes en zorg dat het herbruikbaar is. Als je data semantisch gaat verrijken, doe het dan zo dat die verrijkte data herbruikbaar is en verbonden kan worden met andere databanken.”
Het SURF Research and Innovation Event 2012 vindt plaats op De Haagse Hogeschool op 28 februari. Inschrijven kan hier, het volledige programma vindt u hier
Meest Gelezen
Masterstudenten in het hbo worstelen met academisch schrijven en onderzoek
“Ik zal niet de meest populaire onderwijsminister zijn”
“Langstudeerboete raakt kern van hoger onderwijs”
CvB Erasmus Universiteit weigert tweetalig te vergaderen met medezeggenschap
Nederlands hoger onderwijs “negatieve uitschieter” op kansengelijkheid, toont OESO-rapport