Het woord is aan de Kamer

Nieuws | de redactie
23 januari 2013 | 200 jaar Handelingen zijn in ons land beschikbaar. Maar hoe haal je daar kennis uit? Wanneer werd voor het eerst ‘knettergek’ in de Kamer gebruikt? PoliticalMashup, de zoekmachine van Maarten Marx, helpt als nieuw eScience-instrument onderzoek en media in zulke rijke, complexe data.

“Mashup is de term die in de wetenschap gebruikt wordt voor het samenbrengen van meerdere soorten data. Funda.nl is bijvoorbeeld één van de eerste websites die hier op grote schaal gebruik van maakt. Die site brengt adresgegevens uit Google Maps en huizenadvertenties samen.”

Voor het eerst ‘knettergek’

UvA-onderzoeker Maarten Marx is enkele jaren geleden hetzelfde gaan doen. “Er is in Nederland voor 200 jaar aan parlementaire notulen digitaal beschikbaar. In die teksten zit ontzettend veel structuur. Wat ik heb gedaan is een script schrijven om die structuur zichtbaar te maken. Zo kan je makkelijk uitzoeken wanneer, wie, in welke rol en voor welke partij iemand iets heeft gezegd.”

De keuze om politieke documenten hiervoor te gebruiken werd volgens Marx geboren in de periode dat Wilders in de Tweede Kamer Ella Vogelaar ‘knettergek’ noemde.  “Ik wilde eigenlijk weten of dat al eerder was gezegd in de Kamer, door wie  en in welke context. Maar met de toen bestaande zoekmachines was dat heel erg lastig en ondoorzichtig”

En dat terwijl je volgens de UvA-onderzoeker juist context nodig hebt bij zulke uitspraken. “Je wil weten wie iets heeft gezegd, of dat een interruptie is in een speech in de Tweede Kamer, een Kamervraag of een speech. Je zoekt dus specifiek naar een uitspraak in plaats van het hele document waarin een woord of zoekterm is opgenomen.”

WO II als argument

Als je bijvoorbeeld op de PoliticalMashup de term ‘studiefinanciering’ opzoekt, zie je een grote piek in 1986 bij de invoering van de Wet Studiefinanciering door toenmalig OCW-minister Wim Deetman. Op die manier zijn er natuurlijk vele vragen te beantwoorden door steeds slimmere combinaties van zoektermen te gebruiken. Zowel voor wetenschappers, journalisten en simpelweg geïnteresseerden is het zeer bruikbaar.

“Ik had iemand die was geïnteresseerd in maidenspeeches van nieuwe parlementariërs. In de oude archieven was het daarop moeilijk zoeken, omdat de term maidenspeech wel viel, maar dan niet per se gebruikt werd door de persoon die deze uitsprak. Door te zoeken op de uitspraak maidenspeech, zonder de term ‘bedankt’ en daarbij aan te geven dat het door de Kamervoorzitter werd gezegd, kun je vervolgens aardig deze speeches op een rijtje zetten. En het zijn er nogal wat.”

Ook het NIOD heeft gebruik gemaakt van de Political Mashup. “Zij wilden weten op welke manier de Tweede Wereldoorlog in de Tweede Kamer wordt ingezet als argument. Dat kan op meerdere manieren, als middel om iemand zwart te maken, maar bijvoorbeeld ook als waarschuwing van ‘dat nooit meer’. Door de semantische verrijking van de data kan je die argumenten beter en sneller vinden.”

Verbind data met elkaar

Maarten Marx ontving in 2012 de DANS Dataprijs. De tool werd geprezen omdat het de burger effectief in staat stelt “ofwel voor het verre verleden, als voor de dag van gisteren, het politieke proces beter te doorgronden en ook zijn gekozen volksvertegenwoordigers effectief te controleren.” Marx wil nu de volgende stap zetten, om ook nieuwsberichten aan de data toe te voegen. “Zo kunnen pieken in het gebruik van een term ook direct gelinkt worden aan een nieuwsgebeurtenis.”

Als medewerker van het Instituut voor Informatica onderzoekt Marx het opzoeken van informatie in XML-bestanden, een standaard voor de opbouw van formele opmaaktalen. “Het is die combinatie van tekst en gestructureerde data die zo interessant is. En juist in politieke teksten is dat interessant, omdat daar die onderliggende structuur zo betekenisvol is.”

Op het SURF Research and Innovation Event in Den Haag op 28 februari zal Maarten Marx vertellen over de Political Mashup en het belang van het integreren van verschillende data. “Dat is wel een boodschap die ik wil meegeven. Als je aan de slag gaat met het samenbrengen van die verschillende data, doe het dan alsjeblieft heel netjes en zorg dat het herbruikbaar is. Als je data  semantisch gaat verrijken, doe het dan zo dat die verrijkte  data  herbruikbaar is en  verbonden kan worden met andere databanken.”

Het SURF Research and Innovation Event 2012 vindt plaats op De Haagse Hogeschool op 28 februari. Inschrijven kan hier, het volledige programma vindt u hier


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK