Slimmer zoeken in big data

Bron, promovendus bij het Intelligent Systems Lab (ISLA) van deUvA stelt dat onderzoekers van bepaald materiaal vaak wel weten dathet in het archief zit en hoe het er uit te halen is. Toch komen inhet merendeel van de gevallen onderzoekers met onderzoeksvragennaar het archief en moeten zij eerst op zoek gaan naar geschiktmateriaal en dus het archief verkennen.
Andere terminologie
Grootste probleem vormt het opstellen van de zoekvraag. Alsarchivarissen een andere terminologie hanteren dan de onderzoekersin hun onderzoek gebruiken, wordt vaak niet het gewenste resultaatgeboekt bij de zoekmachine.
Een tweede probleem ontstaat op het moment dat er wel materiaalis gevonden. Onderzoekers hebben immers geen mogelijkheid om vastte stellen of zij al het relevante materiaal verzameld hebben ofdat er ergens nog iets interessants te vinden is waar zij op datmoment nog geen weet van hebben.
Om deze problemen aan te pakken heeft Bron samen met collega’sbinnen ISLA, het Centre for Television in Transition van deUniversiteit Utrecht en Beeld & Geluid een exploratieveinterface ontwikkeld, MeRDES genaamd (voluit: Media Researchers’Data Exploration Suite). Hiermee kunnen uitkomsten vanverschillende zoekopdrachten in rijke archieven zoals dat van Beeld& Geluid met elkaar vergeleken worden.
Termen vergelijken
Door het aantal programma’s dat voor ieder van de zoekopdrachtenrelevant is te visualiseren, krijgen onderzoekers een indruk van dehoeveelheid informatie die omtrent verschillende aspecten van eenonderwerp beschikbaar is. Op deze manier kan bijvoorbeeld deopkomst van het gebruik van de term ‘migrant’ in archiefmateriaalvergeleken worden met het gebruik van de term ‘vreemdeling’.
De hoeveelheid beschikbaar materiaal over een onderwerp en hoehet zich verhoudt tot andere onderwerpen kunnen een grote invloedhebben op de aanpak van het onderzoek en de uiteindelijke vragendie kunnen worden beantwoord.
Om de interface te testen hebben Marc Bron en postdoc JasmijnVan Gorp (UU) een gebruikersstudie uitgevoerd met 40mediawetenschappers. Bron presenteert de uitkomsten van hunonderzoek binnenkort op de internationale conferentie van deSpecial Interest Group on Information Retrieval (SIGIR) die van 12tot 16 augustus in Portland (OR) plaatsvindt.
Een demo van de interface is
Meest Gelezen
