Slimmer zoeken in big data

Nieuws | de redactie
10 augustus 2012 | Grote hoeveelheden gegevens zijn digitaal beschikbaar. Hoe vind je in dat woud van informatie nog wat je wilt vinden? UvA-onderzoeker Marc Bron en Jasmijn van Gorp (UU) ontwikkelden een interface om uitkomsten van zoekopdrachten in rijke archieven met elkaar te vergelijken.

Bron, promovendus bij het Intelligent Systems Lab (ISLA) van deUvA stelt dat onderzoekers van bepaald materiaal vaak wel weten dathet in het archief zit en hoe het er uit te halen is. Toch komen inhet merendeel van de gevallen onderzoekers met onderzoeksvragennaar het archief en moeten zij eerst op zoek gaan naar geschiktmateriaal en dus het archief verkennen.

Andere terminologie

Grootste probleem vormt het opstellen van de zoekvraag. Alsarchivarissen een andere terminologie hanteren dan de onderzoekersin hun onderzoek gebruiken, wordt vaak niet het gewenste resultaatgeboekt bij de zoekmachine.

Een tweede probleem ontstaat op het moment dat er wel materiaalis gevonden. Onderzoekers hebben immers geen mogelijkheid om vastte stellen of zij al het relevante materiaal verzameld hebben ofdat er ergens nog iets interessants te vinden is waar zij op datmoment nog geen weet van hebben.

Om deze problemen aan te pakken heeft Bron samen met collega’sbinnen ISLA, het Centre for Television in Transition van deUniversiteit Utrecht en Beeld & Geluid een exploratieveinterface ontwikkeld, MeRDES genaamd (voluit: Media Researchers’Data Exploration Suite). Hiermee kunnen uitkomsten vanverschillende zoekopdrachten in rijke archieven zoals dat van Beeld& Geluid met elkaar vergeleken worden.

Termen vergelijken

Door het aantal programma’s dat voor ieder van de zoekopdrachtenrelevant is te visualiseren, krijgen onderzoekers een indruk van dehoeveelheid informatie die omtrent verschillende aspecten van eenonderwerp beschikbaar is.  Op deze manier kan bijvoorbeeld deopkomst van het gebruik van de term ‘migrant’ in archiefmateriaalvergeleken worden met het gebruik van de term ‘vreemdeling’.

De hoeveelheid beschikbaar materiaal over een onderwerp en hoehet zich verhoudt tot andere onderwerpen kunnen een grote invloedhebben op de aanpak van het onderzoek en de uiteindelijke vragendie kunnen worden beantwoord.

Om de interface te testen hebben Marc Bron en postdoc JasmijnVan Gorp (UU) een gebruikersstudie uitgevoerd met 40mediawetenschappers. Bron presenteert de uitkomsten van hunonderzoek binnenkort op de internationale conferentie van deSpecial Interest Group on Information Retrieval (SIGIR) die van 12tot 16 augustus in Portland (OR) plaatsvindt.

Een demo van de interface is hier beschikbaar


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK