Slimmer zoeken in big data

Nieuws | de redactie

10 augustus 2012 | Grote hoeveelheden gegevens zijn digitaal beschikbaar. Hoe vind je in dat woud van informatie nog wat je wilt vinden? UvA-onderzoeker Marc Bron en Jasmijn van Gorp (UU) ontwikkelden een interface om uitkomsten van zoekopdrachten in rijke archieven met elkaar te vergelijken.

Bron, promovendus bij het Intelligent Systems Lab (ISLA) van deUvA stelt dat onderzoekers van bepaald materiaal vaak wel weten dathet in het archief zit en hoe het er uit te halen is. Toch komen inhet merendeel van de gevallen onderzoekers met onderzoeksvragennaar het archief en moeten zij eerst op zoek gaan naar geschiktmateriaal en dus het archief verkennen.

Andere terminologie

Grootste probleem vormt het opstellen van de zoekvraag. Alsarchivarissen een andere terminologie hanteren dan de onderzoekersin hun onderzoek gebruiken, wordt vaak niet het gewenste resultaatgeboekt bij de zoekmachine.

Een tweede probleem ontstaat op het moment dat er wel materiaalis gevonden. Onderzoekers hebben immers geen mogelijkheid om vastte stellen of zij al het relevante materiaal verzameld hebben ofdat er ergens nog iets interessants te vinden is waar zij op datmoment nog geen weet van hebben.

Om deze problemen aan te pakken heeft Bron samen met collega’sbinnen ISLA, het Centre for Television in Transition van deUniversiteit Utrecht en Beeld & Geluid een exploratieveinterface ontwikkeld, MeRDES genaamd (voluit: Media Researchers’Data Exploration Suite). Hiermee kunnen uitkomsten vanverschillende zoekopdrachten in rijke archieven zoals dat van Beeld& Geluid met elkaar vergeleken worden.

Termen vergelijken

Door het aantal programma’s dat voor ieder van de zoekopdrachtenrelevant is te visualiseren, krijgen onderzoekers een indruk van dehoeveelheid informatie die omtrent verschillende aspecten van eenonderwerp beschikbaar is. Op deze manier kan bijvoorbeeld deopkomst van het gebruik van de term ‘migrant’ in archiefmateriaalvergeleken worden met het gebruik van de term ‘vreemdeling’.

De hoeveelheid beschikbaar materiaal over een onderwerp en hoehet zich verhoudt tot andere onderwerpen kunnen een grote invloedhebben op de aanpak van het onderzoek en de uiteindelijke vragendie kunnen worden beantwoord.

Om de interface te testen hebben Marc Bron en postdoc JasmijnVan Gorp (UU) een gebruikersstudie uitgevoerd met 40mediawetenschappers. Bron presenteert de uitkomsten van hunonderzoek binnenkort op de internationale conferentie van deSpecial Interest Group on Information Retrieval (SIGIR) die van 12tot 16 augustus in Portland (OR) plaatsvindt.

Een demo van de interface is hier beschikbaar

« University College in Twente

Navigatie

Categorieën

ScienceGuide gaat verder

Slimmer zoeken in big data

Meest Gelezen

Vrouwen houden universiteit draaiende, maar krijgen daarvoor geen waardering

Wederom intimidatie van journalisten door universiteit, nu in Delft

‘Burgerschapsonderwijs moet ook verplicht worden in hbo en wo’

Raad van State: laat taaltoets nog niet gelden voor hbo-opleidingen

Hbo-docent wil wel rolmodel zijn, maar niet eigen moreel kompas opdringen

Laatste artikelen

‘Internationalisering hoger onderwijs is voortzetting van kolonialisme en neoliberalisme’

‘Als we niet investeren in Leven Lang Ontwikkelen, worden we een Incarijk’

‘Ook studenten hebben academische vrijheid’

Na Dijsselbloem wil ook NSC bindende afspraken over blijfkans internationale studenten

Toenemende kritiek in de Kamer op selectie in het hoger onderwijs