Digitaal leermateriaal beter doorzoekbaar

Nieuws | door Tim Cardol
12 maart 2019 | Onder meer het Instituut voor Beeld & Geluid gebruikt het al. Als het aan SURF ligt gaat nieuwe technologie er voor zorgen dat digitale leermaterialen van hogescholen en universiteiten straks beter vindbaar worden.

Databases zijn over het algemeen doorzoekbaar op basis van metadata Metadata zijn data die het type, oorsprong en inhoud van bestanden typeren. Hierbij kan gedacht worden aan de bestandsvorm, de auteur, de publicatiedatum en onderlinge verbanden tussen data. Ze helpen om o.a. om zoekmachines beter te laten functioneren. . Met behulp van machine learning wordt gekeken hoe semi-automatische metadatering het doorzoeken van bronnen kan verbeteren. SURF bekijkt hoe deze techniek hun zoekportaal voor digitale leermaterialen beter doorzoekbaar kan maken.

Zijn repositories de weg naar open access?

In een blog op SURF vertelt Jelmer de Ronde hoe ze bezig zijn om te experimenteren met full tekst search in digitale leermaterialen. “Open leermaterialen komen voor in allerlei verschijningsvormen: er zijn bijvoorbeeld kennisclips, PowerPoint-presentaties, pdf’s, online e-modules, oefentoetsen en ongetwijfeld vele andere vormen. Om full text search mogelijk te maken, moet er een basis-infrastructuur komen die met al deze varianten om kan gaan.”

Spraak omzetten in tekst

Is het in tekstbestanden nog betrekkelijk eenvoudig om alle woorden te indexeren, voor filmpjes en geluidsbestanden is dat al een stuk moelijker. Door onder meer Youtube, maar inmiddels ook het Nederlandse instituut voor Beeld en Geluid wordt gebruik gemaakt van spraakherkenningssoftware. “Je kunt immers pas zoeken in beeldmateriaal als je eerst de gesproken tekst weet om te zetten in geschreven tekst,” vertelt De Ronde aan ScienceGuide.

SURF is daarom aan de slag gegaan met spraakherkenningssoftware die momenteel al gebruikt wordt in de Tweede Kamer. Een van de grote obstakels is het gebruik van jargon – woorden die weinig voorkomen in het algemeen taalgebruik. Het is de bedoeling de software zoveel mogelijk kennismaakt met het specifieke taalgebruik.

Als dat lukt dan moet het mogelijk worden om ook makkelijk verschillende leermaterialen met elkaar te verbinden in een zoekmachine. De Ronde: “Stel dat bijvoorbeeld naast de video van een hoorcollege ook de slides geüpload zijn, dan kan de spraakherkenningssoftware zich aan de hand van de woorden en afkortingen die voorkomen in de slides, voorbereiden op wat hij in de video zal aantreffen.”

Techniek bruikbaar voor meerdere databases

Het automatiseren van metadatering en full tekst search moeten samen de basis gaan leggen voor een zoekportaal voor digitale leermaterialen die dit voorjaar in gebruik moet worden genomen. Bij het project zijn op dit moment zeven hoger onderwijsinstellingen betrokken: Wageningen Universiteit, Universiteit Utrecht, Universiteit van Amsterdam, Universiteit Twente, Hogeschool Inholland, Haagse Hogeschool en Fontys Hogescholen.

Volgens projectleider Open Leermateriaal Kirsten Veelo kan de ontwikkelde technologie hopelijk in de toekomst ook ingezet worden bij andere databases en zoekportalen. “Het is onze bedoeling om deze technologieën breder in te zetten dan alleen het zoeken en vinden van open leermaterialen. De productmanager van de HBO Kennisbank is daarom nauw betrokken bij onze verkenningen.”

Verantwoordelijkheid bij verschillende partijen

Net als voor een database voor open leermaterialen geldt voor de HBO Kennisbank dat er veel verschillende vormen van onderzoeksoutput in verzameld wordt. In de Kennisbank wordt de metadata verzameld van de verschillende publicaties, zodat zij doorzoekbaar zijn op onder meer auteur, hogeschool, jaartal van publiceren en de discipline waaronder zij vallen.

Het invullen van deze metadata is de verantwoordelijkheid van de auteur, dan wel indiener van de publicatie. Juist omdat de verantwoordelijkheid voor het delen en metadateren van de publicaties bij de instellingen zelf ligt, kan semi-automatische metadatering een uitkomst bieden bij het beter structureren van een dergelijke database.

Tim Cardol : 

ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.

Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan

OK