Onderzoeksdata FAIR maken hoef je niet alleen te doen

Nieuws | door Eva Baaren
30 maart 2021 | Het beter vindbaar, toegankelijk, uitwisselbaar en herbruikbaar (FAIR) maken van onderzoeksdata is belangrijk voor open wetenschap en samenwerking tussen onderzoekers, maar is niet voor iedereen even simpel. Bij het Universitair Medisch Centrum Groningen (UMCG) kunnen medewerkers sinds begin dit jaar hulp krijgen van experts binnen én buiten het instituut.
Beeld: SA 3.0.

Begin dit jaar is het UMCG gestart met het Digital Competence Center (DCC), waar medewerkers met al hun vragen over FAIR onderzoeksdata terecht kunnen. Het centrum is voortgevloeid uit het Uitvoeringsplan Investeringen Digitale Onderzoeksinfrastructuur van het ministerie van OC&W, waarbinnen eenmalig 4,5 miljoen euro is vrijgemaakt voor de inrichting van dergelijke lokale expertisecentra op all Nederlandse universiteiten en hogescholen. Van de expertise van het DCC van het UMCG wordt reeds door onderzoekers gebruik gemaakt, al weet niet iedereen het centrum even goed te vinden.

Onderzoeksaanvragen

“De meeste vragen die we bij het DCC krijgen zijn verzoeken om onderdelen van onderzoeksaanvragen te controleren”, vertelt Julissa van der Blij, manager Research Quality & Compliance van het UMCG. “Onderzoekers hebben dan bijvoorbeeld een subsidieaanvraag met daarin een datamanagementplan, en willen weten of het plan voldoet aan de eisen.” Op basis van haar recente ervaringen met het datacentrum en de voorganger ervan, het Research Data Management Loket, schat Van der Blij dat het aantal verzoeken om een review van zo’n plan ongeveer 150 verzoeken per jaar betreft.

Dat onderzoekers met vragen hun over datamanagementplan bij het DCC aankloppen is volgens haar geen overbodige luxe, want er moet bij zo’n plan aan veel zaken worden gedacht. De AVG bijvoorbeeld, maar ook de European Medical Device Regulation. Die laatste stelt specifieke voorwaarden aan de certificering van nieuw te ontwikkelen apps waarmee bijvoorbeeld data van proefpersonen kunnen worden verzameld.

Meld u hier aan voor de ScienceGuide Nieuwsbrief

 

Behalve het beoordelen van datamanagementplannen geeft het DCC ook adviezen aan medewerkers die worstelen met het verbeteren van de kwaliteit van bestaande onderzoeksdata. “Daarbij gaat het om allerlei soorten vragen”, gaat Van der Blij verder. “Hoe maak je je data vindbaar, toegankelijk, uitwisselbaar en bruikbaar? Wat heb je daarvoor nodig? Wat mag er, en wat móet? Wat kun je zelf regelen, en welke essentiële services zijn er binnen het UMCG al beschikbaar voor bijvoorbeeld het opslaan en anonimiseren van data?”

Bring Your Own Data bij de Hanzehogeschool

Toch lijkt nog niet iedereen het DCC van het UMC Groningen te kunnen vinden. Voor het FAIR maken van bestaande datasets is er in Groningen namelijk nóg een route, zo bleek tijdens het laatste seminar van DASH, het Groningse Data Science Center in Health. Die route loopt via de Hanzehogeschool, die sinds een jaar praktijkgerichte bring-your-own-data-sessies houdt waarbij iedereen met een data-gerelateerd verzoek terecht kan.

“Door corona zijn onze bring-your-own-data-sessies wat formeler geworden”, zegt Wynand Alkema, lector Data Science for Life Sciences & Health van de Hanzehogeschool, “maar normaal gesproken zitten we in een zaaltje en bestellen we er pizza bij.” Alkema vertelt dat de sessies zijn ontworpen om onderzoekers te helpen met een concreet probleem. Een team van docenten en studenten kijkt nauwkeurig naar de data, maakt een analyse van het probleem, en formuleert op basis daarvan een antwoord. Dat antwoord kan een advies zijn, maar ook een stukje software of een voorstel om voor langere tijd samen te werken.

Excelsheet

Voor wetenschapper Jennefer Beenen bleek dat laatste een uitkomst. De onderzoekstechnicus van het European Research Institute for the Biology of Ageing (ERIBA) worstelde met het een slecht toegankelijke en lastig bij te houden dataset, en kwam na een rondvraag binnen het UMCG terecht bij het lectoraat van Alkema.

“In ons lab wordt onderzoek naar cellen gedaan”, legt Beenen uit tijdens het webinar, “en voor één van de stappen in het onderzoeksproces wordt een machine gebruikt. Bij elk gebruik worden er gegevens bijgehouden die gaan over wie, wanneer, hoe vaak, en met welke instellingen de machine gebruikt, en of er daarbij complicaties zijn opgetreden. Eerst hielden we dat bij op papier, maar toen dat papierwerk door frequenter gebruik toenam, gingen we over op het gebruik van een Excelsheet.”

Volgens Beenen was Excel echter geen fijn oplossing. De data en de relaties daartussen waren namelijk complexer dan het overzicht waarin het programma van Microsoft kon voorzien. Ook was het bestand onvoldoende doorzoekbaar, slopen er fouten in omdat mensen gebruiksgegevens van papier overschreven, en bleef de dataset ontoegankelijk voor mensen buiten het UMCG en de RUG.

Typen data

“Het eerste wat we het bestand deden was daarover drie vragen stellen”, vertelt lector Alkema. “Welke typen data zitten erin, welke waarden vertegenwoordigen ze, en wat is de relatie ertussen?”

Door de betekenissen van de velden en hun onderlinge relaties te standaardiseren, kon het team een gelaagde database bouwen met daaraan gekoppeld een prototype van een webformulier om gegevens gebruiksvriendelijk in te voeren. “De software is open source”, gaat Alkema verder, “dus er zijn geen licenties nodig, waardoor je het gewoon kunt installeren op je laptop. Ook is het mogelijk om te regelen wie er binnen en buiten het lab toegang heeft tot welke typen data.”

Open voor samenwerking

Dat medewerkers van UMCG soms andere routes nemen om hun datasets en werkwijzen te verbeteren, vindt DCC-vertegenwoordiger Van der Blij niet heel problematisch. “Nog niet iedereen weet dat we bestaan, en het kan bovendien ook voorkomen dat het systeem dat wij aanraden voor data op basis van mensgericht onderzoek net niet past bij een dataset die gaat over het gebruik van een machine.”

Als de dataset van het lab op lange termijn toch moet worden overgezet naar het voorkeurssysteem van het UMCG, dan kan het DCC daar volgens Van der Blij overigens wel weer mee. “Er zijn wel meer datasets uit langlopende meerjarige onderzoeken waarbij dat nog moet gebeuren. We staan overigens zeker open om daarin samen te werken met de Hanzehogeschool, net als met het digitale competentiecentra van de RUG en andere universiteiten”, aldus Van der Blij.


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK