Zijn repositories de weg naar open access?

Analyse | door Sicco de Knecht & Tim Cardol
19 juni 2018 | Als het aan de grote wetenschappelijke fondsen ligt moet onderzoek op korte termijn helemaal open en toegankelijk zijn, voor iedereen. Voor de open access discussie houdt dat onder andere in dat publicaties, proefschriften en inaugurele redes toegankelijk moeten worden gemaakt. Meer dan eens worden hierbij grote online repositories aangewezen als oplossing, maar zijn ze dat ook?
Foto: The National Archives (United Kingdom)

Kort geleden presenteerde de Europese Commissie de nieuwe plannen voor de opvolger van Horizon 2020. Uit die plannen blijkt dat het menens is met het voornemen om het wetenschappelijk proces transparanter en toegankelijker te maken. Er wordt tussen 2021 en 2027 maar liefst €25,8 miljard vrijgemaakt voor open science. Ook op nationaal niveau geeft NWO in haar nieuwe strategie open science een grote rol, vanuit de overtuiging dat dit de innovatiekracht zal verbeteren.

Onder open science wordt niet alleen verstaan dat artikelen vrij toegankelijk zijn, het gaat ook om methoden, data, software, peer review en onderwijsmateriaal. Een forse hoeveelheid (onderzoeks)gegevens dus, die op de een of andere manier met elkaar gedeeld zullen moeten worden. Over hoe dit moet gebeuren stelt NWO het volgende: “Open Science vraagt om een nieuwe infrastructuur met data repositories voor de opslag van onderzoeksgegevens op een veilige en betrouwbare wijze.”

Een forse klus die in de eerste plaats de vraag oproept wat er nu precies verstaan wordt onder een repository. Wat maakt een repository nu anders dan een grote harde schijf? Aan welke standaarden moet deze voldoen om ook echt van toegevoegde waarde te zijn? En de volgende niet onbelangrijke vraag: wie houdt deze bij? Wie is er verantwoordelijk?

Wat zit er in een repository?

Een wetenschappelijk archief, dat is wellicht de beste analogie voor een repository. Waar archieven echter veelal bestaan uit vergelijkbare objecten zoals boeken, kranten of persoonsgegevens, biedt digitale opslag aanzienlijk meer mogelijkheden voor het bijeenbrengen van verschillende soorten data. Of een bestand nu een foto, tekst of muziek bevat maakt voor een computer weinig uit.

In het kader van onderzoeksrepositories valt de categorisering uit in drie hoofdcategorieën: artikelen, data en software. Deze kunnen onderling uit een keur aan bestandstypen bestaan, maar met name het gebruik is verschillend. De vereisten voor opslag zijn voor elke categorie net weer even wat anders. Het aantal verschillende bestandstypen van publicaties is over het algemeen nog te overzien. Wanneer het over data en software gaat worden de zaken ingewikkelder, daarover meer in een volgend artikel.

De Nederlandse hogescholen en universiteiten houden allemaal een eigen repository bij van onder andere wetenschappelijke artikelen, proefschriften, boeken en bijvoorbeeld afstudeerscripties. Het beleid ten aanzien van het onderhoud en wat er in opgenomen wordt is veelal aan de instellingen zelf. Op nationaal niveau worden deze publicaties toegankelijk gemaakt via de repositories NARCIS en de HBO Kennisbank.

Nationale repository voor academisch onderzoek

Op nationaal niveau brengt de KNAW de inhoud van alle wetenschappelijke archieven sinds 2003 bijeen in de repository NARCIS Strikt genomen is NARCIS zelf geen repository maar eerder een portal, een 'toegangspoort' richting de diverse repositories van de verschillende instellingen. Bovendien is het een zoekmachine die de toegang faciliteert. Hetzelfde principe geldt voor de hbo kennisbank. . Deze is momenteel in het beheer van DANS. Aanvankelijk kon NARCIS rekenen op grote interesse van de instellingen, en groeide het aantal publicaties dat werd toegevoegd aan de repository jaarlijks nog. Vanaf 2012 lijkt hier echter de klad in gekomen te zijn, zo blijkt uit cijfers van NARCIS. Of er sprake is van een daling is niet duidelijk, het zou kunnen dat er achterstanden zijn in het toevoegen van artikelen.

Overzicht van invoer in NARCIS. Bron: NARCIS

De dekkingsgraad van proefschriften in NARCIS is, onder andere door het eigen beleid van de instellingen, met 90% en stijgende een bijzondere prestatie. Het is echter een uitzondering op de regel; andere typen publicaties doen het slechter. Op het gebied van wetenschappelijke artikelen houden onderzoekers en instellingen de kaarten tegen de borst. Slechts ruwweg de helft van de artikelen wordt toegevoegd.

Er is niet een enkele reden aan te wijzen voor de achterblijvende dekkingsgraad van artikelen in NARCIS. Wel is in het algemeen duidelijk dat repositories niet aan alle belangen van de wetenschapper tegemoet kunnen komen. Het kerndoel van veel onderzoekers blijft uiteindelijk om hun werk gepubliceerd te krijgen in invloedrijke tijdschriften. Dat is wat collega’s interessant vinden, en wat helpt om een beurs te bemachtigen.

Het toevoegen van de publicatie aan een repository is dus bijna altijd van secundair belang voor de auteur. Een repository kan geen ‘prestige’ leveren omdat deze vaak niets ‘toevoegt’ aan een publicatie zoals een tijdschrift dat doet, onder andere in de vorm van (peer-) review. Een uitzondering op de regel wordt gevormd door repositories als ArXiv in de wis- en natuurkunde. Daar zijn ‘bewijzen’ namelijk door iedereen te verifiëren en ook direct toe te passen. Voor bijna alle andere velden gaat deze vlieger niet op.

Praktijkgericht onderzoek

Vrijwel alle grote hbo-instellingen, samen goed voor een overgrote meerderheid, zijn aangesloten bij de HBO Kennisbank. Dit betekent dat zij via dit kanaal hun eigen repository van de instelling toegankelijk maken via dit kanaal. De HBO Kennisbank bestaat inmiddels zo’n tien jaar en is zeer recent nog gerestyled.

Voor het onderzoek dat aan hogescholen wordt gedaan liggen de zaken net wat anders. Aangezien daar de nadruk vele malen minder ligt op het publiceren van artikelen in peer-reviewed tijdschriften, is de output in termen van publicaties lager. De diversiteit in het type output is echter een stuk hoger.

Veel verschillende bestandstypen vinden hun weg naar deze repository, variërend van artikelen tot multimediale afstudeerscripties. Ook artikelen van lectoren die elders zijn gepubliceerd worden in de database gedeeld, en daarnaast worden er veel afstudeeronderzoeken van studenten in de Kennisbank gezet.

In de Kennisbank wordt de metadata verzameld van de verschillende publicaties, zodat zij doorzoekbaar zijn op onder meer auteur, hogeschool, jaartal van publiceren en de discipline waaronder zij vallen. Het invullen van deze metadata is de verantwoordelijkheid van de auteur, dan wel indiener van de publicatie. Soms delen lectoren zelf hun onderzoek in de HBO Kennisbank, vaker wordt het indienen van publicaties door bibliotheken van hogescholen gedaan.

De verantwoordelijkheid voor het delen van publicaties ligt bij hogescholen zelf, die hun eigen repositories beheren. De HBO Kennisbank is dus meer een gezamenlijke digitale portal voor deze verschillende repositories. Het beheer van de repository is in handen van SURFmarket via de HBO Kennisinfrastructuur (HKI) spreken de betrokken partijen over de vraag hoe de kennis het beste gedeeld en geëtaleerd kan worden.

Niet de baas in eigen huis

In de Roadmap open access 2018-2020 van de VSNU wordt expliciet melding gemaakt van repositories als bron van meer open toegankelijke publicaties. Maar als het gaat over het bereiken van de torenhoge open access ambities is het de vraag of repositories hier het zaligmakende antwoord voor zijn.

Naast het feit dat bijna alle repositories, ook Europese en internationale initiatieven, te maken hebben met uitdagingen wat betreft de dekkingsgraad vormt de weelde aan typen bestanden een forse uitdaging. Er zijn al heel wat miljoenen besteed aan het harmoniseren van bestandstypen en de zogenaamde metadata.

Ook is het de vraag of de verschillende repositories kunnen wedijveren met de grote algemene zoekmachines als Google Scholar, de vakspecifieke zoals Pubmed of de eigen databases van de grote uitgeverijen. NARCIS indexeert momenteel de HBO Kennisbank en beiden worden op hun beurt zelf weer geïndexeerd door de groten der aarde zelf. Veel van het verkeer op de nationale repositories komt dan ook via Google.

Ten slotte gelden de belemmeringen van een paywall net zo hard voor Google als voor een repository. De instellingen zijn dus geen baas in eigen huis. Van alle artikelen in NARCIS is slechts 27,5% open access, hetgeen in schril contrast staat met de doelstellingen van de universiteiten. Wel is het zo dat uitgeverijen het vaak toestaan om de schrijversversie van artikelen na enige tijd publiek toegankelijk op te slaan in een repository waardoor het alsnog in bepaalde vorm open access is.

Mochten de onderhandelingen met de grote uitgevers ertoe leiden dat (Nederlandse) artikelen open access worden, dan zouden NARCIS en de HBO Kennisbank in een klap een hoop artikelen open access beschikbaar maken. Op dat moment zou echter hetzelfde gelden voor de grote zoekmachines, wat vooral de waarde van de repositories als archief en leverancier benadrukt.


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK