Is de European Open Science Cloud ‘too big to fail’?

Nieuws | door Sicco de Knecht
1 november 2018 | Biedt het de uitkomst voor een toekomst met open science, of zijn de ambities achter de European Open Science Cloud daarvoor te vaag en te hoog? Tijdens het internationale eScience congres in Amsterdam leggen nauw betrokken partijen hun zorgen op tafel.

Hij moet en zal er komen: de European Open Science Cloud (EOSC). De EOSC is het project waarmee de Europese Unie beoogt van open onderzoeksdata de nieuwe standaard te maken. Momenteel worden hiervan de contouren geschetst en wordt afgestevend op een model met een enkele ‘portal’ van waaruit onderzoekers of onderzoeksvelden verschillende diensten kunnen afnemen. Maar betrokkenen bij het project zijn sceptisch.

Overamibtieus en vaag

Tijdens het internationale eScience congres wordt gesproken over de voortgang van de EOSC tijdens een bijeenkomst van nationale eScience instituten, verenigd in PLAN E. Deze contouren van de EOSC ten spijt zijn veel van de betrokkenen, zo’n drie jaar na de start van het project, er nog steeds niet over uit wat de exacte functie van deze ‘cloud’ moet zijn en hoe deze vervolgens moet worden vormgegeven.

Op 23 november zal de EOSC gelanceerd worden tijdens een grote bijeenkomst in Wenen. Wat er die dag precies de lucht ingaat blijkt een grote vraag voor veel van de sprekers die vanuit hun functie op verschillende manieren betrokken zijn bij de EOSC. Men vraagt zich hardop af of het plan niet overambitieus is en of de bestaande infrastructuren niet te divers zijn om met elkaar te integreren.

“De EOSC zou een grote infrastructuur moeten worden,” stelt directeur Wilco Hazeleger van het Nederlandse eScience Center in zijn openingswoord, “maar we moeten er echt voor waken dat het geen grote monolithische structuur wordt.” Hij benadrukt dat er vele initiatieven binnen een even zo groot aantal vakgebieden zijn waarbinnen onderzoekers internationaal al lang en breed data met elkaar delen. De vraag is of deze partijen er heil in zien om zich aan te sluiten bij een groot project met een onduidelijk eindpunt.

European Open Science Cloud moet ook door wetenschappers worden gedragen

“In ieder geval moet een dergelijk initiatief zijn uiterste best doen om zo dicht mogelijk bij de onderzoekers en de instituten te blijven.” Volgens Hazeleger en veel van de andere aanwezigen worden er thans wel grote woorden gebruikt voor de EOSC, maar is de afstand tussen de onderzoeker en de grootse plannen van de Europese Commissie nog levensgroot. “Er moet een middle man zijn die de mogelijkheden die het EOSC moet bieden naar de onderzoeker brengt.”

Dat zal nog geen gemakkelijke opgave zijn benadrukt Arjen van Rijn (Nikhef) in zijn presentatie. Van Rijn is een van de oprichters van het e-IRG, een Europees strategie-orgaan van onderzoekers dat al sinds 2003 werkt aan de ondersteuning van internationale e-infrastructuur. “Als onderzoekers hebben we vaak jaren gewerkt om onze processen te laten werken binnen ons eigen vakgebied.”

Hij wijst erop dat zogenaamde wat hem betreft “horizontale” integratie een meer wenselijke route is. Daarbij doelt hij op het feit dat er op nationaal en lokaal niveau vaak al hele interessante en werkzame infrastructuren bestaan. Als deze tussen landen en vakgenoten aan elkaar worden gekoppeld dan zou er een zinvolle invulling gegeven worden aan EOSC. Tegelijkertijd geeft hij ook toe dat dit een zeer ingewikkelde opgave is.

Het niveau van samenwerking dat de EOSC voorstaat vergt dat participerende landen nu snel helderheid geven over hoe hun interne data-infrastructuur eruitziet. Om dat in kaart te brengen zette het e-IRG een enquête uit onder de verschillende verantwoordelijken. Uit de verschillende landkaarten met kleurcodes die hij laat zien blijkt vooral de mate van diversiteit.

Van Rijn: “Er is in sommige lidstaten eigenlijk nog niet eens een heldere structuur belegd, dus dat alles samenvoegen zal nog een hele klus worden.” Op de vraag van Matthew Dovey (Oxford University) of alle landen dan dezelfde kleur – ofwel hetzelfde beleid – moeten hebben reageert Van Rijn ontkennend. “Ik wil minder onduidelijkheid, want nu weten we niet eens hoe het zit.”

“Om eerlijk te zijn weet ik ook nog steeds niet wat EOSC nu eigenlijk is. Toen ik de term voor het eerst hoorde dacht ik: nou dan wil ik ook wel eens weten hoe de nationale open science cloud eruit ziet.” Zolang de meeste instituten, laat staan de lidstaten, hun open data-infrastructuur niet rond hebben ziet hij een Europese structuur niet snel van de grond komen.

Uniformiteit moet geen doel zijn

Of de middelen om de EOSC in de lucht te krijgen afdoende zijn weet eigenlijk niemand. De zogenaamde EOSC-hub, de samenwerking die het project van de grond moet krijgen, heeft wel een aardige zak geld maar ook daar is er discussie of dit voldoende is. “Er is nu ongeveer €33 miljoen voor vrijgemaakt. Dat lijkt een boel geld,” zegt de directeur van het Finse eScience centrum Damien Lecarpentier.

Als manager van het EUDAT initiatief is hij nauw betrokken bij het opzetten van een pan-Europese data-infrastructuur en loopt tegen veel problemen aan. “Als we kijken naar de omvang van de opdracht, ten opzichte van de middelen, dan valt het eigenlijk nogal tegen.” Wat hem in ieder geval niet de gewenste uitkomst lijkt is om werkelijk te streven naar uniformiteit in het opslaan en delen van data.

“Alle bestaande services en data integreren is simpelweg onmogelijk.” Volgens hem kan dat in ieder geval niet het doel zijn. Peter Doorn (DANS) vult hem op dat punt aan vanuit zowel het Nederlandse als internationale perspectief. “Er is zo’n grote diversiteit dat je dat simpelweg niet gaat lukken. Het gaat niet alleen om de data maar ook om het feit dat het allemaal aparte organisatiemodellen zijn. Die kun je niet allemaal in een zak proppen. Ik begin zo langzamerhand het idee te krijgen dat de EOSC ‘too big to fail is’, en dat we vooral om die reden doorzetten.”

Long tail of science

Uiteindelijk is iedereen het erover eens dat de meerwaarde van EOSC erin moet zitten dat de individuele onderzoeker of het vakgebied er de heil van inziet. Wat dat betreft ligt de grootste uitdaging in wat de ‘long tail of science’ is gaan heten. Een beeldspraak die erop wijst dat er een beperkt aantal grote vakgebieden is met een hele grote en homogene gemeenschap, maar ook ontelbare onderzoeksgemeenschappen met een relatief kleine omvang.

Een vergelijkbare beschrijving is passend voor datasets en het gebruik van rekenkracht binnen de grote infrastructuren. Zo is 80% van het gebruik van Franse supercomputers het werk van een enkele partij: CERN. De andere 20% is verspreid over alle andere vakgebieden, hetzelfde geldt voor bijvoorbeeld de dataopslag bij DANS: er zijn een paar hele grote datasets, en talloze kleinere.

Hoe FAIR moeten open data en software zijn?

De realiteit, zo weten enkele van de aanwezigen te vertellen, is dan ook dat een aantal omvangrijke vakgebieden zich simpelweg nog niet hebben aangesloten bij EOSC. Zo zijn medische en biomedische onderzoekers nog nauwelijks aangehaakt vanwege zorgen over het delen van (privacy)gevoelige data en zijn bijvoorbeeld klimatologen meer dan tevreden met hun eigen infrastructuur.

“Als er al een aanpak ligt, dan moeten domeinen en disciplines samenwerken met de digitale infrastructuren”, stelt Van Rijn, daarmee doelend op samenwerking binnen vakgebieden. “Volgens mij is dit de enige zinnige aanpak omdat het op zijn minst de belofte heeft dat het efficiënter en bovenal de belofte van duurzaamheid in zich draagt.”


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK