Data-analisten blijven schaars

Interview | door Tim Cardol
10 december 2018 | Carole Jackson is sinds 2017 directeur van het Nederlandse Instituut voor Radioastronomie (ASTRON). “Ik denk dat wij voor veel wetenschapsgebieden het voorbeeld kunnen geven hoe grote hoeveelheden data en digitale infrastructuur gebruikt kunnen worden.”
Het centrum van LOFAR in Drenthe

ASTRON is een van de meest actieve gebruikers van de faciliteiten van SURFsara. “Onze astronomen maken heel actief gebruik van de onderzoeksinfrastructuur. Ik denk dat wij van alle disciplines de meeste data verzamelen en verwerken.” Op 18 december is Jackson een van de keynote sprekers hij het Super Day evenement van SURFsara.

Met de data die ASTRON over het heelal verzamelt, wordt overal ter wereld onderzoek gedaan. “We werken met heel veel Europese partners samen, dus dat betekent dat we werken aan het op slimme manieren distribueren van onze data.” Daarvoor werkt ASTRON ook samen met commerciële partners in de eigen regio, zoals het onlangs geopende d’Root datacenter in Groningen

Meer dan een gymzaal met knipperende lampjes

“ASTRON’s Low Frequency Array (LOFAR) telescoop verzamelt zo’n 7 petabyte Een petabyte, afgekort PB, is 1000 terabytes ofwel 1.000.000.000.000.000 bytes (10^15B). Een petabyte aan informatie komt overeen met ongeveer een toren van 1,8 km hoog van gestapelde cd-romschijven zonder doosje. per jaar aan data. Dat is heel veel en we kijken dus wat we nodig hebben en tegen welke kosten dat kan. Ook commerciële partijen kunnen interessant zijn, zeker als het simpelweg om het opslaan van ruwe data gaat,” zegt Jackson. “We willen de beste infrastructuur kopen die past bij onze wensen, tegen de juiste prijs.”

Wat voor Jackson bovendien interessant is aan de samenwerking met regionale partners, is de kennis die ook daar weer vandaan komt. “Ik denk dat het noorden van Nederland hier wel echt iets te pakken heeft. We kunnen hier laten zien dat dit niet alleen een regio van landbouw is. Een datacenter kan echt een ‘hub’ zijn, waar studenten kunnen leren en verschillende disciplines iets opsteken van elkaar.”

Astronomie voorop bij big data

Volgens de ASTRON-directeur kan de astronomie op het gebied van data-analyse als een voorbeeld voor andere disciplines dienen. “Ik denk dat we op het gebied van big data wel leidend zijn. Medische wetenschap, geologie, klimaatwetenschap, allemaal disciplines waar big data steeds belangrijker wordt. En ook in de planologie, als we kijken naar smart cities. Het wordt allemaal veel complexer met al die data.”

Dat merken ook studenten, ziet Jackson. “Er zijn inmiddels wel steeds meer vakken in de bachelors die te maken hebben met data-analyse. Het is logisch dat mensen overweldigd worden door die data, dus het is belangrijk hen daar in te trainen. Niet alleen in de wetenschap, maar ook in het bedrijfsleven wordt het werken met grote hoeveelheden data steeds meer een vereiste vaardigheid.”

Ook bij ASTRON merkt Jackson dat het niet zozeer moeilijk is om goede astronomen te vinden, maar dat het met name data-analisten zijn die schaars zijn. “Dat zijn de mensen van wie het voor ons moeilijk is hen aan ons te binnen. Zij kunnen veel meer verdienen bij bijvoorbeeld Amazon of Google. Dat is toch waar je mee concurreert.”

Infrastructuur voor de lange termijn

Jackson hoopt dat het werk dat ASTRON doet in Dwingeloo ook gezien wordt in Den Haag. Afgelopen jaar kwam Ingrid van Engelshoven al eens langs. “Zij begrijpt het belang van infrastructuren als deze. Het gaat om de lange termijn en het is van belang voor de hele wetenschap. Het gaat er om dat we onze nationale infrastructuur ook met elkaar delen.”

Op dit moment heeft ASTRON in LOFAR een radiotelescoop met een netwerk van sensoren dat een groot gebied in Drenthe beslaat en verbonden is met stations in onder meer Duitsland, Groot-Brittannië, Frankrijk en Zweden. De data die er wordt verzameld helpt ook geofysici en landbouwonderzoekers. Maar LOFAR is in zekere zin een opstap.

ICT-uitdaging voor gigantische telescoop

In 2024 moet als alles goed gaat de Square Kilometer Array (SKA) aan de slag gaan. Het radiotelescoop-project dat in Zuid-Afrika en Australië gebouwd gaat worden kent veel gelijkenissen met LOFAR. “De kennis van LOFAR vormt de ruggengraat van SKA. In zekere zin hebben we de weg bereid en is het heel bepalend voor wat we daar straks gaan doen. LOFAR is op zichzelf al een hele indrukwekkende telescoop die ons veel leert over hoe je met zulke grote hoeveelheden data moet omgaan.”

Net als LOFAR zal SKA over een eigen supercomputer beschikken, maar dat is wezenlijk anders dan de faciliteiten waar bijvoorbeeld SURFsara over beschikt. “Zo’n telescoop heeft natuurlijk een eigen processor nodig om de data op te vangen en verwerken. Maar dat is een hele specifieke computer. CERN heeft bijvoorbeeld ook zoiets, maar dat is iets heel anders dan wat we met SURFsara samen doen.”

Uiteindelijk hoopt Jackson met de inspanningen van ASTRON, regionaal en wereldwijd, de astronomie en andere wetenschapsgebieden een stap verder te brengen. Daarin speelt ook open science een rol. “We participeren ook in the European Open Science Cloud, omdat we denken dat het open delen van data en onderzoeksresultaten de hele wetenschappelijke gemeenschap vooruit helpen. Dat betekent ook dat we met elkaar moeten praten over het standaardiseren van die data, zodat het voor iedereen bruikbaar wordt. Dat is geen eenvoudige opgave.”


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK