Eerste hulp bij data-vragen van onderzoekers in hbo

Interview | de redactie
8 november 2021 | “Onze data was versnipperd, iets wat bijzonder onhandig is wanneer je processen wilt automatiseren. We zochten dus een manier om alle data op een centrale plek veilig te kunnen opslaan, bewerken en delen", vertelt Anton Winkelmolen van Fontys Hogescholen. Zijn team klopte aan bij het Digital Competence Center voor Praktijkgericht Onderzoek, waar experts van SURF helpen bij dit soort vragen.
“We hebben de SURF-pilot gebruikt om een structuur in te richten waardoor de data op een centrale plaats wordt verzameld, voor alle betrokkenen beschikbaar zijn, en door bepaalde scripts kunnen worden gelezen”, verteld Anton Winkelmolen van Fontys Hogescholen. Beeld: GreenTechLab.

Onderzoekers en onderzoeksondersteuners binnen het hbo die aanlopen tegen data-gerelateerde problemen hoeven niet zelf het wiel uit te vinden. Ze kunnen namelijk aankloppen bij het Digital Competence Center voor Praktijkgericht Onderzoek (DCC-PO); daar denken experts van SURF mee met de verwerking van data bij onderzoeksprojecten, vertelt Judith Pijnacker, relatiemanager Praktijkgericht onderzoek bij SURF. Daarbij kan het gaan om vragen over researchdata management en data-intensief onderzoek, maar ook bij het FAIR (vindbaar, toegankelijk, interoperabel en herbruikbaar) maken van data, in lijn met de gedachte van Open Science, helpen de experts van SURF.  

Het DCC-PO is een initiatief van hogescholen die, in samenwerking met NWO, een plan hebben gemaakt om de digitalisering binnen het praktijkgericht onderzoek te stimuleren. Het daartoe ingediende plan is door NWO gehonoreerd en heeft geleid tot een project dat duurt tot het einde van november 2022: het DCC-PO. De ondersteuning van onderzoekers en onderzoeksondersteuners verloopt via pilots, vertelt Pijnacker. 

Handen vrijmaken die aan de slag kunnen met data 

 “Tijdens een pilot ontvangen hogescholen geldelijke middelen die ze mogen gebruiken voor de inzet van personeel. Dat helpt hen om handen vrij te maken die dan hiermee aan de slag kunnen. Daarnaast krijgen ze allerhande ondersteuning vanuit SURF. Experts van SURF denken bijvoorbeeld mee over het inrichten van een datastroom en adviseren daarbij hoe dat goed in SURF Research Drive of Research Cloud kan worden verwerkt.” 

De SURF Research Cloud is een platform waarin data, analyses en samenwerkingen bij elkaar kunnen worden gebracht, legt Pijnacker uit. “Dat platform kun je zelf vormgeven middels bouwblokken en verschillende beschikbare applicaties. Daarnaast kun je aangeven hoeveel rekencapaciteit je nodig hebt; die capaciteit kan daarna ook worden opgeschaald. Zo kan elke groep een eigen virtual machine samenstellen waarbinnen het onderzoek wordt uitgevoerd.” 

Moeilijkheden bij bepalen faunaschade in Limburg 

Fontys Hogescholen, en wel het GreenTechLab van Fontys in Venlo, is een van de instellingen die heeft deelgenomen aan de pilot. “Voor ons was dat de eerste keer,” vertelt Anton Winkelmolen, accountmanager bij het GreenTechLab, “dus het was sowieso een ontdekkingstocht.” De pilot bij Fontys draaide rond de bepaling van faunaschade, legt Winkelmolen uit. “Nederlandse grondeigenaren en akkerbouwers hebben vrij vaak last van beschadigingen door wilde dieren. In Limburg ontstaat bijvoorbeeld vaak schade door wilde zwijnen en dassen die door een maisveld lopen of de mais opeten.” Nederland kent een landelijk fonds, beheerd door overheidsorgaan BIJ12, vanwaaruit de faunaschade van akkerbouwers wordt vergoed. Om de schade te kunnen vergoeden moet die echter eerst goed kunnen worden bepaald.  

“Bij ons Green Tech Lab zijn we al enkele jaren bezig met dat vraagstuk”, vertelt Winkelmolen. “Op dit moment wordt de schade bepaald door een taxateur die een perceel bezoekt en dan moet beoordelen of daar faunaschade wordt aangetroffen, en zo ja, hoeveel dan. Tijdens gesprekken met mensen uit de praktijk bleek al snel dat het eigenlijk onmogelijk is om dat nauwkeurig te doen wanneer het een perceel van bijvoorbeeld twaalf hectare betreft. Daarnaast wordt niemand vrolijk van een paar uur door een maisveld lopen. Als gevolg van de huidige werkwijze wordt de faunaschade vaak niet goed ingeschat.”  

Onderzoekers en studenten die denken dat ze het beter kunnen 

Bij het GreenTechLab zag men kansen om die schadebepaling te verbeteren, en wel met behulp van luchtbeelden. “In 2018 zijn we al, in samenwerking met de provincie Limburg en BIJ12, gestart met enkele pilots waarin we dronebeelden gebruiken voor de bepaling van faunaschade”, vertelt Winkelmolen. “Voor deze sector is dit best spannend. Men is nog redelijk traditioneel en helemaal niet gewend om met dit soort toepassingen te werken. Daarnaast vinden ze natuurlijk dat ze zelf de beste rapporteurs hebben die faunaschade het best kunnen inschatten; nu komt er ineens een groepje onderzoekers en studenten die denken dat ze het met een drone beter kunnen.” 

In het begin was dat lastig, geeft hij toe, maar al snel ontstond bij zowel het GreenTechLab als bij BIJ12 dat deze werkwijze de toekomst heeft. Vanuit de lucht is heel goed te zien waar de schade zit, dus de bepaling kan heel nauwkeurig zijn. Als we onze bepalingen vergeleken met die van de taxateur, was de door de taxateur bepaalde schade soms vijf of zes keer zo groot of klein – simpelweg omdat een taxateur minder overzicht heeft op het perceel. Daardoor werd er soms te veel en soms te weinig aan maistelers uitgekeerd, terwijl we een zo eerlijk en objectief mogelijke taxatie willen. Met foto’s vanuit de lucht gaat dat dus beter. De vraag is echter hoe die schadebepaling op basis van luchtfoto’s kan worden verbeterd en geautomatiseerd.” 

We willen automatiseren, maar de data was versnipperd 

In de zoektocht naar die verbetering heeft men eerst een drone over heel veel maisvelden laten vliegen, geleerd hoe dat het best kan worden gedaan en geleerd hoe faunaschade eruitziet vanuit de lucht, legt Winkelmolen uit. “Daarna zijn we de schadeplekken op de luchtfoto’s handmatig gaan markeren. Daarbij hadden we het ontwikkelen van aanvullende software als doel; het is leuk als je een luchtbeeld hebt waarop je de schade beter kunt zien, maar je moet dan alsnog de schade goed berekenen.” 

Daarvoor was het echter eerst noodzakelijk dat de data goed werd verzameld en verwerkt – en daarvoor werd de hulp van SURF ingeschakeld. “De luchtbeelden en de analyses daarvan werden op allerlei verschillende plekken opgeslagen, op laptops, usb-sticks, op eigen systemen, noem het maar op”, schetst Winkelmolen. “De data was dus versnipperd, iets wat bijzonder onhandig is wanneer je processen wilt automatiseren. Daarnaast gaat het bij schadebepalingen om privacygevoelige informatie, dus je wilt een systeem opzetten dat veilig is. Wij zijn toen met SURF in gesprek geraakt omdat we een manier zochten om alle data op een centrale plek veilig te kunnen opslaan, te kunnen bewerken, en het vervolgens ook weer te kunnen delen. Dat was ons eerste doel, nog los van een verdere automatisering van het proces.” 

Het klinkt simpel, maar dat is het niet 

Een afbeelding niet op de eigen laptop maar in de cloud opslaan – dat klinkt niet ingewikkeld. Makkelijk is het echter ook niet, licht Winkelmolen toe. “De luchtfoto’s die we gebruiken vormen heel grote bestanden, dus het kost veel capaciteit om die te up- en downloaden. Gedurende de pilot hebben we verschillende testen gedaan met diensten van SURF zoals de Research Drive en de Research Cloud om uit te vinden hoe iedereen goede beschikking kon hebben over de benodigde bestanden. We hebben daarnaast testen gedaan met zelfgeschreven scripts die de schadeberekeningen op basis van de luchtfoto’s maakten.”  

Ook het tekenprogramma waarmee men bij het GreenTechLab markeert op welke plekken sprake is van faunaschade moest goed kunnen draaien op de diensten van SURF; aangezien dat een programma is dat veel rekencapaciteit vraagt, betrof ook dat geen sinecure. “Wat we doen klinkt heel simpel, maar omdat het over zulke grote bestanden gaat, kost het veel tijd om daarvoor een goede werkwijze te vinden. Om het werkend te krijgen is één, maar om het op snelheid werkend te krijgen vraagt nog veel meer”, aldus Winkelmolen. 

“We hebben de SURF-pilot dus gebruikt om een structuur in te richten waardoor de data op een centrale plaats wordt verzameld, voor alle betrokkenen beschikbaar zijn, en door bepaalde scripts kunnen worden gelezen. We kunnen nu dus efficiënter werken, en het is noodzakelijk voor onze verdere plannen”, legt hij uit. “Een volgende stap in de ontwikkeling van deze werkwijze betreft namelijk het gebruik van zogeheten pre-labels, waarbij de software op basis van onze programmering alvast een markering aanbrengt op plekken die waarschijnlijk faunaschade laten zien. Er zit veel variatie in het beeldmateriaal dat we gebruiken; we zullen dus moeten ondervinden in hoeverre de kunstmatige intelligentie in staat is om zelfstandig de faunaschade te ontdekken en berekenen.” 


«
Schrijf je in voor onze nieuwsbrief
ScienceGuide is bij wet verplicht je toestemming te vragen voor het gebruik van cookies.
Lees hier over ons cookiebeleid en klik op OK om akkoord te gaan
OK