• A
  • A
  • Geen brodddelwerk, maar Top 5 in EU

    - Patrick Aerts, directeur NCF bij NWO, is niet gesticht van het betoog van Frans Nauta over 'supercomputer broddelwerk.' "In zijn betoog liggen bellen en klepels wel erg ver van elkaar." Want Nederland kan en moet wel degelijk naar de Europese top op dit terrein, aldus Aerts.


    'De toonhoogte van het opiniestuk van Frans Nauta in ScienceGuide staat in schril contrast met het hardheidsgehalte van zijn betoog. Van wie hoog van de toren blaast mag enig inzicht in de materie worden verwacht, maar in zijn betoog liggen bellen en klepels wel erg ver van elkaar.

    Kort samengevat komt Nauta's betoog neer op het volgende statement: Moderne onderzoekers doen aan distributed computing en dienen amazon.com te gebruiken. Zij hebben geen supercomputer nodig. Of, zonder dat Frans Nauta het letterlijk noemt: gebruik het Grid (computers via het internet). Folding@home is het bewijs van het succes daarvan. Stel wat geld ter beschikking om dat eerst uit te proberen.

    Sinds het eind van de jaren tachtig zijn één-processor-computers niet snel genoeg meer om in de behoefte aan rekenkracht te voorzien. Sindsdien wordt serieus gewerkt aan het ontwikkelen van multi-processor computers, later massaal parallelle computers, en aan de herontwikkeling van software voor een efficiënt gebruik. Technischwetenschappelijke codes vallen daarbij uiteen in twee types:
    1) (stukken) codes waar de communicatie tussen deelprocessen verwaarloosbaar is;
    2) (stukken) codes waar parallellisatie mogelijk is maar waar het resultaat leidt tot intensieve communicatie tussen de verschillende deelprocessen;

    Folding@home, de botsingsresultaten die uit de LHC van CERN komen en diverse rekenproblemen in de bioinformatica of NMR-experimenten zijn typische voorbeelden van type 1. Deze toepassingen bestaan uit geheel onafhankelijke en relatief kleine deelproblemen. Ideale problemen voor een grid-achtige infrastructuur. Amazon.com biedt een cloud service aan. Qua dienst niet erg verschillend van het grid, behalve de toegang: via de creditcard. Ideaal voor incidenteel gebruik, bijvoorbeeld vanuit het MKB, of voor structureel gebruik voor wie zich het gemak wil permitteren.

    Voorbeelden van type 2 zijn onder meer het rekenen aan de ontwikkeling van botstructuren onder stress, de simulatie van het gehele stroomgebied in Zuid-Nederland, fundamenteel quantum-chemisch onderzoek in katalyse of materiaalwetenschappen of werken aan klimaatonderzoek, om van de weervoorspelling maar niet te spreken. Dit zijn rekenproblemen die fundamenteel alleen parallelliseerbaar zijn ten koste van intensieve communicatie tussen de processen (processoren).

    Het onderscheid tussen een grid, een cluster en een supercomputer ligt primair in het begrip 'latency'. En latency wordt uiteindelijk begrensd door de lichtsnelheid. Alleen al het voortdurend verlies aan rekencycles dat gepaard zou gaan met het ophalen van één byte met de lichtsnelheid uit Groningen als je in Delft zit -en de lichtsnelheid wordt bij lange na niet gehaald, zeker niet in glasvezel en met alle protocollen die moeten worden doorlopen- geeft al aan dat efficiënt gedistribueerd rekenen met frequente communicatie een onmogelijke opgave is.

    Dit is een fundamenteel issue, geen praktisch oplosbaar probleem. Geen bandbreedte, hoe groot ook, kan dat ooit compenseren. Een supercomputer heeft de laagst mogelijke netwerk - en geheugenlatency, en is daardoor bij uitstek geschikt voor het groeiend aantal toepassingen dat intensieve communicatie tussen de processoren nodig heeft. Toepassingen van het type 2 dus, die ongeschikt zijn voor verwerking op de door Nauta bedoelde distributed computing (grid) infrastructuur.

    Om beide typen toepassingen, en alles wat daar tussenin zit van dienst te zijn, wordt er sinds 1990 in Nederland een samenhangend infrastructuurbeleid gevoerd. Daarvan maken een groot landelijk cluster, een datastorage centrum, een geavanceerd datanetwerk (SURFnet) en een nationale supercomputer deel uit. Het zal Nauta zijn ontgaan dat het kabinet reeds in 2006 ook de opbouw van een nationale grid-infrastructuur heeft bekostigd (€30 miljoen). Ook niet helemaal voor niks dus. Maar volkomen terecht.

    De nationale supercomputer en het nationale cluster maken trouwens deel uit van die infrastructuur, om het onderzoekers makkelijk te maken die resources te gebruiken die voor een bepaald deel van het onderzoek het efficiëntst zijn.

    Tenslotte het laatste misverstand, namelijk dat het (alleen) om een nationale supercomputer zou gaan. De Europese commissie is van mening dat Europa zich niet door de VS of Japan wil laten vertellen hoe de grote mondiale problemen zich ontwikkelen of moeten worden opgelost. Zoals bijvoorbeeld rond het klimaat. Het is toch te gek - is de redenering- dat Europa hier niet eens in staat is te verifiëren wat ons van daar wordt verteld, welgemeend of niet.

    Daarom, en op grond van de uitdagende wetenschappelijke problemen die uitsluitend met de krachtigste rekenapparatuur kunnen worden aangepakt of pas daarmee voor het eerst onder bereik komen, heeft men op Europees niveau besloten tot de inrichting van een infrastructuur van top-10 waardige supercomputers, volledig ingebed in andere infrastructuurlagen, waaronder DEISA (grid van tweede-lijns nationale supercomputers), het Europese EGI-grid (hoofdkantoor in Amsterdam mede dankzij alle expertise hier) en de toekomstige Europese datastorage en -services infrastructuur.

    Nederland heeft met het huidige kabinetsbesluit besloten aan al die Europese infrastructuurlagen deel te nemen, inclusief de top. Een top-ICT-infrastructuur is immers een noodzakelijke voorwaarde om als land op ICT-gebied te kunnen uitblinken. Daarmee maakt Nederland althans op dit gebied waar wat het  Innovatieplatform heeft geadviseerd: Nederland op ICT-gebied bij de top-5 van Europa.'

    Dr. Patrick J.C. Aerts, Directeur NCF