'De toonhoogte van het opiniestuk van Frans Nauta in ScienceGuide staat in schril contrast
met het hardheidsgehalte van zijn betoog. Van wie hoog van de toren
blaast mag enig inzicht in de materie worden verwacht, maar in zijn
betoog liggen bellen en klepels wel erg ver van elkaar.
Kort samengevat komt Nauta's betoog
neer op het volgende statement: Moderne onderzoekers doen aan
distributed computing en dienen amazon.com te gebruiken. Zij hebben
geen supercomputer nodig. Of, zonder dat Frans Nauta het letterlijk
noemt: gebruik het Grid (computers via het internet). Folding@home
is het bewijs van het succes daarvan. Stel wat geld ter beschikking
om dat eerst uit te proberen.
Sinds het eind van de jaren tachtig
zijn één-processor-computers niet snel genoeg meer om in de
behoefte aan rekenkracht te voorzien. Sindsdien wordt serieus
gewerkt aan het ontwikkelen van multi-processor computers, later
massaal parallelle computers, en aan de herontwikkeling van
software voor een efficiënt gebruik. Technischwetenschappelijke
codes vallen daarbij uiteen in twee types:
1) (stukken) codes waar de communicatie tussen deelprocessen
verwaarloosbaar is;
2) (stukken) codes waar parallellisatie mogelijk is maar waar het
resultaat leidt tot intensieve communicatie tussen de verschillende
deelprocessen;
Folding@home, de botsingsresultaten
die uit de LHC van CERN komen en diverse rekenproblemen in de
bioinformatica of NMR-experimenten zijn typische voorbeelden van
type 1. Deze toepassingen bestaan uit geheel onafhankelijke en
relatief kleine deelproblemen. Ideale problemen voor een
grid-achtige infrastructuur. Amazon.com biedt een cloud service
aan. Qua dienst niet erg verschillend van het grid, behalve de
toegang: via de creditcard. Ideaal voor incidenteel gebruik,
bijvoorbeeld vanuit het MKB, of voor structureel gebruik voor wie
zich het gemak wil permitteren.
Voorbeelden van type 2 zijn onder meer
het rekenen aan de ontwikkeling van botstructuren onder stress, de
simulatie van het gehele stroomgebied in Zuid-Nederland,
fundamenteel quantum-chemisch onderzoek in katalyse of
materiaalwetenschappen of werken aan klimaatonderzoek, om van de
weervoorspelling maar niet te spreken. Dit zijn rekenproblemen die
fundamenteel alleen parallelliseerbaar zijn ten koste van
intensieve communicatie tussen de processen (processoren).
Het onderscheid tussen een grid, een
cluster en een supercomputer ligt primair in het begrip 'latency'.
En latency wordt uiteindelijk begrensd door de lichtsnelheid.
Alleen al het voortdurend verlies aan rekencycles dat gepaard zou
gaan met het ophalen van één byte met de lichtsnelheid uit
Groningen als je in Delft zit -en de lichtsnelheid wordt bij lange
na niet gehaald, zeker niet in glasvezel en met alle protocollen
die moeten worden doorlopen- geeft al aan dat efficiënt
gedistribueerd rekenen met frequente communicatie een onmogelijke
opgave is.
Dit is een fundamenteel issue, geen
praktisch oplosbaar probleem. Geen bandbreedte, hoe groot ook, kan
dat ooit compenseren. Een supercomputer heeft de laagst mogelijke
netwerk - en geheugenlatency, en is daardoor bij uitstek
geschikt voor het groeiend aantal toepassingen dat intensieve
communicatie tussen de processoren nodig heeft. Toepassingen van
het type 2 dus, die ongeschikt zijn voor verwerking op de door
Nauta bedoelde distributed computing (grid) infrastructuur.
Om beide typen toepassingen, en alles
wat daar tussenin zit van dienst te zijn, wordt er sinds 1990 in
Nederland een samenhangend infrastructuurbeleid gevoerd. Daarvan
maken een groot landelijk cluster, een datastorage centrum, een
geavanceerd datanetwerk (SURFnet) en een nationale supercomputer
deel uit. Het zal Nauta zijn ontgaan dat het kabinet reeds in 2006
ook de opbouw van een nationale grid-infrastructuur heeft bekostigd
(€30 miljoen). Ook niet helemaal voor niks dus. Maar volkomen
terecht.
De nationale supercomputer en het
nationale cluster maken trouwens deel uit van die infrastructuur,
om het onderzoekers makkelijk te maken die resources te gebruiken
die voor een bepaald deel van het onderzoek het efficiëntst
zijn.
Tenslotte het laatste misverstand,
namelijk dat het (alleen) om een nationale supercomputer zou gaan.
De Europese commissie is van mening dat Europa zich niet door de VS
of Japan wil laten vertellen hoe de grote mondiale problemen zich
ontwikkelen of moeten worden opgelost. Zoals bijvoorbeeld rond het
klimaat. Het is toch te gek - is de redenering- dat Europa hier
niet eens in staat is te verifiëren wat ons van daar wordt verteld,
welgemeend of niet.
Daarom, en op grond van de uitdagende
wetenschappelijke problemen die uitsluitend met de krachtigste
rekenapparatuur kunnen worden aangepakt of pas daarmee voor het
eerst onder bereik komen, heeft men op Europees niveau besloten tot
de inrichting van een infrastructuur van top-10 waardige
supercomputers, volledig ingebed in andere infrastructuurlagen,
waaronder DEISA (grid van tweede-lijns nationale supercomputers),
het Europese EGI-grid (hoofdkantoor in Amsterdam mede dankzij alle
expertise hier) en de toekomstige Europese datastorage en
-services infrastructuur.
Nederland heeft met het huidige
kabinetsbesluit besloten aan al die Europese infrastructuurlagen
deel te nemen, inclusief de top. Een top-ICT-infrastructuur is
immers een noodzakelijke voorwaarde om als land op ICT-gebied te
kunnen uitblinken. Daarmee maakt Nederland althans op dit gebied
waar wat het Innovatieplatform heeft geadviseerd: Nederland
op ICT-gebied bij de top-5 van Europa.'
Dr. Patrick J.C. Aerts, Directeur
NCF