Retour au sommaire
 |
Du
côté des labos
Les
superordinateurs et la course
au pétaflop
par
Christophe Jacquemin
28/02/04 |
Les
superordinateurs évoluent à grande vitesse et
les records de puissance et de vitesse de calcul ne cessent
de pleuvoir. Ces machines sont désormais indispensables
à l'avancée de nombreux domaines de la recherche
scientifique, qu'il s'agisse des biotechnologies et de la
protéomique, des neurosciences, de la cosmologie, de
la modélisation et de l'analyse de l'évolution
de l'environnement, de la simulation des essais nucléaires,
etc. Occupant aujourd'hui des pièces entières,
ces supermachines finiront-elle par atteindre dès 2010
la taille d'une simple puce, comme le prédit la firme
IBM avec l'avènement du processeur Trips(1)
capable d'exécuter mille milliards d'opérations
à la seconde ? Et au-delà, pour cause de limites
infranchissables de miniaturisation des processeurs, verrons-nous
alors l'apparition des ordinateurs quantiques [notre
article du 29/01/2004] comme certains le prévoient
pour les années 2020 ?
Un
peu d'histoire
Architecture
vectorielle
De
quand date la première apparition du mot "supercalculateur"
(on dit plutôt maintenant "superordinateur")
? Pour le dictionnaire "Petit Robert", son utilisation
daterait de 1985, avec la définition suivante : "Ordinateur
d'une très grande puissance de calcul, possédant
des temps de cycles d'instruction très courts, des
ressources importantes et la possibilité d'effectuer
des opérations en parallèle". Cela
dit, il peut y avoir décalage de temps entre l'apparition
réelle d'un mot et son acceptation dans le langage
usuel (surtout lorsqu'on sait que la validation de ce terme
par l'office de la langue française, date, elle de...
1998).
On
pourrait aussi bien dater l'apparition du terme "supercalculateur"
à l'année 1976(2),
avec l'apparition du CRAY 1, machine dite à "architecture
vectorielle"(3),
conçue par l'américain Seymour Cray, considéré
comme le père des ordinateurs scientifiques. Refroidi
au fréon, doté de 8 Mo de mémoire vive
et capable d'effectuer quelque 166 millions d'opérations
à virgule flottante(4)
à la seconde (166 mégaflops), ce supercalculateur
pesant près de 5 tonnes coûtait environ 700000
dollars à l'époque. Le premier exemplaire (photo)
fut livré au "Los Alamos National Laboratory".
Seize exemplaires ont été construits.
En
1985, arrive la commercialisation du Cray2, premier ordinateur
à dépasser la puissance de 1 Gflop (1 milliard
de calculs en virgule flottante par seconde). Tournant sous
Unix, la machine peut être équipée jusqu'à
4 processeurs d'excécution (le modèle de base
en comportant 2) tournant à 250 MHz et peut adresser
directement jusqu'à 4 Go de mémoire vive. Chaque
processeur a une puissance de 488 Mflops. Un programme de
multiplication de matrices utilisant les 4 processeurs dispose
d'une puissance de 1.7 Gflops. Le Centre de Calcul Vectoriel
pour la Recherche (CCVR) Ecole polytechnique ou le Centre
interuniversitaire de calcul d'Orsay ont notamment pu bénéficier
de telles machines.
Architecture
massivement parallèle
Si
on voit arriver le Cray3 à la fin des années
80 (5 gigaflops), une nouvelle architecture, dite "massivement
parallèle"(5)
va aussi commencer à s'imposer dès 1986, avec
la commercialisation par la société
Thinking Machines de la Connection Machine CM-1, superordinateur
d'un nouveau type pouvant comporter jusqu'à 65536 processeurs.
La machine est un peu conçue comme le fonctionnement
du cerveau humain car chaque processeur (qui n'a pas besoin
d'être puissant) effectue un travail très réduit
mais ce qui compte, c'est la façon dont sont reliés
les processeurs entre eux. La machine reconfigure les connexions
internes entre les processeurs pour résoudre un problème
donné. Les performances dépendent toutefois
largement du type d'application à traiter, nécessitant
de la part de l'utilisateur une très bonne connaissance
de l'architecture de la machine pour l'écriture de
programmes efficaces. La machine se prête plutôt
aux applications qui comportent une grande quantité
de données auxquelles sont attachés des paramètres
identiques(6).
Elle est particulièrement adaptées aux disciplines
qui utilisent la simulation (le Centre National de Calcul
Parallèle en Sciences de la Terre de Jussieu (Paris)
a par exemple été l'un des premiers à
bénéficier d'une telle machine [CM-5], notamment
pour ses calculs en géophysique). L'architecture massivement
parallèle qui, répétons-le consiste à
distribuer la charge sur un grand nombre de processeurs au
lieu de faire travailler un nombre réduit de processeurs
puissants (cas des machines vectorielles), présente
évidemment un avantage en termes de coût du fait
que les processeurs utilisés sont à peu prè s
les mêmes que ceux employés dans les micro-ordinateurs
de bureau...
C'est ainsi qu'on dépassera le téraflop en 1997
(mille milliards d'opérations en virgule flottante
à la seconde) avec ASCI Red (Accelerated Strategic
Computing Initiative), développé aux Etats-Unis
par INTEL Corporation et Sandia National Laboratories. Ordinateur
massivement parallèle MIMD (Multiple Instruction, Multiple
Data).
Architecture
de grappes d'ordinateurs (clusters)
Course
à la performance oblige (et surtout à la diminition
du coût) voici aujourd'hui les clusters, ordinateurs
classiques mis en réseau pour fonctionner ensemble,
comme une seule machine. Si le problème actuel est
la vitesse des interfaces réseaux gérant la
comunication entre les différents ordinateurs, il n'en
reste pas moins que les clusters les plus puissants n'ont
pas grand choses à envier à d'autres machines.
Qu'on en juge notamment avec Apple qui vient de présenter
le 6 janvier dernier à San Fransisco sa technologie
de grappes Xgrids(7)
permettant de faire calculer ensemble jusqu'à 84 processeurs
G5, fournissant une puissance de calcul d'1,5 téraflop
(système apple déjà testé aux
états-Unis par la Nasa, Genentech, Simon Fraser University,
Reed College and Virginia Tech). Notons que la 3ème
machine la plus puissante au monde (le Terascale, voir tableau
ci-dessous) est un cluster de 1100 G5, affichant 10 téraflops
(coût : 5,2 millions de dollars). La machine arrivant
première, indétrônée depuis son
apparition en 2002, est japonaise : il s'agit de l'Earth Simulator(8),
synthèse entre l'ordinateur à architecture vectorielle
et architecture massivement parallèle, qui atteint
les 35 téraflops. Son coût : 350 millions de
dollars.
A
quand le pétaflop ?
Un
pétaflop représente un million de milliards
d'opérations en virgule flottante par seconde, chiffre
symbolique désormais à atteindre pour des raisons
stratégiques mais aussi pour le prestige que cela confère.
On peut alors ici parler d'une véritable compétition.
La Darpa a d'aileurs lancé en juillet 2003 un appel
d'offres pour qu'on lui soumette des projets innovants.
Sont déjà annoncés un futur CRAY, le
"Red Storm" qui devrait atteindre les 40 téraflops
(Sandia laboratories) et l'ASCI Purple d'IBM (fabriqué
pour le laboratoire national de Laurence Livermore), qui doit
atteindre les 100 téraflops et être livré
pour la fin de cette année. Toujours chez IBM, on s'active
sur Blue Gene/L, qui doit être livré l'année
prochaine aux chercheurs du laboratoire national de Laurence
Livermore. Dix fois plus compacts que les plus performants
des superordinateur actuel et consommant 15 fois moins, il
atteindra les 360 téraflops ! Ambition affichée
par IBM : enfoncer les japonais et asseoir sa domination sur
le secteur, ayant déjà annoncé passer
à mille milliards d'opérations à la seconde
en 2010 sur... une simple puce. Cray, pour sa part, nourrit
l'ambition de founir à cette même date une machine
développant une puissance de calcul d'un pétaflop.
|
Les cinq machines les plus puissantes au monde
source : http://www.top500.org
novembre 2003
1
- Earth simulator
performance de pointe : 35,86 téraflops
[35860 milliards d'opérations
à la seconde - capacité
totale de stockage :
plus de 700 téeraoctets]
Conçu
par l'entreprise japonaise NEC, l'Earth Simulator
(machine hybride vectoriel- massivement parallèle)
occupe une superficie d'un peu plus de la moitié
d'un terrain de footbal. Basé à Yokoama,
ce superordinateur est affecté à des
simulations à l'échelle de la Terre
entière (systèmes terrestres complexes,
climatologiques, géophysique, calcul des courants
marins, etc.)
Indétrônée
depuis son apparition en 2002, et d'un coût
estimé de 350 millions de dollars, la machine
est dotée de quelque 5120 processeurs cadencés
à 500 Mhz. L'installation occupe pas moins
de quatre étages (dont un pour l'équipement
électrique, un autre occupé par des
centaines de kilomètre de câbles...).
En savoir plus :
http://www.es.jamstec.go.jp/
2
- Asci Q
performance de pointe : 13,86 téraflops
(devant atteindre à terme à 30 téraflops)
[13860
milliards d'opérations à la seconde
- capacité
totale de
stockage (à terme) : plus de 654 téraoctets]
Situé au laboratoire national de Los Alamos(LANL)
et dédié à la simulation des
essais nucléaires, Asqi Q (Advanced Simulation
and Computing) est aujourd'hui le plus puissant des
ordinateurs américains. Il comprend pour l'instant
plus de 2000 ordinateurs Alphaserver Hewlett Packard,
chacun d'eux étant munis de 4 processeurs cadencés
à 1,25 GHz.

A terme, ce système à architectecture
massivement parallèle comprendra 3072 AlphaServer
(soit plus de 12000 processeurs), pour une puissance
de 30 téraflops.
En savoir plus :
http://doc.quadrics.com/Quadrics...
3
- Terascale
performance de pointe : 10,28 téraflops
[10280
milliards d'opérations à la seconde
- capacité
totale de
stockage :176 téraoctets]
Le
Terascale est le plus puissant des ordinateurs réalisé
selon l'architecture "cluster", c'est-à-dire
à partir de machines de bureau mises en réseau.
Conçu par les scientifiques de l'Institut polytechnique
de Virginie (avec l'aide de partenaires industriels)
pour faire -comme ils aiment à dire - de la
"Big Science", le superordinateur se compose
de l'association de 1100 ordinateurs G5 (Apple) chacun
doté de deux processeurs Power PC 64 bit s
970 d'IBM.
C'est également l'un des moins chers des supercalculateurs
dans une telle catégorie, avec son coût
estimé à 5 millions de dollars (contre
par exemple 350 millions de dollars pour le Earth
Simulator).
En savoir plus :
http://computing.vt.edu/research_computing/terascale/
4
- Tungsten
performance de pointe : 9,819 téraflops (devant
atteindre à terme à 17.7 téraflops)
[9819
milliards d'opérations à la seconde -
capacité
totale de
stockage :122 téraoctets]
Basé
au National Center for Supercomuting Applications
(NCSA) - Université de l'illinois, le cluster
Tungsten vise aux études concernant la cosmologie
(étude de la structure de l'univers, des étoiles,
mais aussi des propriétés de la matière).
Composé aujourd'hui de 1450 serveurs Dell Power
Edge 1750, dotés chacun de deux processeurs
Intel Xeon, c'est le plus puissant des supercalculateurs
actuels sous Linux (tournant sur la distribution Red
Hat 7°
En savoir plus :
http://www.ncsa.uiuc.edu/Divisions/PublicAffairs/LinuxCluster/tungsten.html
5
- MPP2
performance de pointe : 8,633 téraflops
[8633
milliards d'opérations à la seconde
- capacité
totale de
stockage :195 téraoctets]
Basé
au Pacific Northwest National Laboratory (Richland
- USA), ce superordinateur est notamment dédié
à la biologie et à la modélisation
de l'environnement. Il se compose de 980 ordinateurs
Hewlett Packard, chacun étant doté de
2 processeurs Itanium 2 Intel, cadencés à
1,5 GHz.
En savoir plus :
http://mscf.emsl.pnl.gov/?/capabs/mscf/hardware/intro_parcomputers.html
[NB : Signalons que cette liste Top 500 dressée
en 2003 est déjà obsolète. Aujourd'hui
MPP2 est passé en 6ème place derrière
un supercalculateur IBM d'une puissance de 8,9 téraflops,
basé en Allemagne au centre de recherche de
Julich (voir ci-dessous).]
La liste des 500 ordinateurs
les plus puissants du monde montre la prédominance
des Etats-Unis en la matière : près
des deux-tiers des machines répertoriées
sont situées dans les universités
et laboratoires américains.
Si certains contestent la validité
de cette liste, arguant qu'elle ne s'appuie
pas sur la puissance effective des ordinateurs
mais sur leurs performances de pointe(1),
en tenir compte ne bouleverse finalement
pas grand chose.
En tous cas, si on considère ce Top
500 - seule liste d'ailleurs à faire
référence -, la première
machine basée en Europe apparaissant
dans le classement est située...
en France(2)
et arrive à la 15 ème place
: il s'agit de l'AlphaServer SC45 (Hewlett
Packard) du CEA, doté d'une puissance
3,98 téraflop et réservé
aux applications militaires. Notons que
le premier gros calculateur français
uniquement dédié à
la recherche publique arrive en... 167 ème
position avec 0,822 téraflops (Institut
national de physique nucléaire et
de physique des particules - IN2P3/CNRS).
La Chine (Académie des sciences)
arrive en 14ème position (4,163 téraflops)
du Top 500, le Royaume-Uni (Institut de
physique) en 16ème place (3,4 téraflops).
Un projet européen
de mise en commun des moyens de calcul
Avec le projet Deisa(3)
figurant au 6ème PCRDT(4)
(projet coordonné par l'IDRIS(5)),
et un peu sur le modèle du TeraGrid
américain, six pays vont mettre en
commun leurs moyens de calcul : Allemagne,
Finlande, France, Italie, Royaume-Uni et
Suisse. L'objectif est de déployer
un supercalculateur réparti européen
résultant de l’intégration
de plusieurs supercalculateurs nationaux.
Dans une première phase planifiée
pour début 2005, cette future infrastructure
communautaire doit disposer d’une
puissance intégrée de 30 Téraflops.
Si chaque pays ne disposera pas de la puissance
totale, il pourra être attribué
une part importante à un programme
scientifique donné et réduire
aussi l'attente. Un calcul pourra être
effectué en partie dans n'importe
quel ordinateur des 6 pays, sans même
que l'utilisateur ne s'en rende compte.
Un supercalculateur d'une
puissance de 40 téraflops pour l'Espagne
!
La liste du Top 500 va être rapidement
à revoir : Juan Costa, ministre de
la science et de la technologie a
annoncé le 27 février 2004 l'installation
pour cette année en Catalogne d'un
supercalculateur d'une puissance de 40 Téraflops.
Devant constituer le coeur d'un nouveau centre
de recherche qui hébergera à
terme quelque 4000 chercheurs de toutes nationalités,
la supermachine sera notamment dédiée
à la modélisation avancée
en médecine, à l'étude
du climat, à l'amélioration
de la conception de produits industriels,
qu'il s'agisse d'ingénierie mécanique
ou aéronautique, conception de nouveaux
matériaux, etc. Construite en collaboration
avec IBM, pesant quelque 60 tonnes, elle comprendra
45000 processeurs sous Linux et sera dotée
d'une mémoire centrale de 9 Teraoctets.
Coût prévu : 70 millions d'euros
sur quatre ans.
Mais aussi... un supercalculateur
d'une puissance de 8,9 Téraflops déjà
en service en Allemagne et un autre de 40
Téraflops prévu pour 2005
Début mars 2004, le centre de recherche
allemand de Julich (qui participe au projet
Deisa - voir ci-dessus) vient de mettre en
serviceun super-calculateur d'une capacité
de 8,9 Teraflops. Développé
par IBM, pour un coût de 66 millions
d'euros, il se compose d'un réseau
de 41calculateurs comprenant un total de 1312
processeurs, l'ensemble étant relié
à un système central, via réseau
rapide.
La moitié de la capacité de
calcul doit être utilisée par
divers centres de recherches ainsi que par
des industriels. Une seconde moitié
sera utilisée par l'institut d'informatique
John von Neumann (NIC), fondé par le
centre de recherche de Julich en 1998.
Cela dit, ce centre ne devrait pas conserver
très longtemps sa première place
européenne : le centre de recherche
universitaire de Stuttgart a annoncé
la création d'un super-calculateur
d'une puissance de 15 Teraflops à l'horizon
2005. Et pour cette même date, le centre
de recherche Leibniz de Munich a également
planifié la réalisationd'un
super-calculateur atteignant les 40 Teraflops.
(1)
Certains calculateurs très performants
ne dispensent que 40% de leur capacité
maximale. 
(2)
Qui devrait être rejointe rapidement
par l'Allemagne, pour laquelle le High Performance
Computing Center Stuttgart (HLRS) vient d'annoncer
l'installation en 2004/2005 d'un supercalculateur
NEC d'une vitesse pouvant atteindre 4 téraflops.
Celui-ci sera mis à disposition
des universités et des organismes de
recherche non universitaires de toute l'Allemagne.

(3)
Distribued European Infrastructure
for Supercompution Applications [voir
http://www.deisa.org].

(4)
Programme-cadre de recherche et de développement
technologique. 
(5)
Institut du Développement et des
Ressources en Informatique Scientifique,
situé en France, à Orsay.
Le CNRS vient d’équiper l’IDRIS
d’une architecture IBM eServer pseries
de nouvelle génération, quintuplant
la puissance de calcul disponible (voir
communiqué
de presse du CNRS daté du 19
février 2004). 
|
Liste complète
du Top 500 (novembre 2003)
http://www.top500.org/list/2003/11/
|
Notes
(1) Tero-op Reliable Intelligently-adaptive
Processing System - Voir http://www.silicon.fr/click.asp?id=2201
(2) On aurait tout aussi bien pu choisir
1955, année du lancement de l'IBM 704, première
machine commerciale disposant d'un coprocesseur mathématique,
avec une puissance 5 kFLOPS (milliers d'opérations
en virgule flottante par seconde). Elle utilisait une mémoire
à tores de ferrite de 32768 mots de 36 bits, tores
de ferrite, assurant une fiabilité à toute épreuve
pour l'époque, car ne tombait en panne qu'une fois
par semaine. C'est sur cette machine que sera développé
le langage FORTRAN.
(3) Machine scientifique très
puissante, conçue pour travailler efficacement sur
les vecteurs. Elle possède des unités fonctionnelles
permettant d'effectuer une même opération (par
exemple une additionà sur un grand nombre de données
(les deux composantes des deux vecteurs à additionner).
Il suffit donc de préciser l'opération à
effectuer et sur quelles données opérer pour
que l'unité fonctionnelle exécute seule l'opération
sur toutes les composantes des vecteurs à traiter.
Si les unités fonctionnelles amélioraient alors
grandement la puissance de traitement, les performances de
la machine dépendaient beaucoup de la façon
de la programmer (appelée vectorisation).
(4) Méthode de codage et de stockage
des nombres réels dans les ordinateurs, pour qu'ils
puissent les manipuler assez rapidement.
(5) Dite aussi MPP (Massively Parallel
Computing. Le fonctionement de ces machines repose
sur le principe que l'on peut décomposer un programme
en un ensemble de tâches indépenantes, qui sont
exécutées simultanéments sur des processeurs
différents. Selon la manière dont les processus
coopèrent au cours du traitement, on distingue les
systèmes "fortements couplés" des
systèmes "faiblement couplés".
(6) Si ce type de machine possède
de très nombreux processeurs, la capacité mémoire
de chacun d'entre eux est forcément inférieure
à celle d'un processeur d'une machine vectorielle (qui
lui, est très puissant).
(7) Voir
http://www.apple.com/pr/library/2004/jan/06xgrid.html

(8) Voir notre éditorial du 7
janvier 2003 : http://www.automatesintelligents.com/edito/2003/fev/edito.html
Retour au sommaire
|
|