Documents et articles
 |
Les
superordinateurs et la course
au pétaflop
par
Christophe Jacquemin
28/02/04 |
Les
superordinateurs évoluent à grande vitesse et
les records de puissance et de vitesse de calcul ne cessent
de pleuvoir. Ces machines sont désormais indispensables
à l'avancée de nombreux domaines de la recherche
scientifique, qu'il s'agisse des biotechnologies et de la protéomique,
des neurosciences, de la cosmologie, de la modélisation
et de l'analyse de l'évolution de l'environnement, de
la simulation des essais nucléaires, etc. Occupant aujourd'hui
des pièces entières, ces supermachines finiront-elle
par atteindre dès 2010 la taille d'une simple puce, comme
le prédit la firme IBM avec l'avènement du processeur
Trips(1)
capable d'exécuter mille milliards d'opérations
à la seconde ? Et au-delà, pour cause de limites
infranchissables de miniaturisation des processeurs, verrons-nous
alors l'apparition des ordinateurs quantiques [notre
article du 29/01/2004] comme certains le prévoient
pour les années 2020 ?
Un
peu d'histoire
Architecture
vectorielle
De
quand date la première apparition du mot "supercalculateur"
(on dit plutôt maintenant "superordinateur")
? Pour le dictionnaire "Petit Robert", son utilisation
daterait de 1985, avec la définition suivante : "Ordinateur
d'une très grande puissance de calcul, possédant
des temps de cycles d'instruction très courts, des ressources
importantes et la possibilité d'effectuer des opérations
en parallèle". Cela dit, il peut y avoir décalage
de temps entre l'apparition réelle d'un mot et son acceptation
dans le langage usuel (surtout lorsqu'on sait que la validation
de ce terme par l'office de la langue française, date,
elle de... 1998).
On
pourrait aussi bien dater l'apparition du terme "supercalculateur"
à l'année 1976(2),
avec l'apparition du CRAY 1, machine dite à "architecture
vectorielle"(3),
conçue par l'américain Seymour Cray, considéré
comme le père des ordinateurs scientifiques. Refroidi
au fréon, doté de 8 Mo de mémoire vive
et capable d'effectuer quelque 166 millions d'opérations
à virgule flottante(4)
à la seconde (166 mégaflops), ce supercalculateur
pesant près de 5 tonnes coûtait environ 700000
dollars à l'époque. Le premier exemplaire (photo)
fut livré au "Los Alamos National Laboratory".
Seize exemplaires ont été construits.
En
1985, arrive la commercialisation du Cray2, premier ordinateur
à dépasser la puissance de 1 Gflop (1 milliard
de calculs en virgule flottante par seconde). Tournant sous
Unix, la machine peut être équipée jusqu'à
4 processeurs d'excécution (le modèle de base
en comportant 2) tournant à 250 MHz et peut adresser
directement jusqu'à 4 Go de mémoire vive. Chaque
processeur a une puissance de 488 Mflops. Un programme de multiplication
de matrices utilisant les 4 processeurs dispose d'une puissance
de 1.7 Gflops. Le Centre de Calcul Vectoriel pour la Recherche
(CCVR) Ecole polytechnique ou le Centre interuniversitaire de
calcul d'Orsay ont notamment pu bénéficier de
telles machines.
Architecture
massivement parallèle
Si
on voit arriver le Cray3 à la fin des années 80
(5 gigaflops), une nouvelle architecture, dite "massivement
parallèle"(5)
va aussi commencer à s'imposer dès 1986, avec
la commercialisation par la société
Thinking Machines de la Connection Machine CM-1, superordinateur
d'un nouveau type pouvant comporter jusqu'à 65536 processeurs.
La machine est un peu conçue comme le fonctionnement
du cerveau humain car chaque processeur (qui n'a pas besoin
d'être puissant) effectue un travail très réduit
mais ce qui compte, c'est la façon dont sont reliés
les processeurs entre eux. La machine reconfigure les connexions
internes entre les processeurs pour résoudre un problème
donné. Les performances dépendent toutefois largement
du type d'application à traiter, nécessitant de
la part de l'utilisateur une très bonne connaissance
de l'architecture de la machine pour l'écriture de programmes
efficaces. La machine se prête plutôt aux applications
qui comportent une grande quantité de données
auxquelles sont attachés des paramètres identiques(6).
Elle est particulièrement adaptées aux disciplines
qui utilisent la simulation (le Centre National de Calcul Parallèle
en Sciences de la Terre de Jussieu (Paris) a par exemple été
l'un des premiers à bénéficier d'une telle
machine [CM-5], notamment pour ses calculs en géophysique).
L'architecture massivement parallèle qui, répétons-le
consiste à distribuer la charge sur un grand nombre de
processeurs au lieu de faire travailler un nombre réduit
de processeurs puissants (cas des machines vectorielles), présente
évidemment un avantage en termes de coût du fait
que les processeurs utilisés sont à peu prè s
les mêmes que ceux employés dans les micro-ordinateurs
de bureau...
C'est ainsi qu'on dépassera le téraflop en 1997
(mille milliards d'opérations en virgule flottante à
la seconde) avec ASCI Red (Accelerated Strategic Computing Initiative),
développé aux Etats-Unis par INTEL Corporation
et Sandia National Laboratories. Ordinateur massivement parallèle
MIMD (Multiple Instruction, Multiple Data).
Architecture
de grappes d'ordinateurs (clusters)
Course
à la performance oblige (et surtout à la diminition
du coût) voici aujourd'hui les clusters, ordinateurs classiques
mis en réseau pour fonctionner ensemble, comme une seule
machine. Si le problème actuel est la vitesse des interfaces
réseaux gérant la comunication entre les différents
ordinateurs, il n'en reste pas moins que les clusters les plus
puissants n'ont pas grand choses à envier à d'autres
machines. Qu'on en juge notamment avec Apple qui vient de présenter
le 6 janvier dernier à San Fransisco sa technologie de
grappes Xgrids(7)
permettant de faire calculer ensemble jusqu'à 84 processeurs
G5, fournissant une puissance de calcul d'1,5 téraflop
(système apple déjà testé aux états-Unis
par la Nasa, Genentech, Simon Fraser University, Reed College
and Virginia Tech). Notons que la 3ème machine la plus
puissante au monde (le Terascale, voir tableau ci-dessous) est
un cluster de 1100 G5, affichant 10 téraflops (coût
: 5,2 millions de dollars). La machine arrivant première,
indétrônée depuis son apparition en 2002,
est japonaise : il s'agit de l'Earth Simulator(8),
synthèse entre l'ordinateur à architecture vectorielle
et architecture massivement parallèle, qui atteint les
35 téraflops. Son coût : 350 millions de dollars.
A
quand le pétaflop ?
Un
pétaflop représente un million de milliards d'opérations
en virgule flottante par seconde, chiffre symbolique désormais
à atteindre pour des raisons stratégiques mais
aussi pour le prestige que cela confère. On peut alors
ici parler d'une véritable compétition. La Darpa
a d'aileurs lancé en juillet 2003 un appel d'offres pour
qu'on lui soumette des projets innovants.
Sont déjà annoncés un futur CRAY, le "Red
Storm" qui devrait atteindre les 40 téraflops (Sandia
laboratories) et l'ASCI Purple d'IBM (fabriqué pour le
laboratoire national de Laurence Livermore), qui doit atteindre
les 100 téraflops et être livré pour la
fin de cette année. Toujours chez IBM, on s'active sur
Blue Gene/L, qui doit être livré l'année
prochaine aux chercheurs du laboratoire national de Laurence
Livermore. Dix fois plus compacts que les plus performants des
superordinateur actuel et consommant 15 fois moins, il atteindra
les 360 téraflops ! Ambition affichée par IBM
: enfoncer les japonais et asseoir sa domination sur le secteur,
ayant déjà annoncé passer à mille
milliards d'opérations à la seconde en 2010 sur...
une simple puce. Cray, pour sa part, nourrit l'ambition de founir
à cette même date une machine développant
une puissance de calcul d'un pétaflop.
|
Les cinq machines les plus puissantes au monde
source : http://www.top500.org
novembre 2003
1
- Earth simulator
performance de pointe : 35,86 téraflops
[35860 milliards d'opérations
à la seconde - capacité
totale de stockage : plus
de 700 téeraoctets]
Conçu
par l'entreprise japonaise NEC, l'Earth Simulator (machine
hybride vectoriel- massivement parallèle) occupe
une superficie d'un peu plus de la moitié d'un
terrain de footbal. Basé à Yokoama, ce
superordinateur est affecté à des simulations
à l'échelle de la Terre entière
(systèmes terrestres complexes, climatologiques,
géophysique, calcul des courants marins, etc.)
Indétrônée
depuis son apparition en 2002, et d'un coût estimé
de 350 millions de dollars, la machine est dotée
de quelque 5120 processeurs cadencés à
500 Mhz. L'installation occupe pas moins de quatre étages
(dont un pour l'équipement électrique,
un autre occupé par des centaines de kilomètre
de câbles...).
En savoir plus :
http://www.es.jamstec.go.jp/
2
- Asci Q
performance de pointe : 13,86 téraflops
(devant atteindre à terme à 30 téraflops)
[13860
milliards d'opérations à la seconde -
capacité
totale de
stockage (à terme) : plus de 654 téraoctets]
Situé au laboratoire national de Los Alamos(LANL)
et dédié à la simulation des essais
nucléaires, Asqi Q (Advanced Simulation and Computing)
est aujourd'hui le plus puissant des ordinateurs américains.
Il comprend pour l'instant plus de 2000 ordinateurs
Alphaserver Hewlett Packard, chacun d'eux étant
munis de 4 processeurs cadencés à 1,25
GHz.

A terme, ce système à architectecture
massivement parallèle comprendra 3072 AlphaServer
(soit plus de 12000 processeurs), pour une puissance
de 30 téraflops.
En savoir plus :
http://doc.quadrics.com/Quadrics...
3
- Terascale
performance de pointe : 10,28 téraflops
[10280
milliards d'opérations à la seconde -
capacité
totale de
stockage :176 téraoctets]
Le
Terascale est le plus puissant des ordinateurs réalisé
selon l'architecture "cluster", c'est-à-dire
à partir de machines de bureau mises en réseau.
Conçu par les scientifiques de l'Institut polytechnique
de Virginie((avec l'aide de partenaires industriels)
pour faire -comme ils aiment à dire - de la "Big
Science", le superordinateur se compose de l'association
de 1100 ordinateurs G5 (Apple) chacun doté de
deux processeurs Power PC 64 bit s
970 d'IBM.
C'est également l'un des moins chers des supercalculateurs
dans une telle catégorie, avec son coût
estimé à 5 millions de dollars (contre
par exemple 350 millions de dollars pour le Earth Simulator).
En savoir plus :
http://computing.vt.edu/research_computing/terascale/
4
- Tungsten
performance de pointe : 9,819 téraflops (devant
atteindre à terme à 17.7 téraflops)
[9819
milliards d'opérations à la seconde - capacité
totale de
stockage :122 téraoctets]
Basé
au National Center for Supercomuting Applications (NCSA)
- Université de l'illinois, le cluster Tungsten
vise aux études concernant la cosmologie (étude
de la structure de l'univers, des étoiles, mais
aussi des propriétés de la matière).
Composé aujourd'hui de 1450 serveurs Dell Power
Edge 1750, dotés chacun de deux processeurs Intel
Xeon, c'est le plus puissant des supercalculateurs actuels
sous Linux (tournant sur la distribution Red Hat 7°
En savoir plus :
http://www.ncsa.uiuc.edu/Divisions/PublicAffairs/LinuxCluster/tungsten.html
5
- MPP2
performance de pointe : 8,633 téraflops
[8633
milliards d'opérations à la seconde -
capacité
totale de
stockage :195 téraoctets]
Basé
au Pacific Northwest National Laboratory (Richland -
USA), ce superordinateur est notamment dédié
à la biologie et à la modélisation
de l'environnement. Il se compose de 980 ordinateurs
Hewlett Packard, chacun étant doté de
2 processeurs Itanium 2 Intel, cadencés à
1,5 GHz.
En savoir plus :
http://mscf.emsl.pnl.gov/?/capabs/mscf/hardware/intro_parcomputers.html
[NB
: Signalons que cette liste Top 500 dressée en
2003 est déjà obsolète. Aujourd'hui
MPP2 est passé en 6ème place derrière
un supercalculateur IBM d'une puissance de 8,9 téraflops,
basé en Allemagne au centre de recherche de Julich
(voir ci-dessous).]
La liste des 500 ordinateurs
les plus puissants du monde montre la prédominance
des Etats-Unis en la matière : près
des deux-tiers des machines répertoriées
sont situées dans les universités
et laboratoires américains.
Si certains contestent la validité
de cette liste, arguant qu'elle ne s'appuie
pas sur la puissance effective des ordinateurs
mais sur leurs performances de pointe(1),
en tenir compte ne bouleverse finalement
pas grand chose.
En tous cas, si on considère ce Top
500 - seule liste d'ailleurs à faire
référence -, la première
machine basée en Europe apparaissant
dans le classement est située...
en France(2)
et arrive à la 15 ème place
: il s'agit de l'AlphaServer SC45 (Hewlett
Packard) du CEA, doté d'une puissance
3,98 téraflop et réservé
aux applications militaires. Notons que
le premier gros calculateur français
uniquement dédié à
la recherche publique arrive en... 167 ème
position avec 0,822 téraflops (Institut
national de physique nucléaire et
de physique des particules - IN2P3/CNRS).
La Chine (Académie des sciences)
arrive en 14ème position (4,163 téraflops)
du Top 500, le Royaume-Uni (Institut de
physique) en 16ème place (3,4 téraflops).
Un projet européen
de mise en commun des moyens de calcul
Avec le projet Deisa(3)
figurant au 6ème PCRDT(4)
(projet coordonné par l'IDRIS(5)),
et un peu sur le modèle du TeraGrid
américain, six pays vont mettre en
commun leurs moyens de calcul : Allemagne,
Finlande, France, Italie, Royaume-Uni et
Suisse. L'objectif est de déployer
un supercalculateur réparti européen
résultant de l’intégration
de plusieurs supercalculateurs nationaux.
Dans une première phase planifiée
pour début 2005, cette future infrastructure
communautaire doit disposer d’une
puissance intégrée de 30 Téraflops.
Si chaque pays ne disposera pas de la puissance
totale, il pourra être attribué
une part importante à un programme
scientifique donné et réduire
aussi l'attente. Un calcul pourra être
effectué en partie dans n'importe
quel ordinateur des 6 pays, sans même
que l'utilisateur ne s'en rende compte.
Un supercalculateur d'une
puissance de 40 téraflops pour l'Espagne
!
La liste du Top 500 va être rapidement
à revoir : Juan Costa, ministre de la
science et de la technologie a
annoncé le 27 février 2004 l'installation
pour cette année en Catalogne d'un supercalculateur
d'une puissance de 40 Téraflops. Devant
constituer le coeur d'un nouveau centre de recherche
qui hébergera à terme quelque
4000 chercheurs de toutes nationalités,
la supermachine sera notamment dédiée
à la modélisation avancée
en médecine, à l'étude
du climat, à l'amélioration de
la conception de produits industriels, qu'il
s'agisse d'ingénierie mécanique
ou aéronautique, conception de nouveaux
matériaux, etc. Construite en collaboration
avec IBM, pesant quelque 60 tonnes, elle comprendra
45000 processeurs sous Linux et sera dotée
d'une mémoire centrale de 9 Teraoctets.
Coût prévu : 70 millions d'euros
sur quatre ans.
Mais aussi... un supercalculateur
d'une puissance de 8,9 Téraflops déjà
en service en Allemagne et un autre de 40 Téraflops
prévu pour 2005
Début mars 2004, le centre de recherche
allemand de Julich (qui participe au projet
Deisa - voir ci-dessus) vient de mettre en serviceun
super-calculateur d'une capacité de 8,9
Teraflops. Développé par IBM,
pour un coût de 66 millions d'euros, il
se compose d'un réseau de 41calculateurs
comprenant un total de 1312 processeurs, l'ensemble
étant relié à un système
central, via réseau rapide.
La moitié de la capacité de calcul
doit être utilisée par divers centres
de recherches ainsi que par des industriels.
Une seconde moitié sera utilisée
par l'institut d'informatique John von Neumann
(NIC), fondé par le centre de recherche
de Julich en 1998.
Cela dit, ce centre ne devrait pas conserver
très longtemps sa première place
européenne : le centre de recherche universitaire
de Stuttgart a annoncé la création
d'un super-calculateur d'une puissance de 15
Teraflops à l'horizon 2005. Et pour cette
même date, le centre de recherche Leibniz
de Munich a également planifié
la réalisationd'un super-calculateur
atteignant les 40 Teraflops.
(1)
Certains calculateurs très performants
ne dispensent que 40% de leur capacité
maximale. 
(2)
Qui devrait être rejointe rapidement par
l'Allemagne, pour laquelle le High Performance
Computing Center Stuttgart (HLRS) vient d'annoncer
l'installation en 2004/2005 d'un supercalculateur
NEC d'une vitesse pouvant atteindre 4 téraflops.
Celui-ci sera mis à disposition des
universités et des organismes de recherche
non universitaires de toute l'Allemagne. 
(3)
Distribued European Infrastructure
for Supercompution Applications [voir
http://www.deisa.org].

(4)
Programme-cadre de recherche et de développement
technologique. 
(5)
Institut du Développement et des
Ressources en Informatique Scientifique,
situé en France, à Orsay.
Le CNRS vient d’équiper l’IDRIS
d’une architecture IBM eServer pseries
de nouvelle génération, quintuplant
la puissance de calcul disponible (voir
communiqué
de presse du CNRS daté du 19
février 2004). 
|
Liste complète
du Top 500 (novembre 2003)
http://www.top500.org/list/2003/11/
|
Notes
(1) Tero-op Reliable Intelligently-adaptive
Processing System - Voir http://www.silicon.fr/click.asp?id=2201
(2) On aurait tout aussi bien pu choisir
1955, année du lancement de l'IBM 704, première
machine commerciale disposant d'un coprocesseur mathématique,
avec une puissance 5 kFLOPS (milliers d'opérations en
virgule flottante par seconde). Elle utilisait une mémoire
à tores de ferrite de 32768 mots de 36 bits, tores de
ferrite, assurant une fiabilité à toute épreuve
pour l'époque, car ne tombait en panne qu'une fois par
semaine. C'est sur cette machine que sera développé
le langage FORTRAN.
(3) Machine scientifique très puissante,
conçue pour travailler efficacement sur les vecteurs.
Elle possède des unités fonctionnelles permettant
d'effectuer une même opération (par exemple une
additionà sur un grand nombre de données (les
deux composantes des deux vecteurs à additionner). Il
suffit donc de préciser l'opération à effectuer
et sur quelles données opérer pour que l'unité
fonctionnelle exécute seule l'opération sur toutes
les composantes des vecteurs à traiter. Si les unités
fonctionnelles amélioraient alors grandement la puissance
de traitement, les performances de la machine dépendaient
beaucoup de la façon de la programmer (appelée
vectorisation).
(4) Méthode de codage et de stockage
des nombres réels dans les ordinateurs, pour qu'ils puissent
les manipuler assez rapidement.
(5) Dite aussi MPP (Massively Parallel
Computing. Le fonctionement de ces machines repose sur
le principe que l'on peut décomposer un programme en
un ensemble de tâches indépenantes, qui sont exécutées
simultanéments sur des processeurs différents.
Selon la manière dont les processus coopèrent
au cours du traitement, on distingue les systèmes "fortements
couplés" des systèmes "faiblement couplés".
(6) Si ce type de machine possède
de très nombreux processeurs, la capacité mémoire
de chacun d'entre eux est forcément inférieure
à celle d'un processeur d'une machine vectorielle (qui
lui, est très puissant).
(7) Voir
http://www.apple.com/pr/library/2004/jan/06xgrid.html

(8) Voir notre éditorial du 7 janvier
2003 : http://www.automatesintelligents.com/edito/2003/fev/edito.html
Page d'accueil
| |