Automates
Intelligents s'enrichit du logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet
aussi d'accéder à la définition
du mot dans une autre langue (22 langues sont disponibles,
dont le Japonais).
Article
Le match Watson/humains dans le jeu Jeopardy!
Ce que l'on pourrait en conclure concernant l'Intelligence
artificielle Jean-Paul
Baquiast et Christophe Jacquemin - 17/02/2011
Dans
la présentation que nous faisons du livre de
Martin Ford, The Lights in the Tunnelhttp://www.automatesintelligents.com/biblionet/2011/jan/martinford.html,
nous insistons sur l'argument principal de ce livre
: une grande majorité des travailleurs actuels,
quels que soient leurs professions et leurs grades,
seront remplacés dans les prochaines décennies
par des applications de l'Intelligence artificielle,
des automatismes et de la robotique. Et contrairement
à ce que l'on croit, les personnes les plus
menacées seront celles qui font aujourd'hui
appel aux formes élaborées de la compréhension
du langage naturel et du jugement, en s'appuyant sur
des quantités considérables de connaissances
accumulées aussi bien dans leurs cerveaux que
dans les sources de documentation qu'ils utilisent.
Dans
un premier temps, on cite en exemple les documentalistes
qui répondent, notamment par téléphone
ou en ligne, aux questions posées par des clients.
Une bonne partie des centres serveurs qui avaient
été créés ces dernières
années dans des pays à bas salaires
sont en train de disparaître, du fait du relais
pris par des systèmes d'intelligence artificielle,
fonctionnant sur le mode du système-expert.
Mais la contagion ne risque-t-elle pas de s'étendre
très rapidement à de nombreuses professions
où l'expertise repose en grande partie sur
la consultation d'informations mémorisées,
fussent-elles complexes : médecins, avocats,
enseignants ?
Aujourd'hui,
chacun peut en faire l'expérience en consultant
les bases de données immenses, en nombre et
en contenus, qui constituent la puissance cognitive
d'entreprises à moteurs de recherche telles
que Google. Des algorithmes de plus en plus efficaces
permettent au moteur de comprendre rapidement le sens
des questions posées et d'offrir les réponses
statistiquement les plus appropriées, même
si ces questions sont ambiguës ou partielles.
Le moteur n'invente évidemment rien de nouveau
ce faisant. Il s'appuie sur les références
qui ont été accumulées sur des
centaines de serveurs répartis, qu'il peut
consulter en quelques dixièmes de seconde.
Les réponses mentionnent en premier lieu les
sites ou données les plus consultées.
On
peut le constater à propos de ce que les chercheurs
en Intelligence artificielle ont appelé le
paradoxe Paris Hilton. Si l'on tape ce terme sur Google,
on obtient une dizaine de réponses concernant
la star (photo). Il n'est fait mention de l'hôtel
Hilton à Paris qu'au 12e ou 15e rang. Ceci
tient au fait que les questions sont principalement
posées par des Américains connaissant
la star et ne s'intéressant qu'épisodiquement
à l'hôtel parisien. Si cependant un processus
de recherche plus performant était utilisé
par Google ou par un autre système de question-réponse
professionnel, il aurait pu déduire d'un certain
nombre de connaissances plus subtiles accumulées
à propos du sujet posant la question que c'était
l'adresse de l'hôtel que ce dernier cherchait.
Ce
sont de telles performances que prétendent
accomplir les responsables du mega système-expert
géré par l'ensemble de super-ordinateurs
IBM baptisé Watson, en honneur du fondateur
de la firme. L'actualité s'est beaucoup intéressée
au match qui vient d'opposer ce système aux
gagnants d'un jeu intitulé Jeopardy!,
très populaire aux Etats-Unis. Après
plusieurs épisodes suivis de près par
les médias (fortement orchestrés par
les relations publiques d'IBM), Watson vient de l'emporter
sur ses concurrents humains. Il s'agissait de faire
face à des questions lourdes d'ambiguïtés,
avec la meilleure pertinence et dans les meilleurs
délais.
Jeopardy ! : Watson l'a emporté haut
la main sur ses concurrents humains
Le
match se déroulait en deux manches et
opposait le superordinateur Watson à
deux opposant de poids : Ken Jennings, détenteur
du record du plus grand nombre de victoires
consécutives au Jeopardy! (74), et Brad
Rutter, gagnant du plus gros gain à ce
jeu.
Le premier match, diffusé le 14 février
dernier, a été sans appel : 4.800
$ pour Jennings, 10.400 $ pour Rutter, et 35.734
$ pour Watson, grâce notamment à
deux bonnes réponses aux questions bonus
qui rapportaient plus d'argent.
Bien que Watson a été mené
durant la seconde manche, il finira par la remporter
avec 77.147 $, devant Jennings avec 24.000 $
et Rutter avec 21.600 $.
Sur les 94 réponses données par
Watson, il ne s'est trompé que neuf fois.
Le programme s'est abstenu de répondre
à 26 occasions, n'étant pas assez
sûr de lui pour tenter sa chance (il avait
pourtant la bonne réponse dans 5 de ces
cas, soit 19,2 %).
Avec cette compétition, Watson remporte
un million de dollars, qu'IBM a reversé
à des uvres caritatives.
Pour
préparer Watson à l'épreuve,
les chercheurs et ingénieurs d'IBM(1)
ont entré dans le système (pendant des
semaines, voire des mois), des données de toutes
sortes susceptibles de répondre avec le plus
de pertinence et le plus de rapidité possibles
aux types de questions posées par les humains
dans le jeu Jeopardy!. La base de données,
qui inclue des millions de documents - par exemple
les archives du New York Times, la Bible , des
dictionnaires, thesaurus, encyclopédies (y
compris l'intégralité de Wikipedia et
l'Internet Movie Database) - occupe quatre téra-octets
sur les disques durs du superordinateur Watson.
Progrès
apportés par Watson
C'est
sur la base de ces informations que s'applique la
technologie de question-réponse développée
par IBM. Elle ne paraît pas très différente
de celle utilisée par les systèmes IBM
joueurs d'échecs. Face à une occurrence
nouvelle imposée par le partenaire humain,
l'ordinateur recherche, parmi les milliers ou centaines
de milliers de réponses possibles qu'il a mémorisées,
celle qui paraît la plus adaptée.
Les
performances obtenues sont impressionnantes. De plus
les domaines intéressés pourraient être
étendus indéfiniment, en fonction des
capacités de mémorisation du système
et de la variété des expertises qui
seraient rassemblées. IBM est donc légitime
à prétendre que Watson ou ses successeurs
pourront progressivement s'investir dans tous les
champs du savoir, à condition encore une fois
que les actuels détenteurs des compétences
acceptent de les charger dans le système. Relations
publiques obligent, IBM insiste évidemment,
sur le fait que ces experts ne seront pas dépossédés
de leur rôle social. Ils seront seulement sollicités
à un niveau supérieur, leur permettant
d'appliquer les ressources de leurs cerveaux à
des questions non triviales.
Ceux qui ont connu le début de l'utilisation
des systèmes-experts retrouveront les inquiétudes
ressentis par les experts de l'époque, face
à l'éventualité de se voir remplacer
par de tels systèmes dans un certain nombre
de professions supposant, comme par exemple la médecine,
la formulation de diagnostics à partir de milliers
de données précédemment mémorisées
par la profession. En fait, à l'époque,
les craintes des professionnels les plus avertis se
sont apaisées, compte tenu des faibles performances
des « moteurs d'inférence »
utilisés par les systèmes experts. Ceux-ci
ne se sont généralisés que dans
les systèmes où le champ des questions-réponses
restait limité (comme dans les annuaires téléphoniques
en ligne) ou dans ceux supportant une grande approximation,
que l'utilisateur peut corriger lui-même. C'est
le cas des moteurs de recherche modernes, Google ou
Yahoo.
Il
est indéniable qu'en ce qui concerne les performances,
Watson se rapproche beaucoup plus de celles déployées
par les humains, y compris dans le langage courant.
Avec ce qui semble être une grande aisance,
il "comprend" des questions posées
en langage naturel, c'est-à-dire sans l'obligation
de respecter des formalismes permettant au système
de ne pas s'égarer dans des voies adjacentes
inutiles. Il peut fournir des réponses faisant
appel à diverses sortes de données non
structurées, documents ou discours. Il met
en oeuvre une grande variété de méthodes
d'analyses permettant d'évaluer la façon
dont les réponses qu'il propose répondent
aux questions. Et tout ceci, répétons-le,
à grande vitesse, ce qui lui permet de satisfaire
à l'une des contraintes du jeu : actionner
une sonnerie annonçant la réponse avant
le partenaire humain.
Une forme avancée
d'Intelligence augmentée
On peut donc considérer que Watson est une
forme non pas d'Intelligence artificielle (Artificial
Intelligence) mais d'Intelligence augmentée
(Intelligence Augmentation). Dans le premier cas,
l'Intelligence artificielle incarne l'ambition de
simuler le fonctionnement intelligent du cerveau humain
incorporé, y compris dans des tâches
comme l'imagination ou l'invention (poser des questions
plutôt que répondre à des questions).
Dans le second cas, l 'Intelligence augmentée
s'efforce de rassembler et confronter les connaissances
de nombreux esprits distingués dans leurs disciplines.
Même
si, outre le recueil d'un nombre illimité de
connaissances, elle permet la mise en oeuvre de capacités
d'inférence propres - voire supérieure
- à celles de l'esprit humain, l'Intelligence
augmentée telle que celle de Watson semble
intrinsèquement incapable de répondre
aux questions bien plus complexes que se pose ou se
posera l'Intelligence artificielle.
Reste à savoir si Watson nous éclaire
en quoi que ce soit sur le fonctionnement effectif
des cerveaux humains, y compris de ceux manifestement
très «robotisés» des compétiteurs
attirés par le jeu Jeopardy!. Nous employons
ici ce mot "robotisés" en ce sens
que ces humains, comme tous ceux participant à
ces sortes de "quizz", quelles que soient
leurs grandes qualités en termes de mémorisation
ou d'association, sont sans doute loin de pouvoir
aborder avec beaucoup de valeur ajoutée les
grandes questions que se posent la science, la philosophie
ou la création artistique. Ceci étant,
ils font l'admiration justifiée de leurs contemporains
par l'étendue de leurs connaissances et leur
alacrité intellectuelle.
Or comment fonctionne leur cerveau ? Watson peut-il
nous éclairer en quoi que ce soit à
cet égard ?
On peut en douter. Les cerveaux de ces humains ont
enregistré un grand nombre de données,
qu'ils peuvent restituer sur demande. Mais les bases
neurales de leurs systèmes de mise en mémoire,
d'association, de recherche et de restitution sont
sans doute bien plus complexes que ne le sont les
mémoires informatiques de Watson. Quoi qu'en
disent les ingénieurs d'IBM, ces dernières
ne ressemblent en fait quà des bibliothèques
accessibles par des catalogues plus ou moins limités.
On
ne voit pas comment les mémoires informatiques
de Watson, même mises en oeuvre par des algorithmes
complexes dont IBM conserve le secret, pourraient
intégrer les innombrables processus associatifs,
révélés notamment par l'Imagerie
fonctionnelle, s'établissant entre aires cérébrales
multiples, elles-mêmes en relation avec un grand
nombre de réseaux neuronaux intéressant
la mémoire tout entière d'un corps en
situation.
Ce
sont ces associations - hors de portée des
ordinateurs actuels - qui entrent en jeu pour répondre
aux questions posées par Jeopardy!. Certes
elles prennent plus de temps et peuvent fournir de
mauvaises réponses, contrairement à
Watson. Ce qui fait que l'humain est battu dans le
jeu tel qu'il est organisé. Mais cela ne veut
pas dire que Watson, intrinsèquement, met en
oeuvre des processus plus riches que ceux de l'humain.
A plus forte raison, on ne voit pas comment Watson
pourrait effectivement imaginer et créer de
façon pertinente, c'est-à-dire faire
face à des questions originales dont il n'aurait
pas déjà mémorisé les
grandes catégories de réponse.
Le
lecteur objectera que les meilleurs systèmes
d'Intelligence artificielle ou de robotique évolutionnaire
ne se montrent à ce jour guère plus
convaincants. Ils peinent à simuler l'intelligence
créative. Ils n'éclairent guère
non plus la façon sans doute spécifique
dont le cerveau humain se comporte lorsqu'il fait
montre de ce que nous appelons l'intelligence, la
conscience de soi et la créativité.
Nous
répondrons à cette objection justifiée
que rien n'interdit à l'avenir que les chercheurs
en Intelligence artificielle et en robotique améliorent
les capacités d'invention de leurs systèmes
et permettent alors, avec l'appui d'autres disciplines,
notamment les neurosciences observationnelles, de
mieux comprendre le fonctionnement du cerveau. Mais
il faudra pour cela faire appel à une véritable
inventivité, et non à la «force
brute» déployée par les grands
calculateurs.
C'est une ambition de cette ampleur qui anime le projet
évoqué sur ce site par Alain Cardon
(voir http://www.automatesintelligents.com/edito/2011/fev/edito.html).
IBM
dans ce domaine semble céder à la même
illusion que nous avions signalée en évoquant
son projet Blue Brain (http://www.automatesintelligents.com/echanges/2011/jan/hbsp.html).
Ce ne sera pas en reconstituant avec la force brute
de millions de composants informatiques une mini-colonne
de cortex que l'on pourra obtenir les performances
d'un cortex, fut-ce celui d'un rat. De même
les Watson et super-systèmes experts à
venir auront beau être chargés jusqu'à
étouffer de millions de connaissances, ils
ne pourront jamais en faire un usage aussi intelligent
que le ferait un rat confronté à la
nécessité de sortir d'un labyrinthe.
(1)
Notons que le prix Turing (équivalent d'un
prix Nobel de linformatique) vient d'être
décerné au britannique Leslie Valiant,
professeur à l'université de Harvard,
remarqué pour ses recherches autour de lintelligence
artificielle. Leslie Valiant a participé à
la création de Watson.
PS.
Dans un article un peu technique publié sur
son blog, http://blog.stephenwolfram.com/,
Stephen Wolfram compare à celles de Watson
les méthodes qu'il a utilisées sur son
propre système de questions-réponses,
Wolfram/Alpha. Nous ne reprendrons pas l'argumentaire
ici, mais les spécialistes de la documentation
automatique auront tout intérêt à
s'y référer.