Retour au sommaire
Automates
Intelligents utilise le logiciel
Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront
alors définitions, synonymes et expressions constituées
de ce mot. Une fenêtre déroulante permet
aussi d'accéder à la définition du
mot dans une autre langue (22 langues sont disponibles,
dont le Japonais). |
Interview
Dominique
Dutoit
co-fondateur de la société
Memodata conceptrice du logiciel Alexandria
Propos
recueillis par Christophe Jacquemin (2 mars 2006).
Voir
aussi notre éditorial
Diplômé
en économie, Dominique Dutoit est aussi titulaire
d'un doctorat ès Science. S'intéressant
à la linguistique et à l'informatique,
il a cofondé avec Patrick de Torcy la société
Memodata en 1989, société qui propose
aujourd'hui le logiciel Alexandria (qui a retenu toute
l'attention d'Automates Intelligents).
Ayant été à l'initiative de quelques
projets de recherche européens (dont CRISTAL,
en 1993, qui fut le premier projet en matière
d'indexation sémantique et de désambiguïsation)
Dominique Dutoit considère fondamentalement
que maintenant, pour le français, la première
phase de description linguistique pour l'ordinateur
est achevée. Il s'agit donc désormais
d'entamer une deuxième phase dans laquelle
chaque mot deviendrait activateur d'algorithmes spécifiques.
Dans ce cadre, un premier objet de recherche est la
réintégration de tout ou partie des
descriptions métalinguistiques dans le coeur
actif des dictionnaires électroniques.
Le chercheur prépare actuellement sa HDR (Habilitation
à diriger les recherches) dans le contexte
de sa contribution, en tant que membre des laboratoires
du CNRS GREYC (informatique, université de
Caen) et CRISCO (informatique, Université de
Caen).
Pour
en savoir plus :
Memodata
: http://www.memodata.com
Blog de
Memodata : http://fr-alexandria.blogspot.com/
Pour
installer le logiciel Alexandria :
http://www.memodata.com/2004/fr/alexandria/install.shtml
|
Christophe
Jacquemin (C.J) : Vous êtes le concepteur d'Alexandria,
fantastique logiciel d'aide contextuelle [aide à la
compréhension (définitions, traductions...]
qui mérite bien aussi le terme d'agent intelligent
puisque ce service est disponible en chaque lieu où
il est installé. Quelle est la genèse de la
conception de ce logiciel ?
Dominique
Dutoit (D.T) : J'ai créé la société
Memodata avec mon collègue Patrick de Torcy il y a
16 ans, c'est à dire il y a fort longtemps si lon
considère lambiance de révolution permanente
qui existe dans les technologies de linformation....
Notre objectif visait le développement d'un dictionnaire
du français qui augmenterait de façon sensible
les liens analogiques entre les mots, de telle façon
que la recherche de termes précis, pertinents, soit
facilitée. L'idée générale, toujours
en grande partie vraie aujourd'hui étant d'apporter
une sorte de réponse à la célèbre
phase de Boileau "Ce qui se conçoit bien s'énonce
clairement et les mots pour le dire viennent aisément"
: ce qui est dit avec facilité montre une belle
maîtrise des mots, et le discours clair favorise une
bonne conception. Il sagit de faciliter lexpression
par une meilleure transmission des vocabulaires, précis
ou riches.
C.J
: En se replaçant 16 ans en arrière, on peut
dire que ce projet n'était pas lié au web...
D.T : Oui, 1988/89 c'était bien avant l'apparition
des réseaux...
CJ
: Il s'agissait donc de concevoir un logiciel qui permette
à chacun de disposer d'un dictionnaire "amélioré"
?
D.T : Oui, mais un dictionnaire que l'on a appelé
très rapidement "dictionnaire intégral
", c'est à dire quelque chose, qui de façon
massive, ait lié les mots d'une même langue au
moyen de composantes sémantiques.
CJ
: Sentiez-vous déjà à cette époque
toutes les richesses potentielles de cette idée et
l'ensemble des domaines d'applications qu'elle pouvait couvrir
?
D.T : En fait non. Nous n'avions
pas compris qu'une grosse partie de ce travail pouvait avoir
d'autres destinations, dans un secteur dont nous ne connaissions
pas seulement le nom. Il sagit du "traitement automatique
des langues ". Nous avons réalisé bien
après que ce que nous étions en train de tricoter
à la main pouvait s'appliquer à différentes
activités de ce domaine, qu'il s'agisse de recherche
documentaire, de correction orthographique ou dintelligence
artificielle...
CJ
: Donc deux composantes alors, l'une tournée vers l'utilisateur
humain, l'autre vers l'utilisateur machine...
D.T : Oui, et ceci raconte finalement
les deux activités de notre société depuis
plus de 15 ans. Nous n'avons jamais bien su dire si nous travaillions
pour la machine ou plutôt pour l'humain, considérant
certainement qu'un bon modèle devait rendre service
aux deux.
CJ
: Comment avez-vous réalisé ce dictionnaire
?
D.T : Vous savez, les processus n'ont
pas énormément changé depuis des siècles.
D'un côté, il faut une méthodologie, dans
notre cas une série de logiciels conçus pour
la tâche
CJ
: Oui, mais avant cela, sur quoi vous-êtes vous basés
pour prendre un mot et lui donner une définition ?
D.T : La première version de ce qui était
alors Dicologique ne comportait pas encore de définitions,
mais seulement des quasi-définitions : des éléments
sémantiques qui permettent au lecteur de reconstituer
le sens, avec fort peu dénoncés complets.
Nous construisions un réseau associatif, un réseau
analogique riche, du français. Je me rappelle du tout
début, en 1989. Le premier mot qui ma vraiment
intéressé a été "abattre"
(ce verbe étant au début de lalphabet).
Et six mois après nous constations avec inquiétude
que le travail sur "abattre" progressait encore
découvrant de nouvelles propriétés, de
nouvelles connivences, de nouvelles associations
En
fait, depuis "abattre" cétait une grande
partie du lexique français qui était abordé...
CJ
: Un travail d'inspiration structuraliste...
D.T : Exactement. Selon une approche très simple
et complète en apparence, mais qui a révélé
depuis quelques limites qui nous amène aujourdhui
à repenser une forme de déconstruction. Cette
approche consistait à dire : un mot recèle certains
traits qui le définissent, traits que l'on appelle
en interne des "concepts", cest-à-dire
des objets non lexicaux. Et pour chacun des concepts qui définissent
ce mot-là, je vais faire en sorte que tous les mots
qui utilisent le même concept soient également
donnés dans la foulée, au moment de la déclaration
des concepts.
CJ
: Par exemple ?
D.T : Revenons au mot "abattre", faire tomber,
faire aller vers le bas, coucher. Ces notions entraînent
celles de mouvement, de causation, de haut et de bas, de verticalité,
dhorizontalité etc. Toutes ces notions décrivant
« abattre » décrivent également
de nombreux autres mots. Il faut leur fournir ces mots. Mais
structuralement ces notions appellent dautres notions
plus abstraites : la causation, la géométrie
dans lespace, le mouvement etc. Il faut encore remplir
ces notions de nouveaux mots. Et ces mots peuvent être
très précis. Ils causent alors la constatation
de nouvelles notions, qui entraînent par analyse la
définition de nouveaux concepts. Le travail nest
pas sans fin. Mais il fallut plusieurs années pour
que ce big-bang qui a été pour nous «
abattre » finisse par voir son expansion
faiblir,
jusquà aujourdhui, où les choses
sont maintenant plutôt stables. Je voudrais ajouter
que cette respiration «notion» /«artefact
: concept» /«mot» est fondamentalement au
cur des mécanismes qui ont abouti au logiciel
Alexandria.
CJ
: En fait,
vous êtes en train de me dire qu'avant l'heure, et bien
avant internet, ce logiciel revenait à faire de l'hypertexte...
D.T : Oui, mais finalement, je ne dirais pas tout à
fait cela car avec ce logiciel, depuis pratiquement tous les
nuds, on arrivait à un très grand nombre
de nuds. Un lien hypertexte reste quand même un
lien de 1 à 1, alors que là, ce sont en permanence
des relations de 1 à n.
CJ
: Et vous n'étiez que deux pour faire tout cela ? Sans
aucune subvention ?
D.T : Vous savez, à cette époque, en France,
ces travaux très empiriques nintéressaient
pas beaucoup. On sintéressait alors à
divers idéaux à travers des objets comme l'analyse
syntaxique, la logique des prédicats etc. Mais nous
avons reçu une subvention du ministère de la
Recherche. Ainsi, même si l'idée de ce dictionnaire
analogique n'était pas alors dans le vent du fait de
la difficulté d'en voir des applications, le projet
a été jugé intéressant. Les conseillers
ont dû se dire : on ne sait jamais, et peu d'autres
sont sur ce créneau. Peut-être un jour cela aura-t-il
une importance...
Nous avons ainsi recruté un linguiste (Philippe Herr)
qui est resté presque 5 ans avec nous et a énormément
contribué à ce travail. Travail qui, pour l'humain,
s'appelle un "thésaurus" ou "ontologie
lexicale", et qui, en traitement des langues, s'appellerait
"réseau sémantique".
Ainsi, dès 1992, nous possédions une des plus
grosses fondations ontologiques et associatives au monde sur
une langue donnée.
CJ
: Un vrai
travail de bénédictins !
D.T : Oui, tous ces travaux de dictionnaire, d'un certain
point de vue sont des travaux de fourmis, chaque chose venant
après l'autre. Mais finalement, avec une approche très
organisée comme la nôtre, le travail de fourmi
aboutit à une structure. Aujourd'hui, lorsque je place
un mot de plus dans le dictionnaire intégral, il est
immédiatement en relation avec des milliers d'autres.
CJ
: Mais
finalement, comment cela se construit-il ? A la main ? On
cherche les mots, et autour d'un mot, on cherche toutes les
idées et mots qui s'y rapportent ? Quelle est la part
d'automatisation dans ce travail ?
D.T : En
fait, on ne les cherche pas parce qu'on les trouve dans nos
connaissances mais aussi et surtout... dans les dictionnaires
ordinaires. Nous essayons "simplement" d'avoir une
vision critique et de modéliser un contenant, d'organiser,
de structurer. Et effectivement, aujourd'hui, nous arrivons
à automatiser certaines tâches. Mais c'est parce
qu'une grande masse de travail a été faite préalablement.
Il existe désormais une sorte de socle, qui grandit
et qui donne peu ou prou une certaine forme de compétence
de lecture ou d'"interprétation", à
la machine.
Mais au départ, la machine ne nous assistait pas du
tout puisqu'il n'y avait rien
Il fallait bien lui déclarer
qu'il existe des mots, des noms, des verbes, le verbe "tomber",
le "haut", le "bas"
Aujourd'hui,
parce qu'une infrastructure existe, cela va bien plus vite
lorsque nous avons besoin de reprendre une chose déjà
existante.
CJ
: Ainsi,
vous avez commencé à la main et cela vous a
donné un modèle de la façon de coupler
l'ensemble, puis de le faire exécuter par la machine...
D.T : Oui, mais nous sommes loin de l'automatisation
complète car celle-ci serait le dictionnaire qui se
construit tout seul. Je veux croire quune telle perspective
soit envisageable, pour quenfin nous puissions mettre
un point final à notre travail... mais il faut considérer
que si à un moment donné une telle automatisation
était possible, à un degré avancé,
je me rends compte que nous discutons ici sur le site dAutomates
intelligents, cest quune machine symbolique universelle
aura été conçue.
CJ
: Mais
cela peut devenir un objectif...
D.T : Avec le langage, cest bien sûr lenjeu
qui fait encore rêver quelques uns dentre nous.
Dont nous. Peut-être pour dans vingt ans, pour un peu
avant notre retraite ? Mais pour le moment, il est très
difficile de travailler cette question. Nous connaissons finalement
le même genre de contradictions quen 1989. A lépoque,
les équipes sérieuses faisaient essentiellement
de la syntaxe, laissant sémantique et pragmatique aux
discours théoriques. Aujourdhui, des équipes
sérieuses travaillent de la sémantique mais
dans des domaines très limités. Mais nous ne
croyons pas en la notion de domaine. Je parlais tout à
lheure de «déconstruction». Disons
que lenjeu actuel est encore le décloisonnement,
et quil reste très difficile de financer des
recherches sémantiques générales et empiriques.
CJ
: A quel
moment avez-vous pu viabiliser votre société
?
D.T : Au début, nous maintenions notre entreprise
en diversifiant nos offres, en proposant aussi de la formation
en informatique, activité que nous avons définitivement
arrêtée à partir de 1995.
CJ
: Vous
avez Alexandria comme dictionnaire instalable sur un ordinateur.
Mais finalement, de quoi vivez-vous puisque
- même si c'est un peu différent - le logiciel
peut aussi être téléchargé gratuitement
pour une utilisation dans ses propres pages web ? Comment
avez-vous pu vous structurer et pérenniser l'entreprise
?
D.T :
On peut en gros distinguer une succession de trois phases,
certaines plus tournées vers la recherche et d'autres
vers le grand public.
Pendant 15 ans nous avons assez peu ciblé la recherche
pré-compétitive, c'est-à-dire celle destinée
à une utilisation précise, dotée d'un
marché. Nous avons tout de même beaucoup travaillé
en sous-traitance pour des entreprises ou des laboratoires
effectuant des recherches un peu plus basiques et un peu plus
fondamentales, et qui avaient besoin d'un certain outillage
pour effectuer ces recherches. Nous avons donc conçu
et vendu cet outillage destiné au développement
d'applications dans le domaine du traitement automatique des
langues. Ces entreprises (des grands groupes) venaient nous
chercher puisque nous avions accumulé une compétence
qui était inscrite... dans les disques durs. Cette
activité, qui a tourné à plein entre
1997 et 2003, donnait soit du chiffre d'affaires parce que
l'on avait vendu quelque chose, soit des participations à
des grands projets européens ou autres. Mais à
partir de 2003/2004, les financements des grands projets déclinant
un peu, nous enregistrions moins de commandes. Nous avons
alors regardé ce que nous avions accumulé dans
nos cartons qui pourrait être lancé assez rapidement
sur le marché, sachant que l'on ne pouvait plus travailler
- au moins pendant un certain temps - dans ces environnement
de recherche difficiles.
CJ
: Vous
êtes alors passé à une activité
"grand public"...
D.T : Nous sommes alors passés à nouveau
à une activité grand public. Nous avions depuis
longtemps un projet dénommé "Village Langage",
lequel avait été proposé à la
Commission Européenne en 2000. Avec Alexandria vous
avez une réalisation de ce projet qui pourtant avait
été rejeté.
CJ
: Quel
en est l'originalité ?
D.T : Tout d'abord, son mode de distribution. En fait,
c'est quelque chose qui est strictement informatique, d'une
grande originalité puisque nous sommes ici en face
d'un contenu directement destiné aux auteurs de contenus
et qui les valorise dans leur relation avec les utilisateurs.
CJ
: Vous
parlez ici de l'application web ...
D.T : Oui. Et c'est une application importante parce
qu'Alexandria conduit à un mode d'applications très
diversifiées. Exemple : je suis réparateur d'avions
et mon collègue m'envoie un mail me disant qu'il faut
appliquer la procédure MT-25-4... Je n'irai jamais
dans mon moteur de recherche pour vérifier cette procédure
MT-25-4 si je crois m'en rappeler vaguement. Tandis qu'avec
ce que propose Alexandria (il suffit de cliquer sur le mot
pour avoir tout de suite le résultat), les langues
de spécialités (MT-25-4) et les langues générales
finissent par converger. On est ainsi toujours en situation
d'apprenant, mais en plus, encouragé par le système
à être cet apprenant-là.
CJ
: Un
logiciel qui permet, sans se déplacer, d'établir
une relation individuelle de formation permanente...
D.T
: Oui. Une autre façon de dire les choses est que
les dictionnaires ne sont pas utilisés, ou relativement
peu. Alexandria permet de les rapprocher vraiment du moment
où ils peuvent être utilisés. Ces moments
sont ceux de la lecture d'un document. Là, il y a quelque
chose d'intéressant...
CJ
: Est-ce
le seul outil de ce type existant au monde ?
D.T : A ma connaissance, au niveau du modèle
de diffusion de l'information, il n'existe pas d'équivalent
à ce jour, en tous cas appliqué au transfert
de connaissances. Avec Alexandria, nous déplaçons
la relation : ce n'est pas moi qui prend la décision
d'acheter un dictionnaire, ou d'aller sur un site où
l'on en trouve un, ou de consulter un moteur de recherche
pour trouver une information. Ce sont ces objets-là
qui sont ramenés directement vers moi, non hors contexte
mais dans le contexte de ma lecture ou de mon travail. Autrement
dit, Alexandria établit un espace dans lequel l'information
du dictionnaire n'est pas la même d'une page à
une autre : il forunit une information dépendante du
lieu où on la rencontre... (au contraire des implémentations
de barre d'outils dans Explorer qui fournissent la même
information quelle que soit la page - et quel que soit le
profil du lecteur - ndlr).
En gros, le discours aujourd'hui est un discours en étoile
: il existe une source d'information, google par exemple,
qui est situé à un certain emplacement, et je
vais à cette source d'information pour y chercher quelque
chose. Avec Alexandria, nous sommes-là en présence
d'une source d'informations en réseau. Cette source
qui se déplace de point en point change potentiellement
de contenu en fonction de l'endroit où on la trouve.
Des fonctions de profilage orientée documents sont
maintenant à inventer.
CJ
: Changeant
de taille et de contenu par rapport à quoi? Par rapport
aux mots que l'on peut rentrer nous mêmes dans le système
?
D.T : Oui, par exemple. Mais il existe aussi des travaux
chez-nous ou dans des partenariats à l'étranger,
qui cherchent à appeler ou sélectionner des
contenus qui sont directement en relation avec la page (par
exemple la bonne traduction dans le contexte, mais également
un certain niveau de discours ou d'explication en fonction
de la technicité du document environnant).
CJ
: Par
moment, en cliquant sur une définition, on arrive sur
un lien...
D.T : Oui. C'est un aspect complémentaire. Alexandria
n'édite pas uniquement les contenus dictionnairiques
de Memodata. C'est un média orienté vers les
dictionnaires. Son contenu est en réalité la
propriété d'un grand nombre d'ayant droits :
une bonne vingtaine aujourd'hui, essentiellement universitaires,
mais pas uniquement. Selon les cas, pour certains de ces contenus
qui ne sont pas "langue générale ",
est fourni immédiatement le lien vers le système
documentaire (car généralement il s'agit de
tels systèmes) ayant fourni cette définition.
CJ
: Le
fait de pouvoir éditer des contenus de très
grande qualité, plutôt institutionnels et de
les rendre accessibles sur un grand nombre de sites au travers
d'Alexandria pourrait être une dimension essentielle...
D.T : Oui et ceci a donné
lieu au projet européen COHESION, projet de e-content
auquel nous avons postulé en Novembre 2005. COHESION
est un acronyme pour «Contextual Hypermedia Enhancing
Dissemination». Si dimportantes ressources ont
été distribuées aux établissements
scolaires, scientifiques et culturels pour développer
des contenus internet, alors même que ces contenus ont
été élaborés, il savère
que ces derniers sont peu consultés par les internautes.
Exemple : si je tape "impressionnisme" sur google,
le musée d'Orsay arrive en 15ème ou 20ème
page écran ! Et bien avant, arrive en fait un peu de
tout, voire même des sites X. Avec un objet comme Alexandria
- et c'est l'idée qu'il y a dans "COHESION",
ces contenus institutionnels qui sont associés à
des mots ou à des thématiques extrêmement
particulières seraient référencés
dans notre logiciel qui en proposerait la découverte
au cours de la lecture.
CJ
: Ceci
veut dire que si dans une
page web figurait le mot "impressionniste", un lien
Alexandria mènerait sur des définitions et proposerait
suivant la langue un lien vers les sites intéressants
?
D.T : Non seulement la définition, mais on pourrait
aussi imaginer une fiche de présentation du musée
d'Orsay, celle-ci étant implémentée par
le responsable du site. Et ceci peut être traduit aujourd'hui
dans les faits à destination de plusieurs milliers
de sites web... Jai une bonne nouvelle, toute fraîche,
à annoncer à vos lecteurs. Je viens dapprendre
ce matin que COHESION est éligible. Cest une
grande joie pour nous de voir que ce projet que nous pilotons,
qui groupe 12 partenaires de douze pays européens,
dont 10 universités ou académies, est en passe
dêtre définitivement accepté. Cest
une étape importante pour le succès à
long terme, européen, dAlexandria.
CJ
: Vous
vendez aussi le logiciel à des sociétés
?
D.T
: Nous
commençons en effet à le vendre à des
sociétés souhaitant en disposer dans leur réseau
intranet, l'objectif étant d'y fournir aussi leur propre
vocabulaire d'entreprise en incorporant par exemple des éléments
qui décrivent l'organigramme, des processus ou procédures
de tous types (administratives ou techniques). Ainsi, au lieu
de devoir se rendre dans un système documentaire qui
existe souvent par ailleurs, mais qui n'est pas forcément
consulté par les employés, il vaut mieux que
le système documentaire vienne à eux.
Ceci pourrait aussi intéresser la fonction publique.
Par exemple en disposant d'Alexandria sur les sites du ministère
des Finances, avec un certain nombre d'explications concernant
le vocabulaire juridique et fiscal.
J'ai d'ailleurs remarqué qu'Automates Intelligents
avait commencé à créer ses propres fiches,
notamment pour le mot "Aibo" ou "mémétique",
puisqu'ils s'affichent en pointillés sur les pages
où ils apparaissent...
CJ
: Votre
système permet aussi de traduire un mot d'une langue
à l'autre. Ne
S'agit-il pour l'instant que de cela ?
D.T
:
Tout dépend ici des langues. Notre entreprise Memodata
est par exemple le représentant en France du projet
Wordnet (réseau de mots) de l'université de
Princeton http://wordnet.princeton.edu/,
projet américain qui a débuté un
peu avant notre Dictionnaire Intégral. Comme Memodata
travaille depuis 15 ans plutôt sur un réseau
conceptuel, Wordnet est plutôt un réseau de mots.
Ainsi, nous affichons dans Alexandria des éléments
de Wordnet puisque nous appartenons à la même
association. Donc si vous rechercher un mot de l'anglais vers
l'anglais, vous obtiendrez des définitions en langue
anglaise.
Par exemple, si vous tapez "chapeau" et demandez
une traduction de l'anglais vers l'anglais, vous verrez la
définition "headdress that protects the head
from bad weather ; has shaped crown and usually a brim".
Et si vous cliquez dans l'un des mots de cette définition,
par exemple "head", vous arrivez alors sur tout
un monde...
Ce fonctionnement-là dépend exactement de l'évolution
des projets partenaires au nôtre. Donc potentiellement,
le but c'est que l'on puisse faire effectivement du wolof/wolof
(langue d'Afrique de l'ouest) et de pouvoir passer ensuite
en coréen par exemple.Il s'agit d'interconnecter toutes
les langues pour passer d'un discours de la langue vers elle-même
à un discours de la langue vers les autres langues
à travers les différents réseaux sémantiques.
CJ
: Quel
rapport voyez-vous entre votre outil Alexandria et un moteur
de recherche ?
D.T
:
Je n'en vois aucun pour le moment, quoique, en en parlant
ici avec vous, me viennent évidemment certaines idées
Avec mozbot, qui travaille avec les données de google,
existe actuellement un projet basé sur le fait que
les utilisateurs ne connaissent pas forcément les termes
idoines pour interroger un moteur de recherche.
Eh bien chez-nous, dans cet ordre d'idée, et pour se
placer du côté d'une souveraineté européenne
en la matière, on pourrait imaginer une connexion entre
le moteur de recherche français Exalead (ndlr :
qui doit participer au projet européen Quaero, moteur
dont le but est de rivaliser avec Google) et Alexandria.
L'internaute trouverait le terme idoine à rechercher
grâce à notre logiciel (cf. l'encadré
ci-dessous qui fournit des détails), terme
qui serait ensuite envoyé comme requête dans
le moteur. Donc là, il y a déjà cette
sorte de relation organique qui va s'établir entre
les deux : le mot et les idées qui vont avec et puis
le service de recherche sur le web.
Ce
qu'Alexandria essaie aussi d'établir, c'est une toile
de sites de référence sur des sujets précis
(on rejoint le projet COHESION dont je vous parlais plus haut)
et là, d'une façon très vigilante, il
ne s'agit pas de la couverture du web en entier, mais celle
de certains lieux - totalement dignes de confiance parce que
c'est leur métier - qui ont traité étroitement
de certains sujets. Il s'agirait de proposer ces liens privilégiés
au fur et à mesure de la navigation.
|
Avec Alexandria, retrouvez le terme exact.
Exemple : comment appelle-t-on le chapeau du pape ?
Vous
ne vous rappelez plus du mot définissant le
chapeau du pape, pourtant vous l'avez sur le bout
de la langue... Alors cliquez sur n'importe quel mot
dans cette page pour ouvrir la fenêtre Alexandria.
Tapez alors, dans la fenêtre en haut à
gauche le mot chapeau, puis cliquez sur le bouton
ok.
Cliquez
ensuite sur le premier mot chapeau, qui apparaît
en gras, tout en haut de la fenêtre. Vous obtenez
alors une autre fenêtre (voir ci-dessous), vous
faisant pénétrer au coeur d'un réseau
sémantique qui vous propose de nouvelles entrées
:

Choisissez
ensuite sur le dossier " coiffure de forme assez
rigide". En effet, même si vous ne vous
rappelez pas du nom du chapeau du pape, vous savez
qu'il s'agit d'un truc en hauteur avec une forme assez
rigide. S'affiche alors la fenêtre suivante
:
Choisissez
ensuite "coiffure rigide d'homme" : le pape
est bien sûr un homme... Et là, apparaît
un dossier "tiare papale". Voilà
le mot que j'avais sur le bout de la langue.... :
c'était "tiare".

Si
vous cliquez dans le dossier "tiare papale"
vous obtiendrez alors cette fenêtre :

Puis,
en cliquant sur le mot "tiare" et en cliquant
encore sur le mot, vous obtiendrez sa définition
(que vous auriez pu aussi obtenir dès l'affichage
"tiare papale", simplement en tapant "tiare"
dans la petite fenêtre de recherche en haut
à gauche) :

|
CJ
: Parlons
maintenant de politique. N'existe-t-il pas un risque potentiel
de voir un tel outil récupéré un jour
par une puissance qui souhaiterait imposer à la planète
son dictionnaire mondial, mis au service des intérêts
de cette puissance ?
D.T
:
Vous
avez raison, il faut y penser. Au plan de l'interaction entre
la technologie et les sociétés, Alexandria est
annonciateur de quelque chose d'inéluctable, à
savoir l'existence de ressources de références,
finalement peu nombreuses, qui risquent de couvrir le monde
entier. Et avec un système comme Alexandria, on peut
se retrouver avec une ressource de référence
pour quelque 200 langues.
Ainsi, se pose le problème de savoir quel va être
le statut juridique d'une telle ressource. Aujourd'hui, les
internautes savent bien que le web donne à la fois
de l'information mais aussi du bruit. Le web ne se présente
pas comme un dictionnaire. Or ici, nous sommes en face d'une
construction qui peut techniquement devenir hégémonique.
Mais contrairement au web, il sagit demblée
dune ressource, voire dun « savoir »
réputé exact, de quelque chose considéré
comme étant le reflet direct de la « vérité
»
Ne me demandez pas si le dictionnaire dit la
vérité, je ne le crois pas. Mais c'est ce que
la plupart d'entre nous croient. C'est le dictionnaire qui
va trancher. Et c'est un grave problème. Dans un tel
système, quelle sera à long terme la définition
du mot "démocratie" ou du mot "préservatif".
Quel pouvoir politique aura celui qui possède un tel
logiciel ? Je pense ici à celui qui va donner le sens
des mots pour tous ceux qui n'auront pas à redéfinir
un sens. Car la plupart des gens ne vont pas redéfinir
tous les mots
CJ
: Pouvez-vous
nous expliquer cela à partir d'un exemple ?
D.T
:
Citons par exemple Google. Nombre de citoyens se sont inquiétés
(et je crois savoir qu'Automates Intelligents en fait partie)
de son projet de numériser les bibliothèques.
Google veut indexer TOUTES les bibliothèques, TOUS
les bouquins dans TOUTES les éditions, pour la planète
entière. On comprend bien cette inquiétude,
mais dans une certaine mesure, Google ne va pas changer le
texte d'un philosophe comme Pascal. Parce que ce serait d'abord
un gros travail et puis, s'il était fait (je ne vois
d'ailleurs pas pourquoi), cela serait immédiatement
repérable. Tout ce que peut faire Google, c'est augmenter
sa fréquentation au détriment de celle des bibliothèques.
Il peut aussi éventuellement faire varier l'ordre d'affichage
des réponses, et donc exercer une sorte de "biais
politique" au profit d'objectifs particuliers et privés.
Je ne dis pas que ce n'est pas important, mais ici, avec un
logiciel comme le nôtre, nous nous trouvons en face
de quelque chose de beaucoup plus dangereux à long
terme : se servir du système pour présenter
des choses qui seraient réputées comme vraies,
alors qu'elles ne manifestent qu'un point de vue.
Comprenez-moi bien : je ne suis pas en train de dire qu'il
faut que les dictionnaires soient neutres. Mais si, par exemple,
Wikipédia (ndlr : encyclopédie libre sur
le web, gratuite et multilingue http://fr.wikipedia.org/wiki/Accueil)
affirme "on est neutres, il faut des articles neutres",
à mon avis on ne peut pas être neutre et il est
faux d'affirmer que l'on peut l'être. Plus encore, cette
recherche de la neutralité, si elle est sincère,
aboutirait à un appauvrissement généralisé.
La seule chose vraiment neutre est le néant. En cela,
le neutre soppose directement à la vie. Bref,
il y a plusieurs dangers à affronter. Comment ne pas
permettre la manipulation. Comment ne pas être neutre.
A lépoque du politiquement correct, ces deux
notions se rapprochent dailleurs dangereusement. Dans
cette perspective, je ferai davantage confiance à lEurope,
du fait de toutes ses merveilleuses contradictions, quà
aucune nation pour encadrer un projet comme Alexandria. En
tout cas, il ne faut pas quAlexandria devienne le projet
dune très grosse entreprise. Au contraire, il
faudrait quAlexandria devienne une fédération.
Un groupement dintérêts de plusieurs natures,
contradictoires, qui serait garant des libertés, je
veux dire de labsence de planification trop centralisée.
Memodata travaille jour et nuit à cette fin. Le succès
final de COHESION nous donnera un premier espoir.
CJ
: Ce
que vous voulez finalement dire, même s'il s'agit ici
d'une image de ma part pas forcément réaliste
(quoique ?), c'est que Google, avec les énormes moyens
dont il dispose, et fort des appuis dont il dispose (DARPA(1)),
pourrait très bien se voir un jour confier la mission
de définir l'ensemble des mots pour la planète
entière ? Et ceci dans toutes les langues, y compris
bien sûr avec sa bonne définition du mot "démocratie"
ou du mot "préservatif " ? Et ceci aux services
d'intérêts d'une seule puissance ?
D.T
:
Oui, c'est exactement le fond de ma pensée. Alors vous
imaginez la catastrophe... Parce que là, nous sommes
sur des contenus qui ne peuvent pas dire la vérité,
mais dont les internautes croient à 99% qu'il s'agit
bien d'elle. Je pense donc que notre projet Alexandria devrait
bien sûr être aidé (pour les développements
informatiques), mais plus encore être très soigneusement
entouré, encadré. Et donc, nous essayons d'établir
un comité scientifique, un comité éthique
multiculturel, avec nombre d'universités et de chercheurs
différents qui ont bien cela en tête. Aujourd'hui
cela ne paraît pas très important puisque, avec
50 ou 100000 pages affichées par jour, nous n'avons
pas encore un gros impact. Mais un jour cela ne sera peut-être
plus de cette nature...
CJ
: Combien
êtes-vous dans ce réseau ?
D.T
: Alexandria
est relié à une vingtaine d'établissements
dans le monde entier.
CJ
: Vous
avez évoqué Quaero, projet de moteur de recherche
européen destiné à concurrencer Google...
D.T
: Oui,
c'est un besoin important, mais je pense qu'il ne faut pas
se contenter de refaire un produit comme Google, qui d'ailleurs,
dans une certaine mesure, a construit quelque chose de très
intéressant. Quaero doit être là pour
obliger Google à continuer d'être bon, mais pas
forcément avec l'idée d'essayer de prendre sa
place.
Il faut que cela soit l'occasion de nous donner une certaine
indépendance dans un secteur vraiment stratégique.
Un peu comme Galileo par rapport au GPS, pour prendre ici
un exemple dans un autre secteur.
L'Europe, avec ses 40 langues et sa diversité, pourrait
avoir quelque chose de très important à dire,
un message très clair et très important à
donner au monde à travers un système comme Alexandria.
Et ceci actuellement peut venir d'Europe, et pas d'outre Atlantique.
(1) Darpa : Defense Advanced Research Project
Agency. Département du DoD américain (Department
of Defense) particulièrement concerné par les
recherches en informatique.
Retour au sommaire