Vers le site Automates Intelilgents
La Revue mensuelle n° 71
Robotique, vie artificielle, réalité virtuelle

Information, réflexion, discussion
logo admiroutes

Tous les numéros


Archives
(classement par rubriques)

Image animée
 Dans La Revue
 

Retour au sommaire

Automates Intelligents utilise le logiciel Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront alors définitions, synonymes et expressions constituées de ce mot. Une fenêtre déroulante permet aussi d'accéder à la définition du mot dans une autre langue (22 langues sont disponibles, dont le Japonais).

Interview

Dominique Dutoit
co-fondateur de la société Memodata conceptrice du logiciel Alexandria

Propos recueillis par Christophe Jacquemin (2 mars 2006).
Voir aussi notre éditorial


Pierre Potier - Photo :  CNRS
Diplômé en économie, Dominique Dutoit est aussi titulaire d'un doctorat ès Science. S'intéressant à la linguistique et à l'informatique, il a cofondé avec Patrick de Torcy la société Memodata en 1989, société qui propose aujourd'hui le logiciel Alexandria (qui a retenu toute l'attention d'Automates Intelligents).
Ayant été à l'initiative de quelques projets de recherche européens (dont CRISTAL, en 1993, qui fut le premier projet en matière d'indexation sémantique et de désambiguïsation) Dominique Dutoit considère fondamentalement que maintenant, pour le français, la première phase de description linguistique pour l'ordinateur est achevée. Il s'agit donc désormais d'entamer une deuxième phase dans laquelle chaque mot deviendrait activateur d'algorithmes spécifiques. Dans ce cadre, un premier objet de recherche est la réintégration de tout ou partie des descriptions métalinguistiques dans le coeur actif des dictionnaires électroniques.
Le chercheur prépare actuellement sa HDR (Habilitation à diriger les recherches) dans le contexte de sa contribution, en tant que membre des laboratoires du CNRS GREYC (informatique, université de Caen) et CRISCO (informatique, Université de Caen).

Pour en savoir plus :
Memodata : http://www.memodata.com

Blog de Memodata : http://fr-alexandria.blogspot.com/

Pour installer le logiciel Alexandria :
http://www.memodata.com/2004/fr/alexandria/install.shtml

Christophe Jacquemin (C.J) : Vous êtes le concepteur d'Alexandria, fantastique logiciel d'aide contextuelle [aide à la compréhension (définitions, traductions...] qui mérite bien aussi le terme d'agent intelligent puisque ce service est disponible en chaque lieu où il est installé. Quelle est la genèse de la conception de ce logiciel ?

Dominique Dutoit (D.T) : J'ai créé la société Memodata avec mon collègue Patrick de Torcy il y a 16 ans, c'est à dire il y a fort longtemps si l’on considère l’ambiance de révolution permanente qui existe dans les technologies de l’information....
Notre objectif visait le développement d'un dictionnaire du français qui augmenterait de façon sensible les liens analogiques entre les mots, de telle façon que la recherche de termes précis, pertinents, soit facilitée. L'idée générale, toujours en grande partie vraie aujourd'hui étant d'apporter une sorte de réponse à la célèbre phase de Boileau "Ce qui se conçoit bien s'énonce clairement et les mots pour le dire viennent aisément" : ce qui est dit avec facilité montre une belle maîtrise des mots, et le discours clair favorise une bonne conception. Il s’agit de faciliter l’expression par une meilleure transmission des vocabulaires, précis ou riches.

C.J : En se replaçant 16 ans en arrière, on peut dire que ce projet n'était pas lié au web...
D.T : Oui, 1988/89 c'était bien avant l'apparition des réseaux...

CJ : Il s'agissait donc de concevoir un logiciel qui permette à chacun de disposer d'un dictionnaire "amélioré" ?
D.T : Oui, mais un dictionnaire que l'on a appelé très rapidement "dictionnaire intégral ", c'est à dire quelque chose, qui de façon massive, ait lié les mots d'une même langue au moyen de composantes sémantiques.

CJ : Sentiez-vous déjà à cette époque toutes les richesses potentielles de cette idée et l'ensemble des domaines d'applications qu'elle pouvait couvrir ?
D.T : En fait non. Nous n'avions pas compris qu'une grosse partie de ce travail pouvait avoir d'autres destinations, dans un secteur dont nous ne connaissions pas seulement le nom. Il s’agit du "traitement automatique des langues ". Nous avons réalisé bien après que ce que nous étions en train de tricoter à la main pouvait s'appliquer à différentes activités de ce domaine, qu'il s'agisse de recherche documentaire, de correction orthographique ou d’intelligence artificielle...

CJ : Donc deux composantes alors, l'une tournée vers l'utilisateur humain, l'autre vers l'utilisateur machine...
D.T :
Oui, et ceci raconte finalement les deux activités de notre société depuis plus de 15 ans. Nous n'avons jamais bien su dire si nous travaillions pour la machine ou plutôt pour l'humain, considérant certainement qu'un bon modèle devait rendre service aux deux.

CJ : Comment avez-vous réalisé ce dictionnaire ?
D.T :
Vous savez, les processus n'ont pas énormément changé depuis des siècles. D'un côté, il faut une méthodologie, dans notre cas une série de logiciels conçus pour la tâche…

CJ : Oui, mais avant cela, sur quoi vous-êtes vous basés pour prendre un mot et lui donner une définition ?
D.T : La première version de ce qui était alors Dicologique ne comportait pas encore de définitions, mais seulement des quasi-définitions : des éléments sémantiques qui permettent au lecteur de reconstituer le sens, avec fort peu d’énoncés complets. Nous construisions un réseau associatif, un réseau analogique riche, du français. Je me rappelle du tout début, en 1989. Le premier mot qui m’a vraiment intéressé a été "abattre" (ce verbe étant au début de l’alphabet). Et six mois après nous constations avec inquiétude que le travail sur "abattre" progressait encore… découvrant de nouvelles propriétés, de nouvelles connivences, de nouvelles associations… En fait, depuis "abattre" c’était une grande partie du lexique français qui était abordé...

CJ : Un travail d'inspiration structuraliste...
D.T : Exactement. Selon une approche très simple et complète en apparence, mais qui a révélé depuis quelques limites qui nous amène aujourd’hui à repenser une forme de déconstruction. Cette approche consistait à dire : un mot recèle certains traits qui le définissent, traits que l'on appelle en interne des "concepts", c’est-à-dire des objets non lexicaux. Et pour chacun des concepts qui définissent ce mot-là, je vais faire en sorte que tous les mots qui utilisent le même concept soient également donnés dans la foulée, au moment de la déclaration des concepts.

CJ : Par exemple ?
D.T : Revenons au mot "abattre", faire tomber, faire aller vers le bas, coucher. Ces notions entraînent celles de mouvement, de causation, de haut et de bas, de verticalité, d’horizontalité etc. Toutes ces notions décrivant « abattre » décrivent également de nombreux autres mots. Il faut leur fournir ces mots. Mais structuralement ces notions appellent d’autres notions plus abstraites : la causation, la géométrie dans l’espace, le mouvement etc. Il faut encore remplir ces notions de nouveaux mots. Et ces mots peuvent être très précis. Ils causent alors la constatation de nouvelles notions, qui entraînent par analyse la définition de nouveaux concepts. Le travail n’est pas sans fin. Mais il fallut plusieurs années pour que ce big-bang qui a été pour nous « abattre » finisse par voir son expansion …faiblir, jusqu’à aujourd’hui, où les choses sont maintenant plutôt stables. Je voudrais ajouter que cette respiration «notion» /«artefact : concept» /«mot» est fondamentalement au cœur des mécanismes qui ont abouti au logiciel Alexandria.

CJ : En fait, vous êtes en train de me dire qu'avant l'heure, et bien avant internet, ce logiciel revenait à faire de l'hypertexte...
D.T : Oui, mais finalement, je ne dirais pas tout à fait cela car avec ce logiciel, depuis pratiquement tous les nœuds, on arrivait à un très grand nombre de nœuds. Un lien hypertexte reste quand même un lien de 1 à 1, alors que là, ce sont en permanence des relations de 1 à n.

CJ : Et vous n'étiez que deux pour faire tout cela ? Sans aucune subvention ?
D.T :
Vous savez, à cette époque, en France, ces travaux très empiriques n’intéressaient pas beaucoup. On s’intéressait alors à divers idéaux à travers des objets comme l'analyse syntaxique, la logique des prédicats etc. Mais nous avons reçu une subvention du ministère de la Recherche. Ainsi, même si l'idée de ce dictionnaire analogique n'était pas alors dans le vent du fait de la difficulté d'en voir des applications, le projet a été jugé intéressant. Les conseillers ont dû se dire : on ne sait jamais, et peu d'autres sont sur ce créneau. Peut-être un jour cela aura-t-il une importance...
Nous avons ainsi recruté un linguiste (Philippe Herr) qui est resté presque 5 ans avec nous et a énormément contribué à ce travail. Travail qui, pour l'humain, s'appelle un "thésaurus" ou "ontologie lexicale", et qui, en traitement des langues, s'appellerait "réseau sémantique".
Ainsi, dès 1992, nous possédions une des plus grosses fondations ontologiques et associatives au monde sur une langue donnée.

CJ : Un vrai travail de bénédictins !
D.T : Oui, tous ces travaux de dictionnaire, d'un certain point de vue sont des travaux de fourmis, chaque chose venant après l'autre. Mais finalement, avec une approche très organisée comme la nôtre, le travail de fourmi aboutit à une structure. Aujourd'hui, lorsque je place un mot de plus dans le dictionnaire intégral, il est immédiatement en relation avec des milliers d'autres.

CJ : Mais finalement, comment cela se construit-il ? A la main ? On cherche les mots, et autour d'un mot, on cherche toutes les idées et mots qui s'y rapportent ? Quelle est la part d'automatisation dans ce travail ?
D.T :
En fait, on ne les cherche pas parce qu'on les trouve dans nos connaissances mais aussi et surtout... dans les dictionnaires ordinaires. Nous essayons "simplement" d'avoir une vision critique et de modéliser un contenant, d'organiser, de structurer. Et effectivement, aujourd'hui, nous arrivons à automatiser certaines tâches. Mais c'est parce qu'une grande masse de travail a été faite préalablement. Il existe désormais une sorte de socle, qui grandit et qui donne peu ou prou une certaine forme de compétence de lecture ou d'"interprétation", à la machine.
Mais au départ, la machine ne nous assistait pas du tout puisqu'il n'y avait rien… Il fallait bien lui déclarer qu'il existe des mots, des noms, des verbes, le verbe "tomber", le "haut", le "bas"… Aujourd'hui, parce qu'une infrastructure existe, cela va bien plus vite lorsque nous avons besoin de reprendre une chose déjà existante.

CJ : Ainsi, vous avez commencé à la main et cela vous a donné un modèle de la façon de coupler l'ensemble, puis de le faire exécuter par la machine...
D.T : Oui, mais nous sommes loin de l'automatisation complète car celle-ci serait le dictionnaire qui se construit tout seul. Je veux croire qu’une telle perspective soit envisageable, pour qu’enfin nous puissions mettre un point final à notre travail... mais il faut considérer que si à un moment donné une telle automatisation était possible, à un degré avancé, je me rends compte que nous discutons ici sur le site d’Automates intelligents, c’est qu’une machine symbolique universelle aura été conçue.

CJ : Mais cela peut devenir un objectif...
D.T : Avec le langage, c’est bien sûr l’enjeu qui fait encore rêver quelques uns d’entre nous. Dont nous. Peut-être pour dans vingt ans, pour un peu avant notre retraite ? Mais pour le moment, il est très difficile de travailler cette question. Nous connaissons finalement le même genre de contradictions qu’en 1989. A l’époque, les équipes sérieuses faisaient essentiellement de la syntaxe, laissant sémantique et pragmatique aux discours théoriques. Aujourd’hui, des équipes sérieuses travaillent de la sémantique mais dans des domaines très limités. Mais nous ne croyons pas en la notion de domaine. Je parlais tout à l’heure de «déconstruction». Disons que l’enjeu actuel est encore le décloisonnement, et qu’il reste très difficile de financer des recherches sémantiques générales et empiriques.

CJ : A quel moment avez-vous pu viabiliser votre société ?
D.T : Au début, nous maintenions notre entreprise en diversifiant nos offres, en proposant aussi de la formation en informatique, activité que nous avons définitivement arrêtée à partir de 1995.

CJ : Vous avez Alexandria comme dictionnaire instalable sur un ordinateur. Mais finalement, de quoi vivez-vous puisque - même si c'est un peu différent - le logiciel peut aussi être téléchargé gratuitement pour une utilisation dans ses propres pages web ? Comment avez-vous pu vous structurer et pérenniser l'entreprise ?
D.T :
On peut en gros distinguer une succession de trois phases, certaines plus tournées vers la recherche et d'autres vers le grand public.
Pendant 15 ans nous avons assez peu ciblé la recherche pré-compétitive, c'est-à-dire celle destinée à une utilisation précise, dotée d'un marché. Nous avons tout de même beaucoup travaillé en sous-traitance pour des entreprises ou des laboratoires effectuant des recherches un peu plus basiques et un peu plus fondamentales, et qui avaient besoin d'un certain outillage pour effectuer ces recherches. Nous avons donc conçu et vendu cet outillage destiné au développement d'applications dans le domaine du traitement automatique des langues. Ces entreprises (des grands groupes) venaient nous chercher puisque nous avions accumulé une compétence qui était inscrite... dans les disques durs. Cette activité, qui a tourné à plein entre 1997 et 2003, donnait soit du chiffre d'affaires parce que l'on avait vendu quelque chose, soit des participations à des grands projets européens ou autres. Mais à partir de 2003/2004, les financements des grands projets déclinant un peu, nous enregistrions moins de commandes. Nous avons alors regardé ce que nous avions accumulé dans nos cartons qui pourrait être lancé assez rapidement sur le marché, sachant que l'on ne pouvait plus travailler - au moins pendant un certain temps - dans ces environnement de recherche difficiles.

CJ : Vous êtes alors passé à une activité "grand public"...
D.T : Nous sommes alors passés à nouveau à une activité grand public. Nous avions depuis longtemps un projet dénommé "Village Langage", lequel avait été proposé à la Commission Européenne en 2000. Avec Alexandria vous avez une réalisation de ce projet qui pourtant avait été rejeté.

CJ : Quel en est l'originalité ?
D.T : Tout d'abord, son mode de distribution. En fait, c'est quelque chose qui est strictement informatique, d'une grande originalité puisque nous sommes ici en face d'un contenu directement destiné aux auteurs de contenus et qui les valorise dans leur relation avec les utilisateurs.

CJ : Vous parlez ici de l'application web ...
D.T : Oui. Et c'est une application importante parce qu'Alexandria conduit à un mode d'applications très diversifiées. Exemple : je suis réparateur d'avions et mon collègue m'envoie un mail me disant qu'il faut appliquer la procédure MT-25-4... Je n'irai jamais dans mon moteur de recherche pour vérifier cette procédure MT-25-4 si je crois m'en rappeler vaguement. Tandis qu'avec ce que propose Alexandria (il suffit de cliquer sur le mot pour avoir tout de suite le résultat), les langues de spécialités (MT-25-4) et les langues générales finissent par converger. On est ainsi toujours en situation d'apprenant, mais en plus, encouragé par le système à être cet apprenant-là.

CJ : Un logiciel qui permet, sans se déplacer, d'établir une relation individuelle de formation permanente...
D.T : Oui. Une autre façon de dire les choses est que les dictionnaires ne sont pas utilisés, ou relativement peu. Alexandria permet de les rapprocher vraiment du moment où ils peuvent être utilisés. Ces moments sont ceux de la lecture d'un document. Là, il y a quelque chose d'intéressant...

CJ : Est-ce le seul outil de ce type existant au monde ?
D.T : A ma connaissance, au niveau du modèle de diffusion de l'information, il n'existe pas d'équivalent à ce jour, en tous cas appliqué au transfert de connaissances. Avec Alexandria, nous
déplaçons la relation : ce n'est pas moi qui prend la décision d'acheter un dictionnaire, ou d'aller sur un site où l'on en trouve un, ou de consulter un moteur de recherche pour trouver une information. Ce sont ces objets-là qui sont ramenés directement vers moi, non hors contexte mais dans le contexte de ma lecture ou de mon travail. Autrement dit, Alexandria établit un espace dans lequel l'information du dictionnaire n'est pas la même d'une page à une autre : il forunit une information dépendante du lieu où on la rencontre... (au contraire des implémentations de barre d'outils dans Explorer qui fournissent la même information quelle que soit la page - et quel que soit le profil du lecteur - ndlr).
En gros, le discours aujourd'hui est un discours en étoile : il existe une source d'information, google par exemple, qui est situé à un certain emplacement, et je vais à cette source d'information pour y chercher quelque chose. Avec Alexandria, nous sommes-là en présence d'une source d'informations en réseau. Cette source qui se déplace de point en point change potentiellement de contenu en fonction de l'endroit où on la trouve. Des fonctions de profilage orientée documents sont maintenant à inventer.

CJ : Changeant de taille et de contenu par rapport à quoi? Par rapport aux mots que l'on peut rentrer nous mêmes dans le système ?
D.T : Oui, par exemple. Mais il existe aussi des travaux chez-nous ou dans des partenariats à l'étranger, qui cherchent à appeler ou sélectionner des contenus qui sont directement en relation avec la page (par exemple la bonne traduction dans le contexte, mais également un certain niveau de discours ou d'explication en fonction de la technicité du document environnant).

CJ : Par moment, en cliquant sur une définition, on arrive sur un lien...
D.T : Oui. C'est un aspect complémentaire. Alexandria n'édite pas uniquement les contenus dictionnairiques de Memodata. C'est un média orienté vers les dictionnaires. Son contenu est en réalité la propriété d'un grand nombre d'ayant droits : une bonne vingtaine aujourd'hui, essentiellement universitaires, mais pas uniquement. Selon les cas, pour certains de ces contenus qui ne sont pas "langue générale ", est fourni immédiatement le lien vers le système documentaire (car généralement il s'agit de tels systèmes) ayant fourni cette définition.

CJ : Le fait de pouvoir éditer des contenus de très grande qualité, plutôt institutionnels et de les rendre accessibles sur un grand nombre de sites au travers d'Alexandria pourrait être une dimension essentielle...
D.T :
Oui et ceci a donné lieu au projet européen COHESION, projet de e-content auquel nous avons postulé en Novembre 2005. COHESION est un acronyme pour «Contextual Hypermedia Enhancing Dissemination». Si d’importantes ressources ont été distribuées aux établissements scolaires, scientifiques et culturels pour développer des contenus internet, alors même que ces contenus ont été élaborés, il s’avère que ces derniers sont peu consultés par les internautes. Exemple : si je tape "impressionnisme" sur google, le musée d'Orsay arrive en 15ème ou 20ème page écran ! Et bien avant, arrive en fait un peu de tout, voire même des sites X. Avec un objet comme Alexandria - et c'est l'idée qu'il y a dans "COHESION", ces contenus institutionnels qui sont associés à des mots ou à des thématiques extrêmement particulières seraient référencés dans notre logiciel qui en proposerait la découverte au cours de la lecture.

CJ : Ceci veut dire que si dans une page web figurait le mot "impressionniste", un lien Alexandria mènerait sur des définitions et proposerait suivant la langue un lien vers les sites intéressants ?
D.T : Non seulement la définition, mais on pourrait aussi imaginer une fiche de présentation du musée d'Orsay, celle-ci étant implémentée par le responsable du site. Et ceci peut être traduit aujourd'hui dans les faits à destination de plusieurs milliers de sites web... J’ai une bonne nouvelle, toute fraîche, à annoncer à vos lecteurs. Je viens d’apprendre ce matin que COHESION est éligible. C’est une grande joie pour nous de voir que ce projet que nous pilotons, qui groupe 12 partenaires de douze pays européens, dont 10 universités ou académies, est en passe d’être définitivement accepté. C’est une étape importante pour le succès à long terme, européen, d’Alexandria.

CJ : Vous vendez aussi le logiciel à des sociétés ?
D.T :
Nous commençons en effet à le vendre à des sociétés souhaitant en disposer dans leur réseau intranet, l'objectif étant d'y fournir aussi leur propre vocabulaire d'entreprise en incorporant par exemple des éléments qui décrivent l'organigramme, des processus ou procédures de tous types (administratives ou techniques). Ainsi, au lieu de devoir se rendre dans un système documentaire qui existe souvent par ailleurs, mais qui n'est pas forcément consulté par les employés, il vaut mieux que le système documentaire vienne à eux.
Ceci pourrait aussi intéresser la fonction publique. Par exemple en disposant d'Alexandria sur les sites du ministère des Finances, avec un certain nombre d'explications concernant le vocabulaire juridique et fiscal.
J'ai d'ailleurs remarqué qu'Automates Intelligents avait commencé à créer ses propres fiches, notamment pour le mot "Aibo" ou "mémétique", puisqu'ils s'affichent en pointillés sur les pages où ils apparaissent...

CJ : Votre système permet aussi de traduire un mot d'une langue à l'autre. Ne S'agit-il pour l'instant que de cela ?
D.T : Tout dépend ici des langues. Notre entreprise Memodata est par exemple le représentant en France du projet Wordnet (réseau de mots) de l'université de Princeton http://wordnet.princeton.edu/, projet américain qui a débuté un peu avant notre Dictionnaire Intégral. Comme Memodata travaille depuis 15 ans plutôt sur un réseau conceptuel, Wordnet est plutôt un réseau de mots. Ainsi, nous affichons dans Alexandria des éléments de Wordnet puisque nous appartenons à la même association. Donc si vous rechercher un mot de l'anglais vers l'anglais, vous obtiendrez des définitions en langue anglaise.
Par exemple, si vous tapez "chapeau" et demandez une traduction de l'anglais vers l'anglais, vous verrez la définition "headdress that protects the head from bad weather ; has shaped crown and usually a brim". Et si vous cliquez dans l'un des mots de cette définition, par exemple "head", vous arrivez alors sur tout un monde...
Ce fonctionnement-là dépend exactement de l'évolution des projets partenaires au nôtre. Donc potentiellement, le but c'est que l'on puisse faire effectivement du wolof/wolof (langue d'Afrique de l'ouest) et de pouvoir passer ensuite en coréen par exemple.Il s'agit d'interconnecter toutes les langues pour passer d'un discours de la langue vers elle-même à un discours de la langue vers les autres langues à travers les différents réseaux sémantiques.

CJ : Quel rapport voyez-vous entre votre outil Alexandria et un moteur de recherche ?
D.T : Je n'en vois aucun pour le moment, quoique, en en parlant ici avec vous, me viennent évidemment certaines idées… Avec mozbot, qui travaille avec les données de google, existe actuellement un projet basé sur le fait que les utilisateurs ne connaissent pas forcément les termes idoines pour interroger un moteur de recherche.
Eh bien chez-nous, dans cet ordre d'idée, et pour se placer du côté d'une souveraineté européenne en la matière, on pourrait imaginer une connexion entre le moteur de recherche français Exalead (ndlr : qui doit participer au projet européen Quaero, moteur dont le but est de rivaliser avec Google) et Alexandria. L'internaute trouverait le terme idoine à rechercher grâce à notre logiciel (cf. l'encadré ci-dessous qui fournit des détails), terme qui serait ensuite envoyé comme requête dans le moteur. Donc là, il y a déjà cette sorte de relation organique qui va s'établir entre les deux : le mot et les idées qui vont avec et puis le service de recherche sur le web.
Ce qu'Alexandria essaie aussi d'établir, c'est une toile de sites de référence sur des sujets précis (on rejoint le projet COHESION dont je vous parlais plus haut) et là, d'une façon très vigilante, il ne s'agit pas de la couverture du web en entier, mais celle de certains lieux - totalement dignes de confiance parce que c'est leur métier - qui ont traité étroitement de certains sujets. Il s'agirait de proposer ces liens privilégiés au fur et à mesure de la navigation.


Avec Alexandria, retrouvez le terme exact.
Exemple : comment appelle-t-on le chapeau du pape ?

Vous ne vous rappelez plus du mot définissant le chapeau du pape, pourtant vous l'avez sur le bout de la langue... Alors cliquez sur n'importe quel mot dans cette page pour ouvrir la fenêtre Alexandria. Tapez alors, dans la fenêtre en haut à gauche le mot chapeau, puis cliquez sur le bouton ok.


Cliquez ensuite sur le premier mot chapeau, qui apparaît en gras, tout en haut de la fenêtre. Vous obtenez alors une autre fenêtre (voir ci-dessous), vous faisant pénétrer au coeur d'un réseau sémantique qui vous propose de nouvelles entrées :

Choisissez ensuite sur le dossier " coiffure de forme assez rigide". En effet, même si vous ne vous rappelez pas du nom du chapeau du pape, vous savez qu'il s'agit d'un truc en hauteur avec une forme assez rigide. S'affiche alors la fenêtre suivante :

Choisissez ensuite "coiffure rigide d'homme" : le pape est bien sûr un homme... Et là, apparaît un dossier "tiare papale". Voilà le mot que j'avais sur le bout de la langue.... : c'était "tiare".

Si vous cliquez dans le dossier "tiare papale" vous obtiendrez alors cette fenêtre :

Puis, en cliquant sur le mot "tiare" et en cliquant encore sur le mot, vous obtiendrez sa définition (que vous auriez pu aussi obtenir dès l'affichage "tiare papale", simplement en tapant "tiare" dans la petite fenêtre de recherche en haut à gauche) :

 

CJ : Parlons maintenant de politique. N'existe-t-il pas un risque potentiel de voir un tel outil récupéré un jour par une puissance qui souhaiterait imposer à la planète son dictionnaire mondial, mis au service des intérêts de cette puissance ?
D.T :
Vous avez raison, il faut y penser. Au plan de l'interaction entre la technologie et les sociétés, Alexandria est annonciateur de quelque chose d'inéluctable, à savoir l'existence de ressources de références, finalement peu nombreuses, qui risquent de couvrir le monde entier. Et avec un système comme Alexandria, on peut se retrouver avec une ressource de référence pour quelque 200 langues.
Ainsi, se pose le problème de savoir quel va être le statut juridique d'une telle ressource. Aujourd'hui, les internautes savent bien que le web donne à la fois de l'information mais aussi du bruit. Le web ne se présente pas comme un dictionnaire. Or ici, nous sommes en face d'une construction qui peut techniquement devenir hégémonique. Mais contrairement au web, il s’agit d’emblée d’une ressource, voire d’un « savoir » réputé exact, de quelque chose considéré comme étant le reflet direct de la « vérité »… Ne me demandez pas si le dictionnaire dit la vérité, je ne le crois pas. Mais c'est ce que la plupart d'entre nous croient. C'est le dictionnaire qui va trancher. Et c'est un grave problème. Dans un tel système, quelle sera à long terme la définition du mot "démocratie" ou du mot "préservatif". Quel pouvoir politique aura celui qui possède un tel logiciel ? Je pense ici à celui qui va donner le sens des mots pour tous ceux qui n'auront pas à redéfinir un sens. Car la plupart des gens ne vont pas redéfinir tous les mots…

CJ : Pouvez-vous nous expliquer cela à partir d'un exemple ?
D.T : Citons par exemple Google. Nombre de citoyens se sont inquiétés (et je crois savoir qu'Automates Intelligents en fait partie) de son projet de numériser les bibliothèques. Google veut indexer TOUTES les bibliothèques, TOUS les bouquins dans TOUTES les éditions, pour la planète entière. On comprend bien cette inquiétude, mais dans une certaine mesure, Google ne va pas changer le texte d'un philosophe comme Pascal. Parce que ce serait d'abord un gros travail et puis, s'il était fait (je ne vois d'ailleurs pas pourquoi), cela serait immédiatement repérable. Tout ce que peut faire Google, c'est augmenter sa fréquentation au détriment de celle des bibliothèques. Il peut aussi éventuellement faire varier l'ordre d'affichage des réponses, et donc exercer une sorte de "biais politique" au profit d'objectifs particuliers et privés. Je ne dis pas que ce n'est pas important, mais ici, avec un logiciel comme le nôtre, nous nous trouvons en face de quelque chose de beaucoup plus dangereux à long terme : se servir du système pour présenter des choses qui seraient réputées comme vraies, alors qu'elles ne manifestent qu'un point de vue.
Comprenez-moi bien : je ne suis pas en train de dire qu'il faut que les dictionnaires soient neutres. Mais si, par exemple, Wikipédia (ndlr : encyclopédie libre sur le web, gratuite et multilingue http://fr.wikipedia.org/wiki/Accueil) affirme "on est neutres, il faut des articles neutres", à mon avis on ne peut pas être neutre et il est faux d'affirmer que l'on peut l'être. Plus encore, cette recherche de la neutralité, si elle est sincère, aboutirait à un appauvrissement généralisé. La seule chose vraiment neutre est le néant. En cela, le neutre s’oppose directement à la vie. Bref, il y a plusieurs dangers à affronter. Comment ne pas permettre la manipulation. Comment ne pas être neutre. A l’époque du politiquement correct, ces deux notions se rapprochent d’ailleurs dangereusement. Dans cette perspective, je ferai davantage confiance à l’Europe, du fait de toutes ses merveilleuses contradictions, qu’à aucune nation pour encadrer un projet comme Alexandria. En tout cas, il ne faut pas qu’Alexandria devienne le projet d’une très grosse entreprise. Au contraire, il faudrait qu’Alexandria devienne une fédération. Un groupement d’intérêts de plusieurs natures, contradictoires, qui serait garant des libertés, je veux dire de l’absence de planification trop centralisée. Memodata travaille jour et nuit à cette fin. Le succès final de COHESION nous donnera un premier espoir.

CJ : Ce que vous voulez finalement dire, même s'il s'agit ici d'une image de ma part pas forcément réaliste (quoique ?), c'est que Google, avec les énormes moyens dont il dispose, et fort des appuis dont il dispose (DARPA(1)), pourrait très bien se voir un jour confier la mission de définir l'ensemble des mots pour la planète entière ? Et ceci dans toutes les langues, y compris bien sûr avec sa bonne définition du mot "démocratie" ou du mot "préservatif " ? Et ceci aux services d'intérêts d'une seule puissance ?
D.T : Oui, c'est exactement le fond de ma pensée. Alors vous imaginez la catastrophe... Parce que là, nous sommes sur des contenus qui ne peuvent pas dire la vérité, mais dont les internautes croient à 99% qu'il s'agit bien d'elle. Je pense donc que notre projet Alexandria devrait bien sûr être aidé (pour les développements informatiques), mais plus encore être très soigneusement entouré, encadré. Et donc, nous essayons d'établir un comité scientifique, un comité éthique multiculturel, avec nombre d'universités et de chercheurs différents qui ont bien cela en tête. Aujourd'hui cela ne paraît pas très important puisque, avec 50 ou 100000 pages affichées par jour, nous n'avons pas encore un gros impact. Mais un jour cela ne sera peut-être plus de cette nature...

CJ : Combien êtes-vous dans ce réseau ?
D.T : Alexandria est relié à une vingtaine d'établissements dans le monde entier.

CJ : Vous avez évoqué Quaero, projet de moteur de recherche européen destiné à concurrencer Google...
D.T : Oui, c'est un besoin important, mais je pense qu'il ne faut pas se contenter de refaire un produit comme Google, qui d'ailleurs, dans une certaine mesure, a construit quelque chose de très intéressant. Quaero doit être là pour obliger Google à continuer d'être bon, mais pas forcément avec l'idée d'essayer de prendre sa place.
Il faut que cela soit l'occasion de nous donner une certaine indépendance dans un secteur vraiment stratégique. Un peu comme Galileo par rapport au GPS, pour prendre ici un exemple dans un autre secteur.
L'Europe, avec ses 40 langues et sa diversité, pourrait avoir quelque chose de très important à dire, un message très clair et très important à donner au monde à travers un système comme Alexandria. Et ceci actuellement peut venir d'Europe, et pas d'outre Atlantique.

(1) Darpa : Defense Advanced Research Project Agency. Département du DoD américain (Department of Defense) particulièrement concerné par les recherches en informatique.

Retour au sommaire