Retour au sommaire
|
Billet
d'humeur
L'Europe
prise de vitesse par l'Inde dans la lutte contre la
Babélisation
par
Jean-Paul Baquiast 21/11/04
|
Un des plus grands problèmes auquel se heurte la construction
de l'Union européenne est la nécessité
de faire converser ensemble les populations des 25 Etats-membres.
Ceci n'apparaît pas encore dans la vie quotidienne,
parce que les besoins d'échanges en temps réel
ne sont pas très étendus. Certaines langues
pivots, en priorité l'Anglais, permettent d'assurer
le minimum de compréhension nécessité
par les transactions commerciales ou scientifiques. Mais,
comme on le sait, les institutions communautaires se heurtent
déjà à des difficultés logistiques
considérables, quand il s'agit de produire en temps
utile les documents de travail nécessaires à
chacun des représentants des pays concernés.
Ces
difficultés pourtant ne sont rien face à celles
qui se présenteront quand les réseaux de communication
ouverts au grand public se généraliseront. On
pense déjà aux échanges par Internet,
mais il faut aussi et surtout penser à la communication
vocale et écrite (SMS) transitant par les téléphones
mobiles de plus en plus sophistiqués qui seront bientôt
utilisés couramment par une très grande majorité
des populations. Ces réseaux vont-ils se segmenter
en communautés linguistiques incapables d'inter-communiquer,
ce qui illustrera concrètement l'image détestable
de la tour de Babel ? Mais alors cela condamnera sans doute
définitivement l'établissement d'une conscience
européenne commune, laquelle est pourtant indispensable
à ce dont rêvent tous les stratèges de
la construction européenne : une Europe véritablement
souveraine, aux plans politiques, culturels et surtout technologique
et scientifique.
Il est évident qu'il n'y aura pas de véritable
Europe tant que chacun des quelques 450 millions de citoyens
de chacun des pays ne pourra pas s'il le désire communiquer
librement avec l'un quelconque de tous les autres, sans avoir
à résoudre la moindre difficulté technologique
ou linguistique. Mais pour cela, il n'y a pas de miracle à
espérer des solutions traditionnelles, consistant à
apprendre des langues étrangères ou faire appel
à des traducteurs. Seule l'Intelligence Artificielle
(IA) la plus évoluée sera capable d'offrir des
solutions économiques et efficaces. Nous parlons d'IA
évoluée car on sait que depuis bientôt
40 ans la linguistique informatique de la vielle école
n'a pas réussi à résoudre les multiples
problèmes qu'impose la traduction dès que l'on
veut échapper au monde étroit des formulaires
techniques ou commerciaux.
La question a précisément été
évoquée lors de la première réunion
du Comité Scientifique du futur Congrès espagnol
sur la souveraineté technologique européenne
(voir http://www.admiroutes.asso.fr/larevue/2004/59/colmadrid.htm
) par Jesús Cardeñosa (http://www.vai.dia.fi.upm.es/es/cv/jesus_cv.htm)
professeur d'Ingénierie des Connaissances et d'Intelligence
Artificielle à l'Université polytechnique de
Madrid. Il a souligné que la principale barrière
à l'implantation d'une conscience technologique et
scientifique européenne commune se trouve dans les
barrières linguistiques. Or la technologie, convenablement
encouragée, peut apporter (sans obliger à utiliser
systématiquement l'Anglais) des solutions permettant
de faire diffuser très vite la mentalité technologique
à travers l'Europe, en dépit de la coexistence
des différentes langues nationales.
On pourrait donc penser que l'Europe aurait mis tous les moyens
scientifiques dont elle dispose à résoudre ce
problème. Cela n'a pas encore été le
cas, sans doute parce que manque encore une réflexion
en profondeur sur les besoins de la recherche fondamentale
en Europe. Si le futur Conseil Européen pour la Recherche
Scientifique (European Research Council) dont on parle actuellement
existait, il aurait peut-être pu aborder cette question.
Mais il n'existe pas.
La solution viendra sans doute de l'Inde
C'est
donc d'Inde que viendra sans doute la solution. On sait que
les hindous sont de grands experts en logiciels et ingénierie
de la connaissance. Le Telegraph de Calcutta (http://www.telegraphindia.com/1041115/asp/business/story_4005400.asp)
nous apprend que bientôt, au moins dans le sous-continent
indien, les utilisateurs de téléphones mobiles
pourront parler entre eux – et se faire comprendre -
dans leur langue maternelle. Or celles-ci sont encore plus
nombreuses en Inde qu'en Europe. Il y a sans doute un peu
d'exagération bien compréhensible dans cette
affirmation. Mais nous pouvons en retenir les grandes lignes.
La technologie adéquate, au moins sous une forme expérimentale,
est à l'étude au sein du Centre for Development
of Advance Computing (C-DAC). Elle devrait être disponible
commercialement d'ici trois ans. Notons que le C-DAC est aussi
un des partenaires (avec IBM et ITT) du projet asiatique de
développement des logiciels libres. Les deux questions
se tiennent. On conçoit bien que si une firme comme
Microsoft développait pour son compte des logiciels
propriétaires de traduction, elle se donnerait sur
les cultures du monde une emprise encore plus insupportable
que celle dont elle dispose actuellement. La miniaturisation
des composants des téléphones portables permettra
bientôt à ceux-ci d'embarquer des logiciels d'IA
très sophistiqués, notamment dans le domaine
du traitement de l'image, du son et surtout du sens des messages.
Le marché potentiel est considérable et la logique
de l'Open Source s'impose. C'est du moins ce que pensent les
promoteurs asiatiques de ce qui a été nommé
le Joint Open Source Project. La même idée, malheureusement,
n'a pas germé dans les cerveaux des stratèges
européens, sans doute plus occupés à
dérouler le tapis rouge devant Bill Gates qu'à
penser par eux-mêmes.
On sait qu'après avoir travaillé pour le compte
d'un grand nombre d'entreprises américaines et européennes
pour résoudre le problème du passage à
l'An 2000, l'Inde a acquis une précieuse expérience
dans la communication d'ordinateurs à ordinateurs.
Elle va l'utiliser dans ce projet de traduction. Nous renverrons
le lecteur à l'article du Telegraph of India pour la
description du procédé à l'étude.
Disons qu'un mot parlé en bengali ou dans tout autre
langage local sera transformé en signaux audio, qui
seront ensuite numérisés et analysés
afin d'extraire les caractéristiques importantes du
mot parlé. Celles-ci seront ensuite analysées
par des programmes d'IA afin de déchiffrer le contenu
sémantique (probable) du mot et de le traduire dans
un autre langage, par exemple le tamil. Il s'agit d'une technique
de traduction dite langage vers texte (speech-to-text
translation). Elle suppose la connaissance linguistique
des structures des deux langages au plan syntaxique et sémantique,
ainsi que des dictionnaires et des bases de données
aussi complets que possible. Après traduction, la démarche
inverse sera entreprise, c'est-à-dire que le texte
sera converti en langage parlé, autrement dit en signaux
audio (text-to-speech conversion) .
L'objectif, nous l'avons dit, est qu'à terme ce travail
puisse être exécuté dans le mobile lui-même,
sans avoir à passer par l'intermédiaire de serveurs,
au moins quand il s'agira de phrases relativement simples.
Les serveurs et leurs bases de données serviront en
arrière-plan, pour la synthèse et la mise à
jour des connaissances embarquées (concatanative
synthesis).
Les temps de réponse seront initialement assez longs
(1 ou 2 secondes) mais cela sera peu si on compare le résultat
obtenu à ce que représente le mur d'incompréhension
qui s'établit entre deux personnes de bonne volonté
incapables de comprendre leur langues respectives. L'avenir
commercial s'annonce brillant pour ces technologies. Un expert
de la traduction automatique comme Shyam S. Agrawal estime
qu'à terme chacun voudra avoir sur lui un synthétiseur
vocal et un système de reconnaissance vocal associé
à des facilités de traduction. Le monde des
réseaux ne sera plus concevable sans ces outils. En
2010, le système devrait avoir atteint une maturité
suffisante, généralisant le cross language
information retrieval (CLIR) puis le speech-enabled
retrieval of information, lesquels permettront notamment
de donner à tous les citoyens de l'Inde l'accès
aux informations existant sur l'Internet.
Les pessimistes diront que tous ces projets font en grande
partie montre d'un optimisme mal fondé, non dénué
sans doute de la volonté d'impressionner les concurrents.
Peut-être. Mais peut-être pas. S'ils aboutissent
et si les Européens se laissent prendre de vitesse,
qu'ils se rassurent cependant. Ils pourront toujours se rendre
dans les Centres culturels des ambassades de chacun des Etats-membres
pour essayer de comprendre la civilisation de leurs voisins.
Pour en savoir plus
C-DAC
http://www.cdacindia.com/
Le
projet est développé conjointement avec des
représentants de l'Indian Institute of Technology (IIT)
http://www.iitd.ernet.in/
et l'Indian Institute of Information Technology (IIIT)
http://www.iiitb.ac.in/.
Une coopération avec le Japon et peut-être aussi
l'Allemagne serait envisagée.
Il semble également que des développements communs
avec l'Université polytechnique de Madrid soit engagés.
Retour au sommaire