![]() |
La linguistique informatique
|
![]() |
| 3 pages | par Claire Alberio calberio@yahoo.fr | 26-2-2000 |
Réflexion personnelle à la suite de la conférence "Linguistique et informatique (La traduction automatique)" donnée le 16/02/2000 par Laurence DANLOS au CNAM, dans le cadre du cycle de conférences "L'université de tous les savoirs" .La linguistique informatique fait appel à des domaines scientifiques aussi variés que les systèmes experts, les langages formels et l'intelligence artificielle.
La machine peut analyser les signes mais peut-elle en comprendre tous les sens ?
Si les nouvelles technologies donnent naissance à des robots, faut-il leur prêter des " états dâme " ?
Le langage comprend des règles de syntaxe et de sémantique explicites et précises. Les langages de programmation en sont des exemples, de même que les logiques telles que le calcul des prédicats. Les langages formels contrastent avec les langages naturels comme le français. Ces règles, qui évoluent avec lusage, sont loin de représenter une définition complète ou précise de leur syntaxe, encore moins de leur sémantique. Pour les applications informatiques, les langages naturels sont modélisés par des langages formels.
Un système informatique est constitué par un langage formel et un appareillage déductif. Un système informatique sélectionne les énoncés vrais ou faux grâce à des propositions. La sémantique de ces propositions est prise en compte à travers linterprétation de ces notions. Pour faire des déductions, on utilise des tables de vérité et des techniques de déduction naturelle. Cet appareillage déductif est composé daxiomes et de règles dinférence complexes.
Un langage formel est un ensemble fini de chaînes considéré indépendamment de la signification des symboles. Par exemple, si S est un ensemble quelconque, un S-langage est un sous-ensemble de S mots. S est appelé lalphabet de ce langage.
Les méthodes formelles utilisées permettent un support automatique dun développement, cest à dire une adaptation rigoureuse aidée par un contrôle de type automatique, une analyse sémantique, la transformation de la spécification en conception, lanimation, lassistance à la preuve, la vérification et même la preuve de théorème.
Avec le développement dInternet, les besoins en traduction automatique sont énormes. On trouve des logiciels de traduction automatique disponibles sur le net (Systran, Reverso) mais les traductions générées ne sont pas parfaites. Pourquoi ? La technique de la traduction automatique consiste à passer un texte de langage source par un système de traduction. Le premier système de traduction automatique date de 1946 (année du premier ordinateur qui était un calculateur électronique). Cétait un traducteur mot à mot. La traduction pouvait alors perdre tout son sens.
Exemple : "Ciel mon mari ! " se traduit par " Sky my husband ! ".
Depuis les systèmes de traduction ont progressé mais ils génèrent toujours des erreurs, notamment à cause des ambiguïtés propres à chaque langue.
Un mot est une suite de caractères encadrée de " séparateurs ".Il existe des mots composés que lon ne peut pas traduire mot à mot. Par exemple " pomme de terre " se traduit en Anglais par " potato ". Il faut donc dresser la liste des expressions composées pour chaque langue.
La difficulté vient aussi du fait quil faut reconnaître les expressions composées dans les phrases. Or les éléments ne sont pas forcément contigus. Sans compter les homographes, qui sont des mots qui ont la même graphie mais un sens différent en fonction des catégories de discours différentes.
Le français est une langue à forte morphologie avec des ambiguïtés réelles rares et des ambiguïtés virtuelles fortes.
Lexemple suivant nous montre les ambiguïtés de la langue française. " Zoé a aimé cet avocat. Pourtant, il était véreux. ". La traduction de cette phrase dépend du contexte. En anglais, les traductions pourraient être les suivantes : " Zoé loved/liked this lawyer/avocado. However, he/it was worm-eaten/shady ".
Avocat peut être un fruit ou un homme. Il ny a pas dambiguïté réelle mais virtuelle introduites par lanalyseur.
Le graphe de décision devient vite complexe car les graphes se croisent avec une explosion combinatoire. Si la phrase a n mots, si un mot mi a ki sens (ki traductions) alors, lordinateur doit décider en k hypothèses avec k=k1*k2* kn.
De plus, il y a dautres types dambiguïtés comme les ambiguïtés pragmatiques ou syntaxiques.
Pour y remédier, il faut une connaissance du monde que nous ne savons pas modéliser aujourdhui.
On parle aujourdhui dobjets qui pensent, cest à dire dentités logicielles indépendantes qui contiennent une intelligence (logique et de représentation des connaissances) définissant leur comportement.
Les robots sont munis de ces entités logicielles ce qui les dotent des fonctionnalités suivantes.
(La vision que nous avons ici se dégage des concepts purement liés à lIntelligence Artificielle.)
Autonomie du robot : fonctionnement sans intervention de lhomme, il a le contrôle de ses actions et de son état interne.
Sociabilité, il interagit avec dautres (humains ou non), par le biais dune communication.
Réactivité, il perçoit son environnement (qui peut être le monde physique, un utilisateur via une interface graphique, une collection dautres robots, etc.). Il réagit aux changements qui sy produisent.
Pro-activité, il nagit pas quen réponse à son environnement. Il est capable dexhiber un comportement dirigé par des buts en prenant des initiatives.
Les prototypes comprennent à peu près mais les logiciels sont lents, ils fonctionnent sur de gros ordinateurs, dans des domaines restreint avec un vocabulaire réduit.
Les différences entre lhomme et le robot ou lhumanoïde sont que lhomme comprend le langage alors que lhumanoïde ne comprend rien.
Le robot décharge lhomme de tâches complexes ou répétitives mais ne peut pas être comparé à un être humain. Il ne confie pas ses états dâme mais confie ses états de fonctionnement (exemple : batteries à plat). Il na pas dâge mental, il na ni 3 ans, ni 5 ans. On ne peut pas le comparer à un enfant car un enfant fait un apprentissage de la langue.
A une forme langagière, correspond une situation (compréhension), à une situation correspond une forme de langage (production). Il nexiste pas denfant qui ne pourrait ne parler que dun unique domaine. Un enfant maîtrise tous les domaines qui font partie de son quotidien.
Le robot, objet de toutes les recherches, sera bientôt beaucoup plus sophistiqué. Il devrait être doté des fonctionnalités suivantes.
La délégation : le robot exécute une tâche pour le compte dun utilisateur. La tâche est exécutée de manière indépendante, mais sous la responsabilité de lutilisateur et est accomplie selon la stratégie de celui-ci.
La personnalisation : le robot apprend ou connaît les préférences de lutilisateur, autrement dit son profil. Il intègre une stratégie de choix selon les préférences de lutilisateur, stratégie quil sait adapter aux changements.
Le suivi de contrat, lorsque la nature du service entraîne une consommation effective différée, lusage du service résulte en un contrat entre le serveur et le client qui sachèvera une fois lobjet du contrat consommé. Par exemple, un client qui achète un voyage fait une réservation qui constitue un contrat entre le voyagiste (ici le robot) et lui-même jusquà ce que le voyage soit effectué. Dans un tel cas, le robot assure le suivi du contrat jusquà ce que le service soit consommé. Il est capable de réagir aux changements susceptibles daffecter le contrat et le cas échéant de rechercher des solutions nouvelles.
La combinaison de services : le robot est capable délaborer une réponse à la requête dun utilisateur en utilisant lui-même plusieurs services et en combinant leurs réponses.
Le robot peut comprendre les langages dans tous les domaines sans formation préalable.
Les applications de la linguistique informatique permettent à lhomme de rendre son interlocuteur intelligible, quil soit homme ou machine. Bien que cette science touche de plus en plus notre quotidien, " lhumanoïde qui comprend et éprouve des sentiments ne devrait pas voir le jour, du fait de la complexité des problèmes à résoudre, avant 3001 " (L.DANLOS).
http://www.admiroutes.asso.fr/action/theme/science/linguist.htm
Droits de diffusion