Vers le site Automates Intelilgents
La Revue mensuelle n° 113
Robotique, vie artificielle, réalité virtuelle

Information, réflexion, discussion
logo admiroutes

Tous les numéros


Archives
(classement par rubriques)

Image animée
 Dans La Revue
 

Retour au sommaire

Automates Intelligents s'enrichit du logiciel Alexandria.
Double-cliquez sur chaque mot de cette page et s'afficheront alors définitions, synonymes et expressions constituées de ce mot. Une fenêtre déroulante permet aussi d'accéder à la définition du mot dans une autre langue (22 langues sont disponibles, dont le Japonais).

 

Article.
J'ai tendance à voir ce que je m'attends à voir, entendre ce que
je m'attends à entendre

Jean-Paul Baquiast -- 11/12/2010


Image. Simulation d'un mitraillage au sol (source www.simulation-france-magazine.com/)

Deux thèses s'opposent généralement concernant le rôle du sujet dans l'interprétation de ce qu'il perçoit sensoriellement. Pour la première thèse, les sujets ont tendance à percevoir ce que pour des raisons diverses ils s'attendent à percevoir ou ont envie de percevoir. Pour la seconde thèse, les sujets sont généralement sans opinions préconçues. Ils sont donc ouverts à ce que leurs sens leur font percevoir, même si ces perceptions contredisent leurs opinions préalables. On peut soulever la question quel que soit le message sensoriel perçu (image, son...) et quels que soient les domaines d'intérêt en cause (philosophie, politique, sentiments, etc.).

Inutile de dire que la première thèse est la plus répandue. La plupart des psychologues et cogniticiens considèrent que l'esprit n'est pas une page blanche, ni à la naissance, ni ensuite dans la vie (blank slate). Chaque cerveau s'est doté au long de son existence d'un stock de plus en plus riche de données et d'interprétations mémorisées, auquel il fait appel pour interpréter ce qu'il perçoit et s'en servir pour définir de nouvelles opinions ou de nouveaux comportements.

Ce « poids du passé » ou de l'expérience acquise est tel qu'il peut conduire certains sujets à interpréter de façon totalement contraire à l'expérience commune telle ou telle donnée nouvelle. Il peut même conduire certains à la refuser complètement, dans un véritable déni de réalité. Bien évidemment, si ces interprétations subjectives a priori se révèlent systématiquement en contradiction avec de nouvelles perceptions, le cerveau du « négationniste » finit en général par se résoudre à modifier son point de vue.

Mieux vaudrait cependant faire preuve d'emblée de ce que l'on nomme dans le langage courant l'ouverture d'esprit face aux perceptions ou aux idées nouvelles. Il s'agit d'un facteur essentiel d'adaptabilité et de survie. Sinon, les individus et les groupes resteraient enfermés dans des comportements incapables d'évoluer. Mais l'ouverture d'esprit n'est-elle pas contre nature, autrement dit un voeu hors d'atteinte, parce que contraire à la façon dont le cerveau se comporte aux niveaux les plus élémentaires des neurones du cortex ?

Pour répondre à cette question, il est intéressant d'observer, en utilisant les ressources les plus récentes de l'imagerie cérébrale fonctionnelle, comment se comportent les cerveaux de sujets volontaires confrontés à de nouveaux messages sensoriels. C'est ce que viennent de faire des chercheurs de la Duke University, dans le cadre d'une étude pilotée par le cogniticien Tobias Egner dont les résultats viennent d'être publiés. Selon des observations utilisant l'imagerie fonctionnelle par résonance magnétique (f/MRI), l'équipe est conduite à proposer un changement de paradigme concernant la façon dont procèdent les neurones visuels du cerveau confrontés aux perceptions provenant de l'appareil visuel. Les auteurs proposent de remplacer ou tout au moins de compléter le concept jusqu'alors le plus utilisé, celui de « détection des caractères » (feature detection) par celui de « codage - ou décodage - prédictif »  (predictive coding).

Concrètement, ceci signifie que les neurones visuels développent en continu des prédictions relatives à l'interprétation ou à l'utilisation de ce qu'ils perçoivent, quitte à modifier les suppositions se révélant erronées si de nouvelles perceptions se montrent en contradiction avec les premières interprétations. L'expérimentation a ainsi montré que lorsque des sujets s'attendent à percevoir un visage, ils mettent plus de temps que ceux ne s'y attendant pas à distinguer l'image de ce visage de celle de l'image d'un immeuble – et réciproquement.

Le rôle important du décodage prédictif

Much ado for nothing, beaucoup de bruit pour rien, dira-t-on. N'est-ce pas ce que l'on pouvait effectivement supposer ? L'étude de la Duke University n'est pas cependant inutile, au contraire. Elle conduit à une conclusion plus générale, qui éclaire la façon dont le cerveau travaille. Nos neurones prédisent et «publient» ce que nous voyons avant que nous n'ayons pris conscience de l'avoir vu. Il s'agit d'un processus dit top down, s'opposant au processus jusqu'ici couramment admis dit bottom up. Les neurones visuels traitent les informations provenant de la rétine à travers des couches hiérarchisées. Dans le processus bottom up, on suppose que les couches les plus basses détectent d'abord des formes élémentaires, telles que des lignes horizontales ou verticales, avant de les envoyer aux couches supérieures qui les assemblent en figures plus complexes. L'image voyagerait ainsi de couches en couches jusqu'à se présenter sous une forme élaborée interprétable par le reste du cerveau, c'est-à-dire par la conscience du sujet.

Dans le modèle top down au contraire, les neurones de chaque couche élaborent des prédictions relatives à ce que devraient être les images perçues par la couche immédiatement inférieure. Les prédictions sont comparées avec les données entrantes dans les couches inférieures, de façon à éliminer les erreurs de perception ou de prédiction de ces couches. Finalement, selon Egner, une fois éliminées toutes les erreurs de prédiction, le cortex visuel ne conserve que l'interprétation la plus certaine de l'objet perçu, à partir de quoi le sujet voit effectivement cet objet. Le total de l'opération s'exécute de façon inconsciente en quelques millisecondes. Le concept de « codage prédictif » était utilisé depuis plusieurs décennies, mais ce serait la première fois qu'il serait vérifié indiscutablement grâce à la f (MRI). De ce fait serait au moins en partie remis en cause le concept de « détection des caractères ».

Resterait cependant à préciser un point que, semble-t-il, n'ont pas abordé les chercheurs: dans quelles parties du cerveau les neurones de la couche supérieure du cortex visuel trouvent-ils les "prédictions" ou images prédictives dont ils s'inspireront pour interpréter les informations visuelles qu'ils reçoivent. S'agit-il d'images conservées en mémoire dans le cortex visuel ? S'agit-il au contraire d'images importées des aires cérébrales du cortex associatif (ou intelligent), qui viendraient influencer la perception du moment. A priori, cette dernière hypothèse parait la plus vraisemblable, car elle confirmerait l'influence des opinions sur la perception, mais il faudrait la démontrer.

Par ailleurs, les chercheurs de la Duke Université n'ont pas semble-t-il étendu en termes plus généraux les conclusions que l'on pourrait tirer de leurs expérimentations. En ce qui concerne l'intelligence artificielle, sans avoir la prétention de le faire à leur place, nous pourrions peut-être suggérer l'intérêt d'organiser sur le modèle mis en évidence par Egner la façon dont les cerveaux des robots se construiront des cartes de leur environnement. C'est d'ailleurs semble-t-il ce que font déjà beaucoup de roboticiens.

Dans le domaine plus général de la connaissance, nous pourrions retenir des travaux de la Duke University le fait que le poids attribué aux modèles interprétatifs conservés en mémoire par notre cerveau et utilisés pour donner un sens à de nouvelles entrées sensorielles paraît plus important encore que ce que l'on pourrait spontanément penser. Même si des prédictions erronées se trouvent corrigées en quelques millisecondes par le cortex visuel, on pourrait difficilement exclure que globalement, elles ne puissent entrainer des conséquences sur la façon dont certaines erreurs pourraient être conservées et se propager de proche en proche, fussent-elles progressivement corrigées.

On comprendrait mieux alors comment ce qu'il faut bien nommer des préjugés conduisent le cerveau à donner un sens à ses perceptions puis à ses actions – c'est-à-dire en fait à construire un monde conforme à ces préjugés. Certes, on peut penser que le cerveau saura distinguer à temps un visage humain d'une silhouette de maison lors d'une expérience de laboratoire, mais en sera -t-il de même lorsqu'il s'agira de distinguer un ami d'un ennemi lors du mitraillage d'une troupe au sol à partir d'un avion de combat.

On peut supposer que les mêmes erreurs d'interprétation doivent se produire dans la perception de fragments de discours. Si l'on attend de moi que je tienne un discours belliqueux, sans doute sera-t-on tenté de conférer un sens agressif au moindre de mes propos. Si l'on en conclut trop vite que je suis un homme à abattre, mes chances de survies seront sérieusement compromises.

Références
Journal of neuroscience 8 décembre 2010 Expectation and Surprise Determine Neural Population Responses in the Ventral Visual Stream
Voir aussi:
http://www.dukenews.duke.edu/2010/12/egner_vision.html

Retour au sommaire