NETWORK DES SCIENCES SOCIALES DE CHINE
Recherches interdisciplinaires
ACCUEIL>RECHERCHES>Recherches interdisciplinaires
La compréhension humaine n'est pas essentielle à la traduction automatique
Source : Chinese Social Sciences Today 2025-09-05

De l'Antiquité à nos jours, la traduction a servi de passage crucial pour les échanges entre civilisations. Elle exige la maîtrise de deux langues, ainsi que des compétences en compréhension écrite et en rédaction, ce qui en fait l'une des activités intellectuelles les plus exigeantes entreprises par l'humanité. Pour des raisons pratiques, la quête d'une traduction plus rapide et plus économique a stimulé les progrès rapides de la traduction automatique (TA). Notamment, la traduction automatique neuronale (TAN), fondée sur les réseaux de neurones artificiels, a récemment propulsé la TA à des sommets inégalés. L'industrie de la TA affirme souvent que la TAN se rapproche de la qualité de la traduction humaine. Pourtant, de nombreuses études comparant la traduction humaine et la traduction automatique sous divers angles ont mis en lumière des lacunes fondamentales de la TA — des lacunes que, dans nombreux cas, seuls les traducteurs humains peuvent surmonter. Certains soutiennent que malgré ses progrès impressionnants, la TA ne peut toujours pas rivaliser avec la traduction humaine, car elle manque d'une compréhension authentique, et que les futures avancées de la TA dépendront également des progrès dans la compréhension automatique.

Nous ne partageons pas cet avis. Au contraire, nous estimons que les progrès récents de la TA s'orientent dans la bonne direction, et que ces critiques peuvent être largement ignorées. En effet, nous craignons que promouvoir la « compréhension » au sens humain comme prochain objectif pour la TA puisse être trompeur et finalement irréalisable. Ici, la « compréhension » désigne l'intelligence sémantique du type de celle possédée par les humains.

Essence de la compréhension

À l'heure actuelle, notre connaissance de ce qu'implique la « compréhension » reste imprécise. « Qu'est-ce que comprendre ? » est devenu ces dernières années l'objet de vifs débats philosophiques. On distingue généralement deux grandes perspectives : l'approche épistémique et l'approche par les capacités. Les philosophes des sciences considèrent la compréhension comme une forme de connaissance plus avancée, tandis que les épistémologues ont tendance à la voir non pas simplement comme la possession de plus de connaissances, mais comme la manifestation d'une capacité.

Bien que la nature de la compréhension demeure non résolue, il est clair qu'elle représente une activité intellectuelle hautement complexe. Doter les machines d'une compréhension semblable à celle de l'homme serait extraordinairement difficile. En effet, posséder une telle capacité est en soi un objectif ultime de la recherche en intelligence artificielle ; le considérer plutôt comme un moyen technique est une erreur. Cela soulève la question centrale de cet article : une compréhension de type humain est-elle véritablement indispensable à la TA ? Par analogie, avant l'invention des avions, on aurait pu se demander si une machine volante devait nécessairement battre des ailes comme un oiseau.

Types d'ambiguïté

Le plus grand défi de la traduction réside dans l'ambiguïté. Les théories abondent sur les sources de l'ambiguïté dans le langage naturel et son impact sur la traduction. Ici, nous nous concentrons sur plusieurs types critiques, dont deux en particulier constituent les obstacles les plus sérieux pour la traduction : l'ambiguïté lexicale et l'ambiguïté grammaticale. L'ambiguïté lexicale imprègne toutes les langues naturelles. Comme Ashish Vaswani et al. l'ont souligné, chaque mot dans chaque langue est polysémique — allant des sens littéraux aux sens figurés, en passant par les nuances précisées uniquement par le contexte — et les machines doivent identifier la signification pertinente. Par exemple, en anglais, « bank » peut désigner une institution financière ou la berge d'une rivière, alors qu'en chinois, aucun mot unique ne couvre ces deux sens. En traduction, un choix doit être fait, et c'est le contexte qui détermine quel sens s'applique.

Un exemple célèbre d'ambiguïté est la phrase : « The toy box was in the pen ». Le plus souvent, « pen » désigne un instrument d'écriture, mais il peut aussi signifier un enclos pour animaux, et plus rarement un petit espace de rangement. Étant donné qu'une boîte à jouets ne pourrait jamais tenir dans un instrument d'écriture, il est déraisonnable d'interpréter la phrase comme « la boîte à jouets était dans le stylo/le stylo à bille ». Par conséquent, l'interprétation correcte doit être « la boîte à jouets était dans le petit espace de rangement ». Cet exemple est notable car il met en évidence de manière frappante le problème de l'ambiguïté : la phrase ne fournit aucun indice contextuel, et l'interprétation correcte repose sur une acception extrêmement rare du mot.

L'ambiguïté grammaticale surgit au niveau de la phrase. L'un des objectifs des règles grammaticales est de réduire cette ambiguïté, mais dans l'usage réel, de nombreuses langues emploient une grammaire plus souple, certains éléments étant omis, ce qui conduit à de multiples interprétations possibles. Un cas classique est : « I saw the man on the street with a telescope ». Cela peut signifier soit « J'ai utilisé un télescope pour voir l'homme dans la rue », soit « J'ai vu l'homme dans la rue qui tenait un télescope ». L'ambiguïté lexicale et l'ambiguïté grammaticale peuvent également coexister, cumulant les difficultés de désambiguïsation.

Il est évident que résoudre l'ambiguïté est une tâche ardue, même pour les humains, et infiniment plus pour les machines. Du point de vue de la TA, l'ambiguïté introduit une explosion combinatoire et une complexité computationnelle, créant ainsi un goulot d'étranglement redoutable. L'analyse syntaxique — qui consiste à décomposer une phrase ambiguë en structures multiples et à analyser les relations entre elles — a longtemps été une approche principale dans la TA basée sur des règles. Pour résoudre l'ambiguïté, ces systèmes doivent enregistrer tous les sens possibles d'un mot selon les contextes. Par exemple, pour traduire correctement « I went to the bank to get some cash » en chinois par « 我去银行取一些现金 » et non par « 我去河堤取一些现金 », le système doit encoder des règles telles que « lorsque bank co-occurre avec cash, traduire par '银行' ». Cependant, l'ambiguïté est si omniprésente que certains mots courants peuvent avoir plus de 20 sens, tandis que des règles grammaticales flexibles font croître exponentiellement le nombre de structures phrastiques possibles avec la longueur de la phrase. Cette complexité combinatoire rend pratiquement impossible la construction d'un système de TA basé sur le dictionnaire et les règles capable de résoudre toutes les ambiguïtés au sein d'une phrase. La raison fondamentale de l'échec de ces systèmes tient simplement au fait qu'ils sont limités par la complexité computationnelle.

Éviter la compréhension humaine

Qu'est-ce qui, alors, donne naissance à l'ambiguïté elle-même ? La réponse est simple : l'acte même de tenter d'interpréter le sens. Autrement dit, l'ambiguïté émerge précisément parce que la compréhension exige l'interprétation, et l'interprétation génère inévitablement des possibilités divergentes. Pourtant, une fois que l'ambiguïté surgit, elle se heurte inévitablement au goulot d'étranglement de la complexité computationnelle.

Un raisonnement simple s'ensuit : Serait-il possible de contourner le besoin de compréhension, évitant ainsi complètement l'ambiguïté ? En effet, c'est précisément la voie qu'a empruntée la technologie — passant de la TA basée sur des règles à des méthodes basées sur des corpus, telles que la traduction automatique statistique (SMT) et la TAN. La difficulté de la désambiguïsation fut l'une des principales motivations derrière l'adoption des approches basées sur corpus. Ces méthodes ne cherchent pas à résoudre le sens de manière sémantique, mais modélisent plutôt les correspondances de manière probabiliste grâce à la co-occurrence contextuelle. Ce faisant, elles ont ouvert une voie large, libérée des contraintes de la complexité combinatoire — obtenant des résultats frappants. Bien que les méthodes basées sur corpus semblent résoudre l'ambiguïté, leur vrai but ne réside pas dans la détermination sémantique mais dans l'estimation probabiliste. En résistant à la tentation d'interpréter le sens, elles échappent au piège computationnel de l'ambiguïté.

En ce sens, en évitant la compréhension sémantique de type humain, la TA contourne le problème du calcul insoluble et produit des résultats efficaces. Telle est la logique interne de son évolution technologique — une logique qui explique également pourquoi la TA s'est délibérément éloignée de la compréhension de style humain. Le fruit de cette avoidance pourrait même être considéré comme une nouvelle forme de « compréhension machine » : la TA ne s’ancre pas dans l'intelligence sémantique, mais dans des caractéristiques non sémantiques du langage — telles que les corrélations statistiques entre les mots et les phrases au sein d'une même langue, et les correspondances entre celles-ci à travers les langues. Autrement dit, les machines peuvent acquérir un mode de « compréhension » distinct de celui des humains, mais suffisant pour permettre une traduction réussie.

La compréhension sémantique, bien que très importante en traduction humaine, n'est pas une condition nécessaire pour la TA elle-même. Les progrès de la TA à ce jour doivent peu à la compréhension sémantique, mais reviennent beaucoup aux corrélations statistiques non sémantiques : les dépendances entre les mots et les phrases au sein des énoncés, et les correspondances entre ceux-ci à travers les langues. Ces corrélations découlent des propriétés combinatoires du langage et des alignements bilingues. Tant que les corpus d'apprentissage et les phrases à traduire présentent de telles structures combinatoires, les machines peuvent apprendre des données et produire des traductions de haute qualité. De cette manière, des tâches qui pourraient sembler exiger une compréhension sémantique peuvent, en réalité, être accomplies par les machines grâce à une forme alternative de « compréhension ».

Il s'ensuit donc qu'un comportement intelligent nécessitant une compréhension humaine n'exige pas nécessairement un processus analogue chez les machines. La prétendue dépendance ou nécessité de la compréhension pourrait, dans nombreux cas, n'être qu'une illusion ou une diversion. Dans la pratique de l'ingénierie, aucun comportement intelligent n'a encore été réalisé en invoquant véritablement la compréhension. Autrement dit, les comportements qui semblent exiger la compréhension peuvent être réalisés sans elle. La compréhension est donc une aide utile, mais non un fondement indispensable. Bien que cette perspective n'avance pas elle-même notre connaissance de ce qu'est véritablement la compréhension, elle encourage une réflexion sur son importance relative. Il en va de même pour la traduction : la compréhension est précieuse, mais non essentielle.

En conclusion, la recherche sur la compréhension — en cherchant à percer son essence même — revêt une grande importance. Mais en attendant une telle avancée, les machines devraient poursuivre leur propre voie vers l'intelligence.
 

Shen Hongliang, Wang Xin et Luo Hui sont chercheurs à l'Institut sur la Recherche et l'Application de l'Intelligence de Princeton.

Edité par:Zhao Xin
  • Copyright © CSSN All Rights Reserved
  • Copyright © 2023 CSSN All Rights Reserved