Traduction automatique : quand l’utiliser (ou non)

L’homme contre la machine

Les réseaux de neurones et l’apprentissage profond ont transformé l’industrie de la traduction. Dans le monde entier les entreprises exploitent la puissance de l’IA avec des outils de traduction automatique qui permettent de réduire les coûts et de traduire de gros volumes de texte plus rapidement que jamais.

Mais lorsqu’il s’agit de certains types de traduction, il est possible que la traduction automatique ne soit pas suffisante. Voici un guide complet qui met en détail les avantages et les inconvénients des outils de traduction automatique et lorsqu’il est préférable d’utiliser un traducteur humain.

 

Qu’est-ce que la traduction automatique (TA)

Il existe actuellement deux principaux types de traduction automatique : la traduction automatique statistique (SMT) et la plus récente traduction automatique neuronale (NMT).

SMT et NMT s’appuient sur des sources de données parallèles : des textes qui ont été écrits et traduits par de vraies personnes dans deux langues différentes, qui peuvent ensuite être comparés côte à côte (appelés « corpus » en linguistique).

SMT analyse ces textes et associe des mots et des expressions équivalents, tandis que NMT « apprend » à l’aide d’un système de réseaux de neurones artificiel. Ce système basé sur l’IA associe non seulement des mots à des concepts tels que le type (verbe, nom…) et même le registre (formel, argot…), mais se met également à jour en fonction des corrections des utilisateurs.

 

Le contexte est roi

En tant que traducteurs professionnels, nous utilisons souvent des traductions précédentes et même des ressources en ligne gratuites comme Linguee pour nous inspirer lorsque nous jouons avec une phrase particulière. Pourquoi? Nous pouvons voir comment divers termes ont été traduits dans des contextes similaires et exercer notre propre jugement sur ce qui conviendra le mieux.

L’utilisation de textes parallèles et de l’apprentissage en profondeur a changé la donne pour la traduction automatique. Même des outils gratuits comme Google Translate ont commencé à produire des traductions plus fluides et « à consonance humaine », tandis que des solutions payantes comme SDL et Microsoft Translator ont révolutionné la traduction pour les entreprises. En conséquence, il y a eu une augmentation notable du nombre d’entreprises utilisant la traduction automatique neuronale au cours des dernières années.

 

Les avantages pour les entreprises

Le principal avantage de l’utilisation de la traduction automatique neuronale est qu’elle est rapide. Une fois que vous avez formé un système neuronal, il peut produire de gros volumes de traductions avec un ton de voix naturel beaucoup plus rapidement qu’un traducteur humain.

Bien que des traducteurs professionnels soient toujours tenus d’éditer les traductions (un processus connu sous le nom de « post-édition »), NMT garantit la cohérence et augmente la productivité, tout en réduisant les coûts.

Cela semble imbattable, non ? Pour les tâches simples, NMT peut être la meilleure solution. Mais il y a encore de multiples défis à soulever même pour les solutions les plus sophistiquées et quelques écueils majeurs à éviter…

 

Les limites de la traduction automatique

L’apprentissage en profondeur a permis à la traduction automatique de traduire des phrases de manière plus intelligente. Mais comme l’explique le scientifique cognitif Douglas Hofstadter dans son article « The Shallowness of Google Translate », il s’agit encore de décoder des phrases plutôt que de les comprendre.

Pourquoi est-ce important ? Parce que les langues sont plus qu’un simple ensemble de modèles et de règles linguistiques. Elles sont régies par les conventions sociales et le contexte culturel.

 

Le problème des pronoms

En français, au-delà de la relation adulte-enfant, il peut être difficile pour les locuteurs non natifs de savoir quand utiliser « tu » ou « vous ». Ce n’est pas aussi simple que la famille et les amis par rapport aux étrangers ou aux relations professionnelles. Certains de nos clients dans les médias et la publicité commencent tout de suite à utiliser le tu informel (même si nous ne nous sommes jamais rencontrés).

En grec, un homme dans la quarantaine pourrait utiliser en plaisantant l’informel « εσί » ( esi ) au lieu de « εσείς » ( eseis ) lors d’une rencontre avec quelqu’un de plus jeune, mais la personne plus jeune répondra toujours en utilisant le « εσείς », sinon cela semblerait étrange et même irrespectueux.

En tant que traducteurs, nous nous appuyons à la fois sur notre connaissance des langues et sur nos interactions avec les personnes qui les parlent. Il ne suffit pas de savoir qu’une langue a deux formes de « vous ». Vous devez avoir une idée du moment et de l’endroit où les utiliser en fonction de la situation, ce qui rend impossible la prédiction des moteurs NMT. Si vous vous trompez, vous risquez de causer beaucoup de faux pas.

 

Idiome

En ce qui concerne la traduction des expressions idiomatiques, les outils de traduction automatique doivent toujours s’appuyer sur des traductions existantes. Si vous le tapez l’expression française « poser un lapin à quelqu’un » dans Google Translate, vous obtiendrez la bonne traduction en anglais (« to stand someone up »). Mais c’est uniquement parce qu’il a été corrigé manuellement par les utilisateurs. Le système lui-même n’a aucun moyen de saisir le sens global, il n’a donc pas pu proposer lui-même cette traduction.

Une traduction automatique peut sembler grammaticalement correcte, mais ce n’est pas une garantie d’exactitude. L’expression grecque « μου κάθεται στο στομάχι » se traduira littéralement par « il est assis sur mon ventre », mais cela signifie en fait que vous ne supportez pas quelqu’un (ou que quelque chose vous donne une indigestion).

 

Blagues et jeux de mots

C’est particulièrement délicat si la phrase est un jeu de mots (essayez de traduire « Êtes-vous ravis au lit ? d’une publicité pour Panzani, ou « J’y suis, thé [t’es] ou ? d’une pub pour Monoprix et vous verrez). NMT ne peut que prédire l’ordre probable des mots. Il ne peut pas délibérément jouer avec pour un effet créatif ou capturer le double sens.

 

Sous-titres : tout est dans le timing

Le contexte culturel et les idiomes ne sont que quelques-uns des nombreux défis auxquels la traduction automatique est confrontée en matière de traduction audiovisuelle. Le sous-titrage, en particulier, nécessite bien plus qu’une simple mise en correspondance ou un apprentissage à partir d’un contenu déjà traduit.

  • Timing : il existe des directives strictes sur la vitesse de lecture et la durée pendant laquelle les sous-titres doivent apparaître à l’écran. Cela signifie que la traduction doit être condensée et reformulée afin que le public puisse suivre ce qui se passe sans avoir à lire chaque mot.
  • Enfreindre les règles : vous ne pouvez pas toujours suivre les directives de manière absolue. Les sous-titres ne sont pas censés apparaître sur les changements de plan ou les changements de scène, par exemple, mais les changements de plan sont parfois impossibles à éviter en fonction de la façon dont le film a été monté.
  • Adaptation : les jeux de mots et les références culturelles doivent être remplacés par quelque chose de familier pour le public cible pour préserver l’effet t (par exemple, nous avons dû trouver un équivalent américain à une émission de télévision canadienne-française obscure appelée Grujot et Délicat).
  • Signification non verbale : les sous-titreurs dépendent fortement de ce que font les locuteurs à l’écran (réactions, expressions faciales, langage corporel, ton de voix, rythme, etc.). Vous devez être capable de capturer toutes ces informations pour obtenir le bon sens. (Quand les francophones disent que quelque chose est « terrible », veulent-ils dire que c’est « horrible » ou « génial » ?)

Il appartient au sous-titreur individuel de trouver des moyens créatifs de traduire le matériel en respectant toutes ces contraintes.

 

Que se passe-t-il quand ça va mal

Même lorsqu’il s’agit de traduire le sens de base, l’outil NMT ne s’en rapproche même pas. Nous avons dû complètement réécrire même la traduction automatique la plus fluide parce que les sous-titres – qui auraient bien pu fonctionner dans un contexte différent – n’avaient absolument rien à voir avec ce qui se disait à l’écran.

Le recours au « sous-titrage assisté par machine » est un problème répandu, comme le montre cet article sur le Festival du cinéma américain de Deauville . Les sous-titres français étaient criblés de traductions mot à mot maladroites, d’erreurs de traduction et d’un mélange incohérent de pronoms formels et informels, grâce aux dernières « solutions de pointe ».

Malheureusement, cela n’a pas empêché les fournisseurs de services linguistiques de se tourner vers la traduction automatique pour le contenu audiovisuel et de réduire leurs tarifs (et leurs normes) en conséquence. Le syndicat suédois des sous-titreurs Medietextarna a récemment mis sur liste noire une société appelée lyuno pour avoir fait exactement cela.

 

La touche humaine

Cependant la plupart des entreprises ont des attentes plus réalistes quant à ce que la traduction automatique peut faire.

Une enquête récente de l’UE a montré que les PME européennes ont tendance à utiliser la traduction automatique à des fins d’information uniquement (comme pour comprendre les sites Web et les réseaux sociaux). La plupart choisissent encore de travailler avec des traducteurs professionnels pour leurs activités principales (ventes, marketing, contrats, négociation, etc.).

Seules des traductions effectuées par un humain garantissent que le style sera précis et exact.

 

A qui faites-vous confiance ?

Vous pensez peut-être que les traductions automatiques sont impartiales et sont donc plus fiables que les traducteurs individuels. Mais ce n’est pas nécessairement le cas.

Prenez des enregistrements audio, par exemple. Ce que quelqu’un dit peut prendre des significations très différentes hors de son contexte. De la même manière que le sous-titrage, le manque d’informations visuelles et de contexte pose un problème pour la traduction automatique.

Les avocats ont souvent besoin de faire traduire des conversations enregistrées afin qu’elles puissent être utilisées comme preuve. La traduction finale doit non seulement être fidèle à la transcription originale, mais doit également être approuvée par la partie adverse.

Dans cette situation, vous avez besoin de linguistes experts qui peuvent discuter et justifier de la façon dont ils ont traduit le matériel et interprété sa signification.

 

Éviter les biais

Un autre problème avec la technologie de l’IA en général est le parti pris.

Il a été démontré que les algorithmes reflètent les préjugés et les stéréotypes qui existent dans la société et en ligne. Les images générées automatiquement d’Alexandria Ocasio-Cortez en bikini n’en sont qu’un des nombreux exemples.

Mais ce ne sont pas seulement les algorithmes de recherche et de saisie semi-automatique qui font des hypothèses biaisées sur nos identités. Il a également été démontré que la traduction automatique hérite des préjugés des sources de données qui y sont introduites.

L’équipe derrière Google Translate a trouvé quelques solutions de base pour éviter les concepts sexués, y compris des options féminines et masculines pour les traductions du turc vers l’anglais (« Il est médecin »/ »Elle est médecin », etc.).

Mais il existe toujours un risque que les traductions générées automatiquement contiennent un langage injurieux ou biaisé, surtout si elles s’appuient sur des sources de données inconnues (textes parallèles compilés par le fournisseur de solutions ou trouvés en ligne).

À une époque où les marques sont de plus en plus conscientes des préjugés inconscients et du besoin de diversité et d’inclusivité dans leurs communications, les spécialistes du marketing ne peuvent pas se permettre d’utiliser des traductions automatiques qui s’appuient sur des sources de données obsolètes ou biaisées.

 

Une question de style

Enfin, les traductions automatiques sont généralement dépourvues de style. La cohérence du ton est garantie mais vous n’obtenez pas un ton de voix unique. Il est laborieux (et donc coûteux) de former des moteurs NMT pour apprendre le style spécifique d’une publication ou d’une marque. Bien que des efforts aient été faits pour développer des moteurs personnalisés pour les entreprises (voir les dernières solutions de Microsoft), les résultats sont encore inférieurs au travail produit par un traducteur professionnel.

 

L’avenir de la traduction

Bien que de plus en plus sophistiquée, la traduction automatique n’a pas remplacé les traducteurs. Mais elle a eu un impact profond sur notre travail.

Katie, notre fondatrice, a suivi l’évolution de l’industrie de traduction : « L’une des tendances que j’ai remarquées depuis mes débuts en 2011 est la diversification. Les traducteurs se diversifient de plus en plus dans des domaines comme l’écriture et d’autres professions créatives qui sont peut-être plus valorisés que la traduction et moins touchés par l’automatisation. »

Les clients recherchent également activement des traductions qui s’éloignent davantage de l’original « afin que cela ne ressemble pas à Google Translate ». Cela ne signifie pas qu’ils s’attendaient à une traduction mot à mot absurde. Cela signifie qu’ils veulent quelque chose de plus que le type de traduction de base que vous obtenez avec NMT et la post-édition. Ils veulent quelque chose d’original qui ajoute de la valeur et de l’authenticité pour le public cible.

La nature de notre travail change. C’est plus difficile, mais c’est une meilleure utilisation de nos compétences. Libérés des contraintes d’un travail de traduction répétitif, nous avons plus de liberté pour jouer avec le style et proposer de nouvelles solutions linguistiques et créatives.

Étant donné que les systèmes d’aujourd’hui continuent de s’appuyer fortement sur des textes et des traductions générés par l’homme, il est clair que les traducteurs professionnels auront toujours une longueur d’avance.