Dans le monde actuel, plus de 7000 langues différentes coexistent. Pourtant, Internet nous réunit dans un espace virtuel sur lequel nous interagissons. Ce petit miracle n’aurait pas été possible sans les progrès monumentaux réalisés par les services de traductions en ligne proposés par Google et certains de ses rivaux.
Dans une étude passionnante, des chercheurs d’Amazon Web Services et de l’université de Californie se sont penchés sur les traductions en ligne. Les auteurs estiment que malgré les énormes avancées réalisées, de nombreuses traductions laissent encore à désirer.
Pour y voir plus clair, les scientifiques ont passé au crible près de 6 milliards de phrases traduites dans au moins deux langues. L’idée était d’évaluer la qualité. Concrètement, plus l’expression est traduite et plus sa qualité laisse à désirer.
Sans surprise, certaines langues, qui ne sont pas très répandues, s’en tirent assez mal, notamment des dialectes africains. Les chercheurs expliquent ces mauvais résultats par le manque de données. En effet, les modèles de langage ont besoin d’une quantité suffisante pour fonctionner correctement, et ce n’est pas le cas pour certaines langues.
De grossières erreurs qui font tâche
C’est un vrai souci, car cela signifie que les nouvelles IA telles que ChatGPT et ses rivaux risquent d’avoir du mal à fonctionner correctement pour certaines langues si les traductions ne son pas à la hauteur.
Dans certains cas, les mauvaises traductions peuvent d’ailleurs poser de gros problèmes. Nos confrères de Digital Information World citent ainsi un exemple de conseils médicaux destinés à des Arméniens où prendre de l’ibuprofène pour soulager la douleur devient prendre un “missile antichar pour soulager la douleur”.
D’autres exemples ont émaillé l’actualité récente. On se souvient notamment que dans le cadre du conflit entre Israël et le Hamas, la fonction de traduction d’Instagram ajoutait de manière automatique le mot “terroriste” à des biographies comportant le mot “palestinien”.
Ce bug a été rapidement corrigé, et Meta s’est dans la foulée fendu d’un message d’excuse par le biais d’un porte-parole : “Nous avons corrigé un problème qui a brièvement provoqué des traductions imprécises de l’arabe dans certains de nos produits”. Le groupe de Mark Zuckerberg n’a en revanche pas expliqué l’origine de ce bug très gênant.
Il illustre en tout cas les lacunes de ces outils de traduction. S’ils s’avèrent très utiles en faisant tomber la barrière de la langue, ils doivent encore être perfectionnés pour éviter de telles bévues.
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Le sous-titre « De grossières erreurs qui font tâche » !!!!!!
C’était vraiment la phrase et l’article où faire une faute !
Bravo Presse-Citron !
(Pour info, tache et tâche ne signifient pas la même chose)
J’allais le dire !
Faute ridicule qui apparaît partout, même sur des sites d’informations sérieux.
Et je ne parle pas des formules à la mode dont on nous abreuve en permanence. Dernière en date : “documenté”, anglicisme qui remplace “analysé”, “étudié”, “précisé”, etc.
On pourrait écrire un article sur le sujet !
Bonjour,
Si je peux me permettre, puisque vous faites un article sur les erreurs de traduction, cela aurait été bien de vous relire avant de publier des fautes de français :
Extraits de votre article : “De grossières erreurs qui font tâche (faute de grammaire : “Tache” ne prend pas d’accent lorsque cela désigne une salissure. Tâche = travail à exécuter)
“C’est un vrai souci, car cela signifie que les nouvelles IA telles que ChatGPT et ses rivaux risquent d’avoir du mal à fonctionner correctement pour certaines langues si les traductions ne SON pas à la hauteur.”=> (SONT, ce serait mieux non ?)