Au cours des dernières années, la traduction automatique (TA) a beaucoup contribué à augmenter l’efficacité et à réduire le coût des processus de traduction. Un tel essor a aussi fait ressortir le rôle crucial que jouent les traductrices professionnelles dans ce processus.
La plupart des traductrices exploitent des outils de traduction assistée par ordinateur (TAO) afin d’améliorer l’exécution des projets de traduction. Ces outils de TAO offrent notamment l’avantage de permettre la création de mémoires de traduction, c’est-à-dire des bases de données propres à chaque client où sont conservées les unités de traduction (par exemple, des « segments » contenant une phrase en anglais et sa correspondance en français). À chaque nouvelle demande de traduction de ce client, les outils de TAO évaluent la « correspondance » entre son contenu et celui des mémoires de traduction. Les segments déjà traduits dans une demande précédente (et, donc, en mémoire) sont alors automatiquement réinsérés dans la nouvelle demande.
C’est en pourcentage qu’on mesure la correspondance entre un segment (p. ex., une phrase) et le contenu de la mémoire de traduction. Ainsi, pour une phrase qui se retrouve entièrement traduite en mémoire de traduction, on parle d’une correspondance à 100 % (ou correspondance parfaite). Le travail de la traductrice se borne alors à relire la phrase et à s’assurer qu’elle est correcte en contexte. Il peut aussi y avoir en mémoire des traductions qui ressemblent beaucoup au nouveau contenu sans être parfaitement identiques. On parle alors de « correspondances floues » et le pourcentage (de 75 % à 99 %) reflète le degré de similitude. Les phrases dont le taux de correspondance est inférieur à 75 % sont généralement considérées comme du nouveau contenu, étant donné le volume de modifications à faire. Par exemple, les phrases à 0 % n’ont jamais été traduites auparavant; la traductrice doit les traduire entièrement, tandis que celles à 90 % ne nécessitent que des changements mineurs à la traduction déjà en mémoire. Avec le temps, les mémoires de traduction d’un client donné s’enrichissent et permettent à la fois de réduire les coûts et d’assurer l’uniformité des communications, surtout lorsque le contenu des divers documents se ressemble ou lorsqu’un même document est remis à jour périodiquement.
La traduction automatique neuronale (TAN) complète à merveille, dans bien des cas, les outils de TAO. Cette technologie d’intelligence artificielle intervient là où la mémoire de traduction ne donne pas de résultats satisfaisants (p. ex., pour les correspondances inférieures à 75 %). Elle requiert à la base un ensemble volumineux de textes déjà bien traduits, appelé « corpus », et des méthodes d’apprentissage profond permettant d’analyser le contenu et de composer une traduction. Pour le contenu non spécialisé, les « moteurs » de TAN généralistes donnent souvent de bons résultats. Toutefois, si le contenu concerne un domaine spécialisé, il vaut mieux « entraîner » un moteur pour chaque combinaison de langues. Cet entraînement initial repose généralement sur un corpus générique de traductions humaines dans le domaine en question, auquel on peut greffer le contenu du client (sa mémoire de traduction généralement). Pour que le moteur de TAN donne de bons résultats, il faut que le corpus d’entraînement soit très volumineux et comprenne des traductions de bonne qualité, ce qui explique pourquoi la TAN n’est pas appropriée à certaines paires de langues à l’heure actuelle. Il est d’ailleurs possible d’améliorer cet entraînement initial au fil de l’utilisation du moteur. Le travail consiste alors à prétraduire automatiquement le contenu, à le faire réviser par des traductrices professionnelles, puis à retourner les corrections dans le corpus afin d’améliorer la qualité future des résultats. Il s’agit d’une opération qui peut s’avérer longue et coûteuse.
Ajoutons enfin que même un moteur de TAN bien entraîné ne garantit ni l’exactitude ni la fluidité des traductions. En ce sens, la traduction automatique neuronale ne saurait se substituer à l’intervention humaine, c’est-à-dire à des révisions et à des retraductions (selon le cas) par des traductrices professionnelles.
L’exactitude et la fluidité de la traduction automatique dépendent de plusieurs facteurs. Outre la qualité du corpus d’entraînement, la qualité du contenu à traduire (la source) vient en tête de liste. À ce titre, les textes simples, clairs et sans ambiguïtés conviennent très bien. C’est aussi le cas du matériel rédigé d’après un guide de style, des glossaires ou des lexiques, ou encore un langage limité (controlled language).
Les moteurs de TAN généralistes fonctionnent bien avec du contenu général comme des textes administratifs. En règle générale, plus le contenu est spécialisé, plus le moteur de TAN doit être entraîné pour une industrie ou un client donné si l’on veut obtenir des résultats satisfaisants. Les contenus ayant trait à l’informatique (sauf les interfaces utilisateur), aux services juridiques et aux télécommunications semblent également donner les meilleurs résultats.
En ce qui concerne les langues ciblées, une étude publiée par Intent.to en juillet 2020 montre que la plupart des moteurs de TAN donnent de bons résultats en anglais, en espagnol, en français, en chinois et en russe, mais qu’il y a encore du chemin à faire pour le finnois et le japonais, notamment.
Voici quelques questions qui vous aideront à déterminer s’il vaut mieux utiliser la TAN dans un projet donné :
Y a-t-il beaucoup de contenu à traduire en peu de temps? Si vous avez des millions de mots à faire traduire dans des délais extrêmement serrés, la TAN vous aidera.
Le contenu est-il répétitif? Les manuels techniques, les descriptions de produit et la documentation de logiciels sont propices à la TAN. Les magazines ne le sont pas du tout!
Le contenu est-il pérenne ou éphémère? Les commentaires des clients, les courriels, les bases de connaissances et les foires aux questions font l’objet de mises à jour fréquentes. De plus, personne ne s’attend à ce que ce genre de contenu soit rédigé dans une langue irréprochable. C’est également souvent le cas du contenu dont la diffusion se limite au personnel à l’interne.
Dans tous ces cas, la traduction automatique peut constituer une solution économique et efficace.
Même les meilleurs moteurs de traduction automatique neuronale n’arrivent pas à la cheville de la traduction professionnelle humaine quand il s’agit de rassurer ou de convaincre le lecteur. Il faut donc les éviter en traduction de matériel publicitaire, de sites web et de tout autre contenu destiné à la clientèle et qui requiert à la fois une expertise particulière et une grande maîtrise de la langue cible. Dans tous les cas, il ne faut jamais considérer le résultat d’une traduction automatique comme un produit fini. L’intervention d’une traductrice professionnelle demeure toujours nécessaire. Il arrive même que du contenu complexe traité par un moteur de TAN donne de si mauvais résultats que la traductrice estimera préférable de retraduire la totalité du texte.
La traduction automatique améliore nettement la plupart des processus de traduction. Mais, elle ne les remplace pas : elle s’insère plutôt entre la préparation du projet et la traduction ou la révision du contenu par une professionnelle.
Pour Google, les traductions automatiques non retouchées par des humains sont catégorisées comme du contenu autogénéré, ce qui nuit au classement du site en question. Cependant, la traduction « en temps réel » d’un site web au moyen d’un gadget à l’écran ou de la fonction « Traduire cette page » n’entraîne aucune pénalité, car le classement du site n’est établi que pour le contenu en anglais. Pour que votre site web intègre les classements dans une autre langue, il faut créer un domaine, un sous-domaine ou un sous-répertoire dans cette langue et y insérer du contenu traduit ou révisé par une vraie personne.
Si vous envisagez l’utilisation de la TAN, consultez un cabinet de traduction qui connaît cette technologie et pourra vous guider dans le choix du contenu et du moteur de traduction automatique.
D’une certaine façon, la TAN représente l’évolution naturelle des outils de traduction assistée par ordinateur que nous utilisons depuis une quinzaine d’années. Une évolution qui arrive à point, compte tenu de la croissance exponentielle du contenu à traduire. Il ne faut toutefois pas perdre de vue que la TAN nécessite presque toujours l’intervention subséquente d’une professionnelle. En fait, si la traduction automatique augmente considérablement la capacité de traitement, elle met aussi en exergue la valeur ajoutée d’une traductrice professionnelle : cette expertise linguistique qui permet de juger d’une traduction et d’en faire une communication fluide, objectivement et subjectivement adaptée au lectorat cible. Aucun moteur de traduction automatique neuronale ne remplace ça.