Nous y voici : vous avez préparé une vidéo qui présente votre entreprise ou votre produit, lance une campagne publicitaire, ou encore s’intègre dans un programme de formation du personnel. Cette vidéo comprend des voix hors champ ou incarnées. Maintenant, il vous la faut en plusieurs langues. Voici les grandes étapes du processus de traduction multilingue de narrations vidéo :
En gros, la transcription d’une vidéo consiste à produire un scénario écrit identique à ce qui est dit dans la vidéo. S’il s’agit d’une opération assez simple, il en va autrement de la traduction. Pour obtenir un scénario en langues étrangères qui soit de qualité professionnelle, faites appel à un cabinet de services linguistiques qui maîtrise l’ensemble du processus de narration vidéo multilingue. Au sein de ce cabinet, la personne responsable du projet choisira des traducteurs qui répondent à deux critères : une bonne connaissance du domaine concerné et une grande maîtrise de la traduction dans la langue visée. Ainsi le scénario pourra-t-il être parfaitement adapté à votre auditoire cible. S’il s’agit d’une vidéo promotionnelle, il faudra probablement faire intervenir un traducteur marketing, spécialiste de l’adaptation publicitaire (ou transcréation), afin de rendre le contenu aussi inspirant et convaincant que dans la langue d’origine.
La transcription de la vidéo devrait comporter des codes chronologiques. Ces codes constituent des repères utiles notamment quand il faut plus de mots pour exprimer une idée dans une autre langue. Ce phénomène, appelé « foisonnement », peut grossir de 50 % le nombre de mots nécessaires dans certaines langues. Les codes chronologiques servent alors à repérer les endroits où le narrateur manquera de temps pour dire tout ce qui doit être dit. Le cas échéant, le traducteur pourra condenser les expressions afin de corriger la situation, sans compromettre le message. Les codes chronologiques sont également très importants au moment de l’enregistrement des voix.
Si vous avez fait vous-même la transcription de la vidéo, mais n’avez pas inscrit les codes chronologiques, votre partenaire pourra remédier à la situation.
La prochaine étape devrait, en fait, commencer dès le début de l’étape 1.
Le recours à des voix humaines a longtemps été la seule façon de produire des narrations multilingues. Ces dernières années ont vu l’émergence de solutions moins coûteuses basées sur des technologies de synthèse texte-parole (text-to-speech, ou TTS). Avant de choisir entre une voix humaine et la TTS, posez-vous les questions suivantes :
La vidéo cherche-t-elle à susciter des émotions?
Si votre objectif consiste à convaincre d’acheter un produit, à faire aimer une marque, à promouvoir la loyauté des employés ou à engager l’auditoire dans une cause, la TTS et sa voix quelque peu « robotique » ne vous aideront pas. Même si la technologie s’est améliorée, le résultat fait encore grincer des dents bon nombre de personnes.
De nos jours, et par la force des choses en temps de pandémie, les rencontres en personne et les visites en magasin ont beaucoup diminué, au profit de vidéos consultées à distance. Ce qui n’a pas changé toutefois, c’est le facteur « émotions » dans la transmission des messages.
La vidéo a-t-elle pour but de former ou d’informer?
La TTS convient mieux aux vidéos qui servent simplement à former ou à informer. Certains de nos clients y ont recours pour la formation de leurs employés, a fortiori si cette formation est exigée des autorités de réglementation.
Que vous optiez pour des voix humaines ou en TTS, vous devrez préciser l’âge, le sexe, le ton et la personnalité que vous recherchez. Ces paramètres permettront à votre partenaire de proposer plusieurs échantillons de voix conformes à vos attentes.
Certaines langues sont associées à des cultures que vous connaissez peu. Il est tout à fait possible qu’une voix dans une culture ne suscite pas les mêmes émotions dans une autre. Dans le doute, votre partenaire pourra vous recommander celles qui ont le plus de chances de produire l’effet escompté. Les projets que nous avons menés ont souvent démontré que la façon d’exprimer des concepts peut varier sensiblement d’une culture à une autre. Par exemple, la traduction en 12 langues d’une application du domaine de la santé nous a permis de comprendre que les gens de certaines cultures préfèrent les voix masculines tandis que ceux d’autres cultures préfèrent les voix féminines.
Ce n’est pas tout : il faut aussi tenir compte des variations régionales. Ainsi, une vidéo destinée au Québec sera reçue très différemment selon que la voix hors champ parle le français canadien ou le français parisien. Il en va de même des voix britanniques comparativement aux voix américaines. L’importance des variations régionales dépendra surtout de l’image de marque que l’on veut véhiculer et de la fonction de la vidéo dans le marché cible.
Consultez les personnes qui, parmi vos connaissances et vos employés, connaissent bien la culture en cause. Au besoin, consultez également votre partenaire. S’il s’agit d’un cabinet de professionnels, il saura certainement vous aider.
Ce n’est qu’une fois la transcription, la traduction et le choix des voix terminés que l’on peut passer à l’enregistrement.
Enregistrement de voix humaines
Pour produire un enregistrement de qualité, il faut disposer d’un équipement professionnel (microphone, casque, logiciel d’enregistrement et de montage) et d’un endroit adéquatement isolé des bruits ambiants. Tout enregistrement audio nécessite du montage postproduction, mais l’endroit où cet enregistrement a lieu peut dépendre du type de vidéo et de votre budget. S’il s’agit d’enregistrer une publicité télévisuelle, vous devez disposer de moyens suffisants pour réserver l’emplacement et le personnel d’un studio d’enregistrement professionnel. Dans d’autres contextes, il suffira d’embaucher un narrateur à la pige doté d’un studio à la maison et d’outils de montage qu’il maîtrise.
Dans tous les cas, fournissez aux narrateurs choisis des directives quant à la prononciation de certains termes spécialisés, des noms de marque et des noms de produit. C’est donc dire que vous devez au préalable déterminer comment votre marque et vos produits seront prononcés en langues étrangères.
Enfin, le narrateur devra s’assurer que l’enregistrement est conforme aux codes chronologiques du scénario. Nous l’avons dit plus haut, une telle synchronisation n’est pas toujours simple compte tenu du foisonnement. Malgré tous les efforts déployés par le traducteur et le gestionnaire de projet afin de réduire la longueur du texte, des difficultés peuvent persister. Le narrateur choisira alors de moduler son débit de voix en vue de bien synchroniser l’audio et la vidéo. S’il n’y parvient pas, il pourra aussi exiger des modifications au scénario.
L’enregistrement de la voix est une étape qui demande beaucoup plus de temps que la durée réelle de la vidéo. En pratique, le narrateur enregistre à de nombreuses reprises les extraits jusqu’à ce que lui-même ou son technicien soit satisfait du débit, de la fluidité, du ton et de la durée de chacun de ces extraits. Par la suite, le technicien élimine de la piste audio les sons superflus (bruits respiratoires et autres).
Production de voix par TTS (synthèse texte-parole)
Si vous avez opté pour des enregistrements TTS, il faut annoter et adapter le scénario avant de générer la piste audio. Cette tâche est cruciale, notamment si la vidéo comporte des termes spécialisés, des noms de marque ou des noms de produit. Le spécialiste de la localisation s’accompagnera d’un traducteur afin de tester diverses prononciations, jusqu’à ce qu’ils trouvent la bonne. En TTS, le foisonnement demeure également un facteur nécessitant des modifications à la traduction ou un changement de débit. En bref, si la TTS s’est améliorée au fil des ans, elle continue de nécessiter l’intervention de traducteurs et de spécialistes de la localisation.
En tant que client, vous devez préciser dans quel format de fichier vous souhaitez obtenir la vidéo traduite. Aurez-vous besoin du fichier audio seulement, ou d’une vidéo prête à la publication? Y a-t-il d’autres spécifications techniques à observer? Discutez-en avec les producteurs de la vidéo et avec les personnes qui utiliseront la vidéo une fois traduite. Le format MP3 (et ses variations) est le plus répandu. Il s’agit d’un format comprimé qui suffit dans la plupart des cas, même s’il entraîne des pertes sonores.
Après vous avoir livré le produit final, votre partenaire de services linguistiques devrait conserver les fichiers originaux non comprimés (WAV, AIFF, SDII, etc.) en cas de modifications subséquentes. De telles modifications seront apportées dans les fichiers d’origine plutôt que dans les fichiers comprimés afin de ne pas compromettre la qualité audio. Dans certains cas, comme le changement du volume ou du débit sonore, ou encore l’ajout d’effets particuliers, il n’est pas nécessaire d’enregistrer les voix à nouveau.
Une fois la narration enregistrée et ajoutée à la vidéo, le produit final devrait être revu par une personne qui connaît la langue étrangère concernée, afin de s’assurer que la synchronisation fonctionne. Votre partenaire de services linguistiques peut aussi vous aider à cette étape.
La narration vidéo est une opération qui n’est pas simple et qui coûte cher. Voilà pourquoi vous devriez faire appel à un cabinet de services linguistiques qui s’y connaît en la matière. Dans le présent article, nous avons volontairement omis d’autres aspects de la traduction de vidéo, comme la traduction du texte affiché à l’écran, l’ajout de sous-titres et le remplacement des images qui ne conviennent pas dans certaines cultures. Pour obtenir l’effet escompté de vos vidéos multilingues, ne laissez rien au hasard.