ALTICA Traductions - Votre agence de traduction technique en Isère, une entreprise responsable, réactive et fiable à proximité

Ensemble, communiquons plus loin The ultimate French translation
FrançaisAnglaisAllemandEspagnol

Actualités


Pourquoi j'ai mangé mon avocat !

Publiée le 20/02/2017
Traduction, expliquer nos compétences

Au cours de ces dernières années, la traduction automatique est devenue un outil très apprécié du grand public. Les moteurs de traduction (ancienne génération) sont des moteurs statistiques qui ne prennent pas en compte le contexte mais utilisent des textes dans plusieurs langues, qu’on appelle corpus.

Ce système ne repose pas sur les règles de grammaire mais extrait des modèles à partir de textes déjà existants, dans une ou plusieurs langues. Les corpus monolingues permettent d’extraire et d’enregistrer les tournures de phrases les plus courantes et naturelles. Les corpus plurilingues comprennent les versions d’un même texte dans différentes langues, permettant d’établir des correspondances entre les langues. Pour être efficace, un outil de traduction automatique statistique doit avoir au minimum un corpus monolingue de plus d’1 milliards de mots et un corpus plurilingue d’1 million de mots.

Les meilleurs résultats sont obtenus lorsque l’on souhaite traduire de l’anglais, du français, du chinois, de l’espagnol, de l’arabe et du russe. En effet, ce sont les langues dans lesquelles nous avons le plus de corpus disponibles, l’anglais servant souvent de langue « pont ». Par exemple si l’on souhaite traduire du russe vers du chinois mais si les corpus plurilingues des deux langues sont trop limités, on traduira le russe en anglais puis l’anglais en chinois.

Cependant l’utilisation d’une langue « pivot » implique généralement une perte d’information. Par exemple, l’anglais ne fait pas différence entre le tutoiement et le vouvoiement. C’est ainsi qu’une phrase comme « Vous rentrez chez vous » devient « You go back home » en anglais, puis « Du gehst nach Hause » (tu rentres chez toi) en allemand.

On perd alors une information importante car, en cas d’ambiguïté, le moteur de traduction appliquera la traduction la plus fréquente dans son corpus.

Cette question de fréquence pose également un problème. Le moteur étant incapable de gérer les règles de grammaire et de déterminer si un mot en est un ou non, si des rigolos s’amusent à traduire un bon nombre de fois le mot « ratatouille » par « rrrrrrr », cette traduction pourra être utilisée par le moteur.

Il est donc possible de « manger son avocat » car, pour savoir quel sens est utilisé dans une phrase, il faut prendre en compte le contexte. Mais le moteur de traduction statistique appliquera la traduction la plus fréquente dans le corpus.

Aujourd’hui, la plupart de ces incohérences commencent à être corrigées grâce à l’arrivée des modèles neuronaux. Ils reproduisent le fonctionnement d’un cerveau humain et peuvent ainsi prendre en compte le contexte d’une phrase et en analyser le sens.

C’est grâce à ces nouveaux modèles qu’un moteur de traduction est aujourd’hui capable de traduire l’expression « avoir du pain sur la planche » par « have some work to do », au lieu d’une traduction littérale telle qu’un moteur statistique fournirait « to have some bread on the board ».

Mais dès que l’on fait varier un peu le contexte, le moteur neuronal ne reconnaît plus l’expression figée :

Malgré des progrès technologiques considérables, les solutions de traductions automatiques restent donc bien moins performantes que la traduction humaine... mais c'est un sujet à suivre !