Infos

Rien pout l'instant.

 

Satisfaction

ActivAction est en perpétuelle recherche de nouveaux collaborateurs (traducteurs & interprètes), si vous désirez intégrer notre équipe, contactez Emilia en lui envoyant un email: assistant@activaction.fr

Vendredi 4 avril 2008

Le Pentagone expérimente au Moyen-Orient des logiciels de traduction vocale. Et IBM s'apprête à vendre des services en ligne.

Yuqing Gao n'en revient toujours pas de la belle histoire qui lui est arrivée. Cette chercheuse d'origine chinoise peaufine depuis des années ses algorithmes de reconnaissance vocale chez IBM. En 2001, elle participe à l'appel d'offres que l'industriel propose à ses scientifiques. Face à l'écrémage de cette compétition, dix lauréats sur des milliers de propositions, Yuqing Gao ne se fait pas d'illusions avec son projet de traducteur simultané. Pourtant, la proposition décroche le soutien d'IBM. L'industriel mise sur l'originalité de l'approche face à cette problématique complexe. Contrairement à la majorité des approches linguistiques des années 1990, les chercheurs privilégient désormais une méthode statistique. « Les linguistes ont essayé de modéliser toutes les règles des deux langages à traduire. Cette méthode s'est avérée beaucoup trop lourde et elle demande beaucoup d'experts du langage. Nous avons opté pour la corrélation de couples de phrases, c'est dix fois moins long à réaliser », explique-t-elle.

Cette technique n'a pu éclore que depuis quelques années, la capacité de calcul n'était pas suffisante auparavant.

Son projet profite alors d'un coup de pouce inattendu. L'agence de recherche militaire américaine Darpa entend parler du projet et propose de le financer. Le 11 septembre 2001 est passé par là, le Pentagone cherche un moyen de se faire comprendre au Moyen-Orient, où ses troupes sont engagées. IBM pensait travailler sur la traduction de l'anglais vers le mandarin, le marché le plus prometteur. Finalement, Yuqing Gao et son équipe voit l'arabe passer en tête des priorités... langue qu'elle se résout à apprendre.

La Darpa engage sur le sujet une compétition et sélectionne deux autres équipes dirigées par BBN et SRI International, chaque société s'appuyant sur des laboratoires universitaires. Les militaires déboursent 50 millions d'euros par an avec deux objectifs. A court terme, ils veulent évaluer sur le terrain l'état de l'art de la traduction. A l'horizon 2010, la Darpa fixe comme cap aux chercheurs d'atteindre un taux de traduction de 90 à 95 %. D'après les évaluations du National Institute of Standards and Technology, les meilleurs logiciels dépassent aujourd'hui 70 % de précision.

Quiproquos assez longs

Chez les militaires, la Darpa n'est pas la seule agence à s'intéresser. Le commandement des opérations spéciales Ussocom travaille, lui, en direct avec la société VoxTec. Elle a conçu des boîtiers spécifiques de traduction automatique qui sont déployés en Irak. Un logiciel de traduction fait appel à six composants pour franchir cette course d'obstacles périlleuse : le logiciel doit interpréter la voix et la transformer en texte, traduire la phrase obtenue et puis dicter le texte traduit. Dans chaque sens. Les chercheurs d'IBM ont enregistré la diction de centaines de personnes en anglais et en arabe. « Nous avons varié les âges des personnes ou les accents. Chacun était invité à lire des phrases rédigées ou à s'exprimer librement. Nous avons ensuite traduit toutes leurs paroles », explique Yuqing Gao. Aux cas litigieux de reconnaissance vocale, les chercheurs ont associé des contextes définis par des logiques mathématiques. « Ice cream » (glace) et « I scream » (je hurle) sont, par exemple, évoquées dans des phrases très différentes mais une traduction approximative peut provoquer des quiproquos assez longs, surtout dans l'ambiance tendue d'un check- point ou d'un interrogatoire.

« Notre traduction de l'arabe marche très bien, les militaires en sont satisfaits », assure Yuqing Gao. Le système comprend des centaines de milliers de phrases et 100.000 mots. Le logiciel a été installé dans des ordinateurs portables militarisés et équipés de micros. Un millier d'assistants personnels dotés du logiciel ont aussi été distribués en Irak. Mais il a fallu fortement alléger le logiciel pour l'adapter au manque de mémoire et de capacités de calcul de l'appareil. Sur ordinateur, la traduction est immédiate, mais sur PDA deux secondes de décalage sont encore nécessaires.

Résultats mitigés

Testé au laboratoire, le système est assez bluffant. Il n'est pas exempt d'erreurs, mais il sait en corriger certaines. S'il ne parvient pas à identifier un mot, en cas de mauvaise prononciation par exemple, il propose une alternative. Pour plus de fiabilité, le logiciel propose systématiquement deux traductions qui sont affichées en texte sur l'écran, en même temps qu'elles sont prononcées. Sur le terrain, les résultats sont plus mitigés. D'après des témoignages de soldats cités par le « Washington Post », les premiers appareils testés sur le terrain ne donnent pas satisfaction.

En parallèle à l'arabe, Yuqing Gao a bien avancé dans la traduction du couple anglais-mandarin, sa langue maternelle. D'autres langues très parlées comme l'espagnol ou le japonais sont prévues. Mais la prochaine traduction la plus attendue est le perse, demandée avec une suspecte insistance par le Pentagone. L'équipe d'IBM a déjà défriché le sujet à l'été dernier. La Darpa leur a proposé pour exercice de réaliser un traducteur élémentaire en trois mois, histoire de voir s'il est possible de concevoir rapidement un tel système en partant de zéro. L'exercice sera bientôt renouvelé mais la langue qui intéresse le plus le Pentagone reste un mystère. Une affaire à suivre, donc, sur le plan géopolitique.

Le système ne servira pas que les militaires, puisque IBM envisage de commercialiser prochainement cette technologie. Il ne sera pas disponible sous forme de logiciel, mais en tant que service. Le groupe discute avec des opérateurs de téléphonie mobile ou des services de téléphonie IP.


par ActivAction Europe publié dans : Actualité
ajouter un commentaire commentaires (0)    recommander
Retour à la page d'accueil

Calendrier

Août 2008
L M M J V S D
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
             
<< < > >>

Images aléatoires

Catégories

Blog : Santé sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur avec TF1 Network - Signaler un abus