Archive for the ‘Natural Language Processing’ Category

Traduction instantanée : le défi de la DARPA

Monday, January 29th, 2007

30 milliards de dollars, c’est le montant que la DARPA (Defense Advanced Research Projects Agency) a décidé de dépenser sur les 5 prochaines années pour être capable de traduire instantanément en anglais l’ensemble des sources d’informations disponibles (Web, TV, radio, dialogues…). Les compagnies à se partager le gâteau sont IBM, BBN technologies et SRI International accompagnées de grandes universités américaines.

GALE (Global Autonomous Language Exploitation), c’est le nom du projet, a pour objectif de traduire pour 2010 les langues étrangères avec une précision de 90 à 95 %. Le taux de précision du projet est aujourd’hui de 65 à 75 %.

La tâche est ardue car dans toutes les sources d’informations, il y a d’abord beaucoup de « bruits » (bruit de fond pour l’audio, images et design pour le web…), auxquelles s’ajoutent les dialectes, l’argot et les nouvelles tournures de phrases et de mots (le langage du web). De plus beaucoup de langues ne sont pas structurées comme l’anglais (Arabe, Mandarin…). Enfin l’analyse se fait sur des sources pour la plupart non structurées, c’est-à-dire n’ayant pas de forme particulière définie au préalable.

Le défi est grand mais les progrès sont pour le moment au rendez-vous. A l’horizon 2020, il ne sera normalement plus du tout utile de maîtriser une langue étrangère, alors pour les enfants qui commencent aujourd’hui leur cursus scolaire, ne vous fatiguez pas trop !

Source : CNN