Apprenez une nouvelle langue et traduisez le Web simultanément!

C'est enfin l'été! Vous préparez votre voyage à l'étranger: billets d'avion, réservations, trousse de toilette, vaccins exotiques et un petit guide linguistique qui vous aidera à communiquer lors de votre périple. Connaître la langue locale serait beaucoup plus pratique, mais le processus d'apprentissage demande de l'investissement, autant monétaire que temporel.

Coïcidence heureuse, un nouveau site Web est devenu disponible au grand public depuis le 19 juin dernier: Duolingo. Il s'agit d'un service gratuit, conçu par le créateur de reCaptcha [1], qui a la très étonnante caractéristique d'utiliser l'enseignement de langues secondes afin de traduire le Web! En effet, Duolingo est un site qui utilise pleinement les possibilités de la participation massive sur la Toile afin de rendre le Web compréhensible pour tous.

Cet ambitieux projet propose à l'utilisateur de traduire des phrases allant du niveau débutant jusqu'au niveau avancé, par écrit ou à l'oral (avec l'aide d'un programme de reconnaissance vocale intégré). La différence est que les phrases affichées ne sont pas créées à des fins pédagogiques, mais sont tirées de sites tels que Wikipédia et The New York Times. Les phrases traduites sont donc d'actualité et peuvent par la suite nourrir d'autres versions linguistiques de leur site d'origine. L'avantage est aussi dans le nombre: des centaines de milliers de personnes utilisent Duolingo [2], et par conséquent des centaines de milliers de personnes traduisent le Web tout en apprenant un nouveau langage.

L'interrogation qui nous vient à l'esprit concerne la pertinence et la qualité des traductions ainsi produites. Pour chaque phrase soumise aux utilisateurs, les agents intelligents du site font la moyenne des différentes traductions; la version qui revient le plus fréquemment est considérée comme étant la bonne. Bien entendu, des filtres grammaticaux, orthographiques et linguistiques entrent en jeu, de même qu'une révision humaine. Et comme tout site utilisant des agents intelligents, il est à prévoir que la méthode de sélection des traductions se raffinera au fil du temps.

De plus, l'interface et la méthode d'enseignement de Duolingo sont simples, claires et ludiques. L'utilisateur amasse des points pour changer de leçon ou de niveau et peut comparer ses traductions à celles des autres. Il est également possible de faire traduire son propre site.

Un des buts avoués du fondateur est de traduire la totalité de la version anglaise de Wikipédia [3] dans le plus de langues possibles. Il estime que si cent mille personnes utilisent Duolingo pour apprendre l'espagnol, il faudra cinq semaines pour traduire la totalité de Wikipédia de l'anglais vers l'espagnol, et seulement quatre-vingts heures si ce nombre monte à un million de personnes. Ce qui équivaut monétairement à un projet de 50 000 000 $.

Les langues disponibles pour l'apprentissage sont pour l'instant le français, l'espagnol et l'allemand. Éventuellement, il sera aussi possible d'apprendre le portugais, le chinois et l'arabe. L'interface est actuellement offerte en anglais et en espagnos, mais d'autres langues suivront.

 

[1] reCaptcha est le programme de reconnaissance d'utilisateurs humains le plus connu qui utilise le «crowdsourcing» afin de numériser l'ensemble des livres de la bibliothèque Google.

[2] 300 000 personnes avaient fait une demande pour participer à la version beta privée à la fin de 2011.

[3] La version anglaise de l'encyclopédie en ligne est celle qui contient le plus d'articles, soit près de 4 millions. La deuxième langue la plus utilisée est l'allemand, avec près de 1 300 000 articles, bien loin derrière la langue de Shakespeare.

 

Pour en savoir plus, voir la conférence du fondateur Luis von Ahn à propos de reCaptcha et Duolingo, prononcée lors des TED Talks:

von Ahn, Luis. 2011. Massive-Scale Online Collaboration. En ligne: http://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration.html (consulté le 21 juin 2012).