Moteurs de recherche de bitextes/mémoires de traduction

Il existe sur le Web plusieurs sites intégrant un moteur de recherche de mémoires de traduction disponible gratuitement. Je vais vous présenter deux projets découverts récemment Translation Search Machine et MyMemory. Leur point commun : un puissant moteur de recherche de corpus de textes parallèles multilingues et de mémoires de traduction.

Translation Search Machine (ou TSM), outil en ligne de Tele.Translator.Network, propose de sélectionner simplement la langue source et la langue cible et de lancer la recherche comme dans un moteur de recherche classique. Vous accédez alors à une page de résultats avec les segments sources et les segments cibles. Vous pouvez choisir d’accéder à l’affichage en parallèle du texte source et du texte cible. Les utilisateurs enregistrés de TTN peuvent sélectionner leur domaine de recherche.

L’ambition de ce projet est énorme puisqu’il recense déjà au moins 20 millions d’unités de traduction et prévoit pour 2008 de recenser environ 60 % des pages traduites sur le Web. Il faut noter que de nombreux résultats en français proviennent de sites canadiens. Le résultat est cependant un peu décevant même s’il permet de trouver quelques traductions intéressantes. En effet, il n’est pas possible de recherche des termes composés, une limite majeure pour un projet de ce type. Même s’il est indiqué dans l’aide que cette recherche est possible, elle ne fonctionne pas (ou mal). De plus, certains textes sont référencés mais ne sont pas traduits.

MyMemory est également un moteur de recherche de mémoires de traduction qui semble plus complet. Il fonctionne de la même manière à la différence que vous ne pouvez sélectionner que la langue cible. Les résultats se présentent en affichage parallèle, les segments sources à gauche et les segments cibles à droite.

Le projet est également ambitieux puisqu’il prétend recenser 100 millions d’unités de traduction en 2008. Leur moteur de recherche exploite le contenu multilingue disponible sur le Web. De plus, il est possible de créer une mémoire de traduction à partir d’un fichier, de l’exporter ou de l’importer sur leur moteur. Il dispose donc d’une caractéristique intéressante puisqu’il s’agit d’une plateforme collaborative. Il est possible d’évaluer la qualité d’un segment si vous êtes enregistré.

Ce moteur permet de rechercher des termes composés mais il faut savoir que l’affichage des caractères spéciaux est très mal pris en charge.

Si vous voulez consulter un exemple de résultats pour une recherche, cliquez ici.

Ces sites Web sont très intéressants puisqu’ils permettent de rechercher de la terminologie plus facilement et plus rapidement qu’avec les moteurs de recherche traditionnels. Ils méritent encore quelques améliorations mais ils sont à mon avis très prometteurs et sont un excellent complément aux dictionnaires multilingues puisqu’ils fournissent également le contexte lors de votre recherche.

N.B. : je viens de trouver un nouveau site Internet de la même catégorie que les sites cités dans cet article. Si vous êtes intéressés, il s’appelle Linear B.

The following two tabs change content below.
Nicolas Gouyette is a freelance translator and reviser providing linguistic services, mainly English into French translation, for International Organizations and NGOs.

Latest posts by Nicolas Gouyette (see all)