IM2 | OQP

2007/08/04

Mathématiques, traductions, recommandations

Filed under: Français, communication, computer, french, traduction Robin @ 12:00 (2068 lectures)

UPDATE : j’ai ajouté un autre google tech talk qui parle spécifiquement de l’analyse du langage naturel.

Mathieu parle de Lire dans son dernier billet et j’allais hi-jacker la conversation quand j’ai cru plus sage de faire ça ici. J’essaie de répondre à sa question ” Quand on va avoir de la traduction automatique qui marche pour vrai (et à grande échelle), là on va avoir du fun! ”

Je fais une comparaison avec une présentation que j’ai écouté hier sur le calcul par intervals. Comme vous le savez, un ordinateur travaille avec une limite de précision mathématique, soit des nombres entiers ou à virgule flottante. Depuis 40 ans, nos chips calculent de plus en plus rapidement, mais jamais ils nous donnent une évaluation de l’erreur, parce qu’un résultat, c’est un point, un nombre unique. Le calcul par intervals de son côté prend des intervals en entrée et génère un interal en sortie. L’interval est délimité par les nombres les plus précis que l’architecture peut générer exactement (par exemple, 0,1 ne peut être exprimé exactement en binaire, mais 0,125 l’est).

Ainsi, le calcul par intervals permet d’obtenir les bons résultats sans craindre les overflow, divisions par 0, etc. Faut écouter la présentation pour bien comprendre, je ne suis pas assez familié avec le domaine pour faire un meilleur résumé. Ce qu’il faut surtout retenir, c’est qu’au lieu d’une réponse unique, on obtient une infinité de résultats dans un interval précis et l’assurance qu’on a la bonne réponse ainsi qu’un degré de précision explicite. Avec les calculs à virgule flottante, la seule réponse obtenue ne nous renseigne aucunement sur sa qualité. Plus les calculs sont rapides, plus on va obtenir d’erreurs.

Pour revenir à la traduction, les outils disponibles généralement offrent une seule réponse sans information quant à la précision obtenue. C’est le même problème selon moi. Ce qu’il nous manque, qui va de pair avec la compréhension du texte (qui n’est pas à la portée de nos ordinateurs… le bon sens, c’est pas évident à coder !), c’est cet interval de réponses. Quand notre interlocuteur nous parle, on peut en échapper des bouts et à ce moment précis, on conserve tout le contexte. Un peu plus loin dans la discussion, ce contexte nous revient et nous sommes en mesure de comprendre ce qui nous échappait plus tôt. L’important, c’est le contexte (l’interval). Si on ne conserve qu’une seule interprétation et que c’est la mauvaise, on n’est pas bien avancé. Et parfois, les phrases ont réellement un double sens qui ne pourra pas être traduit d’une seule phrase : il nous faudra générer (traduire) en deux phrases pour reprendre le sens original. Et si c’était de l’humour ou quelque chose d’aussi subtil, générer deux phrases au lieu d’un seul jeu de mot, c’est n’est plus très drôle.

En conclusion, traduire automatiquement, ce n’est vraiment pas pour demain. Un bon livre sur le sujet de mon auteur favori, Douglas Hofstadter, directeur du département de science cognitive de l’université d’Indiana, s’intitule ” Le ton beau de Marot ” (c’est en anglais). Je vous le recommande.

Note : au lieu des traductions automatiques, ont voit de plus en plus de jeux comme le ESP game (maintenant le Google Image Labeler) pour identifier des images et reCAPTCHA qui sert à la fois à identifier les humains et à terminer des projets de reconnaissance optique de caractères difficiles. Quelque chose dans ce sens pour la traduction serait un pas dans la bonne direction, tant qu’on conserve toutes les traductions et qu’on en fasse usage.

Incremental Bayesian Networks for Natural Language Parsing, the 1h video:

2 Comments »

  1. Antoine, dans sa réflexion de geek Au sujet de la traduction automatique, parle du “moi” et de la conscience, le sujet exploré dans le dernier livre d’Hosftadter, “I am a strange loop”. On semble être pas mal sur la même longueur d’onde.

    Comment by Robin — 2007/08/14 @ 20:16

  2. Lire…

    Dany Lafferrière, à Radio-Canada ce matin (je paraphrase, qu’il me pardonne s’il ne l’a pas dit comme ça) : “Il faut lire aussi des livres qu’on n’a pas envie de lire. C’est comme ça qu’on élargit son horizon, qu’on découvre du nouveau….

    Trackback by mat@koumbit — 2007/08/14 @ 22:36

RSS feed for comments on this post. TrackBack URI

Leave a comment

Powered by WordPress