Un gant n’est pas un interprète (et inversement)

Publié le 10 mai 2016 par Stéphan @interpretelsf

Si j’avais le talent de Jean de Lafontaine, j’écrirais ce billet sous forme d’une fable qui raconterait l’histoire de ce gant, qui se prit pour un interprète pouvant traduire des langues des signes et qui à la fin se dégonfla comme une baudruche, les créateurs de ce gant « traducteur » s’apercevant (et les journalistes avec eux) qu’ils s’étaient fourrés encore une fois le doigt (ganté) dans l’oeil.

En effet, depuis quelques jours réapparait l’invention qui doit bouleverser le monde de l’interprétation en langue des signes et celui de la communication entre sourds et entendants : deux étudiants de l’université de Washington, Thomas Pryor et Navid Azodi, ont inventé SignAloud, des gants capables de traduire la langue des signes américaine (ASL) en un discours oral, dixit de nombreux sites d’informations grand public ou technologiques.
Chaque gant comporte des capteurs sur les doigts et les poignets qui enregistrent la position des mains et les mouvements qui correspondent aux mots et phrases dans la langue des signes américaine. Ces données sont envoyées en Bluetooth à un ordinateur qui les étudie à l’aide d’un algorithme séquentiel qui fonctionne à la manière d’un réseau neuronal (je dois admettre que j’ai fait un copié-collé de ce passage car je n’ai pas tout compris).
Si les données correspondent à un geste, le mot associé (ou la phrase) est énoncé en anglais via le haut-parleur.

Bien qu’à l’état de prototype, ces gants permettraient d’exprimer des messages simple en une langue ultra simple qui ressemble cependant plus à de « l’américain signé » (les signes sont plaqués sur la syntaxe la langue anglaise orale) qu’à l’ASL (American Sign Language).

Sans juger de la réelle qualité de ces gants, on peut néanmoins affirmer que la communication autour de ce projet a été très efficace car un peu partout dans le monde, des journalistes relayés par les réseaux sociaux, ont proclamé : « ils ont inventés des gants qui traduisent la langue des signes » (BFMTV par exemple).

Une remarque d’abord. Ce n’est pas le premier essai et cette « invention » n’a rien de révolutionnaire. En 2012 déjà, des ukrainiens avaient été récompensés pour une invention semblable comme le racontait le site SooCurious avec déjà la même accroche : « Des étudiants inventent des gants capable d’opaliser le langage des signes » (inutile de revenir sur l’appellation erronée de langage des signes à la place de langue des signes).

Ensuite on notera que ce sont toujours des étudiants ingénieurs (en informatique, en génie mécanique…) qui sont à l’origine de ces créations. Jamais dans leurs équipes il n’y a de linguistes, de sourds ou d’interprètes capables leur expliquer la structure, le fonctionnement bref le génie de ces langues gestuelles (qui ne sont pas des langages tel que le langage informatique mais bien des langues) et pourquoi nous somme loin d’une solution gantée permettant de « traduire » d’une langue des signes vers une langue orale.
Les journalistes non plus ne sont pas très curieux : jamais ils n’interrogent ces mêmes linguistes, sourds ou interprètes sur la validité de ces projets.

Personnellement, je doute que prochainement ce système pourra traduire fidèlement et agréablement un long discours.
En effet les langues des signes sont vivantes, complexes. Elles ne sont pas qu’une succession de signes. Elles possèdent leur propre syntaxe qui est intimement liée à la perception visuelle, puisque cette langue répond à une logique visuelle et non auditive. Ainsi la grammaire de la langue des signes française (LSF) n’est pas identique à celle du français (par exemple la place des mots dans la phrase n’est pas la même). Elle se construit comme un plan au cinéma. D’abord le temps (passé-présent-futur), ensuite le lieu (où cela se passe-t-il ? ), puis les acteurs (qui ? ) et enfin l’action (le verbe).

Les discours énoncés sont basés sur l’utilisation des signes donc des mains mais aussi du regard et de l’espace, des expressions du visage (il est admis que les langues des signes sont composées de 5 paramètres) : les configurations des mains, leurs emplacements, leurs orientations et leurs mouvements forment des signes équivalents à des mots disposés devant soi comme sur une scène de théâtre. Les emplacements de ces signes, ainsi que la direction du regard, permettent de visualiser les relations (actif ou passif), le temps (signes tournés vers l’arrière pour le passé, vers l’avant pour le futur). Le visage et le mouvement des épaules servent aussi à exprimer les nuances du discours, les émotions par exemple l’ironie, le doute, la colère…

Ces gants et leurs capteurs auront-ils la précision et la finesse nécessaires pour détecter tous ces paramètres ? Les algorithmes seront-ils assez élaborés pour déterminer avec exactitude l’intention du locuteur ? Aujourd’hui non, demain pas sur, un jour… sans doute.
Au mieux, actuellement, ce système pourrait traduire quelques signes simples en mots, quelques phrases basiques (sujet/verbe/complément).
De là à proclamer que des gants peuvent traduire la ou les langues des signes il y a un gouffre (car bien sur comme chaque pays ou région possède sa propre langue des signes, il faudra aussi multiplier les programmes informatiques et autres algorithmes pour prendre en compte cette diversité).

Enfin qui voudrait porter ces vilains gants pour se rendre chez son boulanger et acheter une baguette en langue des signes avec traduction par une voix synthétique (je ne parle même pas d’aller boire un dernier verre dans un bar). 
Sans être un adepte du « c’était mieux avant » et refuser toute idée de progrès on peut remarquer que la technique habituelle de la phrase écrite sur un bout de papier reste très efficace et que le mime ou le pointage conservent leur charme. Bref, les sourds n’ont pas attendu ces gants pour être autonomes et communiquer dans des situations simples de la vie de tous les jours. 

Ces gants ne sont qu’un exemple parmi les nombreuse tentatives pour accéder à la compréhension de la langue des signes sans passer par l’effort de l’apprendre.
D’autres systèmes sont censés traduire comme celui utilisant Kinect (de Microsoft) avec une caméra de reconnaissance interactive branchée sur la console Xbox 360 et qui reconnait puis traduit les signes.
En enregistrant puis en normalisant les mouvements de la langue des signes, le système utilise un algorithme pour déterminer l’alignement du mouvement de la trajectoire 3D. Une fois que la machine a assimilé les données visuelles, elle essaye de les faire correspondre aux mots qu’elle connaît par ordre de pertinence via son dictionnaire interne. A l’inverse, le système peut aussi traduire les textes sous la forme d’avatars signeurs qui apparaissent à l’écran. Cette invention date de juillet 2013 mais depuis la parution de quelques articles, plus de nouvelle. 

Face à ces nombreuses tentatives toujours infructueuses, il est bon cependant de rappeler qu’il existe aujourd’hui dans le monde un système de traduction qui fonctionne bien et qui s’appelle « interprète en langue des signes ». Malheureusement – en France notamment – cette profession peine à se développer, faute de budget nécessaire d’abord pour la formation de ces futurs professionnels puis pour leur assurer une rémunération descente. 

Il ne faudrait pas que ces beaux projets high-tech nous fassent oublier que le Ministère de la Justice paye péniblement 30€ brut l’heure d’interprétation dans un tribunal, que la CAF dans certaines régions refuse de faire appel à des interprètes F-LSF pour des raisons budgétaires, qu’en mairie, pour se marier et comprendre les articles du Code civil (ardus à traduire), c’est le sourd qui devra souvent payer de sa poche la prestation d’interprétation. Et ces gants n’y changeront rien.

Aussi, avant de se pâmer devant de futurs et hypothétiques progrès technologiques (qui adviendront sans doute dans quelques années ou décennies) intéressons-nous davantage (et vous aussi les journalistes) aux carences de la société française en matière d’accessibilité et n’oublions pas le présent en encourageant la communication entre sourds et entendants grâce à la présence d’interprètes diplômés et justement payés c’est à dire un peu plus que les 1300€ que touchera en moyenne un interprète F-LSF débutant après 5 années d’études. 

.

© Stéphan – ( i ) LSF