La reconnaissance vocale est-elle formatrice ? Par Stéphane Diebold

Share |

La reconnaissance vocale, ou « reconnaissance automatique de la parole », a fait des efforts considérables en l'espace de 5 ou 10 ans. Il s’agit d’une technique qui associe l'enregistrement de la voix à sa transcription écrite. Cela ouvre de nombreuses perspectives dans un monde qui place l'orthographe comme une valeur essentielle du socle des connaissances de base. La technologie ouvre des opportunités à saisir. Encore faut-il comprendre le phénomène. Qu'est-ce qui va changer avec la démocratisation de la reconnaissance vocale ?

L'ordinateur, grâce à un logiciel adapté, est capable de reconnaître la voix de l'homme. Le taux de reconnaissance est de 95 % à 98 %. Les publicités des logiciels insistent particulièrement sur ces taux qui frisent le record. Mais, elles parlent peu des taux d’erreur, de moins de 10 % pour les textes lus et beaucoup plus pour les conversations, de 30 à 70 %, suivant qu’il s’agisse de personnes qui se connaissent ou non. Plus on se connait, moins on fait d’efforts. Il n’existe pas que la reconnaissance, mais aussi la bonne reconnaissance… Enfin, nous n'allons pas chipoter notre plaisir, la reconnaissance vocale a atteint des niveaux particulièrement élevés. De plus, l'initialisation du logiciel est de plus en plus facile : en 3 ou 4 minutes de lecture de texte la chose faite. Et la machine fait le reste… Elle s'entraîne à lire, s’il y a acceptation de la part de l’individu, les mots qu’il a utilisé dans tout ce qu’il a déjà écrit, la mémoire de l’ordinateur. On parle de reconnaissance vocale apprenante au sens où elle apprend de nos écrits. Qu'est-ce que cela change concrètement ?

La première conséquence est que l'écrit sera de moins en moins un élément discriminant pour évaluer un individu. Le correcteur d'orthographe avait déjà favorisé le bien écrire, encore fallait-il savoir écrire, là, il s'agit simplement de savoir parler. Comment ne pas penser aux analphabètes ou aux illettrés qui face à leur difficulté d'écrire trouveraient une solution à des prix défiant toute concurrence. Des outils de reconnaissance vocale sont accessibles à des prix inférieur à 40 € pour Dragon Naturally Speaking par exemple. L'illettrisme pourrait être combattu avec seulement 40 € ?

Mais allons plus loin, si on enregistre une conférence, la reconnaissance vocale permet la transcription par écrit. D'ailleurs, avec le cloud, les Smartphones sont de plus en plus capables d'utiliser des logiciels de reconnaissance vocale pour la retranscrire en direct par écrit. La reconnaissance vocale ouvre voie au rich média et à la démocratisation de son utilisation.

L'usage de la reconnaissance sociale s'inscrit dans un phénomène beaucoup plus large, celui de la machine qui enrichit l'homme. C'est le mythe du cyborg. La reconnaissance vocale peut-être conjuguée à la lecture optique où l'ordinateur est capable de déchiffrer ce qui est écrit. Écrire, lire peuvent être pris en charge par la machine. Reste toutefois la reconnaissance du sens qui n’est pas encore totalement maîtrisé par la machine. Si la machine comprend l'homme, que reste-t-il à l'homme, surtout quand on voit qu'il comprend de moins en moins la machine ?


A propos de l’auteur :

Stéphane Diébold a mis son expérience au service de l’innovation pédagogique et de la performance en entreprise, au sein de TEMNA (www.temna.fr) dont il est le fondateur depuis 2003. Associatif, il a assumé des responsabilités dans une dizaine d’association, essentiellement formatives, aujourd’hui Vice-président du GARF (Groupement des acteurs et responsables formation) et de l’ETDF (European traning and development federation – Fédération européenne pour la formation et le développement.

à lire également

Dans la même rubrique

RECHERCHER UNE FORMATION

AEC logo


Recherche guidée thématique

Recherche par thème :