Texte original
Signalons d'emblée que cette dictée extraite de Ceux de 14 (1950) de Maurice Genevoix fait 606 signes et correspond bien aux consignes données dans la note de service du 24 février 2012 marquée par un allongement de la dictée : "La maîtrise de la langue et de l'orthographe est évaluée [...] par la dictée d'un texte de 600 à 800 signes, de difficulté référencée aux attentes orthographiques des programmes."
Texte obtenu avec l'application de transcription
Observations et note obtenue sur 6
Une étude exhaustive mot à mot du texte obtenu par transcription serait nécessaire, mais les observations suivantes ont été d'emblée relevées :
- La fonctionnalité consistant à automatiquement ajouter la majuscule à chaque début de phrase a été utilisée. Cette dernière n'a pas fonctionné pour la majuscule initiale de l'extrait.
- La machine a tendance à écrire le mot "Sapo" avec majuscule plutôt que « sa peau ». C'est curieux : ce choix s'explique peut-être par une plus grande fréquence sur le net du mot « sapo » (le crapaud en espagnol) ou « Sapo », la marque déposée ou bien encore la structure de la Société Anonyme à Participation Ouvrière (SAPO), plutôt que le nom commun français précédé du possessif au féminin.
- Dans la 5ème phrase, la machine tombe dans le piège de l'homophonie et retranscrit « elle est fleur » plutôt que « elle effleure ». Comme dans le texte de Le Clézio l'année dernière ou celui de Kessel en 2014, la machine nous invite, par ses erreurs, à réinterroger le grain du texte, à envisager d'autres possibles, à prendre des chemin de traverses ... peut-être plus poétiques. Après tout, à quel nom commun renvoie le pronom personnel féminin qui ouvre la quatrième phrase ? N'est-il pas possible que ce soit la nuit, reprise du sujet de la deuxième phrase, plutôt que la boue ?
- Dans cette même phrase, et quelle que soit la façon de dicter le texte à la machine, la retranscription aboutit inévitablement à la faute d'accord « les marches solide ». L'application considère-t-elle « solide » comme un nom commun générique qui serait ici comme apposé au singulier ? Cela m'intrigue, d'autant que OK Google fait systématiquement la même faute. (voir ci-dessous).
- Plus loin, l'adjectif « hardi » avec un « h » et un « i » et non un « y » comme nous le verrons plus loin, n'est pas accordée au féminin avec le sujet. Quand on dicte à la tablette « elle est hardie », l'accord au féminin est correct. L'accord « se perd » en quelque sorte quand on ajoute un seul mot entre le sujet et l'attribut.
- La machine comme peut-être certains collégiens lors de cette dictée du Brevet fait la faute à « engloutis ».
- Dans l'avant-dernière phrase, une confusion s'opère entre les deux pronoms "on" et "elle".
- Enfin, dans la phrase finale, l'outil de transcription choisit selon moi la voie/voix du lyrisme et propose « cela est souffle » plutôt que « cela essouffle ». Est-ce totalement farfelu ?
Text to Speech bloc notes obtiendrait 3/6 à cette dictée si le correcteur ferme les yeux sur l'absence de virgule. N'a pas été retiré de point pour «
elle est fleur » car les surveillants-lecteurs avaient pour consigne d'écrire le mot "
effleure" au tableau. Il convient de rester équitable vis à vis de la machine.
Et si nous dictions cet extrait à une application de reconnaissance vocale ?
Après la lecture d'
un article du Huffington Post du 23 juin 2016 proposant sous la forme d'une vidéo de dicter ce texte de Genevoix au logiciel Siri, nous est venue l'idée d'en faire autant avec l'application de reconnaissance vocale OK Google proposée sous le système d'exploitation Androïd depuis fin 2014. Nous avons ainsi dicté le texte de l'épreuve phrase après phrase et force est de reconnaître que l'outil s'en tire plutôt bien.
Rappelons d'emblée que OK Google tout comme Siri ne sont pas à proprement parler des outils de transcription du discours oralisé (Speech to text) mais des assistants personnels "intelligents" fonctionnant avec la reconnaissance vocale pour aider l'utilisateur à effectuer des tâches multiples comme envoyer des messages, consulter un calendrier, interroger un carnet d'adresses ...
Lors de cette expérience, l'application n'a cessé d'interroger sa base de données et est irrémédiablement
tombée, surtout quand l'énoncé dépassait les 7 à 10 mots, sur le texte donné en dictée lors de l'épreuve du DNB 2016, examen national qui a donné en effet lieu à la mise en ligne d'un nombre important d'articles, de posts de blogs, de messages twitter ...
Ainsi, la première phrase, plutôt ordinaire, correctement orthographiée, renvoie à des sites généralistes sans lien avec la dictée du DNB
_____
Il n'en est plus de même avec la suite du texte de Genevoix. Quand on dicte à l'application "
La nuit vous entre dans les yeux.", le moteur renvoie en effet immédiatement au texte de la dictée de jeudi dernier, via le Huffington Post, Nice-Matin, Konbini.com, le Café Pédagogique ... :
_____
Il en va de même pour toute la suite du texte.
Même quand la transcription comporte des fautes de langue, elle renvoie néanmoins dans ses premières réponses au texte original :
_____
Plus drôle, l'application, tout en faisant remonter le texte original de Genevoix dans ses premières réponses, propose aussi des transcriptions qui versent parfois carrément dans l'écriture automatique. Ces dernières n'auraient certainement pas déplu aux surréalistes :
_____
Terminons l'expérience avec un exemple tout aussi étonnant que significatif du fonctionnement de cette application de reconnaissance vocale. Quand on lui dicte la 5ème phrase de la dictée, celle qui comprend l'adjectif "
hardie" au féminin, OK Google se trompe et écrit "Hardy" confondant l'adjectif et le patronyme de la célèbre chanteuse. Mais si l'on va plus loin et que l'on inspecte les résultats de la recherche, on tombe sur
cette page où le texte croise la dictée originale et sans faute du brevet avec un commentaire d'une internaute reprenant non sans humour le nom de famille de la célèbre chanteuse ...
_____
Ce dernier exemple nous rappelle combien le célèbre moteur de recherche et son application de reconnaissance vocale s'appuient bien davantage sur des algorithmes de calcul d'occurences rencontrées sur le net que sur la norme orthographique et grammaticale contruite par les dictionnaires, les lexicographes et les grammairiens.
Pour aller plus loin
La dictée à l'envers (récit d'une expérience avec une classe de 3ème)
La dictée à l'envers du DNB 2015
Les articles de Wikipedia consacrés à la
dictée et à la
cacographie.
Emmanuel VASLIN, interlocuteur académique pour le numérique (IAN) en Lettres