• Aucun résultat trouvé

5. RÉSULTATS DES EXPÉRIENCES

5.4 Erreurs dans les textes produits et erreurs de reconnaissance lors des

5.4.4 Erreurs et problèmes de reconnaissance lors des Tests 2 et 3

5.4.4.2 Erreurs de reconnaissance avec les participants italophones et

Le Tableau 16, ci-dessous, récapitule les erreurs qui ont eu lieu au cours de la RV avec les participants italophones.

204 Puisqu'il s'agissait de la première fois que les participants francophones utilisaient ce logiciel.

Sujet IT 1 Sujet IT 2 Sujet IT 3 Sujet IT 4 Sujet IT 5 Sujet IT 6 Moyenne groupe mixte

Moyenne des trois sujets IT

Utilisa-teur

12 24 2 11 13 5 11,1 10

Matériel 1 3 11 6 1 14 6 5,3

Retrans-cription

2 3 0 1 1 3 1,6 2

Causes multiples

5 20 10 2 6 8 8,5 6,3

Total 20 50 23 20 21 30 27,3 23,6

Tableau 16. Erreurs de reconnaissance avec les italophones et les traducteurs italophones lors du Test 2.

Comme exposé dans le Tableau 16, il s'est produit plus d'erreurs lors de la reconnaissance vocale avec le participant italophone 2 qui possédait l'accent le plus marqué du groupe mixte.

Les autres italophones ont pour leur part rencontré des nombres d'erreurs très proches lors de la RV, bien que le sujet IT 6 ait totalisé légèrement plus d'erreurs que les sujets IT 1, 3, 4 et 5.

Cet écart peut principalement s'expliquer par le fait que le sujet IT 6 a rencontré de nombreux problème dus au micro qu'elle a utilisé lors de ce test, comme nous le verrons plus loin.

La plupart des erreurs dues aux utilisateurs ont été entraînées par des prononciations erronées ou portant à confusion, résultant de l'accent italien des participants. Il s'est produit moins d'erreurs dues (entièrement ou en partie205) aux accents des sujets IT 3, 4 et 6, qui ont donc été ceux dont les accents étaient les plus compréhensibles pour Dragon NS lors de ce test.

Comme nous pouvons le voir dans le Tableau 16, tous les participants italophones ont rencontré de nombreux problèmes dus à la position ou à des bugs des différents microphones qu'ils ont utilisés lors des expériences (ainsi que quelques rares ralentissements de la reconnaissance et bugs Dragon206). Cependant, les sujets IT 1 et 5 semblent avoir utilisé un

205 Certaines erreurs de prononciation sont regroupées en catégories « causes multiples » puisque l'accent des utilisateurs couplé aux problèmes de microphone qu'ils ont rencontrés ont entraîné plusieurs erreurs.

206 Puisqu’ils y avaient plusieurs casques équipés de microphones en salle informatiques et que certains fonctionnent mieux que d'autres. De plus, nous n'avons pas pu effectuer toutes les expériences le même jour avec les mêmes casques bien qu'il s'agissait toujours des mêmes marques et modèles et que nous cherchions toujours à utiliser les casques disponibles qui fonctionnaient le mieux.

microphone qui fonctionnait légèrement mieux que ceux des autres participants italophones207 et mieux l'avoir positionné puisque leur souffle a moins affecté la reconnaissance contrairement aux sujets IT 2, 3, 4 et 6208.

Les quelques erreurs de retranscription qui ont eu lieu avec les participants italophones, ont principalement été des erreurs de majuscule manquante. Il y a également eu quelques confusions liées aux homophones et aux commandes parmi ces erreurs. Il semblerait par ailleurs, que les statistiques de Dragon NS (qui s'adaptent au cours de la dictée pour mieux reconnaître la dictée de l'utilisateur) aient entraîné des erreurs avec les sujets IT 2 et 6. En effet, à certaines occasions ces deux sujets ont eu des prononciations correctes ou quasiment identiques à celles de natifs et Dragon a écrit un mot différent de celui qui avait été dicté209. Il est possible que les prononciations erronées ou portant à confusion que ces deux sujets ont utilisées précédemment dans leur texte et durant la création de leur profil utilisateur aient provoqué ces erreurs.

Enfin, la plupart des erreurs entraînées par des causes multiples ont été dues à l'accent italien des participants italophones et à des bugs ou problèmes de position du microphone qu'ils utilisaient.

Grâce à l'examen de ces erreurs, nous avons pu voir que certaines mêmes prononciations des participants ont été mal interprétées par Dragon NS à plusieurs reprises (du fait de l'accent italien de ces derniers)210. Par exemple, les « de » du Sujet IT 2 ont souvent été retranscrits par des « des »211, bien que cela n'est pas été le cas à chaque fois grâce aux efforts de prononciations de ce participant, ainsi qu'à l'usage de l'empreinte vocale sur Dragon NS, même sans entraînement212. Ainsi, malgré les difficultés potentielles que présentaient le

207 Ces deux participants ont utilisé le même casque muni d'un microphone lors des expériences avec la RV sur système non spécialisé puisqu'ils ont passé le Test 1 et 2 au même créneau horaire.

208 Qui, à cause des problèmes de reconnaissance dus aux microphones utilisés ou à leur accent, ont souvent trop approché leur bouche du micro ou trop soufflé leur prononciation en essayant de la rendre plus claire pour le système.

209 Ainsi, « au sein de votre entreprise » est retranscrit par « au cent de votre entreprise » avec le Sujet IT 2, malgré le fait que sa prononciation de « sein » dénasalisée soit similaire à celle d'un locuteur natif du sud de la France, par exemple.

210 Puisque le corpus que nous avons créé était spécialement conçu pour regrouper des prononciations potentiellement problématiques pour ces locuteurs.

211 Voir Annexe 16, Tableau récapitulatif des erreurs lors de la reconnaissance vocale sur système non spécialisé avec les participants italophones.

212 Car comme nous l'avons vu en Section 3.1, la simple création d'un profil utilisateur (empreinte vocale) sur Dragon NS permet au logiciel de reconnaître l'utilisateur en utilisant un texte de référence (voir Figure 7, Section 3.1). Ainsi, la création du profil contenant des prononciations « accentuées » de certains mots de ce texte de référence permettra potentiellement d'éviter de futures erreurs lorsque l'utilisateur les emploiera. De

corpus, la plupart des participants sont parvenus à avoir des prononciations correctes afin d'être mieux reconnus par le système (par exemple : lorsque le Sujet IT 2 a répété « arrivé » en faisant un effort de prononciation « Tu es arrivé à Haïti ? » a été retranscrit correctement).

Et, quand ils n'y parvenaient pas, la correction des erreurs pendant la dictée (grâce aux répétitions des passages mal retranscrits) a permis de limiter la reproduction d'erreurs identiques, même sans spécialisation du système.

5.4.4.3 Erreurs de reconnaissance avec les traducteurs italophones