• Aucun résultat trouvé

5.0 - Introduction

Ce chapitre est consacré à la présentation des résultats des analyses statistiques effectuées à partir des résultats des données de l’évaluation de la prononciation au niveau segmental, le degré de l’accent étranger et l’intelligibilité. Ces analyses ont permis de vérifier si G1 et G2 se distinguent au niveau de nos trois variables et de déterminer lequel a obtenu de meilleurs résultats par rapport au GC. Nous commencerons par la présentation des résultats de la prononciation des sons (5.1). Les sections 5.2 et 5.3 seront dédiées à la présentation des résultats du degré de l’AE et de l’intelligibilité respectivement. Enfin, nous terminerons ce chapitre en regroupant les constats qui se dégagent des résultats (5.4).

5.1 - Au niveau des sons

Dans la première phase du test, les participants ont identifié des mots à partir d’images. Ces mots comportaient des sons jugés problématiques pour les francophones apprenants l’ALS. L’objectif de notre recherche était de vérifier la prononciation de quatre sons (/h/, /θ/, /ɑ/ suivi par /r/ et /ɑ/ non suivi par /r/). Dans notre test nous avons présenté cinq autres sons qui constituaient des distracteurs. Les sons étaient les suivants :

son 1 : son /i/ (sheep) son 2 : son /ŋ/ (king) son 3 : son /r/ (rain) son 4 : son /ʊ/ (cookie) son 5 : son /ɪ/ (lips)

Nous avons remarqué, lors d’une analyse préliminaire, que les participants des groupes G1 et G2 ont obtenu des résultats différents de ceux du GC, non seulement au niveau des quatre sons cibles de l’étude, mais aussi au niveau des cinq sons distracteurs qui étaient censés être non problématiques. Cette remarque nous a menée à effectuer des analyses statistiques individuelles pour les neuf sons.

5.1.1 - Accord inter-juge

Nous avons commencé nos analyses en nous assurant de la présence d’une cohérence inter- juge. À cet effet, un test de Shrout et Fleiss avec les 7 autres tests a été appliqué. L’indice ICC (inter class correlation) de Shrout-Fleiss était égal à 0.72914, ce qui signifie une bonne cohérence inter-juge.

5.1.2 - Résultats individuels des sons 5.1.2.1 - Son 1 : /i/

Nous présentons ici les résultats de la prononciation du son /i/ présent dans le mot "sheep" selon une échelle de Likert. Nous n’avons pas trouvé une différence significative entre les groupes à en juger par la statistique de Kruskall-Wallis (χ2 = 0.7937, dl =2, p < 0.6724). Le tableau IV montre qu’avec les comparaisons multiples, il n’y avait aucune différence entre les trois groupes. Avec un score de 4.53 pour G1, 4.55 pour G2 et 4.66 pour GC (annexe K); G1 et G2 ont réussi à avoir une prononciation similaire du son /i/, et semblable à celle du GC.

Tableau IV Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /i/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 0.7416 1.0487 0.7387

G1(4ans) vs. GC -0.1478 0.2090 0.9880

G2(6ans) vs. GC -0.8354 1.1814 0.6810 *Une valeur de p inférieure à 0.05 est significative

5.1.2.2 - Son 2 : /ŋ/

Concernant la prononciation du son /ŋ/ présent dans le mot "king", les résultats de l’approche non paramétrique du test de Kruskall-Wallis (χ2 = 9.6445, dl = 2, p < 0.0080) nous montrent qu’il y a une différence significative entre les trois groupes. Comme présentées dans le tableau V, les comparaisons multiples de Dwass, Steel et Critchlow-Fligner (DSCF) ont permis de situer cette différence et de faire des comparaisons. Comme résultat, nous avons

trouvé qu’il n’y avait pas de différence entre GC et G1 (4 ans), alors que G2 (6 ans) diffère de GC et de G1.

Tableau V Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /ŋ/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 2.0850 2.9487 0.0929

G1(4ans) vs. GC -1.5807 2.2355 0.2540

G2(6ans) vs. GC -2.8339 4.0077 *0.0128 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous trouvons que les résultats de GC (4.76) et de G1 (4.51) sont proches alors que G2 se trouve en deuxième place avec une moyenne de 4.05 sur 5. Ces résultats signifient que les résultats de prononciation du son 2 de GC et de G1 sont comparables. Ils sont présentés dans la figure 1 où nous pouvons voir que le score moyen de G2 au niveau du son /ŋ/ est plus faible que celui de GC et de G1.

Figure 1. Score moyen des résultats des jugements de la production de /ŋ/

5.1.2.3 - Son 3 : /r/

Pour les résultats de la prononciation du son /r/ présentée dans le mot "rain", la statistique de Kruskall-Wallis (χ2=5.4002, dl=2, p<0.0672) n’a révélé aucune différence. Aussi, les

0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

comparaisons multiples de DSCF, présentées dans le tableau VI, nous ont indiqué qu’il n’y avait pas de différence.

Tableau VI Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /r/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 2.1454 3.0340 0.0809

G1(4ans) vs. GC -0.0747 0.1057 0.9969

G2(6ans) vs. GC -1.7140 2.4239 0.1999 *Une valeur de p inférieure à 0.05 est significative

Cela signifie que les deux groupes expérimentaux G1 et G2 ont réussi à obtenir un score au niveau de la prononciation du son /r/ proche de celui du groupe contrôle. Ce rapprochement est présenté dans la figure 2, où les moyennes des trois groupes sont proches.

Figure 2 Score moyen des résultats des jugements de la production de /r/

5.1.2.4 - Son 4 : /ʊ/

Pour les résultats de la prononciation du son /ʊ/ présentée dans le mot "cookie", il y avait une différence significative entre les groupes à en juger par l’application de la statistique de Kruskall-Wallis (χ2=13.0194, dl=2, p<0.0015). Présentées dans le tableau VII, les comparaisons multiples de DSCF ont indiqué que G1 et G2 diffèrent de GC. Il n’y avait pas

0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

de différence entre G1 et G2. Ces résultats signifient qu’aucun groupe n’a obtenu une moyenne proche de celle du GC pour la prononciation du son /ʊ/.

Tableau VII Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /ʊ/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 1.9958 2.8225 0.1132

G1(4ans) vs. GC -2.5935 3.6678 *0.0257

G2(6ans) vs. GC -3.1648 4.4757 *0.0044 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous trouvons que GC avait de meilleurs résultats avec 4.47 puis se trouve G1 en deuxième position avec une moyenne de 3.44, puis G2 avec une moyenne de 2.86 sur 5. Cependant, ces résultats signifient que les moyennes de G1 et de G2 sont comparables, mais qu’aucun de ces deux groupes n’a obtenu une prononciation comparable à celle de GC. Ces résultats sont présentés dans la figure 3, où il y a une différence apparente entre les moyennes de GC et celles de G1 et de G2.

Figure 3. Score moyen des résultats des jugements de la production de /ʊ/ 0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

5.1.2.5 - Son 5 : /ɪ/

Pour la prononciation du son /ɪ/ présent dans le mot "lips", il y avait une différence significative entre les groupes, à en juger par la statistique de Kruskall-Wallis (χ2=10.9208, dl=2, p<0.0043). Comme présentées dans le tableau VIII, les comparaisons multiples de DSCF indiquent que les trois groupes sont différents les uns des autres : G2 diffère de G1 et de GC, alors que G1 et GC sont comparables.

Tableau VIII Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /ɪ/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 1.7781 2.5147 0.1769

G1(4ans) vs. GC -2.1830 3.0872 0.0741

G2(6ans) vs. GC -3.0754 4.3493 *0.0060 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous trouvons que GC avait de meilleurs résultats avec 4.71, puis se trouve G1 avec une moyenne de 4.26 et ensuite G2, avec une moyenne de 3.97. Ces résultats signifient que les moyennes du GC et du G1 sont comparables, mais que G2 n’a pas réussi à avoir des résultats proches du GC. Ces résultats sont présentés dans la figure 4, où GC et G1 sont comparables, alors que G1 et G2 sont proches.

Figure 4 Score moyen des résultats des jugements de la production de /ɪ/ 0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

5.1.2.6 - Son 6 : /ɑ/ suivi par /r/

Concernant la prononciation du son /ɑ/ suivi par /r/ présenté dans les mots "farmer", "barn", "farm", "garlic", "jar", "star" et "car", il y avait une différence significative entre les groupes à en juger par la statistique de Kruskall-Wallis (χ2=11.1827, dl=2, p<0.0037). Présentées dans le tableau IX, les comparaisons multiples de DSCF indiquent que les trois groupes diffèrent les uns des autres : G2 diffère de GC et de G1, alors que G1 et GC ont des résultats comparables.

Tableau IIX Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /ɑ/ suivi par /r/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 2.4932 3.5260 *0.0339

G1(4ans) vs. GC -2.0163 2.8515 0.1083

G2(6ans) vs. GC -2.6480 3.7448 *0.0221 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous avons trouvé que GC et G1 se placent en première position avec des moyennes respectives et similaires de 4.92 et de 4.86. Alors que G2 se trouve en deuxième position avec une moyenne de 4.63. Ces résultats signifient que G2 n’a pas réussi à avoir une prononciation du son /ɑ/ proche de celle de GC alors que G1 a réussi à avoir une prononciation proche de celle de GC. Ces résultats sont présentés dans la figure 5.

Figure 5 Score moyen des résultats des jugements de la production de /ɑ/ suivi par /r/

0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

5.1.2.7 - Son 7 : /ɑ/ non suivi par /r/

Pour la prononciation du son /ɑ/ non suivi par /r/ présent dans les mots "ball" et "dog", il y avait une différence significative entre les trois groupes selon la statistique de Kruskall- Wallis (χ2=14.7986, dl=2, p<0.0006). Présentées dans le tableau X, les comparaisons multiples de DSCF indiquent que les trois groupes sont différents les uns des autres: GC diffère de G1 et de G2, alors que G1 et G2 ont obtenu des moyennes comparables.

Tableau X Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /ɑ/ non suivi par /r/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 1.7397 2.4603 0.1905

G1(4ans) vs. GC -2.8843 4.0791 *0.0109

G2(6ans) vs. GC -3.5307 4.9932 *0.0012 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous trouvons que GC avait de meilleurs résultats avec 4,8, puis G1 et G2 avec des moyennes respectives de 3.93 et de 3.40. Ces résultats signifient que les moyennes de G1 et de G2 sont comparables, mais qu’aucun de ces deux groupes n’a obtenu une prononciation comparable à celle de GC. Ils sont présentés dans la figure 6, où la différence entre GC et les deux groupes expérimentaux est apparente.

Figure 6 Score moyen des résultats des jugements de la production de son /ɑ/ non suivi par /r/

0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

5.1.2.8 - Son 8 : /h/

Pour le son /h/ présenté dans les mots "hat", "hospital", "hair", "heart", "hamburger", "hot- dog" et "handbag", il y avait une différence significative entre les groupes à en juger par la statistique de Kruskall-Wallis (χ2=14.1107, dl=2, p<0.0009). Présentées dans le tableau XI, les comparaisons multiples de DSCF indiquent que les trois groupes diffèrent les uns des autres : G2 diffère de G1 et de GC, alors que les résultats de G1et de GC sont comparables.

Tableau XI Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /h/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 2.0510 2.9005 0.1003

G1(4ans) vs. GC -2.3274 3.2914 0.0521

G2(6ans) vs. GC -3.5732 5.0533 *0.0010 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous trouvons que GC se trouve en première position avec une moyenne de 4.56, puis G1 en deuxième position avec une moyenne de 4.47 et, finalement, se trouve G2 avec une moyenne de 3.99. Ces résultats signifient que G2 n’a pas réussi à avoir une prononciation du son /h/ proche de celle du GC. Ces résultats sont présentés dans la figure 7.

Figure 7 Score moyen des résultats des jugements la production de /h/ 0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

5.1.2.9 - Son 9 : /θ/

Finalement, pour le son /θ/ présenté dans les mots "think", "bath", "thief", "earth", "thigh", "teeth" et "thunder", il y avait une différence significative entre les groupes à en juger par la statistique de Kruskall-Wallis (χ2=15.8070, dl=2, p<0.0004). Présentées dans le tableau XII, les comparaisons multiples de DSCF indiquent que les trois groupes sont différents les uns des autres : GC diffère de G1 et de G2. De plus, aucun des groupes n’a obtenu un résultat proche ou comparable à celui de GC.

Tableau XII Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du son /θ/

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 1.5136 2.1405 0.2845

G1(4ans) vs. GC -3.2481 4.5935 *0.0033

G2(6ans) vs. GC -3.5528 5.0244 *0.0011 *Une valeur de p inférieure à 0.05 est significative

Pour situer ces différences sur une échelle de 1 (très mauvaise prononciation) à 5 (très bonne prononciation, qui ressemble à celle des locuteurs natifs), nous avons trouvé que GC se positionne en première place avec une moyenne de 4.56, puis se trouve G1 en deuxième position avec une moyenne de 2.27 et finalement se trouve G2 en troisième position avec une moyenne de 1.7. Ces résultats signifient qu’il y a un grand écart entre les résultats de G1 et de G2 et les résultats de GC, ce qui montre qu’aucun groupe n’a obtenu un résultat proche de celui de GC. Ces résultats sont présentés dans la figure 8 où le grand écart entre les groupes est évident.

Figure 8 Score moyen des résultats des jugements de la production de /θ/ 0 1 2 3 4 5 6 G1(4ans) G2(6ans) GC

5.2 - Au niveau de l’AE

5.2.1 - Accord inter-juges

Nous avons calculé la cohérence inter-juges en utilisant huit programmes différents. L’indice ICC de Shrout-Fleiss 0.81050 > 0.7 signifie qu’il y a une bonne cohérence inter-juges.

5.2.2 - Résultats des scores de l’AE

Les résultats de l’approche non paramétrique du test Kruskall-Wallis (χ2=20.6407, dl=2,

p<0.0001) ont montré qu’il y avait une différence significative entre les trois groupes. Pour

situer cette différence et faire des comparaisons, nous avons effectué les comparaisons multiples de DSCF (tableau XIII). Ces comparaisons nous indiquent que les valeurs de P sont encore inférieures à 0.05, ce qui signifie que toutes les comparaisons deux à deux sont significatives, ce qui nous indique que tous les groupes sont différents les uns par rapport aux autres.

Tableau XIII Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau de l’accent étranger

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. GC 3.6233 5.1241 *0.0008

G1(4ans) vs. G2(6ans) -2.6850 3.7972 *0.0198

GC vs. G2(6ans) -3.5924 5.0805 *0.0010 *Une valeur de p inférieure à 0.05 est significative

Pour déterminer lequel des groupes avait un meilleur accent, nous avons classé les trois groupes selon les valeurs moyennes de chaque groupe (annexe L). Sur une échelle de 1 (no foreign accent) à 9 (very strong foreign accent), GC a obtenu une moyenne de 2.09, suivi par G1 qui a obtenu un score de 6.75 et, en dernier lieu, G2 avec un score de 7.9 sur 9. Ces résultats sont présentés dans la figure 9, où la différence concernant les moyennes obtenues entre GC et les deux autres groupes expérimentaux est apparente.

Figure 9 Score moyen des résultats de jugement des extraits au niveau de l’AE pour chaque groupe

5.3 - Au niveau de l’intelligibilité

5.3.1 - Accord inter-juges

Nous avons calculé la cohérence inter-juges en utilisant huit programmes différents au niveau des erreurs totales. L’indice ICC de Shrout-Fleiss étant de 0.065503< 0.7, signifie qu’il n’y a pas une bonne cohérence inter-juges. Pour vérifier si la cause du désaccord inter-juges existait au niveau des erreurs triviales ou des erreurs non triviales, nous avons calculé l’ICC de manière individuelle pour ces deux types d’erreurs. Nous avons trouvé un indice ICC de 0.28843 pour les erreurs triviales et de 0.12902 pour les erreurs non triviales. Ces résultats signifient qu’il n’y avait aucun accord inter-juges pour tous les niveaux. Puisqu’il était évident qu’il y avait un grand écart entre les résultats de J3 et les résultats des autres juges, nous avons décidé de ne pas prendre en considération les scores de J3. Ceci s’explique par le fait que J3 n’a pas suivi exactement les instructions données pour la transcription des enregistrements, ce qui a entraîné ce grand écart dans les résultats. Pour vérifier l’accord inter-juges entre J1 et J2, nous avons effectué d’autres calculs. Les résultats du test de Shrout- Fleiss ont montré qu’il y avait une bonne cohérence inter-juges avec un indice ICC égal à 0.81626 au niveau des erreurs non triviales et un indice ICC égal à 0.79348 au niveau du total des erreurs.

5.3.2 - Résultats des scores des erreurs non triviales

Le résultat de l’approche non paramétrique du test Kruskall-Wallis (χ2=0.7474, dl=2,

p<0.6882) a montré qu’il n’y avait pas de différence significative entre les trois groupes.

0 1 2 3 4 5 6 7 8 9 G1(4ans) G2(6ans) GC

Même avec les comparaisons multiples de DSCF (tableau XIV), nous n’avons pas trouvé de différence significative. En effet, les moyennes de chaque groupe au niveau des erreurs non triviales étaient presque similaires : 0.988 pour G1, 0.981 pour G2 et 0.987 pour GC.

Tableau XIV Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau des erreurs non triviales

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) 0.7448 1.0533 0.7368

G1(4ans) vs. GC 0.6688 0.9458 0.7816

G2(6ans) vs. GC -0.1273 0.1801 0.9911

5.3.3 - Résultats des scores des erreurs triviales

Pour faire une vérification supplémentaire, nous avons appliqué le test de Kruskall-Wallis au niveau des erreurs triviales et nous avons trouvé qu’il n’y avait toujours pas de différences significatives (χ2=4.3174, dl=2, p<0.1155). Avec le calcul des moyennes de chaque groupe, nous avons trouvé des résultats très proches : 0.987 pour G1, 0.995 pour G2 et 0.993 pour GC.

5.3.4 - Résultats des scores du total des erreurs

Par déduction, nous avons trouvé qu’il n’y avait pas de différences significatives au niveau des totaux des erreurs. Par le test de Kruskall-Wallis, nous avons trouvé qu’il n’y avait pas de différence (χ2=0.5253, dl=2, p<0.7690). Même avec les comparaisons multiples de DSCF (tableau XV), nous n’avons pas trouvé de différence entre les trois groupes.

Tableau XV Comparaison multiple à deux par la méthode de Dwass, Steel, Critchlow-Fligner au niveau du total des erreurs

Groupe Wilcoxon Z DSCF Value Pr > DSCF G1(4ans) vs. G2(6ans) -0.7197 1.0178 0.7518

G1(4ans) vs. GC -0.4009 0.5669 0.9152

À propos des moyennes obtenues, nous avons trouvé que les résultats étaient presque similaires, avec des moyennes de 0.976 pour G1, de 0.976 pour G2 et de 0.98 pour GC. Les résultats sont présentés dans la figure 10, où nous observons une quasi égalité entre les trois groupes.

Figure 10 Score moyen des résultats de jugement de l’intelligibilité pour chaque groupe

5.4 - Principaux constats

Les résultats découlant des analyses statistiques pourraient se résumer par les constats suivants :

1. En ce qui concerne les sons : sur neuf sons présentés, G1 a réussi à avoir une prononciation de six sons comparables à celle du GC. Seulement au niveau des sons /ʊ/, /ɑ/ non suivis par /r/ et /θ/, G1 n’a pas réussi à obtenir des scores comparables à ceux du GC. Pour G2, sur neuf sons présentés, ce groupe n’a réussi à avoir une prononciation comparable au GC que pour les deux sons /i/ et /r/.

2. À propos de l’AE, aucun groupe expérimental n’a obtenu un score proche de celui du GC. Cependant, le G1 a obtenu un meilleur score que celui du G2.

3. Pour l’intelligibilité, les deux groupes expérimentaux et le groupe contrôle ont obtenu des résultats presque similaires ce qui signifie que les participants de G1 et de G2 sont intelligibles. 0,95 0,955 0,96 0,965 0,97 0,975 0,98 0,985 0,99 0,995 G1(4ans) G2(6ans) GC

Dans le chapitre suivant, nous allons discuter de nos résultats à la lumière des résultats des études recensées et des renseignements exposés dans la problématique, ce qui nous permettra de répondre à notre question de recherche.

CHAPITRE 6

Documents relatifs