CHAPITRE I Développement phonologique chez le jeune enfant enfant
CHAPITRE 2 Résultats du projet international Paidologos : Données fréquentielles du langage adressé à l’enfant en Données fréquentielles du langage adressé à l’enfant en Données fréquentielles du langage adressé à l’enfant en Données fréquentielles du langage adressé à l’enfant en
2.6. Résultats en français : données fréquentielles du français français
2.6.1. Résultats : fréquence des séquences CV initiales
séquences CV en français, selon les trois types de corpus définis.
Pour ce qui concerne le corpus de parole adressée à l’enfant (nos enregistrements) les phénomènes de resyllabation ont été comptabilisés comme des mots commençant par une séquence CV, notamment pour les liaisons enchaînées, fréquentes à l’oral. Ainsi, la part des mots de contenu commençant par une séquence CV parmi la totalité des mots de contenu est plus importante dans ce corpus, totalisant environ les ¾ des mots de contenu (figure 1 ci-dessous).
Figure 1 : Proportion des mots commençant par une séquence CV (corpus CDS)
Sous LEXIQUE 2, cette prépondérance des séquences CV initiales n’est pas si importante, comme l’indique la figure 2. La part des mots commençant par une autre structure que CV est fréquente.
Ces résultats ont été calculés sur la totalité des mots de contenu. Nous pouvons expliquer cet effet par le phénomène de liaison, important en français, qui augmente significativement la fréquence des mots commençant par une séquence CV dans la parole adressée à l’enfant. Ce phénomène de liaison n’a pas pu être pris en compte pour le corpus LEXIQUE 2 puisqu’il s’agit de données basées sur des écrits.
Figure 2 : Proportion des mots commençant par une séquence CV (corpus LEXIQUE 2)
Sous LEXIQUE 3, nous retrouvons sensiblement le même profil que sous LEXIQUE 2, comme le montre la figure 3 ci-dessous. De la même façon, les données LEXIQUE 3 ne sont disponibles que sous forme écrite et il n’est pas possible d’en extraire les occurrences de liaisons.
Figure 3 : Proportion des mots commençant par une séquence CV (corpus LEXIQUE 3)
Les données fréquentielles ci-dessous s’attachent à décrire les fréquences des mots commençant par les séquences CV.
2.6.2. Fréquence des consonnes d’attaque en français.
2.6.2.1. Uniformité des fréquences des consonnes dans les trois types de données.
Nous retrouvons des données comparables pour certaines fréquences concernant les consonnes d’attaque dans les trois types de données (LEXIQUE 2 ; LEXIQUE 3 ; CDS « child directed speech »). Certaines fréquences sont cependant différentes selon le corpus observé. Après une analyse plus fine, les différences concernent les données CDS avec les données de LEXIQUE 2 et LEXIQUE 3. Les données émanant de LEXIQUE (2 et 3) ne sont pas différentes entre elles.
Nous observons que la plupart des consonnes d’attaque sont plus fréquentes avec les données CDS, ce qui s’explique directement par la plus grande proportion de mots de contenu commençant par une séquence CV. Cependant, la fréquence de /z/ est beaucoup plus fréquente, et la consonne /n/ est relativement plus fréquente.
p b t d k g f v s z S Z l m n r -7 -6 -5 -4 -3 -2 -1 LEX 2 LEX 3 CDS
Figure 4 : Comparaison des fréquences (en log) des consonnes d’attaque en français selon les trois corpus étudiés
2.6.2.2. Fréquences des phonèmes /k/ et /t/ à l’initiale des mots de contenu
Une des premières comparaisons possibles concerne les fréquences de /t/ et /k/ à l’initiale des mots de contenu. La comparaison entre /t/ et /k/ est importante car de nombreux travaux concernant portant sur l’acquisition de l’anglais ont montré que les enfants tendent à remplacer /k/ par /t/ (cf. partie 1, chapitre 1). Nous reviendrons par la suite sur ces résultats. Nous décrivons ici les fréquences observées parmi nos différents corpus.
Figure 5 : Fréquence de /t/ et /k/ en position initiale des mots (corpus LEXIQUE 2).
Figure 6 : Fréquence de /t/ et /k/ en position initiale des mots (corpus LEXIQUE 3).
Dans le langage adulte adressé à l’enfant de 2 ans, /k/ reste supérieur à /t/, cependant la différence de fréquence est minime.
Figure 7 : Fréquence de /t/ et /k/ en position initiale des mots (corpus CDS).
2.6.2.3. Fréquence des consonnes (C) dans les séquences CV à l’initiale des mots de contenu
Les graphes ci-dessous comparent les fréquences des différentes consonnes considérées, avec les deux bases de données, LEXIQUE 2 et 3, ainsi qu’avec les données de parents s’adressant à leur enfant de 2 ans.
LEXIQUE 2 qui traite des fréquences écrites, montre que l’on retrouve 6 consonnes majoritaires (au dessus des 5%) qui sont les phonèmes /p/, /d/, /k/, /s/, /r/ et /m/.
Les phonèmes les moins fréquents (en dessous de 2%), sont les phonèmes /g/, /S/, /z/, /Z/, /n/.
Figure 8 : Détail des fréquences des consonnes (LEXIQUE 2).
Sous LEXIQUE 3, traitant des données du français oral, les résultats sont très proches de ceux obtenus avec la base de données LEXIQUE 2.
Notamment, les consonnes les plus fréquentes sont identiques (/p/, /d/, /k/, /s/, /r/ et /m/). Cependant, les phonèmes /p/ et /m/ sont légèrement en deçà des 5% de fréquence en position d’attaque d’une séquence CV.
Nous retrouvons également les mêmes fréquences faibles (moins de 2%) pour les phonèmes /g/, /S/, /z/, /Z/, /n/.
Figure 9 : Détail des fréquences des consonnes (LEXIQUE 3).
Les fréquences des données orales recueillies auprès des adultes s’adressant au jeune enfant de 2 ans sont comparables en certains aspects aux deux bases de données LEXIQUE.
Les mots commençant par une séquence CV étant plus importants dans la base de données orales spécifique aux enfants, les fréquences globales sont plus élevées.
Nous retrouvons les mêmes phonèmes les plus fréquents au-dessus des 5% d’utilisation dans la parole adressée aux enfants : /p/, /d/, /k/, /s/, /r/ et /m/. Les phonèmes /t/ et /l/ ont des proportions plus importantes ici (au-dessus de 5%).
Le phonème /p/ est ici le phonème le plus employé, puis viennent le /k/ et le /m/. Les phonèmes /t/, /d/ et /s/ sont ensuite les trois autres phonèmes les plus fréquents.
Les phonèmes les moins fréquents sont à nouveau les phonèmes /g/, /S/, /z/, /Z/. Le phonème /v/ est également peu fréquent.
Le phonème /n/, peu fréquent dans les bases de données LEXIQUE, est ici relativement fréquent.
Figure 10 : Détail des fréquences des consonnes (CDS).
En regroupant les consonnes par mode et lieu d’articulation, nous retrouvons les fréquences reportées à la figure 11 et à la figure 12.
La part des consonnes fricatives reste importante dans l’input que reçoit l’enfant.
Les lieux d’articulation indiquent une forte présence des alvéolaires, dentales et labiales.
Figure 11 : Proportion des consonnes selon le mode d'articulation (corpus CDS)
2.6.3. Contextes vocaliques
2.6.3.1. Comparaison entre les différentes bases de données
La figure 13 montre quelles sont les voyelles les plus fréquentes en français en fonction des 3 types de données observées.
Ici encore, des fréquences semblables se retrouvent d’une base de données à l’autre, sauf pour les contextes vocaliques /u/ et /y/.
Sous Lexique 2, les contextes vocaliques majoritaires sont /A/, /E/ et /O/ (figure 14).
Figure 13 : Proportion (en log) des voyelles dans les séquences CV initiales des mots (Corpus LEXIQUE 2, LEXIQUE 3 et CDS)
Figure 14 : Proportion des voyelles dans les séquences CV initiales des mots (LEXIQUE 2).
Sous Lexique 3, nous retrouvons les mêmes contextes vocaliques majoritaires (/A/, /E/, /O/).
Figure 15 : Proportion des voyelles dans les séquences CV initiales des mots (LEXIQUE 3).
Dans le langage adressé au jeune enfant, les mêmes contextes vocaliques se dégagent. Les voyelles /i/ et /y/ sont les moins fréquentes lorsqu’elles suivent la consonne d’attaque des mots, alors que ce sont les voyelles /u/ et /y/ qui sont les moins fréquentes dans les données LEXIQUE 2 et LEXIQUE 3.
Figure 16 : Proportion des voyelles dans les séquences CV initiales des mots (CDS).
2.6.4. Séquences CV fréquentes à l’initiale des mots de contenu dans la parole adressée à l’enfant.
Le tableau indique le détail des fréquences des séquences CV initiales en nombre d’occurrences.
Tableau 8: Nombre d'occurrences des séquences CV dans le corpus CDS.
/A/ /i/ /y/ /u/ /E/ /O/ /8/
/p/ 28 7 4 13 13 13 7 /b/ 19 4 0 8 8 11 1 /t/ 21 6 2 11 18 9 2 /d/ 11 8 2 5 23 11 10 /k/ 19 3 1 13 4 33 3 /g/ 10 2 0 0 0 2 1 /f/ 3 7 1 7 7 8 4 /v/ 8 3 1 3 6 5 3 /s/ 16 8 7 5 11 11 6 /z/ 12 4 0 0 4 8 0 /S/ 10 1 1 1 6 7 5 /Z/ 9 0 2 3 6 2 2 /l/ 21 6 2 6 13 5 4 /r/ 19 2 1 4 10 3 22 /m/ 27 7 2 5 20 10 2 /n/ 19 3 2 6 13 7 2