3.2 Comment se développent les invariants des unités distinctives ?
3.2.3 La structure des unités distinctives
Nous avons étudié le développement des représentations motrices et sensorielles chez le bébé
en nous appuyant sur des études sur le développement de la perception et de la production. Dans
celles-ci, nous avons vu que le bébé semble apprendre progressivement les représentations sensorielles
et motrices correspondant aux unités distinctives propres à sa langue. Néanmoins, il subsiste deux
questions : 1) les unités phonétiques elles-mêmes elles innées ou acquises ? 2) Ces unités
sont-elles syllabiques ou phonémiques ?
Ce sont les deux questions auxquelles nous nous intéressons dans cette section à travers trois
parties. Nous étudions d’abord si les unités sont innées ou acquises. Ensuite, nous étudions les études
présentant la syllabe comme unité de base. Nous terminons sur le développement phonémique.
3.2.3.1 Des unités phonétiques innées ou acquises ?
Du fait que le bébé perçoive dès les premiers mois la majorité des contrastes phonétiques, même
ceux ne faisant pas partie de sa langue native, il semble intéressant de se demander s’il possède dès la
naissance un bagage phonétique universel. Comme le rappelle Peperkamp (2003), il y a plusieurs avis
sur le sujet. Une des théories est de supposer que les frontières entre les contrastes phonétiques
cor-respondent à des changements acoustiques et auditifs généraux permettant au bébé de les discriminer
dès la naissance (Kuhl, 2000). Ainsi, les catégories phonétiques seraient naturellement séparées les
unes des autres. Cette hypothèse s’appuie notamment sur le fait que certains contrastes phonétiques
sont discriminables par plusieurs animaux, tels que les singes ou les chinchillas (Kuhl et Miller, 1975;
Kuhl et Padden, 1983). L’apprentissage se ferait par la suite par focalisation sur certaines de ces
ca-tégories grâce à l’apprentissage statistique. Cependant, comme le mentionne Pierrehumbert (2003),
les catégories phonétiques sont spécifiques à chaque langue et l’hypothèse des frontières catégorielles
universelles ne semble pas viable. La discrimination des contrastes phonétiques se ferait uniquement
grâce à un apprentissage statistique sans frontières préalables. Cependant, il est possible de trouver
un compromis entre les deux théories. Ainsi, Kuhl (2004) propose que les catégories sont bien au
départ universelles mais qu’elles sont « primitives » et que le bébé se focaliserait par la suite, durant
l’apprentissage, sur les frontières propres à sa langue. Ainsi, selon cette théorie, les frontières
uni-verselles serviraient d’amorce aux frontières définitives, spécifiques à chaque langue, acquises durant
l’apprentissage.
Par ailleurs, on peut se demander si cette discrimination précoce est phonétique ou simplement
auditive. Les expérimentations sur cette question étudient plus en détail le cerveau du bébé en
utili-sant des techniques d’enregistrement neuronal. Par exemple, l’expérimentation de Dehaene-Lambertz
et Baillet (1998) montre que les bébés de 3 mois ont une représentation neuronale similaire à celle de
l’adulte. Pour cela, ils enregistrent les potentiels évoqués lors d’un changement purement acoustique
et d’un changement phonétique. Ils observent que, bien que les deux changements correspondent à un
changement acoustique de même amplitude, les réponses électrophysiologiques sont plus élevées lors
du changement phonétique. Ils en déduisent que les bébés discriminent les contrastes de façon
phoné-tique et pas simplement de façon auditive. Une expérimentation similaire par Dehaene-Lambertz et
Peña (2001) confirme ces résultats.
Cependant, cela ne signifie pas pour autant que les stimuli sont traités comme ceux de l’adulte.
Par exemple, dans les données d’imagerie par magnétoencéphalographie de Kuhl et al. (2014), les
auteurs observent les zones d’activation des bébés de 7 et 11-12 mois. Ils montrent qu’à 7 mois les
aires auditives et motrices s’activent de façon équivalente aussi bien pour les contrastes natifs que non
natifs. Cependant, à 11-12 mois, ils observent que les aires auditives s’activent davantage pour les
contrastes natifs et les aires motrices s’activent davantage pour les contrastes non-natifs. Ce dernier
comportement correspond à ce qui est obtenu chez l’adulte contrairement au premier et laisse donc
supposer que les bébés de moins de 7 mois ne réagissent pas aux stimuli de la même manière que
les adultes. Par ailleurs, l’expérimentation de Cheour et al. (1998) montre qu’à 6 mois, les contrastes
mesurés par l’amplitude de la réponse MMN respectent une hiérarchie auditive et non phonétique
(plus d’amplitude pour des stimuli plus distincts, qu’ils fassent partie de la langue ou pas) alors qu’à
12 mois la hiérarchie devient phonétique et conforme à celle des adultes (plus d’amplitude pour des
stimuli correspondant à deux catégories différentes, même s’ils sont acoustiquement proches).
En résumé, il reste encore difficile de savoir si les unités phonétiques sont présentes dès la
nais-sance ou non. Il semblerait que le bébé soit guidé d’abord par des contrastes acoustiques qui
de-viennent très rapidement phonétiques, c’est-à-dire interprétés en lien avec la langue. Ainsi, même si
les unités phonétiques ne correspondent pas au départ à celles de l’adulte, le bébé possède les
méca-nismes permettant de les acquérir.
3.2.3.2 Une structure cognitive principalement syllabique
La majorité des études sur le développement de la perception considère un codage phonémique
en étudiant les contrastes consonantiques, comme l’illustrent par exemple les études sur la perception
catégorielle. Néanmoins, du fait que les études sont réalisées plus généralement avec des syllabes, on
pourrait également supposer que le bébé discrimine en réalité des syllabes. De plus, les recherches
sur le développement et notamment celles sur le babillage semblent plutôt se centrer sur une structure
syllabique.
Dans leur revue sur les représentations mentales des unités de parole durant l’acquisition, Hallé
et Cristia (2012) considèrent que l’unité phonétique de base en perception est la syllabe, ce qu’ils
affirment très clairement : « Young children code speech in terms of syllables ». Cette hypothèse
est également soutenue par d’autres auteurs (Jusczyk, 1997; Mehler et Hayes, 1981), citant divers
résultats comme arguments.
Parmi ceux les plus cités, les bébés posséderaient presque de façon innée la capacité de compter
les syllabes plutôt que les phonèmes dans un énoncé. C’est ce que testent Bijeljac-Babic et al. (1993).
En utilisant la méthode HAS, ils observent d’abord que les bébés de quatre jours savent discriminer
un ensemble bisyllabique CVCV (par exemple, [rifu, kepa]) d’un ensemble trisyllabique CVCVCV
(par exemple, [mazopu, rekiva...]) et inversement. Ils testent ensuite la discrimination d’ensembles
bisyllabiques CVCV composés soit de 4 phonèmes (par exemple, [rifu, kepa]) , soit de 6 phonèmes
(par exemple, [treklu, suldri]). Cependant, ils n’observent aucune déshabituation entre ces deux
en-sembles. Ils supposent donc que les bébés détectent les changements du nombre de syllabes mais pas
ceux modifiant le nombre de phonèmes. Ils interprètent ceci en faveur d’un codage syllabique.
À l’aide d’une expérimentation voisine, Bertoncini et Mehler (1981) proposent une comparaison
de stimuli syllabiques et non syllabiques. Dans leur étude, ils testent des bébés français de deux mois
avec la méthode HAS sur leur capacité à distinguer des stimuli ayant une structure syllabique correcte
(par exemple, [tap] vs. [pat]) ou des stimuli ne respectant pas cette structure syllabique (par exemple,
[tSp]-[pSt]). Ils montrent que les bébés discriminent les premiers mais pas les seconds. Par ailleurs,
les bébés sont également capables de discriminer ces secondes structures lorsqu’elles sont comprises
dans une structure syllabique (par exemple, [utSpu]-[upStu]). Du fait que seuls les stimuli syllabiques
sont discriminés, ils en déduisent que les bébés s’appuient sur un traitement syllabique.
Cependant, comme le précisent Bertoncini et al. (1988), ces deux résultats pourraient également
s’expliquer par le fait que les bébés sont sensibles à la prosodie de leur langue et reconnaîtraient
les ensembles rythmiques sans avoir pour autant un codage syllabique. Néanmoins, une comparaison
plus directe de la discrimination phonémique et syllabique semble tout de même jouer en faveur de
la syllabe. Par exemple, Jusczyk et Derrah (1987) proposent un protocole où des bébés de deux mois
sont familiarisés à un ensemble de quatre syllabes CV partageant la même consonne C ([bi, bo, ba,
bÄ]). Avec la méthode HAS, ils testent ensuite trois stimuli différents : 1) un stimulus possédant
une voyelle V différente mais la même consonne C ([bu]), 2) un stimulus possédant une consonne
C différente mais une voyelle V commune ([di]) et 3) un stimulus avec une nouvelle consonne C et
une nouvelle voyelle V ([du]). Ils remarquent que les bébés se déshabituent dans les trois conditions.
Cela va à l’encontre de l’hypothèse d’une unité phonémique. En effet, selon cette hypothèse, le bébé
ne devrait pas réagir face au stimulus 1) (ou moins réagir) puisque la consonne [b] est commune aux
stimuli avec lesquels il a été habitué. Or, le fait qu’il se déshabitue identiquement laisse penser qu’il
ne remarque pas que la consonne [b] est commune aux stimuli avec lesquels il a été habitué et donc
qu’il possède davantage un traitement syllabique où chaque syllabe est perçue indépendamment. Cette
expérimentation est répliquée par Bertoncini et al. (1988). Par ailleurs, ces auteurs réalisent également
le même type d’expérimentation en habituant les bébés de deux mois avec des syllabes CV partageant
une même voyelle ([bi, si, li, mi]). En testant les stimuli avec 1) une nouvelle voyelle V ([ba]), 2)
une nouvelle consonne C ([di]) ou 3) une nouvelle consonne C et voyelle V ([da]), ils obtiennent
également une déshabituation pour les trois stimuli.
En production, les principales théories semblent également plutôt en faveur d’un codage initial
syllabique. Du fait que les bébés ne savent produire des énoncés qu’à partir du babillage, les auteurs
se focalisent surtout sur cette période. La question principale est de savoir si le babillage se fait en
termes d’un codage phonémique associant une consonne C et une voyelle V ou en termes d’un codage
syllabique global CV. La théorie Frame Then Content (MacNeilage et al., 1997, voir également
sec-tion 3.2.1.2) privilégie la seconde opsec-tion dans les stades initiaux du babillage (Hallé et Cristia, 2012,
pour une revue)
En résumé, la majorité des études de perception, surtout comportementales, convergent vers
l’hy-pothèse d’une primauté de l’unité syllabique dans les premiers stades du développement. Cette
ques-tion ne semble pas vraiment avoir été étudiée actuellement par les études en neurosciences.
3.2.3.3 Le développement phonémique
Il y a assez peu d’études pour contre-argumenter et considérer plutôt un codage phonémique
précoce chez le bébé. En effet, outre les travaux défendant le codage syllabique, un des arguments
principaux contre un codage phonémique vient du fait que l’enfant apprend à manipuler consciemment
les phonèmes assez tardivement par rapport à la syllabe (voir le concept de « phonological/phoneme
awareness », Carroll et al., 2003; Fowler et al., 1991; Mann et Wimmer, 2002; Ziegler et Goswami,
2005).
Parmi les exceptions, on trouve les études sur l’apprentissage des voyelles (Kuhl et al., 1992; Polka
et Werker, 1994). Par exemple, dans l’étude de Kuhl et al. (1992), des bébés américains et suédois de 6
mois sont testés sur leur discrimination du contraste [i], prototypique de l’anglais et [y], prototypique
du suédois. Pour réaliser leur expérimentation, les auteurs se basent sur le fait que la discrimination
des voyelles n’est pas catégorielle comme pour les consonnes mais que la discrimination est moins
bonne entre une voyelle prototypique et une voyelle proche qu’entre deux voyelles non prototypiques.
Cela est nommé « effet magnet ». En utilisant la technique HT, la discrimination des prototypes
suédois et anglais est évaluée par rapport à celle d’autres voyelles proches. Les résultats montrent que
les bébés américains discriminent mieux le prototype anglais et que les bébés suédois discriminent
mieux le prototype suédois. Ils en déduisent que l’apprentissage perceptif améliore la perception des
prototypes natifs, ce qui laisse supposer que les bébés apprennent bien les phonèmes de leur langue et
ce, avec des effets de « perceptual narrowing » sur les voyelles dès 6 mois. A cette même période, les
auteurs d’une étude de pupillométrie montrent que les bébés semblent pouvoir reconnaître une même
consonne couplée avec différentes voyelles. En conséquence, ils supposent que les bébés de 6 mois
seraient capables de retrouver l’invariant consonantique (Hochmann et Papeo, 2014).
Dans une expérimentation similaire en neurosciences, Cheour et al. (1998), comme nous l’avons
vu précédemment (voir section 3.1.3.2), montrent la présence de traces phonémiques, spécifiques à
chaque langue, dès 12 mois, ce qui reste assez tardif par rapport à la syllabe et par rapport au résultat
précédent. Dans leur expérimentation, ils observent qu’à 12 mois, le bébé finlandais réagit davantage
au contraste finnois qu’estonien et inversement, jouant en faveur d’un codage phonémique au moins
vocalique.
Ainsi, il semble bien que s’opère au cours du développement, tant en production qu’en
percep-tion, un passage progressif de la syllabe, unité primaire et disponible dès les tous premiers temps de
l’acquisition, vers le phonème, unité émergente acquise éventuellement plus tardivement, selon des
processus qui restent encore largement à définir.
3.2.3.4 Conclusion
Pour synthétiser, nous avons d’abord observé que les processus de perception phonétique
asso-ciés à la syllabe semblent être grossièrement similaires à ceux de l’adulte dès deux mois. De leur
côté, les unités phonémiques ne semblent être réellement acquises que plus tardivement. Nous
revien-drons, dans le chapitre 6, sur cette structure cognitive en présentant un modèle permettant d’étudier
l’acquisition conjointe des syllabes et des phonèmes.
Modélisation des unités distinctives et
présentation du modèle COSMO
Dans le chapitre précédent, nous nous sommes consacrés à l’analyse de la caractérisation et du
développement des unités phonétiques à travers la revue de diverses études sur la parole. Celles-ci
sont principalement basées sur des expérimentations sur l’humain, qu’elles soient comportementales
ou neuroscientifiques. Dans toute la suite de cette thèse, nous nous focalisons toujours sur les unités
phonétiques, mais en faisant appel à un tout autre domaine : la modélisation computationnelle.
Les modèles computationnels sont des outils adaptés pour tester des hypothèses sur les
méca-nismes internes d’un phénonème et semblent, en ce sens, appropriés pour tenter de mieux comprendre
comment fonctionne le cerveau humain. La modélisation computationnelle s’applique aussi à la
pho-nétique et de nombreux modèles ont été créés pour en comprendre les différents aspects.
Dans ce chapitre, en nous appuyant sur les faits et théories du chapitre précédent, nous décrivons,
dans un premier temps, plusieurs modèles computationnels s’étant intéressés, directement ou non, aux
unités phonétiques. Dans un second temps, nous présentons le modèle COSMO, que nous utilisons
dans nos simulations.
4.1 Les modèles computationnels étudiant les unités phonétiques
L’ensemble de cette section suit le plan du chapitre précédent et se base ainsi sur les deux questions
suivantes : 1) comment les unités phonétiques sont-elles caractérisées dans les modèles
computation-nels ? 2) Comment s’effectue le développement des unités phonétiques dans les modèles
computa-tionnels ? Nous tentons d’apporter des éléments de réponses dans les deux prochaines sous-sections.
Nous commençons par aborder les modèles computationnels phonétiques de perception et de
pro-duction avant de nous focaliser spécifiquement sur les modèles s’intéressant au développement des
unités phonétiques.
Dans le document
Modélisation bayésienne du développement conjoint de la perception, l'action et la phonologie
(Page 50-56)