• Aucun résultat trouvé

3.2 Comment se développent les invariants des unités distinctives ?

3.2.3 La structure des unités distinctives

Nous avons étudié le développement des représentations motrices et sensorielles chez le bébé

en nous appuyant sur des études sur le développement de la perception et de la production. Dans

celles-ci, nous avons vu que le bébé semble apprendre progressivement les représentations sensorielles

et motrices correspondant aux unités distinctives propres à sa langue. Néanmoins, il subsiste deux

questions : 1) les unités phonétiques elles-mêmes elles innées ou acquises ? 2) Ces unités

sont-elles syllabiques ou phonémiques ?

Ce sont les deux questions auxquelles nous nous intéressons dans cette section à travers trois

parties. Nous étudions d’abord si les unités sont innées ou acquises. Ensuite, nous étudions les études

présentant la syllabe comme unité de base. Nous terminons sur le développement phonémique.

3.2.3.1 Des unités phonétiques innées ou acquises ?

Du fait que le bébé perçoive dès les premiers mois la majorité des contrastes phonétiques, même

ceux ne faisant pas partie de sa langue native, il semble intéressant de se demander s’il possède dès la

naissance un bagage phonétique universel. Comme le rappelle Peperkamp (2003), il y a plusieurs avis

sur le sujet. Une des théories est de supposer que les frontières entre les contrastes phonétiques

cor-respondent à des changements acoustiques et auditifs généraux permettant au bébé de les discriminer

dès la naissance (Kuhl, 2000). Ainsi, les catégories phonétiques seraient naturellement séparées les

unes des autres. Cette hypothèse s’appuie notamment sur le fait que certains contrastes phonétiques

sont discriminables par plusieurs animaux, tels que les singes ou les chinchillas (Kuhl et Miller, 1975;

Kuhl et Padden, 1983). L’apprentissage se ferait par la suite par focalisation sur certaines de ces

ca-tégories grâce à l’apprentissage statistique. Cependant, comme le mentionne Pierrehumbert (2003),

les catégories phonétiques sont spécifiques à chaque langue et l’hypothèse des frontières catégorielles

universelles ne semble pas viable. La discrimination des contrastes phonétiques se ferait uniquement

grâce à un apprentissage statistique sans frontières préalables. Cependant, il est possible de trouver

un compromis entre les deux théories. Ainsi, Kuhl (2004) propose que les catégories sont bien au

départ universelles mais qu’elles sont « primitives » et que le bébé se focaliserait par la suite, durant

l’apprentissage, sur les frontières propres à sa langue. Ainsi, selon cette théorie, les frontières

uni-verselles serviraient d’amorce aux frontières définitives, spécifiques à chaque langue, acquises durant

l’apprentissage.

Par ailleurs, on peut se demander si cette discrimination précoce est phonétique ou simplement

auditive. Les expérimentations sur cette question étudient plus en détail le cerveau du bébé en

utili-sant des techniques d’enregistrement neuronal. Par exemple, l’expérimentation de Dehaene-Lambertz

et Baillet (1998) montre que les bébés de 3 mois ont une représentation neuronale similaire à celle de

l’adulte. Pour cela, ils enregistrent les potentiels évoqués lors d’un changement purement acoustique

et d’un changement phonétique. Ils observent que, bien que les deux changements correspondent à un

changement acoustique de même amplitude, les réponses électrophysiologiques sont plus élevées lors

du changement phonétique. Ils en déduisent que les bébés discriminent les contrastes de façon

phoné-tique et pas simplement de façon auditive. Une expérimentation similaire par Dehaene-Lambertz et

Peña (2001) confirme ces résultats.

Cependant, cela ne signifie pas pour autant que les stimuli sont traités comme ceux de l’adulte.

Par exemple, dans les données d’imagerie par magnétoencéphalographie de Kuhl et al. (2014), les

auteurs observent les zones d’activation des bébés de 7 et 11-12 mois. Ils montrent qu’à 7 mois les

aires auditives et motrices s’activent de façon équivalente aussi bien pour les contrastes natifs que non

natifs. Cependant, à 11-12 mois, ils observent que les aires auditives s’activent davantage pour les

contrastes natifs et les aires motrices s’activent davantage pour les contrastes non-natifs. Ce dernier

comportement correspond à ce qui est obtenu chez l’adulte contrairement au premier et laisse donc

supposer que les bébés de moins de 7 mois ne réagissent pas aux stimuli de la même manière que

les adultes. Par ailleurs, l’expérimentation de Cheour et al. (1998) montre qu’à 6 mois, les contrastes

mesurés par l’amplitude de la réponse MMN respectent une hiérarchie auditive et non phonétique

(plus d’amplitude pour des stimuli plus distincts, qu’ils fassent partie de la langue ou pas) alors qu’à

12 mois la hiérarchie devient phonétique et conforme à celle des adultes (plus d’amplitude pour des

stimuli correspondant à deux catégories différentes, même s’ils sont acoustiquement proches).

En résumé, il reste encore difficile de savoir si les unités phonétiques sont présentes dès la

nais-sance ou non. Il semblerait que le bébé soit guidé d’abord par des contrastes acoustiques qui

de-viennent très rapidement phonétiques, c’est-à-dire interprétés en lien avec la langue. Ainsi, même si

les unités phonétiques ne correspondent pas au départ à celles de l’adulte, le bébé possède les

méca-nismes permettant de les acquérir.

3.2.3.2 Une structure cognitive principalement syllabique

La majorité des études sur le développement de la perception considère un codage phonémique

en étudiant les contrastes consonantiques, comme l’illustrent par exemple les études sur la perception

catégorielle. Néanmoins, du fait que les études sont réalisées plus généralement avec des syllabes, on

pourrait également supposer que le bébé discrimine en réalité des syllabes. De plus, les recherches

sur le développement et notamment celles sur le babillage semblent plutôt se centrer sur une structure

syllabique.

Dans leur revue sur les représentations mentales des unités de parole durant l’acquisition, Hallé

et Cristia (2012) considèrent que l’unité phonétique de base en perception est la syllabe, ce qu’ils

affirment très clairement : « Young children code speech in terms of syllables ». Cette hypothèse

est également soutenue par d’autres auteurs (Jusczyk, 1997; Mehler et Hayes, 1981), citant divers

résultats comme arguments.

Parmi ceux les plus cités, les bébés posséderaient presque de façon innée la capacité de compter

les syllabes plutôt que les phonèmes dans un énoncé. C’est ce que testent Bijeljac-Babic et al. (1993).

En utilisant la méthode HAS, ils observent d’abord que les bébés de quatre jours savent discriminer

un ensemble bisyllabique CVCV (par exemple, [rifu, kepa]) d’un ensemble trisyllabique CVCVCV

(par exemple, [mazopu, rekiva...]) et inversement. Ils testent ensuite la discrimination d’ensembles

bisyllabiques CVCV composés soit de 4 phonèmes (par exemple, [rifu, kepa]) , soit de 6 phonèmes

(par exemple, [treklu, suldri]). Cependant, ils n’observent aucune déshabituation entre ces deux

en-sembles. Ils supposent donc que les bébés détectent les changements du nombre de syllabes mais pas

ceux modifiant le nombre de phonèmes. Ils interprètent ceci en faveur d’un codage syllabique.

À l’aide d’une expérimentation voisine, Bertoncini et Mehler (1981) proposent une comparaison

de stimuli syllabiques et non syllabiques. Dans leur étude, ils testent des bébés français de deux mois

avec la méthode HAS sur leur capacité à distinguer des stimuli ayant une structure syllabique correcte

(par exemple, [tap] vs. [pat]) ou des stimuli ne respectant pas cette structure syllabique (par exemple,

[tSp]-[pSt]). Ils montrent que les bébés discriminent les premiers mais pas les seconds. Par ailleurs,

les bébés sont également capables de discriminer ces secondes structures lorsqu’elles sont comprises

dans une structure syllabique (par exemple, [utSpu]-[upStu]). Du fait que seuls les stimuli syllabiques

sont discriminés, ils en déduisent que les bébés s’appuient sur un traitement syllabique.

Cependant, comme le précisent Bertoncini et al. (1988), ces deux résultats pourraient également

s’expliquer par le fait que les bébés sont sensibles à la prosodie de leur langue et reconnaîtraient

les ensembles rythmiques sans avoir pour autant un codage syllabique. Néanmoins, une comparaison

plus directe de la discrimination phonémique et syllabique semble tout de même jouer en faveur de

la syllabe. Par exemple, Jusczyk et Derrah (1987) proposent un protocole où des bébés de deux mois

sont familiarisés à un ensemble de quatre syllabes CV partageant la même consonne C ([bi, bo, ba,

bÄ]). Avec la méthode HAS, ils testent ensuite trois stimuli différents : 1) un stimulus possédant

une voyelle V différente mais la même consonne C ([bu]), 2) un stimulus possédant une consonne

C différente mais une voyelle V commune ([di]) et 3) un stimulus avec une nouvelle consonne C et

une nouvelle voyelle V ([du]). Ils remarquent que les bébés se déshabituent dans les trois conditions.

Cela va à l’encontre de l’hypothèse d’une unité phonémique. En effet, selon cette hypothèse, le bébé

ne devrait pas réagir face au stimulus 1) (ou moins réagir) puisque la consonne [b] est commune aux

stimuli avec lesquels il a été habitué. Or, le fait qu’il se déshabitue identiquement laisse penser qu’il

ne remarque pas que la consonne [b] est commune aux stimuli avec lesquels il a été habitué et donc

qu’il possède davantage un traitement syllabique où chaque syllabe est perçue indépendamment. Cette

expérimentation est répliquée par Bertoncini et al. (1988). Par ailleurs, ces auteurs réalisent également

le même type d’expérimentation en habituant les bébés de deux mois avec des syllabes CV partageant

une même voyelle ([bi, si, li, mi]). En testant les stimuli avec 1) une nouvelle voyelle V ([ba]), 2)

une nouvelle consonne C ([di]) ou 3) une nouvelle consonne C et voyelle V ([da]), ils obtiennent

également une déshabituation pour les trois stimuli.

En production, les principales théories semblent également plutôt en faveur d’un codage initial

syllabique. Du fait que les bébés ne savent produire des énoncés qu’à partir du babillage, les auteurs

se focalisent surtout sur cette période. La question principale est de savoir si le babillage se fait en

termes d’un codage phonémique associant une consonne C et une voyelle V ou en termes d’un codage

syllabique global CV. La théorie Frame Then Content (MacNeilage et al., 1997, voir également

sec-tion 3.2.1.2) privilégie la seconde opsec-tion dans les stades initiaux du babillage (Hallé et Cristia, 2012,

pour une revue)

En résumé, la majorité des études de perception, surtout comportementales, convergent vers

l’hy-pothèse d’une primauté de l’unité syllabique dans les premiers stades du développement. Cette

ques-tion ne semble pas vraiment avoir été étudiée actuellement par les études en neurosciences.

3.2.3.3 Le développement phonémique

Il y a assez peu d’études pour contre-argumenter et considérer plutôt un codage phonémique

précoce chez le bébé. En effet, outre les travaux défendant le codage syllabique, un des arguments

principaux contre un codage phonémique vient du fait que l’enfant apprend à manipuler consciemment

les phonèmes assez tardivement par rapport à la syllabe (voir le concept de « phonological/phoneme

awareness », Carroll et al., 2003; Fowler et al., 1991; Mann et Wimmer, 2002; Ziegler et Goswami,

2005).

Parmi les exceptions, on trouve les études sur l’apprentissage des voyelles (Kuhl et al., 1992; Polka

et Werker, 1994). Par exemple, dans l’étude de Kuhl et al. (1992), des bébés américains et suédois de 6

mois sont testés sur leur discrimination du contraste [i], prototypique de l’anglais et [y], prototypique

du suédois. Pour réaliser leur expérimentation, les auteurs se basent sur le fait que la discrimination

des voyelles n’est pas catégorielle comme pour les consonnes mais que la discrimination est moins

bonne entre une voyelle prototypique et une voyelle proche qu’entre deux voyelles non prototypiques.

Cela est nommé « effet magnet ». En utilisant la technique HT, la discrimination des prototypes

suédois et anglais est évaluée par rapport à celle d’autres voyelles proches. Les résultats montrent que

les bébés américains discriminent mieux le prototype anglais et que les bébés suédois discriminent

mieux le prototype suédois. Ils en déduisent que l’apprentissage perceptif améliore la perception des

prototypes natifs, ce qui laisse supposer que les bébés apprennent bien les phonèmes de leur langue et

ce, avec des effets de « perceptual narrowing » sur les voyelles dès 6 mois. A cette même période, les

auteurs d’une étude de pupillométrie montrent que les bébés semblent pouvoir reconnaître une même

consonne couplée avec différentes voyelles. En conséquence, ils supposent que les bébés de 6 mois

seraient capables de retrouver l’invariant consonantique (Hochmann et Papeo, 2014).

Dans une expérimentation similaire en neurosciences, Cheour et al. (1998), comme nous l’avons

vu précédemment (voir section 3.1.3.2), montrent la présence de traces phonémiques, spécifiques à

chaque langue, dès 12 mois, ce qui reste assez tardif par rapport à la syllabe et par rapport au résultat

précédent. Dans leur expérimentation, ils observent qu’à 12 mois, le bébé finlandais réagit davantage

au contraste finnois qu’estonien et inversement, jouant en faveur d’un codage phonémique au moins

vocalique.

Ainsi, il semble bien que s’opère au cours du développement, tant en production qu’en

percep-tion, un passage progressif de la syllabe, unité primaire et disponible dès les tous premiers temps de

l’acquisition, vers le phonème, unité émergente acquise éventuellement plus tardivement, selon des

processus qui restent encore largement à définir.

3.2.3.4 Conclusion

Pour synthétiser, nous avons d’abord observé que les processus de perception phonétique

asso-ciés à la syllabe semblent être grossièrement similaires à ceux de l’adulte dès deux mois. De leur

côté, les unités phonémiques ne semblent être réellement acquises que plus tardivement. Nous

revien-drons, dans le chapitre 6, sur cette structure cognitive en présentant un modèle permettant d’étudier

l’acquisition conjointe des syllabes et des phonèmes.

Modélisation des unités distinctives et

présentation du modèle COSMO

Dans le chapitre précédent, nous nous sommes consacrés à l’analyse de la caractérisation et du

développement des unités phonétiques à travers la revue de diverses études sur la parole. Celles-ci

sont principalement basées sur des expérimentations sur l’humain, qu’elles soient comportementales

ou neuroscientifiques. Dans toute la suite de cette thèse, nous nous focalisons toujours sur les unités

phonétiques, mais en faisant appel à un tout autre domaine : la modélisation computationnelle.

Les modèles computationnels sont des outils adaptés pour tester des hypothèses sur les

méca-nismes internes d’un phénonème et semblent, en ce sens, appropriés pour tenter de mieux comprendre

comment fonctionne le cerveau humain. La modélisation computationnelle s’applique aussi à la

pho-nétique et de nombreux modèles ont été créés pour en comprendre les différents aspects.

Dans ce chapitre, en nous appuyant sur les faits et théories du chapitre précédent, nous décrivons,

dans un premier temps, plusieurs modèles computationnels s’étant intéressés, directement ou non, aux

unités phonétiques. Dans un second temps, nous présentons le modèle COSMO, que nous utilisons

dans nos simulations.

4.1 Les modèles computationnels étudiant les unités phonétiques

L’ensemble de cette section suit le plan du chapitre précédent et se base ainsi sur les deux questions

suivantes : 1) comment les unités phonétiques sont-elles caractérisées dans les modèles

computation-nels ? 2) Comment s’effectue le développement des unités phonétiques dans les modèles

computa-tionnels ? Nous tentons d’apporter des éléments de réponses dans les deux prochaines sous-sections.

Nous commençons par aborder les modèles computationnels phonétiques de perception et de

pro-duction avant de nous focaliser spécifiquement sur les modèles s’intéressant au développement des

unités phonétiques.