• Aucun résultat trouvé

CHAPITRE  2.   Etude  des  variations  phonologiques  en  production  et  perception  :  cadres  théoriques

2.   Mes  Choix  méthodologiques

Pour ma part, j’ai toujours fait le choix de partir de corpus et d’enquêtes pour ensuite formuler des hypothèses sur l’acquisition phonologique. J’ai choisi de traiter les corpus de manière quantitative. D’une part, car seule cette approche permet à la fois de déduire un comportement typique d’une population donnée et de montrer des profils particuliers dans cette même population. D’autre part, parce que les approches quantitatives permettent d’expliquer des variations dans une même population, grâce à des variables indépendantes quantifiables et mesurables (sexe, milieu social,...). Pour exemple, une étude effectuée en 2002 (Chabanal et Embarki, 2002) faisait produire à 24 enfants des liaisons facultatives. Ces jeunes sujets de 9 ans étaient répartis en deux groupes selon l’appartenance socio-économique de leurs parents. Les enfants devaient des liaisons facultatives dans des situations variant du moins formel (commentaires sur des images) au plus formel (récitation devant public). Les données montrent une sensibilité des enfants en général à la situation stylistique et donc une conscience stylistique dès l’âge de 9 ans. Par ailleurs, elles montrent également une différence marquée entre les groupes sociaux. Ces derniers se conforment moins bien aux normes conversationnelles.

Les approches quantitatives ont évolué au cours de mes recherches, elles sont passées de l’enregistrement de données uniquement enfantines à l’enregistrement des interactions parents-enfant.

48

2.2.

Recueils longitudinaux et transversaux

Les différentes études que j’ai menées sont de nature co-variationnistes, à ce titre elles se fondent sur des données quantitatives. Deux méthodes sont possibles dans ce courant.

Dans un cas, le nombre de sujets est réduit mais la quantité de données linguistiques est suffisamment importante et étirée dans le temps pour en tirer des données objectives sur l'hétérogénéité des pratiques linguistiques. Il m’est apparu clair que l’approche longitudinale est la plus à même de décrire le développement puisqu’elle suit l’évolution d’un même sujet ou d’un même groupe sur le temps. Notre recherche s’est donc majoritairement appuyée sur cette approche. Dans cette configuration de nature longitudinale, j’ai enregistré (Chabanal, 2003) deux garçons entre 40 et 50 mois durant dix heures à raison d'une séance de deux heures tous les deux mois. Je disposais ainsi d'environ mille contextes de liaison et de deux mille productions de liquides pour les deux enfants. Dans le cadre du projet Phonlex, ce sont de plus jeunes sujets (de 28 mois à 48 mois) qui ont été enregistrés durant une semaine tous les 8 mois. Les temps d’enregistrement ont varié de 4h30 à 8h/semaine selon les enfants.

Concernant la deuxième méthode de recueil des données, de type transversal, le nombre de sujets doit être suffisamment important pour que la durée de l'enregistrement soit réduite. Comme le souligne Kern : « cette alternative permet un recueil resserré dans le temps et atténue les différences interindividuelles tout en donnant la possibilité de retracer une trajectoire développementale » (Kern, 2013 : 14). Dans cette configuration, j’ai enregistré dans le cadre du projet FLE-PHONE, des groupes d’étudiants sur des durées d’enregistrements courts et à peu de temps d’intervalle. La création d’un cadre expérimental afin d’observer l’acquisition de paires minimales par des étudiants de FLE s'est inspirée des méthodes d’entraînements intensifs (Lively et al, 1993). J'en donne les raisons plus loin lorsque j’aborde ce projet en détail (cf. chapitre 3).

49

2.2.1. Les  outils  de  traitement  utilisés  

Brian MacWhinney et Catherine Snow ont été, à partir des années 80, les précurseurs dans la conception d’outils pour numériser des données enfantines, avec la base de données CHILDES (Child Language Database Exchange System). Le caractère volontairement ouvert de cet hébergement favorise le dépôt de corpus spontanés ou expérimentaux. Le format CHAT (Codes

for the Human Analysis of Transcripts) est utilisé pour permettre l’analyse de corpus via le

programme CLAN (Computerized Language ANalysis). Ce format fait l’unanimité dans la communauté travaillant sur l’acquisition de par sa simplicité et sa fonctionnalité, c’est donc tout naturellement que nous nous sommes tournés vers lui pour nos dernières recherches.

Mes premiers corpus (Chabanal, 2003, 2006), ont fait l’objet de transcription orthographique avec un codage spécifique pour les variables phonologiques. Ce mode de transcription fastidieux s’est montré peu efficace pour être mis sous des formats numériques de traitement de l’oral. Pour faciliter la lisibilité de nos données dans CHILDES, nous avons opté pour le langage de balisage XML (eXtensible Markup Language) en définissant nous même un schéma de structuration (le format XML-ALIPE) sur lequel je reviens plus tard de manière précise (point 1.6, p.129).

2.2.2. Les  apports  de  corpus  numérisés  pour  la  variation  

Les nombreux corpus numérisés concernant les productions d’adultes (Phonologie du Français Contemporain) ou d’enfants (Colaje, CHILDES, Alipe…) ont permis de pointer trois faits importants :

• La présence d’une variation constante, certains auteurs allant jusqu’à prétendre que la variation linguistique, loin d’être l’exception, serait la règle dans nos productions langagières,

• Les observations des usages comme garant d’une modélisation et de formalisations nouvelles, sans que l’on suppose une hypothétique grammaire universelle,

• la modélisation de la variation nécessitant la prise en compte de facteurs sociaux et cognitifs en interaction, intégrés notamment dans des modèles variationnistes, dynamiques comme le modèle exemplariste (Pierrehumbert, 2002, Goldinger, 1998, Bybee, 2006) ou les approches multimodales.

50 La prise en compte de la variation comme phénomène multifactoriel est une orientation majeure de nos travaux. Nous faisons un rapide point sur les données actuelles présentant cette multidimensionnalité avant de proposer nos propres hypothèses sur son acquisition dans le cadre de la théorie basée sur l’usage.

3. Point sur la multidimensionnalité de la variation