Choix méthodologiques - Introduction générale

CHAPITRE 1. Introduction générale

3. Choix méthodologiques

Le taux d’erreur global pour la conjugaison de 58 verbes avec la première personne du singulier est de 4,9%. Cependant, les contextes : « 1ère personne du singulier + quiero » et « 1ère

personne du singulier + puedo » représentent 60% de l’utilisation de ce contexte chez l’enfant.

Puisque ces deux formes sont correctement marquées (probablement apprises par cœur) elles ont été retirées et le taux d'erreur a évolué à 10,4%.

Ce taux d’erreurs est la conséquence de la forte utilisation de la 3ème personne du singulier au lieu de la 1ère ou 2ème personne du singulier attendu. L'inflexion avec la 3ème personne du singulier était la forme la plus fréquente dans le discours adressé aux enfants et donc, dans ces premières étapes, les enfants ont repris de manière incorrecte ce contexte quand ils ne connaissaient pas la forme correcte. Deux conséquences importantes découlent des résultats.

Tout d'abord, en dépit d'un faible taux d'erreur global, la morphologie verbale est effectivement apprise progressivement, avec des contextes d'erreurs élevés, liés à des fréquences d'input fortes.

Ensuite, la granularité a son importance puisque le niveau d'abstraction pour lequel on compte la fréquence d'une forme révèle des données différentes sur les modes d’acquisition : les erreurs sont faibles si l'on traite l'accord en tant que catégorie, mais beaucoup plus élevées quand on regarde le système soit en termes de marquage pour une personne, soit en termes de collocations précises.

3. Choix méthodologiques

Au cours de mon parcours de recherche, j’ai évolué d’une approche basée sur le recueil de productions enfantines, à partir de corpus enregistrés en situation naturelle ou contrôlée, vers un recueil mêlant productions enfantines et production adultes en interaction. L’enregistrement de corpus dense a l’intérêt par exemple d’intégrer, via le child direct speech, des données importantes pour mieux considérer l’influence du bain linguistique sur la production langagière des jeunes locuteurs. En effet, les études sur corpus traitant de l’influence parentale ont souvent postulé que les parents jouaient un rôle dans l’acquisition mais sans prendre le soin de recueillir les données parentales et sans croiser ces données avec celles des enfants dans un même corpus.

39 L’enregistrement « naturel » des interactions parents-enfant est le premier élément de définition de ce type de corpus. On peut y adjoindre un cahier de notes où nous notons « à la volée » des contextes produits hors de la période d’enregistrement. Le moment choisi pour enregistrer ces interactions est variable, il peut s’agir du repas, du bain ou lors de jeux.

La question de la quantité de données suffisantes par jour et sur la totalité du corpus constitue l’autre donnée fondamentale pour la constitution d’un corpus dense. Le temps d’enregistrement doit être calculé à partir de l’émergence plus ou moins fréquente des formes que l’on veut étudier. Tomasello et Stahl (2003) précisent par exemple que la fréquence d’utilisation de copules ou de pronoms en anglais est telle que l’enregistrement d’une heure par jour d’interactions parents-enfant sur deux semaines est suffisant.

Les mêmes auteurs inventorient les différents procédés pour évaluer la quantité suffisante de temps d’enregistrement recommandé pour avoir suffisamment de données à traiter. En ce qui concerne le corpus de Prune (40 mois), un des corpus dense recueilli au cours de mes recherches, pour un enregistrement d’une heure trente par jour sur une semaine, nous avons récolté en moyenne par jour, 25 contextes de liaison chez la mère, 123 contextes chez le père et 139 chez la fillette. Ces éléments sont suffisants pour travailler sur des études quantitatives. Comme le précise Tomasello (2003), de telles données peuvent nous aider à étudier l’influence de deux aspects de l’environnement langagier : l’un se manifestant au travers de la nature du discours entendu (children hear differents things), l’autre au travers de la quantité du discours entendu (in

differents quantities).

3.1.

Apports de deux corpus majeurs : phonlex, ALIPE

Le premier corpus auquel je fais référence dans le cadre de mes recherches est celui que j’appellerai « Phonlex ». Il a pu voir le jour grâce au soutien du programme 5 « Phonlex » (sous la responsabilité de Jacques Durand).

Il est constitué d’un ensemble de corpus denses dans lequel on retrouve des interactions parents-enfant de trois fillettes (Salomé, Lola, Prune). Ce premier corpus a été simplement transcrit orthographiquement et codé pour la liaison (absence ou réalisation de la liaison, erreur de liaison, type de liaison, contexte syntaxique de liaison).

40 Grâce à ces données, j’ai pu notamment décrire les spécificités de l’input parental en matière de production de liaisons (Chabanal et liégois, 2014).

Les données de Phonlex ont été ensuite complétées par d’autres sessions d’enregistrement à partir des mêmes sujets ou de nouveaux sujets. Cet ensemble a donné lieu à un autre projet que nous avons mis en place avec deux collègues du LRL : Thierry Chanier et Loîc Liégeois. Le projet ALIPE (Acquisition de la Liaison et Interaction Parents – Enfant, http://-diffusion.univ-bpclermont.fr/alipe/index.html) rend compte des spécificités du discours adressé à l’enfant et de l’influence qu’exerce l’input adulte sur les productions enfantines (Liégeois, 2009 ; Chabanal et Liégeois, 2011). Il concerne l’étude de la liaison et de l’élision. Le traitement des données et la possibilité qu’elles soient diffusées dans la communauté de chercheurs s’intéressant à l’acquisition, ont donné lieu à un travail considérable d’annotation et de programmation.

Je ferai état de ce dernier qui permet aujourd’hui, grâce au projet ALIPE (cf. 3.2, p.144) de proposer sur un serveur de la Maison des Sciences de l’Homme de Clermont-Ferrand

(http://-diffusion.univ-bpclermont.fr/alipe/index.html) les corpus avec des critères précisant le locuteur, le

type de variable étudié, la réalisation ou non de cette dernière, son caractère juste ou erroné et un ensemble d’informations visant à observer la granularité de la variation. Une mise au format CHAT des corpus a permis de déposer dans CHILDES (Macwhinney et Snow, 1985) la plus grande partie de nos corpus. Par souci de clarté, je préciserai lors de la présentation de mes résultats, la source de mon corpus, à savoir s’il s’agit du corpus « phonlex » ou « ALIPE ». Ils devraient ainsi permettre à la communauté internationale de travailler sur différents niveaux linguistiques sur les interactions parents-enfants.

3.2.

Hétérogénéité des publics choisis

Mes deux axes principaux de recherche concernent de deux types de publics.

Le premier est en lien avec un public adulte de Français Langue Etrangère (FLE) et de Français Langue Maternelle (FLM). Les locuteurs de FLE, issus d’une population d’étudiants étrangers (sinophones et lusophones), sont confrontés aux spécificités du système phonologique du français que l’on peut résumer ainsi : système tendu, antérieur et arrondi possédant une grande quantité de voyelles avec quatre degrés d’aperture. Ces spécificités aboutissent à des confusions phonologiques, source de variation. Mon implication en tant qu’enseignant de FLE m’a naturellement conduit à réfléchir à des conduites de remédiation que je décrirai dans un chapitre spécifique. Une recherche en didactique de la prononciation via des méthodes de correction intensive a donc été menée à titre expérimental.

Le second public adulte de FLM a permis, à partir d’observations issues d’une enquête sociolinguistique menée à Clermont-Ferrand, de me sensibiliser à la base de données PFC (http://www.projet-pfc.net/). Le cadre méthodologique rigoureux m’a aidé à décrire la variation régionale sous ses aspects syntaxiques, lexicaux et phonétiques dans une perspective variationniste. En effet, des variables indépendantes comme l’âge, la situation stylistique ont été corrélées avec les productions des sujets enregistrés.

L’autre axe de nos travaux repose sur l’observation de jeunes enfants francophones. Différentes variables phonologiques (liquides en contexte post-consonantique finales, liaisons, schwa) ont été étudiées et me permettent de proposer un modèle d’acquisition basé sur l’usage, où l’influence des interactions sociales via le bain linguistique jouerait un rôle déterminant dans la construction de principes phonologiques. L’âge de ces enfants est précoce, se situant pour la grande majorité de nos recherches entre 28 et 48 mois.

3.3.

Orientations socio-cognitives

Sont interrogées, à travers ces publics, deux thématiques en lien avec la variation phonologique :

3.3.1. Les aspects sociolinguistiques en lien avec la variation

En premier lieu, mes études dressent un inventaire des usages (phonologiques, lexicaux, syntaxiques) selon des variables sociolinguistiques indépendantes (publics FLE/FLM, âge, sexe…). En cela, mon orientation sociolinguistique est clairement variationniste. J’exploite des données quantitatives que je corrèle à des critères sociaux. Par ailleurs, la question de l’environnement langagier est abordée par l’étude du bain linguistique. Ce dernier est de nature différente dans mes recherches. Dans le cadre du projet avec des apprenants de FLE, le bain linguistique est « contrôlé », dans le sens où l’apprenant reçoit un input créé par mes soins de manière intensive et sur une période donnée. S’agissant de mes recherches sur la variation enfantine, le bain linguistique est constitué du discours spontané des parents dans le cadre de corpus denses.

3.3.2. Les dispositifs psycholinguistiques d’encodage phonologique :

Je compte observer les dispositifs cognitifs mis en place pour l’encodage : - de schémas réguliers d’alternance phonologique (public enfantin francophone), - d’invariants phonologiques (public adulte FLE).

S’agissant du premier axe, les travaux donnent habituellement lieu à deux types de débats dans lequel j’interviens à travers l’étude de la liaison et schwa. Le premier concerne le lieu de la variation. Est-elle ancrée phonologiquement ou lexicalement ? En clair, est ce qu’il existe des contraintes voire des règles phonologiques générales, innées ou non, intervenant sur la production variable de la liaison obligatoire ou facultative sans faire référence à la nature même du mot ? Ou bien, est-ce que le lexique en lui-même pourrait avoir encodé des formes plurielles (avec ou sans le phonème variable) que le locuteur activerait selon des procédures davantage liées à l’usage qu’à des principes abstraits (Bybee, 2005 ; Chevrot et al, 2005 ) ?

43 Le deuxième débat repose sur la nature des processus d’acquisition d’unités phonologiques variables. Une première approche, l’approche abstractionniste (Wauquier, 2010) et plutôt inductive, préconise une production de la variation phonologique contrainte par des principes abstraits. Une seconde approche, de nature exemplariste (Tomasello, 2003, 2006 ; Pierrehumbert, 2001) part plutôt du principe selon lequel « language structure emerges from language uses » (Tomassello, 2003 : 85). Dans ce cadre, c’est ce que l’enfant entend et produit qui le conduit à façonner un fonctionnement langagier régulier. A partir de ce dernier cadre, auquel je souscris, nous² avons proposé un scénario développemental d’acquisition de la liaison obligatoire et facultative (Chevrot et al, 2007, 2009 ; Nardy, 2008). Il prédit que l’une des premières étapes de l’acquisition de la liaison repose sur la mémorisation de mots1-mots2 les plus présents dans l’input. Lors d’étapes ultérieures, des réflexions de type analogique basées toujours sur la force de l’input et donc sur des éléments concrets engendreraient des mécanismes abstraits mais sans que les généralisations effacent les traces concrètes emmagasinées dans notre lexique.

Ainsi, le schéma que nous défendons modéliserait l’encodage lexical de la variation phonologique sur des bases empiriques liées à la fréquence lexicale tout en fonctionnant sur des schémas plus abstraits, des slots ou des formulations générales de type mots 1 + X. Dans ces conditions, la question du rapport entre phonologie et lexique est posée de la façon suivante : le locuteur mémorise des exemplaires lexicaux contenant les unités phonologiques variables (/pɘti/ versus /pti/, /lɘtʀyk/ versus /ltʀyk/) à partir de collocations entendues dans l’input. L’ensemble de ces éléments concrets est stocké et traité à partir de capacités cognitives telles que l’analogie pour en déduire qu’un même terme peut avoir différentes formes ou représentations phonologiques dans le lexique mental. Un enfant qui entendrait ‘petit’ toujours prononcé avec /t/ devant voyelle dans certains contextes morpho-syntaxiques, pourrait en conclure que le /t/ appartient lexicalement au mot et qu’il s’ancre phonologiquement et variablement lorsqu’il est précédé d’une voyelle.

Les variables phonologiques seraient acquises par le contact avec les formes ou collocations lexicales entendues et mémorisées dans l’input. L’encodage lexical des variations phonologiques est envisagé dans différents courants, généralement abstractionniste (Norris, 1994) ou exemplariste (Pierrehumbert, 2002).

2 L’emploi du « nous » est utilisé lorsque les travaux ont été menés collectivement, quand ces derniers sont le fruit de mon seul travail, j’emploie naturellement le « je ».

Dans le document Variation et acquisition/apprentissage phonologique : Input, fréquence, construction (Page 39-45)