Création du matériel expérimental - CHAPITRE 4 MÉTHODOLOGIE EXPÉRIMENTALE

3 PARTIE III – MÉTHODOLOGIE

3.4 CHAPITRE 4 MÉTHODOLOGIE EXPÉRIMENTALE

3.4.1 Création du matériel expérimental

Elle se déroule en 4 étapes : obtention des items linguistiques, enregistrement, création des stimuli, analyse acoustique des stimuli. Ces 4 étapes sont détaillées ci- après.

3.4.1.1 Obtention des items linguistiques

La plupart des expériences nécessitent 2 types d‟items :  des items expérimentaux

 des items de remplissage

Selon les expériences, ces 2 catégories d‟items peuvent être :  des mots

 des pseudo-mots (séquence de phonèmes de la langue considérée, agencés de manière à respecter les contraintes phonotactiques de la langue sans pour autant former un mot existant)

 des non-mots (séquence de phonèmes de la langue considérée, agencés sans respecter les contraintes phonotactiques de la langue)

Leur obtention est décrite dans les 2 sous-sections suivantes.

3.4.1.1.1 Sélection des mots

La sélection des mots se fait en 3 étapes :

 extraction, à partir d‟une base de données lexicale, d‟un sous-ensemble de mots ayant les caractéristiques souhaitées, déterminées à partir des facteurs codés dans la base de données

 élimination manuelle de tous les mots de ce sous-ensemble qui possèdent des caractéristiques linguistiques et psychologiques indésirables, relativement à des facteurs qui ne sont pas codés dans la base de données (décrits plus bas)  sélection manuelle des mots dans le sous-ensemble filtré, de manière à

obtenir des conditions aussi homogènes que possible

Ces 3 étapes sont détaillées ci-dessous. Les deux premières visent à cibler le contenu de la base de données au plus près des besoins, afin de permettre, à la dernière étape, de se concentrer plus facilement sur l‟homogénéité du matériel.

3.4.1.1.1.1 Première étape : sélection d’un sous-ensemble dans une base de données lexicale

La base de données qui a été utilisée est BRULEX. La sélection dans cette base de données est faite selon les critères suivants :

 catégorie grammaticale « nom »

 nombre de syllabes « 1 ou 2 » selon l‟expérience

 structure syllabique souhaitée (selon l‟expérience. Toutes les syllabes utilisées commencent par une consonne)

 réduction des ambiguïtés (contrôle de l‟homophonie ou contrôle de l‟homogénéité de ce facteur à travers les conditions ou aux analyses statistiques)

 détermination de la position du point d‟unicité phonologique du mot (pré ou post-final ; si pré-final, à une position particulière (exemple : dernier phonème))

 contrôle de l‟absence de schwa et de gémination

3.4.1.1.1.2 Deuxième étape : filtrage manuel des mots Élimination des :

 mots pour lesquels l‟information de fréquence n‟est pas disponible dans BRULEX (exemple : « pétanque »)

 mots préfixés et pseudo-préfixés (exemple : « préfixe », « préfet »)  mots composés (exemple : « grand-père »)

 mots argots ou populaires (exemple : « clébard »), insultants (exemple : « crétin ») ou pouvant l‟être par leur ambiguïté (exemple : « cochon »), etc.

 mots d‟origine étrangère (exemple : « bowling »)

 mots sexuellement connotés (exemple : « capote ») ou à enchâssements sexuellement connotés (exemple : « confesse »)

 mots malaisés à syllaber (exemple : « tab/lée » - « ta/blée »)

 mots ayant deux syllabes phonologiquement identiques (exemple : « barbare »)

 noms ressemblant à des adverbes ou à des adjectifs (exemple : « petit »)  noms pouvant être des prénoms (exemple : « clémence »)

3.4.1.1.1.3 Troisième étape : sélection manuelle des items à partir du sous-ensemble filtré

La sélection est faite de manière à ce que :

 les items soient suffisamment employés dans la population pour être connus de tous les participants testés

 les items satisfassent aux facteurs manipulés dans l‟étude :

 présence d‟un enchâssement initial (E/nE – [] renferme le mot [])  enchâssabilité de l‟item à l‟initiale d‟un mot plus long (I/nI – [] peut

être le début de [tik])

 lexicalité d‟une syllabe à une position précise dans un mot (M/nM – la première syllabe de [tik] est un mot ([]))95

 fréquence d‟une syllabe dans le lexique (Rare / Fréquente (R/F))  fréquence positionnelle d‟occurrence d‟une syllabe dans les mots

 à l‟initiale (R/F)

 en position non initiale (R/F)  les items ne s‟amorcent pas mutuellement :

 relations sémantiques (exemple : « vache » et « champ ») et morphologiques (exemple : « graine » et « grainetier ») entre mots

 relations sémantiques entre mots enchâssés et mots porteurs (exemple : « lance » dans « balance », en rapport sémantique avec « bataille »)  qu‟une même syllabe, lorsqu‟elle existe dans un item expérimental, n‟existe

pas deux fois dans le matériel de l‟expérience

 les items forment des conditions en moyenne appariées, pour autant de facteurs non expérimentaux que possible :

 fréquence formelle phonologique d‟occurrence  nombre de phonèmes

 position du point d‟unicité phonologique.

95 _{La sélection des syllabes, ou des mots en fonction de leurs syllabes constitutives, de même que la}

création des pseudo-mots en fonction des caractéristiques des syllabes, se fait à l’aide de deux bases de données syllabiques issue de l’analyse de BRULEX, l’une produite par Jeremy Goslin, l’autre par l’auteur (non publiées).

D‟autres facteurs spécifiques peuvent contraindre la sélection, en fonction des expériences (exemple : les mots bisyllabiques dont la deuxième syllabe est un mot présentent un point d‟unicité identique à celui du mot enchâssé en deuxième syllabe). Ces spécificités sont détaillées lors de la présentation de chaque expérience.

3.4.1.1.2 Choix et création des pseudo-mots et des non-mots

Les pseudo-mots utilisés dans les expériences sont de deux types :

 des syllabes du Français : items expérimentaux sélectionnés à partir des bases de données syllabiques obtenues par analyse de BRULEX (J. Goslin ; C. Lachaud)

 des syllabes et bisyllabes artificiels : items distracteurs créés pour permettre la réalisation des tâches de décision lexicale, de manière à respecter la phonotactique de la langue française, à partir de rien ou à partir de mots du Français selon les besoins de l‟expérience.

Les non-mots utilisés sont des syllabes créées, qui n‟existent pas en Français selon BRULEX. Une seule expérience (Expérience 12) utilise des non-mots.

3.4.1.1.2.1 Sélection de syllabes pseudo-mot du Français Elle est faite en fonction des facteurs :

 nombre de phonèmes

 structure phonétique de la syllabe  fréquence d‟occurrence

 nombre de mots renfermant la syllabe  position d‟occurrence

 fréquence positionnelle d‟occurrence

 nombre de mots renfermant la syllabe à une position donnée 3.4.1.1.2.2 Création de pseudo-mots

Les règles de création dépendent de ce qui est testé dans la situation expérimentale. D‟une manière générale, les pseudo-mots ne doivent pas interférer avec le traitement des items expérimentaux. Il fallait donc être particulièrement vigilant à ce que les pseudo-mots :

 n‟évoquent pas directement un mot expérimental (lien phonologique. Exemple : // / « téléphone »)

 n‟évoquent pas indirectement un mot expérimental (lien sémantique). Exemples :

 le pseudo-mot évoque par sa ressemblance phonologique un mot en lien sémantique avec un mot expérimental (// évoque « téléphone », en lien sémantique avec « parole »)

 le pseudo-mot renferme un mot enchâssé relié sémantiquement à un mot expérimental (le pseudo-mot /plasmuk/ renferme le mot « place » en lien sémantique avec le mot « espace »)

3.4.1.1.2.3 Création des non-mots Les non-mots sont créés de manière à :

 évoquer le moins possible de mots du Français (testé par enquête auprès de quelques étudiants). Il est cependant quasi-impossible d‟avoir un non-mot qui n‟évoque rien (le système réaliserait l‟appariement le moins mauvais sur la base de la sonorité de l‟item, et trouverait toujours quelque chose à apparier)  être appariés aux syllabes pseudo-mot (syllabes du Français) utilisées dans les

autres conditions pour respecter une structure phonétique commune de la syllabe

3.4.1.1.3 Remarques concernant la base de données lexicale

utilisée pour la création et le contrôle du matériel

expérimental

La base de données BRULEX, utilisée comme référence dans cette étude, est parfois critiquée sur trois points :

 quantité de mots : limitée à 35746 entrées, essentiellement à cause de l‟absence des formes conjuguées des verbes. La position du point d‟unicité théorique (PU de chaque mot) qui est fournie par cet outil (calculée sur ce corpus de 35746 mots) serait donc une approximation du PU théorique réel. Il en serait de même pour l‟évaluation des fréquences d‟occurrence syllabiques calculées à partir de BRULEX.

 représentativité de l‟usage réel et contemporain du Français : les informations de fréquence sont issues de l‟analyse (Centre de Recherche pour un Trésor de la Langue Française (Imbs, 1971)) de corpus littéraires (romans, essais, recueils de poèmes, œuvres dramatiques) publiés entre 1919 et 1964. Il ne s‟agit donc pas d‟une fréquence réelle d‟usage quotidien et contemporain par l‟adulte moyen.

 limite du nombre de facteurs renseignés

Depuis 2001, une nouvelle base de données lexicale pour le Français contemporain, LEXIQUE (New et al., 2001), est disponible aux chercheurs. Résolvant les critiques précédentes, LEXIQUE apporte un progrès certain à ce type d‟outils. Cependant, la base de données BRULEX a été utilisée pour les raisons suivantes :

 à l‟époque de sa publication, LEXIQUE contenait beaucoup trop d‟erreurs pour apparaître comme un outil crédible et professionnel, et inciter au changement de base de référence. Par contre, BRULEX, utilisée dans de nombreuses études psycholinguistiques sur le Français, avait acquis le statut d‟un standard

 le travail avait été commencé avec BRULEX. Il était difficile de justifier d‟un changement de référence en cours de recherche :

 qui aurait induit une hétérogénéité dans l‟étude

 alors que BRULEX est en adéquation suffisante avec les besoins du travail (et puisque son contenu représente un vocabulaire 3 fois supérieur au vocabulaire de l‟adulte moyen, selon Content et col. (1990)).

Les remarques suivantes permettent d‟appuyer cette position :

 Position du PU : les positions du PU données par BRULEX et LEXIQUE s‟écartent probablement de la position réelle pour un mot et un individu donnés, du fait qu‟il s‟agit d‟une position théorique qui dépend du lexique analysé, alors que la position réelle du PU d‟un mot dépend du lexique connu par un individu (impossible à déterminer). La présence de formes conjuguées dans un corpus décale les PU vers la fin des mots, par rapport au PU calculé sur un corpus qui ne renferme pas de formes conjuguées. Il reste cependant à quantifier cet écart et à savoir si psychologiquement, les verbes conjugués sont traités comme leurs lemmes (cette question fait toujours l‟objet de recherches en morphologie), avant de se prononcer sur les bienfaits expérimentaux de cette précision nouvelle. Ce point est donc considéré comme non crucial pour justifier un changement de référence.

 Fréquence d‟occurrence et la représentativité de l‟usage contemporain des mots : le travail développé dans l‟Annexe 1 page 423 a montré que l‟influence de la fréquence d‟usage d‟un mot n‟est pas un prédicteur fiable du temps nécessaire à la reconnaissance du mot. L‟effet de la fréquence disparaît lorsque l‟âge d‟acquisition estimé et la familiarité conceptuelle subjective d‟un mot sont intégrés au modèle d‟analyse, conjointement à la fréquence d‟occurrence (corrélations et interactions). La fréquence aurait une influence prédictive parce qu‟elle explique un peu de l‟âge d‟acquisition et un peu de la familiarité conceptuelle. L‟âge d‟acquisition et la familiarité conceptuelle ont été utilisés dans les analyses statistiques en tant que covariables, conjointement à la fréquence phonologique d‟occurrence calculée à partir des fréquences fournies par BRULEX. Cette solution offre un bien meilleur contrôle que l‟utilisation de fréquences plus contemporaines, telles que celles fournies dans LEXIQUE

 Fréquence phonologique d‟occurrence d‟une syllabe : elle dépend de 2 facteurs : le nombre de mots dans lequel la syllabe se trouve et la fréquence d‟usage de chacun de ces mots. Le premier facteur, à cause de sa nature structurale, pourrait avoir une implication importante sur l‟activation lexicale. Il est vrai que pour ce facteur, BRULEX conduit peut-être à une évaluation approximative du lexique (inventaire des syllabes peut-être incomplet ?). Toutefois, quelle est la proportion de syllabes manquantes, en dehors des syllabes correspondant à des affixes ? Peut-elle être si importante que BRULEX ne permette pas une approximation suffisante ? Il est vrai aussi que l‟estimation du nombre de mots renfermant une syllabe donnée est biaisée s‟il manque des formes conjuguées dans cette comptabilisation (cf. remarques précédentes concernant le traitement de ces formes et leur représentation en mémoire). Concernant le second facteur (fréquence d‟usage du mot), il est vrai que la fréquence d‟occurrence des mots dans BRULEX est

certainement moins représentative de l‟usage contemporain moyen du Français que celle de LEXIQUE. Cependant, il faut considérer l‟emploi qui a été fait de la fréquence phonologique des syllabes : opposer des syllabes rares à des syllabes fréquentes. Cela est certainement possible avec l‟approximation donnée par BRULEX. Même si des différences existent entre BRULEX et LEXIQUE (mots nouveaux ou ayant un usage nouveau, employés fréquemment aujourd‟hui alors qu‟ils ne l‟étaient pas dans la littérature entre 1919 et 1964 ; mots tombés en désuétude alors qu‟ils étaient d‟un usage plus fréquent ; lexique différent), rien n‟autorise à dire qu‟elles sont suffisantes pour inverser les caractéristiques d‟une condition portant sur un ensemble d‟items. Si des changements existent dans l‟utilisation des mots d‟une langue, des points demeurent constants parce que les mots sont ancrés dans la réalité, au sujet de laquelle ils servent à communiquer.

3.4.1.2 Enregistrement et traitements numériques

Une fois les items linguistiques sélectionnés / créés en fonction des caractéristiques voulues, ils doivent prendre corps dans le monde physique pour devenir les stimuli délivrés aux sujets lors des tests expérimentaux. Cette opération nécessite un locuteur, du matériel d‟enregistrement, et une procédure d‟enregistrement, trois points qui sont détaillés ci-dessous.

3.4.1.2.1 Le locuteur

 Une locutrice, naïve quant aux buts de l‟expérience, a été choisie pour lire les items de la partie sur la prosodie (phrases construites, sémantiquement structurées en courts textes), sur la base de la clarté et de l‟expressivité de sa voix. Sa consigne était de prononcer les phrases de la manière la plus naturelle et vivante possible. Sa naïveté était un point essentiel pour la création du matériel utilisé dans cette partie du travail, puisque la relation entre les facteurs topologiques / morphosyntaxiques et la prosodie, devait, si elle existait, émerger naturellement.

 La naïveté du locuteur n‟était pas un point théorique essentiel pour l‟enregistrement des items utilisés dans les expériences sur l‟activation lexicale. Cet aspect apparaissait même insignifiant en regard des impératifs techniques pour produire des items ayant les caractéristiques acoustiques et prosodiques précisément définies, et surtout, homogènes.

Faire appel à une personne extérieure et inexpérimentée est très coûteux en temps et en énergie :

 obtenir des productions ayant les caractéristiques désirées nécessite un temps d‟enseignement puis d‟entraînement

 il faut parfois procéder à plusieurs sessions d‟enregistrement, lorsque le matériel produit contient des défauts ou n‟est pas homogène. Agender de nouvelles sessions prend du temps, sans garantie de la disposition du locuteur ni du résultat de l‟enregistrement

 d‟une expérience à l‟autre, le locuteur peut être différent, introduisant un paramètre aléatoire qui limite la possibilité de comparer les résultats à travers les différentes étapes de l‟étude.

Pour ces raisons, le locuteur utilisé a été l‟auteur du travail. Les avantages de ce choix sont considérables :

 disponibilité à volonté

 connaissance des caractéristiques acoustiques souhaitées du matériel  connaissance de la procédure de production et d‟enregistrement  homogénéité des corpus à travers l‟étude

L‟inconvénient, qui peut-être discuté, est que ce locuteur ne dispose pas toujours de l‟accent local. Ceci peut avoir interféré dans la reconnaissance de certains items par certains sujets. Il faut cependant préciser qu‟à Genève, l‟accent est peu marqué dans la population du fait de la proximité de la France, du fait qu‟une communauté française importante vit et travaille sur le canton, et du fait que beaucoup d‟étudiants viennent de l‟étranger et en particulier de la France.

3.4.1.2.2 Le matériel d’enregistrement

Le Laboratoire Parole et Langage (Aix-en-Provence) et le Laboratoire de Psycholinguistique Expérimentale (Genève) mettent à disposition des chercheurs les outils techniques pour produire un matériel expérimental irréprochable sur le plan acoustique :

 local insonorisé (chambre sourde à Aix-en-Provence, caisson insonorisé à Genève)

 micro de qualité professionnelle (SHURE Bêta 58A)  enregistreur numérique DAT (Sony ZA5ES)

 dispositif de transfert de l‟information DAT  ordinateur, sous un format numérique (carte son (Turtle Beach) munie de connecteurs numériques (Aix- en-Provence), module son externe (Creative Sound Blaster « Extigy ») muni de connecteurs numériques et optiques (Genève))

 logiciels d‟édition du son (Sound Forge® (Sonic Foundry, 2000) et Cool Edit Pro (Syntrillium Software Corporation, 2003))

 logiciels d‟analyse acoustique (Praat / Windows® (Boersma & Weenink, 2000), MES Signaix / UNIX (Espesser, 1994) et ESPS / UNIX (Entropic Research Laboratory, 1998))

3.4.1.2.3 La procédure d’enregistrement

La procédure suivie est standard. Elle est détaillée ci-dessous.

3.4.1.2.3.1 Organisation de la liste d’items à lire

Le but de la structuration du matériel à lire est de favoriser une production homogène à travers les conditions expérimentales.

 Les mots sont successivement sélectionnés un par un dans chacune des conditions expérimentales, pour former une liste de lecture. Le processus est réitéré jusqu‟à épuisement des items. Ceci permet de répartir les modifications imperceptibles de diction, qui existent entre le début et la fin d‟un enregistrement (rythme, mélodie, intensité, timbre de voix), de façon homogène sur l‟ensemble des conditions.

 Les items monosyllabiques sont présentés séparément des items bisyllabiques. Ceci permet l‟adoption plus aisée par le locuteur d‟un profil prosodique constant.

3.4.1.2.3.2 Installation du locuteur et réglages du volume

Le but est ici d‟assurer une qualité optimale de la prise de son (volume adapté, absence de bruit dans le signal, etc.).

 Le locuteur est installé dans la pièce insonorisée.

 La position du micro et la distance entre sa bouche et le micro est vérifiée (éviter l‟enregistrement de souffles). Elle doit être constante pendant toute la durée de l‟enregistrement pour limiter les variations d‟intensité du signal  Une phase de test sert à déterminer les niveaux optimaux d‟enregistrement, et

à « échauffer » le locuteur

3.4.1.2.3.3 Production, enregistrement et transfert des données  Lecture des items de l‟étude sur la prosodie :

 présentation sur écran du groupe de phrases relatives à un item (phrase d‟introduction sémantique, phrase porteuse)

 lecture vivante et modulée (donner l‟impression que les phrases sont formulées spontanément lors d‟une discussion)

 Lecture des items des études sur la reconnaissance des mots parlés :  présentation sur papier

 le locuteur est attentif à produire les items avec un débit constant et une intonation identique

 le rythme de production est lent : chaque item est lu comme s‟il était seul, c‟est-à-dire suivi d‟une pause assez longue. Ceci est voulu afin d‟éviter une prosodie de liste

 pour disposer d‟un corpus à l‟acoustique homogène, la liste est lue deux fois dans la foulée. Les items utilisés dans les expériences sont sélectionnés à partir du milieu de la première lecture jusqu‟au milieu de la deuxième lecture, cette zone d‟enregistrement s‟avérant être en général la plus homogène (le locuteur a trouvé son rythme et n‟est pas encore lassé). Une troisième lecture est faite après une pause, afin de disposer de 3 enregistrements d‟un même item, au cas où la production serait bruitée ou non utilisable sur la zone sélectionnée pour une raison ou une autre (souffle, intensité trop forte, bruit de mouvement, bruit de bouche, etc.)  lorsque le locuteur se rend compte qu‟un item est défectueux, il le répète

immédiatement

 Transfert des données par connexion numérique, du DAT à l‟ordinateur, où le corpus est enregistré (logiciels d‟édition du son) dans un fichier son au format PCM du standard Windows® (.wav ; échantillonnage à 44100 Hz, 16 bits, stéréo. Le fichier subit immédiatement un ré-échantillonnage : passage en format mono ; passage en 16000 Hz pour le corpus utilisé dans la partie prosodie pour des raisons techniques relatives à la resynthèse – tous les autres corpus sont laissés en 44100 Hz (qualité sonore meilleure à l‟écoute)).

3.4.1.3 Création des stimuli

3.4.1.3.1 Stimuli en voix naturelle

Une fois le corpus disponible sur ordinateur au format audionumérique voulu, la phase de création des stimuli commence. Elle se décompose en 4 étapes détaillées ci- dessous : nettoyage, sélection, marquage, découpage. Au terme de cette procédure, on dispose d‟autant de fichiers son que le corpus renferme d‟items.

 Nettoyage

 le corpus est écouté attentivement

 à l‟aide d‟un logiciel d‟édition du son, il est débarrassé :

 des portions inutiles (pauses longues, début et fin de session, toux, bruits divers)

 des items posant un problème (parasitage, variabilité acoustique, etc.).

 Sélection

 la version de chaque item qui sera utilisée dans l‟expérience est sélectionnée dans le fichier nettoyé, de manière à ce que l‟ensemble soit le plus homogène possible (intensité, mélodie, débit, articulation)

 les sélections sont conservées tandis que le reste du fichier est effacé  Marquage

 chaque item contenu dans le fichier son résultant de l‟étape de sélection est marqué manuellement, à l‟aide du logiciel Praat.

 cette phase de marquage consiste en deux procédures :

 localisation précise des frontières initiale et finale de chaque item (début et fin de l‟oscillation acoustique correspondant à l‟item)  labellisation de chaque séquence sonore ainsi délimitée

 Découpage

 le fichier son marqué et labellisé est découpé en autant de fichiers son qu‟il

Dans le document La prégnance perceptive des mots parlés: une réponse au problème de la segmentation lexicale ? (Page 135-148)