Variables explicatives et codage des catégories

Chapitre 4 : Discussion conclusive

4.2. Limites méthodologiques

4.2.5. Variables explicatives et codage des catégories

Pour atteindre l’un des objectifs de la présente étude, les deux variables linguistiques liées à la coarticulation, PRE_LIEU et POST_LIEU, ont été codées grâce à un nombre limité de catégories. Cette méthode a certes permis de relever des patrons coarticulatoires marquants et de mieux comparer nos résultats à ceux des études antérieures; cependant, la classification retenue pourrait voiler des tendances qui ne seraient révélées qu’en affinant les catégories ou en distinguant simplement toutes les consonnes les unes des autres, à l’instar d’Armstrong et Low (2008) et de Mooney (2016) dans leurs analyses respectives. Par exemple, comme on l’a vu dans la section 4.1.2, le /ʁ/ antéposé est associé à des valeurs de F2 plus basses que les autres consonnes postérieures, ce que nous n’avons pu constater qu’indirectement, en observant les modes conditionnels de l’effet aléatoire du MOT. Dans le même esprit, Armstrong et Low (2008 : 440) mentionnent qu’un /m/ postposé favoriserait l’antériorisation de /ɔ/, à la différence de /p/ ou /f/; Yaeger (1979), Paradis (1985) et Hall (2007) indiquent quant à eux que les consonnes nasales postposées favoriseraient l’antériorisation de /ɔ/. L’examen de l’effet individuel de chaque consonne était hors du spectre de la présente étude; cependant, étant donné le nombre d’occurrences que nous avons recueillies et la variété de mots et de pseudo-mots disponibles, analysées autrement, nos données permettraient peut-être d’éclairer l’influence sur l’antériorisation de /ɔ/ du mode articulatoire, de la nasalité ou de la fréquence d’apparition des consonnes dans le lexique (Armstrong et Low, 2008). Par ailleurs, un codage

consonne par consonne permettrait sans doute également d’affiner la comparaison entre le français hexagonal et le français québécois.

Malgré le codage large adopté pour les variables linguistiques, les variables explicatives exploitées dans le cadre de la présente étude ont en général permis d’expliquer une part substantielle de la variance observée dans les valeurs de fréquences formantiques, comme le montre le Tableau 20, qui synthétise les R² calculés pour chacun des modèles (voir l’Annexe 9 et l’Annexe 11) à l’aide de la bibliothèque R piecewiseSEM (Lefcheck, 2015).

F1 F2 F3

Corpus 25 % 50 % 75 % 25 % 50 % 75 % 25 % 50 % 75 % C10-12 0,56 _(0,82) _(0,84)0,56 _(0,76)0,42 _(0,90)0,64 _(0,88)0,59 _(0,84)0,59 _(0,85)0,32 _(0,86)0,34 _(0,84)0,34 C16-17 0,49 _(0,79) _(0,82)0,55 _(0,81)0,55 _(0,88)0,62 _(0,85)0,57 _(0,85)0,64 _(0,88)0,62 _(0,89)0,70 _(0,88)0,58

Tableau 20 – Valeurs de R² marginal et conditionnel (entre parenthèses) calculées pour chacun des modèles statistiques

Ces indices, d’une valeur entre 0 et 1, donnent un aperçu du pouvoir explicatif d’un modèle statistique : le R² conditionnel illustre la part de la variance expliquée par tous les facteurs, fixes et aléatoires, alors que le R² marginal illustre celle qui est expliquée par les seuls facteurs fixes (Nakagawa et Schielzeth, 2013). Dans le Tableau 20, le R² marginal dépasse 0,30 dans tous les cas, et 0,50 dans 13 des 18 modèles73_{. Ces performances sont excellentes, considérant le nombre élevé de} paramètres réputés influencer les valeurs des fréquences formantiques et le faible nombre de variables indépendantes examinées dans le cadre de cette étude. L’ajout de l’effet des facteurs aléatoires porte l’ensemble des modèles à des valeurs de R² conditionnel au-delà de 0,75, et même de 0,80 dans 16 cas sur 18. Ce fait indique que la plupart de la variance qui n’est pas expliquée par les facteurs fixes dépend de variables lexicales ou individuelles, liées aux effets aléatoires du MOT ou du LOCUTEUR. Une éventuelle variation des fréquences formantiques liée au genre comme construit social (et non au sexe biologique des individus, associé à des différences physiologiques), par exemple, pourrait être absorbée par les constantes aléatoires calculées pour chaque locuteur.

En dépit de ces bons résultats, soulignons que trois variables linguistiques au moins n’ont pas été considérées dans nos analyses : la fréquence lexicale, la durée et le statut lexical (mot/pseudo-mot). D’abord, bien que la fréquence lexicale ait été mentionnée dans quelques études antérieures (par ex. Lamontagne, 2015a; Mooney, 2016), nous jugions difficile de la prendre en compte directement en raison de la comparaison de deux variétés de français (français québécois et hexagonal) et de l’utilisation conjointe de mots et de pseudo-mots – le choix de ces derniers n’a d’ailleurs pas été orienté en fonction de la fréquence lexicale. L’inclusion de constantes aléatoires par MOT, bien qu’elle n’ait pas permis en elle-même d’évaluer l’effet réel de la fréquence lexicale, a selon nous suffi à faire

73_{Les modèles les moins performants sont ceux qui ont été calculés pour F}

3 dans le corpus C10-12. Ce fait est surprenant, puisque les R² marginaux des modèles évaluant F3 pour le corpus C16-17 sont notablement meilleurs, alors que les mêmes variables indépendantes ont été prises en considération dans tous ces modèles. Nous n’avons pas d’explication à cette situation.

en sorte que les modèles la prennent en compte et que les résultats pour les facteurs fixes retenus soient les plus fiables possible.

Quant à la durée, que nous avons relevée pour effectuer les mesures en différents points de chaque voyelle, nous avons préféré ne pas l’inclure dans nos modèles statistiques : l’ajout d’un prédicteur continu les aurait rendus encore plus complexes. Il serait toutefois important de vérifier si la faible durée de certaines occurrences n’explique pas en partie leur antériorisation, sachant que cette relation entre durée et voyelles réduites a été notée non seulement dans le cas de /ɔ/ (par ex. Yaeger, 1979; Lamontagne, 2015a), mais aussi pour les voyelles en général (Stevens et House, 1963; Lindblom, 1963).

Concernant le statut lexical, nous avons inclus, dans le corpus C16-17, aussi bien des mots (en majorité, soit 49) que des pseudo-mots (27), de façon à avoir assez de matériel linguistique à notre disposition pour bien évaluer l’effet du lieu d’articulation des consonnes adjacentes sur /ɔ/. Cette décision peut être critiquée sur au moins deux aspects.

Premièrement, selon l’hypothèse de la double voie (dual route hypothesis), d’abord évoquée par Forster et Chambers (1973), puis reprise par nombre d’études74_{, il est possible que les deux types} d’unités que nous avons utilisées, mots et pseudo-mots, soient traités différemment au moment où les locuteurs doivent les lire à voix haute : les mots, dont l’orthographe est connue, auraient une forme phonologique stockée en mémoire et récupérée par une recherche dans le « dictionnaire » mental, alors que les pseudo-mots, n’ayant jamais été lus auparavant, seraient plutôt produits grâce à des règles de correspondance graphèmes-phonèmes (Coltheart, Curtis, Atkins et Haller, 1993). L’hypothèse de la double voie s’appuie notamment sur le temps de lecture variable entre les unités de statut lexical différent (Forster et Chambers, 1973). Au moment de préparer notre publication consacrée aux résultats pour F2 à 50 % dans le corpus C16-17 (St-Gelais et al., 2018), nous avons ainsi ajouté le statut lexical comme facteur fixe au modèle de régression linéaire à effets mixtes, jugeant qu’il pouvait avoir influencé la prononciation de /ɔ/. Toutefois, ce paramètre n’est pas apparu pertinent dans l’explication de la variation de la fréquence formantique. Il semble probable que la méthodologie que nous avons employée pour faire produire les pseudo-mots, qui consistait d’abord à les insérer dans une phrase et à les faire prononcer une première fois avant de les faire répéter, ait amoindri d’éventuelles différences de traitement entre les mots et les pseudo-mots. Sur la base du résultat obtenu, l’effet du statut lexical n’a pas été évalué dans les autres modèles.

Deuxièmement, plusieurs des syllabes que nous avons catégorisées comme des pseudo-mots s’apparentent phonologiquement à des mots usuels, du moins en français québécois. D’une part, bob correspond à « Bob », diminutif usuel du prénom « Robert »; de l’autre, mop (« mop » = ‘vadrouille’),

kop (« cup » = ‘petit verre en papier’), god (« God » = ‘Dieu’), bomme (« bum » = ‘voyou’), gonne

(« gun » = ‘fusil’), pof (« puff » = ‘bouffée de cigarette’) et honne (« on » = ‘allumé / activé’) constituent des graphies alternatives d’emprunts à l’anglais. De façon similaire, en français hexagonal

74_{Pour une vue d’ensemble des travaux sur la question, le lecteur peut se référer à Coltheart et al. (1993) et à} Pritchard, Coltheart, Palethorpe et Castles (2012).

mais de plus en plus en français québécois également, notre pseudo-mot mog rappelle « mug », emprunt à l’anglais signifiant ‘tasse’. Nous avons fait le choix de ne pas utiliser, dans notre tâche de lecture, les mots correspondant à ces pseudo-mots. Par exemple, le graphème <u>, présent dans plusieurs de ces mots, aurait pu être rendu par un /y/ par un locuteur les rencontrant pour la première fois; or, nous avions pour objectif de susciter la voyelle /ɔ/ et nous ne voulions pas devoir « corriger » les participants de l’étude pour orienter leur production attendue. Nous espérons que l'utilisation systématique du graphème <o> a permis de mettre tous les locuteurs sur un pied d’égalité par rapport à ces quelques syllabes. De surcroît, les participants ont été appelés à lire ces pseudo-mots dans des phrases porteuses ne permettant pas de les relier au sens des mots correspondants (« Tu dis les mots X »), le tout dans une partie de la tâche de lecture comprenant une multitude d’autres pseudo-mots n’ayant aucune ressemblance avec des mots existants (par ex. ud, nok, did, ig, etc.).

Dans le document L’antériorisation de /ɔ/ en français contemporain : une étude acoustique comparative entre Québec et France (Page 152-155)