• Aucun résultat trouvé

intersectionnelle du genre et du langage

1.3 L’intersectionnalité : une nouvelle appro- appro-che du genreappro-che du genre

1.3.3 Intersectionnalité et méthodes quantitatives

Les origines racistes de la statistique

La démarche intersectionnelle a majoritairement été appliquée à des travaux qualitatifs, et n’a que très progressivement adopté des méthodo-logies quantitatives (Rouhani, 2015). Cette réticence s’explique en partie par le lourd passé de la statistique, qui a entretenu pendant des décennies un lien étroit avec les théories et les politiques eugénistes. Les concepts de corrélation et de régression ont ainsi été développés par Francis Galton, cousin de Charles Darwin et inventeur de l’eugénisme. Galton utilisait ces techniques pour démontrer la « supériorité » intellectuelle de la « race » européenne et des classes sociales bourgeoises et aristocratiques britan-niques (Zuberi, 2001). Les Britanbritan-niques Ronald Fisher, créateur du test F, de l’analyse de variance et du concept de l’hypothèse nulle, et Karl Pearson, le père de la valeur p et du test du χ2, défendaient eux aussi des théories eugénistes.

différences humaines, dans le but de mettre en lumière une prétendue su-périorité de la race blanche (Zuberi, 2001). Ces théories et ces techniques ont nourri l’idéologie nazie, mais ont également motivé, aux États-Unis, des politiques eugénistes comme les campagnes de stérilisation forcée de minorités et de populations pauvres (Rivard, 2014). Les tests standardi-sés utilistandardi-sés aujourd’hui dans le système éducatif américain, comme le SAT Reasoning Test, qui détermine en partie l’admission dans les universités, perpétuent l’héritage de la statistique eugéniste. Ces tests censés mesurer l’intelligence et la performance ont été conçus pour exclure les personnes de couleur du système éducatif ; ils continuent à jouer un rôle important dans le racisme structurel américain (Levy, 2019).

Comment rendre la statistique intersectionnelle ?

Même si certain·es pensent que les méthodes qualitatives sont plus adap-tées à l’intersectionnalité, ces quinze dernières années, des techniques quan-titatives ont commencé à être intégrées aux travaux intersectionnels. Cela a notamment été fait dans les domaines de la sociologie de la santé (Veens-tra, 2011, Warner et Brown, 2011), de l’épidémiologie (Marcellin et al., 2013) de la psychologie (Stirratt et al., 2008) et de l’éducation (Covarru-bias, 2011).

À cause du passé de la statistique, cette adoption du quantitatif s’ac-compagne d’une réflexion indispensable sur l’éthique. D’un côté, les cher-cheur·es s’interrogent sur les techniques les plus adaptées à la démarche intersectionnelle, soulignant que les structures mathématiques des mé-thodes quantitatives ne sont pas neutres sur le plan théorique (N. A. Scott & Siltanen, 2017) et qu’il convient de les choisir avec soin et de les utiliser avec une grande rigueur. De l’autre, ils mettent en évidence la nécessité d’utiliser la statistique pour défaire l’effacement des groupes marginalisés (Bowleg & Bauer, 2016) et pour « rendre visible l’invisible » (López et al., 2018). Pour Bowleg et Bauer (2016), cela ne peut se faire que dans le cadre d’une « mixed-methods approach », qu’elles définissent comme :

« A distinct methodology focused on rigorously combining statistical ap-proaches with in-depth culturally grounded narratives and meanings from qualitative approaches to gain a deeper understanding than either method could provide alone » (p. 338).

Les interactions, un outil statistique fondamental pour la recher-che intersectionnelle quantitative

Prenant en exemple son travail de recherche sur les lesbiennes afro-américaines, la psychologue Lisa Bowleg (2008) souligne les défis méthodo-logiques de la recherche intersectionnelle quantitative. Pour elle, les mé-thodes quantitatives (et qualitatives) sont souvent basées sur une approche « additive » qui considère l’effet de chaque variable comme indépendant, ce qui est contraire aux principes de la recherche intersectionnelle. Pour me-surer les discriminations auxquelles sont confrontées les lesbiennes afro-américaines, il ne suffit pas d’additionner l’expérience des femmes, des

les-biennes et des Afro-Américaines : l’expérience de ce groupe n’est pas la simple somme de ces trois variables.

La régression multiple, une méthode inférentielle aujourd’hui large-ment utilisée dans les sciences sociales, apporte une réponse à ce problème (N. A. Scott & Siltanen, 2017). Elle permet d’étudier l’effet de plusieurs variables sur un phénomène donné. Toutefois, dans une approche intersec-tionnelle, il convient de ne pas étudier uniquement les effets principaux (ou isolés) des variables. Il faut, à la place, intégrer aux modèles de régres-sion ce que l’on appelle des « interactions » entre deux variables (ou plus), de façon à mettre en lumière les effets parfois différents des combinaisons entre, par exemple, genre et ethnicité, ou genre et catégorie socioprofession-nelle. Cela permet de changer de perspective : dans les modèles de régres-sion sans interaction, pour étudier par exemple la façon dont les femmes afro-américaines utilisent tel ou tel procédé linguistique, il faut addition-ner l’effet de la variable principale « femme » (qui est le même pour toutes les femmes qu’elles soient blanches, afro-américaines ou autres) et de la variable principale « afro-américain·e » qui est le même pour les femmes et les hommes). Sans les interactions, l’analyse statistique peut masquer complètement une partie de la réalité.

Un article, paru en 1999 aux États-Unis dans le New England Journal

of Medicine (Schulman et al., 1999) et souvent cité en exemple (Bowleg &

Bauer, 2016), illustre l’importance des interactions. Il étudie l’impact des préjugés des médecins sur leur propension à envoyer des patients souffrant de douleurs thoraciques vers un spécialiste, en prenant en compte trois variables : l’âge, le genre, et l’ethnicité (blanc·hes et Afro-Américain·es). Les chercheurs n’ont inclus que les effets principaux de ces variables dans leur analyse, et non leur interaction. Ils en ont conclu que la probabilité qu’un·e patient·e soit envoyé·e vers un spécialiste était 40 % moins im-portante pour les femmes blanches et les patient·es afro-américain·es que pour les hommes blancs, et 60 % moins importante pour les femmes afro-américaines. Les auteur·es de cette étude ont créé un second modèle de régression avec interactions et en ont présenté les résultats, sans toutefois les interpréter, se focalisant sur le modèle avec effets principaux. L’analyse de ce second modèle révèle une réalité différente. En fait, les femmes afro-américaines sont le seul groupe à souffrir de discrimination dans ce cas ; elles sont 60 % moins susceptibles d’être envoyées vers un spécialiste que les autres patient·es, y compris les hommes afro-américains et les femmes blanches.

Cet exemple montre bien à quel point étudier seulement les effets princi-paux peut être trompeur. L’analyse des interactions est donc centrale dans la recherche intersectionnelle quantitative, quel que soit son objet d’intérêt, car « the experiences of those at a particular intersection cannot be unders-tood as a sum of their parts » (Bowleg & Bauer, 2016, p. 339). En aucun cas les modèles contenant uniquement les effets principaux ne peuvent être utilisés dans une perspective intersectionnelle : il ne suffit pas d’étudier plusieurs variables, encore faut-il savoir si et comment elles interagissent.

Contraintes

Si l’analyse des interactions est un outil très puissant, elle a également des contraintes de poids. Les difficultés commencent avec la constitution des échantillons. Ceux-ci doivent être plus grands que les échantillons né-cessaires pour réaliser des analyses incluant uniquement les effets princi-paux. En effet, lorsque l’on intègre une interaction à un modèle de régres-sion (pour reprendre l’exemple cité ci-dessus), on ne peut plus comparer toutes les femmes à tous les hommes (quelle que soit leur ethnicité), ou tou·tes les Afro-Américain·es à tou·tes les blan·ches. On compare des sous-groupes : les femmes afro-américaines aux femmes blanc·hes, aux hommes afro-américains et aux hommes blancs. Plus il y a de niveaux dans une variable (c’est-à-dire de catégories), plus l’échantillon doit être important.

Les difficultés augmentent lorsque l’on souhaite étudier des interac-tions dites de high order, c’est-à-dire qui prennent en compte plus de deux variables. En théorie, il est tout à fait possible d’analyser l’effet de trois ou quatre variables (genre + âge + ethnicité + orientation sexuelle, par exemple). En pratique, cela pose des problèmes considérables, car, à chaque fois que l’on ajoute une variable dans l’interaction, on divise la taille des sous-groupes. On a donc besoin d’échantillons de taille importante. Un nom-bre trop réduit d’observations dans chaque sous-groupe entraine des pro-blèmes de puissance statistique : les tests statistiques n’atteignent souvent pas le niveau de significativité (Bauer, 2014). Il a été proposé, comme so-lution, d’augmenter le seul de significativité. Celui-ci est conventionnelle-ment fixé à 0.05, signifiant qu’il y 5 % de chances d’obtenir les résultats constatés si l’hypothèse nulle (celle de l’absence de relation entre les va-riables, par exemple le genre et l’âge, sur le phénomène d’intérêt). Le faire passer à 0.10 pourrait, selon certains chercheurs, pallier les problèmes de puissance statistique (N. A. Scott & Siltanen, 2017). Notons également que les interactions de plus de deux variables sont extrêmement difficiles à in-terpréter, comme nous le montrons dans le chapitre consacré aux méthodes statistiques (→ p. 165).

Le cas de la sociolinguistique

Si ces problèmes concernent l’ensemble de la recherche intersection-nelle, ils touchent de façon plus forte certains domaines, comme la linguis-tique. Les sociologues ont accès à des bases de données issues de sondages ou de recensements, qui leur permettent d’étudier de gros échantillons com-binant plusieurs variables. Ces données ne sont évidemment pas adaptées à des recherches sociolinguistiques variationnistes ou de corpus. Lorsque l’on veut réaliser une étude de corpus, il faut non seulement recueillir les informations sociodémographiques des personnes (en multipliant les va-riables, et en ne se contentant pas de l’identité de genre ou de l’ethnicité), mais aussi leur production orale ou écrite. Cela n’est pas forcément difficile si on peut se contenter d’un petit échantillon de quelques personnes, dans une optique qualitative, mais peut être extrêmement long et coûteux quand on souhaite étudier plusieurs centaines ou milliers de sujets. Cela explique

sans doute la faible présence de l’approche intersectionnelle en linguistique quantitative.

La CMC : un nouveau terrain pour la sociolinguistique intersec-tionnelle

La majorité des études sociolinguistiques (intersectionnelles ou non) se sont intéressées à la langue orale. Face à la difficulté de constituer de grands échantillons accompagnés des annotations sociodémographiques né-cessaires, la CMC s’impose comme un terrain fertile pour les sociolinguistes (→ chapitre 2). D’énormes quantités de données sont librement accessibles, et, comme nous le verrons dans le chapitre où nous présentons la construc-tion de notre corpus (→ p.109), il est possible de recueillir des informaconstruc-tions démographiques de manière relativement fiable.

1.4 Les intersections du genre, de l’âge et de

l’ethnicité

Cette section est consacrée à l’âge et à l’ethnicité, les deux variables sociodémographiques que nous étudions en interaction avec le genre dans nos analyses.

1.4.1 L’âge

La construction de l’âge

L’âge est une composante centrale de l’expérience humaine. Il a une dimension biologique, avec le vieillissement du corps, et une dimension so-ciale (Fournier, 2010). C’est donc à la fois une expérience individuelle et col-lective, la construction de l’histoire personnelle d’un individu et de sa place dans la société (Eckert, 1998). Même si l’âge est un phénomène universel, les systèmes d’âge varient selon les cultures. Dans les sociétés industriali-sées, l’âge chronologique, calqué sur le calendrier, est la mesure officielle. Certains anniversaires sont toutefois plus marquants que d’autres, comme le « sweet sixteen » aux États-Unis, ou la majorité. L’entrée dans une nou-velle décennie peut aussi avoir une signification sociale particulière.

La vie est également ponctuée par des évènements qui ne sont pas for-cément liés à l’âge chronologique. La sociologie utilise le terme de « cycle de vie » pour désigner ces évènements de la vie, qui s’enchainent de façon similaire pour tous les individus. Ce cycle de vie est composé de « l’entrée dans l’institution scolaire, dans la sexualité, dans le travail, dans l’indépen-dance économique, dans la conjugalité, dans la maternité-paternité, dans l’inactivité. . . » (Fournier, 2010, p. 103). Ces évènements sont connectés à de grandes étapes de la vie : l’enfance, l’adolescence, l’âge adulte, la vieillesse, des concepts que l’on invoque souvent pour expliquer les différences de com-portements entre les individus (Eckert, 1998).

Les étapes de la vie s’accompagnent parfois de pressions normatives sur les individus, comme la pression pour les femmes de se marier avant d’at-teindre un certain âge. Sur le plan linguistique, ces pressions poussent par exemple les adolescent·es à utiliser une langue fortement vernaculaire, et les adultes à adopter des pratiques langagières plus conservatrices (Eckert, 1998). Toutefois, les étapes du cycle de vie sont avant tout des constructions idéologiques : « Just as gender does not unfold naturally from biology, nei-ther do life-stages such as childhood, adolescence, adulthood, or old age. » (Eckert, 2003, p. 381). L’adolescence, par exemple, a été inventée récem-ment. Elle n’existait pas avant le 20èmesiècle, et est un produit des change-ments du monde du travail : avec l’industrialisation, il était devenu néces-saire que les jeunes ne puissent pas entrer immédiatement sur le marché du travail (Eckert, 2003). Récemment, on a vu l’apparition d’une nouvelle catégorie, créée par le marketing : les préadolescents, ou « tweens », à cheval entre enfance et adolescence (Mitchell & Reid-Walsh, 2005).

L’âge social se différencie enfin de l’âge biologique lorsque l’on prend en compte les évènements historiques qui marquent la vie d’un individu et le différencient des personnes d’autres générations (Fournier, 2010). Les « di-gital natives », c’est-à-dire les personnes nées à partir des années 1980, ont grandi dans le monde d’internet, de la diffusion de l’anglais à l’échelle mon-diale et de l’essor de l’urbanisation, des faits structurants qui influencent leurs usages langagiers (Tagliamonte, 2016b).

Les études variationnistes regroupent généralement les individus en fonction de leur âge chronologique, qui est la mesure officielle de l’âge dans les sociétés occidentales. L’âge n’est toutefois pas considéré comme une va-riable numérique (19 ans, 20 ans, 21 ans, etc.). Pour mettre en valeur des différences significatives sur le plan statistique, il est nécessaire de grou-per les individus (Eckert, 1998). Deux approches sont possibles. L’approche étique consiste à grouper les personnes arbitrairement dans des classes d’âge, comme les décennies, comme l’a par exemple fait Labov (2006). L’ap-proche émique les regroupe en fonction de phases du cycle de vie, comme l’enfance, l’adolescence, ou l’âge mûr, ou d’une expérience historique parta-gée (les baby boomers, les millenials).

Âge et changement linguistique

La question principale qui a retenu l’attention des sociolinguistes est le lien entre les différences intergénérationnelles et le changement tique (Thibault, 1997). Les études synchroniques du changement linguis-tique cherchent ainsi à identifier des corrélations entre l’âge des locuteurs et la fréquence de certaines variables. La présence d’une corrélation peut être expliquée par deux phénomènes : elle peut refléter un changement lin-guistique en cours dans la communauté, ou être due au fait que les indi-vidus ne parlent pas de la même façon à des époques différentes de leur vie (gradation d’âge). Les adolescent·es, par exemple, utilisent davantage de variantes vernaculaires que les adultes. Toute la question est de savoir quel phénomène explique les différences constatées entre les classes d’âge. C’est un projet difficile, parce qu’on ne peut pas se contenter de

compa-rer des tranches d’âge à un moment donné. Deux méthodologies permettent d’isoler la variation liée au cycle de vie d’une personne et la variation liée au changement linguistique. La première (trend study) consiste à reproduire une même étude dans une même communauté à des époques différentes, en s’intéressant à chaque fois à plusieurs classes d’âges différentes. Cette méthodologie a été adoptée, par exemple, pour reproduire l’étude réalisée par Labov en 1966 (2006 pour la seconde édition) sur la prononciation du /r/ à New York (Guy, 2018 ; Mather, 2012). La panel study est la seule mé-thodologie qui peut réellement montrer comment les usages linguistiques varient au cours de la vie. Elle est plus complexe à mettre en œuvre, car il faut suivre les mêmes individus tout au long de leur vie (G. Sankoff, 2006). Pour cette raison, la plupart des études du changement linguistique ont été des trend studies (Eckert, 1998).

Changement au cours du cycle de vie

Pour Labov (2001), le langage change, de la naissance à l’âge adulte, selon un modèle composé de trois étapes. Tout d’abord, l’enfant acquiert le langage en le modelant sur la façon de parler de la personne qui s’occupe de lui le plus souvent (sa mère, généralement). C’est la phase d’acquisition. Quand il entre à l’école, il commence à utiliser de nouvelles variantes au contact de la communauté. C’est ce que Labov appelle l’incrémentation. Cette phase se poursuit jusqu’à la fin de l’adolescence. Ensuite vient la phase de stabilisation : les individus cessent d’intégrer de nouvelles formes à leur façon de parler. L’hypothèse de Labov est que leur façon de parler ne change plus au cours du reste de leur vie ; le conservatisme de l’âge adulte serait dû à la pression d’utiliser la langue standard dans le monde du travail. Notons toutefois qu’aujourd’hui, le jeunisme exerce une autre pression, et des adultes s’approprient parfois le langage des jeunes (Branca-Rosoff, 2018).

Cette perspective, couplée au fait que l’étude de l’âge a longtemps été majoritairement motivée par la volonté d’identifier les changements lin-guistiques, généralement phonologiques, a conduit de nombreux sociolin-guistes à considérer l’âge comme étant une force immuable, face à laquelle les individus n’ont aucun choix (contrairement à la classe sociale, par exem-ple, où la mobilité est possible). Pour ces linguistes, l’âge n’a pas vraiment de dimension sociale, dans le sens où il n’est pas construit par les indivi-dus. Coupland (2001) regrette le fait que beaucoup ne considèrent pas l’âge adulte et l’âge mûr comme étant « sociolinguistically crucial » (p. 188). Pour lui, l’âge est le parent pauvre de la sociolinguistique, par rapport à d’autres variables abondamment étudiées comme le genre, la classe sociale et l’eth-nicité. Eckert fait le même constat : « There has been no concerted study of variation from a life-course perspective » (Eckert, 1998, p. 152).

L’adolescence

L’adolescence est la phase de la vie qui a été la plus abondamment étu-diée par les sociolinguistes. Pendant cette période, spécifique à l’époque

moderne et aux sociétés industrialisées, les adolescent·es s’écartent de la sphère familiale pour devenir « elles-mêmes » ou « eux-mêmes ». En même temps, on leur refuse l’entrée dans le monde des adultes en les isolant dans les collèges et les lycées. L’école devient une « hothouse for the construction of identities » (Eckert, 1998, p. 163), où les changements intellectuels, so-ciaux et physiques s’accélèrent. Par conséquent, c’est à l’adolescence que les usages non standard sont les plus importants. Consciemment ou in-consciemment, les adolescent·es utilisent des mots que leurs parents n’em-ploient pas, pour s’affranchir de leur autorité. Le langage est également un moyen pour les adolescent·es de marquer la solidarité avec leurs pairs (Tagliamonte, 2016b). Il leur permet d’indiquer à quel groupe ils appar-tiennent (par exemple, chez Eckert, les « burnout » et les « jocks »). Comme elle est une période particulièrement non conformiste, l’adolescence est une phase clé pour l’étude du changement linguistique. Certains des usages adolescents influencent durablement l’ensemble de la langue d’une com-munauté : « adolescents act as major agents of linguistic change » (Eckert, 2003, p. 391).

Âge et genre

Pour Eckert (2003), l’étude sociolinguistique de l’âge est indissociable de celle du genre, mais aussi d’autres variables comme la classe sociale et l’ethnicité. Elle appelle les sociolinguistes à étudier le cycle de vie et la façon dont les différentes étapes de la vie sont « genrées ». L’interaction du genre a notamment été mise en évidence en Finlande par Paunonen (1994) (cité par Eckert, 1998), qui a montré, en combinant une trend study et une

panel study que les usages des femmes devenaient moins normatifs avec le

temps, contrairement à ceux des hommes.

1.4.2 L’ethnicité

Note : dans la section qui suit, nous utilisons le terme « race » pour dé-signer le mot anglais « race ». Cependant, dans les autres sections et cha-pitres de la thèse, nous utilisons le terme « ethnicité » pour désigner l’anglais