• Aucun résultat trouvé

3. D ES PRATIQUES LEXICALES EN RÉSEAU PEU COHÉSIF

3.6. V ARIABLES DÉPENDANTES LINGUISTIQUES ET VARIABLES DE CON- CON-TRÔLE

Dans ce travail, on cherche à voir si les pratiques langagières se répartissent de manière coordonnée et s’il est possible d’identifier des mécanismes pouvant les expliquer. Pour ce faire, on va s’intéresser à la similarité entre les individus et les similarités personnelles, soit à quel point un individu est similaire aux autres membres du réseau ou, au contraire, en quoi il présente un vocabulaire moins consensuel et plus personnel. On va s’atteler à

comprendre si les distributions observées peuvent être expliquées par une approche rela-tionnelle.

Dans cette partie, je reviens tout d’abord sur les méthodes qui ont été utilisées pour tester le lien entre réseau et pratique langagière en réseau cohésif et normatif. Pour les méthodes d’analyse, je m’inspire de ce qui a été fait pour ces types de réseaux, qui ont tout de même prouvé une grande capacité explicatrice. Milroy (Milroy, 1980, 1987 ; Milroy and Milroy, 1977, 1985) postule pour la première fois qu’il existe un lien entre le langage d’un locuteur et la structure de son réseau social, plus particulièrement de son intégration et de sa place en son sein.

Pour l’observer, elle a développé le concept d’échelle de score de réseau, appelé le Net-work Strenght Scale (NSS). Elle regarde à quel point les individus sont intégrés au réseau en leur attribuant un score basé sur une échelle d’intégration construite de la manière suivante : en haut de l’échelle seront ceux qui sont membres d’un sous-groupe territorialement iden-tifié à grande densité ; ceux qui ont de nombreuses relations familiales au sein du territoire ; ceux qui partagent avec au moins deux personnes du territoire retenu un même lieu de travail ; ceux qui partagent leur lieu de travail avec au moins deux personnes du même sexe qu’eux ; ceux qui partagent des moments en dehors du travail avec leurs collègues. Cela permet alors de donner un score d’intégration dans le réseau à chaque individu. Une corré-lation est ensuite faite entre le score obtenu au réseau et la variable linguistique (LV). Le concept de variable linguistique (LV) a été développé par Labov (1966). Celle-ci est définie selon la prononciation : elle crée une échelle avec à la base une prononciation qui s’écarte de la prononciation idéale typique du vernaculaire et en haut une prononciation qui se rap-proche de l’idéal typique du vernaculaire. Chaque locuteur obtient alors un pourcentage de vernaculaire. Elle regarde ensuite s’il y a une corrélation entre score pour le réseau et score pour la variable linguistique.

Pour cette recherche, je reprends le concept de variable pour le réseau et de variable linguistique en amenant cependant certaines nuances. Pour calculer les similarités entre les individus, je crée une matrice de similarité des pratiques. Pour ce faire, je procède en plu-sieurs étapes : premièrement, je crée une matrice basée sur les questions sur le vocabulaire propre à l’UNIGE. Pour chaque étudiante et étudiant, j’indique quels sont les termes qui ont été employés à chaque question. Cela permet de créer une matrice bimodale avec en ligne les verbatims et en colonne les étudiants et étudiantes. On a des données bimodales ou two-mode que l’on traite comme de données d’affiliation: «Affiliation data consist of a set of binary relationships between members of two sets items » (Borgatti and Halgin, 2011, p.

417). Le terme affiliation se réfère à un lien basé sur la participation d’une entité à une autre entité (Hannemann and Riddle, 2011). Le terme entité peut définir aussi bien des entités physiques qu’abstraites. Aussi, les données d’affiliation permettent de rendre compte d’un lien qui n’est pas directement observable (Dodsworth et Benton, 2017). Cela permet alors de reconstituer un réseau basé sur le comportement et d’inférer, depuis celui-ci, des pra-tiques (Dodsworth et Benton, 2017). Dans cette recherche, les deux modes sont les étu-diant(e)s d’un côté et leur pratique en termes de vocabulaire de l’autre. La matrice représente donc les mots utilisés pour chaque étudiant(e).

Ensuite, à partir de cette matrice bimodale, je construis la matrice de similarités basée sur la similarité des individus par cross-products dans UCINET (Borgatti et al., 2002). Cette mé-thode permet de transformer une matrice bimodale, en matrice de coparticipation. On ob-tient pour chaque dyade d’étudiant(e)s le nombre de mots en commun. Ainsi, plus les

individus ont de mots en commun, plus ils sont considérés comme similaires. On obtient une matrice de similarités des pratiques pour l’ensemble du réseau.

On s’intéresse également au comportement individuel et les similarités personnelles, afin de voir le degré de consensus et d’individualisation des pratiques lexicales. Pour les scores personnels, je les calcule à partir de la matrice des similarités : pour chaque individu, je calcule sa moyenne de similarités dyadiques. Celle-ci est normalisée en fonction du nombre de mots possibles. Chaque individu obtient un score de similarité : « 0 » représente aucune similarité, « 1 » représente une similarité parfaite avec les autres membres du réseau. J’ob-tiens la similarité personnelle pour l’ensemble du réseau.

Ce procédé est également effectué sur les questions portant sur les pratiques lexicales exogènes au contexte particulier de l’Université de Genève. On obtient donc une matrice de similarités et un score de similarité personnelle pour le vocabulaire extra UNIGE.

Le tableau qui suit (Tabl. 7) présente la corrélation entre la matrice de similarité intra UNIGE et la matrice de similarité extra UNIGE. Le manque de corrélation significative (r=0.021, p-value=0.37) montre qu’il n’y a pas de liens entre ces deux matrices, et que donc on peut s’attendre à une logique de répartition particulière, pour chaque type de vocabulaire.

En procédant à un T-test utilisant la méthode de permutations (Borgatti et al, 2002), qui permet de calculer si les moyennes entre deux groupes sont significativement différentes, on observe effectivement une différence de moyenne entre les deux (0.24, p-value=0.0001).

En moyenne la similarité dyadique est plus basse pour le vocabulaire propre à l’UNIGE que pour le vocabulaire extra UNIGE. Cela indique, une fois encore, un plus faible con-sensus d’usages pour ce premier.

Tableau 7 : Corrélation QAP entre les matrices de similarités et T-test pour moyennes de similarités personnelles (N=72)

Afin de tester certains effets confondants possibles, j’intègre aux modèles des variables de contrôle. Pour tester la similarité dyadique, je retiens le degré d’étude, le genre, le lieu d’origine, l’âge et la langue maternelle. Le choix de retenir l’année d’étude est motivé par le fait qu’on a vu qu’une certaine homophilie par année semblait s’opérer. Intégrer l’année comme variable de contrôle permet dès lors de s’assurer que les résultats obtenus dépendent

Vocabulaire

bien du réseau. Pour ce qui est du lieu d’origine, du genre, de l’âge et la langue maternelle, je retiens ces variables, car, dans la littérature, elles ont été testées comme influençant les pratiques langagières (Macauly, 2013 ; Ash, 2013 ; Queen, 2013 ; Labov, 1966, 1972a, 1972b, 1976, 1986 ; Eckert, 1988 ; Milroy, 1987 ; Gordon, 2013 ; Greco, 2014b ; Kirkham

& Moore, 2013 ; Fought, 2013). Afin de construire des matrices à tester, je reprends la méthodologie de Borgatti et al. (2018). Pour créer la matrice pour les années d’études, je code « 1 » les dyades qui sont d’un même degré d’étude et « 0 » celles qui ne le sont pas.

Pour le genre, le principe est le même : je crée sur la base des attributs une matrice ou les dyades sont codées « 1 », si les individus sont du même genre et « 0 », autrement. Pour le lieu d’origine également : « 1 » pour les personnes venant du même lieu et « 0 » pour ceux qui ne partagent pas des origines géographiques communes. Pour l’âge également, les per-sonnes d’un même âge sont codées « 1 », les autres « 0 ». De même pour la langue mater-nelle : les dyades qui ont une même langue matermater-nelle sont codées « 1 » et les autres « 0 ».

Le Tableau 8 présente les corrélations QAP entre les variables de contrôles et la matrice de similarités pour le vocabulaire propre à l’UNIGE et pour le vocabulaire exogène à l’UNIGE. Cela est fait pour voir quelles variables de contrôle intégrer dans les modèles qui présenteront des résultats significatifs. On peut voir que seuls le genre (r=0.061, p-va-lue=0.096) et la provenance géographique (r=0.072, p-value=0.10), sont tout juste signifi-cativement liés au partage de pratiques lexicales, pour le vocabulaire propre à l’UNIGE. On trouve ici le problème lié à l’instabilité de la significativité. En effet, en procédant plusieurs fois aux tests, il arrive que le alpha passe la limite de 0.1. Malgré cela, j’opte pour considérer ces résultats comme significatifs. Les personnes d’un même genre et les personnes ayant des origines communes ont tendance à partager davantage de mots. Ces deux variables seront donc intégrées aux régressions QAP, pour les mécanismes qui montrent un certain lien significatif.

Pour le vocabulaire extra UNIGE, on peut voir que l’âge (r=0.077, p-value<0.05), le genre (r=0.161, p-value<0.05) et la provenance géographique (r=0.111, p-value<0.1) sem-blent être positivement corrélés à la similarité dyadique. Ces résultats s’inscrivent dans les postulats présents dans la littérature (Macauly, 2013 ; Ash, 2013 ; Queen, 2013 ; Labov, 1966, 1972a, 1972b, 1976, 1986 ; Eckert, 1988 ; Milroy, 1987 ; Gordon, 2013 ; Greco, 2014b ; Kirkham & Moore, 2013 ; Fought, 2013). Ces variables seront donc intégrées aux modèles.

Tableau 8 : Corrélations QAP entre les variables de contrôle et les matrices de similarités pour le vocabulaire propre à l’UNIGE et pour le vocabulaire extra UNIGE

***p<0.01 ** p<0.05 *p<0.1 ; N=72

Variables UNIGE Extra UNIGE

Âge

Pour la similarité personnelle, j’intègre également des variables de contrôle. Celles-ci sont l’année d’étude, l’âge et le genre. L’année d’étude a été transformée en variable métrique avec la première année recodée « 1 », la deuxième année « 2 » et la troisième année « 3 ».

Cela suppose une hiérarchisation des années. On cherche à tester si, au fur des années, les individus deviennent davantage similaires, ou pas. Pour l’âge, le principe est le même, on cherche ainsi à tester l’influence de l’âge sur la similarité personnelle. Pour le genre, je prends les hommes comme variable de référence. Seules les femmes sont testées, du fait que les personnes non binaires ne sont qu’au nombre de 2 dans l’échantillon.

Le Tableau 9 montre les corrélations bivariées entre les variables de contrôles et la simi-larité personnelle pour le vocabulaire propre à l’UNIGE et pour le vocabulaire extra UNIGE. On cherche à voir si les caractéristiques personnelles influent sur le fait d’utiliser un vocabulaire plus individuel ou plus consensuel. On peut voir qu’aucune variable retenue ne semble être significativement liée à la similarité personnelle.

Pour ce qui est de la similarité personnelle pour le vocabulaire extra UNIGE, seul le genre est significativement et positivement corrélé (r=0.270, p-value<0.05). Dans ce réseau, les femmes semblent être les personnes qui ont un langage plus consensuel et par consé-quent moins individuel. Cela correspond au postulat de la littérature (Milroy, 1987). Le genre sera alors intégré comme variable de contrôle pour les analyses relationnelles relatives au vocabulaire extra UNIGE.

Tableau 9 : Corrélations bivariées entre les variables de contrôle et les similarités person-nelles pour le vocabulaire propre à l’UNIGE et pour le vocabulaire extra UNIGE

***p<0.01 ** p<0.05 *p<0.1 ; N=72

Une fois ces postulats posés et les variables dépendantes qui vont servir pour tester les différents mécanismes, ainsi que les variables de contrôle identifiées et opérationnalisées, on peut s’atteler à étudier les mécanismes retenus pour répondre à la problématique : En quoi les réseaux peu cohésifs peuvent-ils également être générateurs de pratiques locales coordonnées ? Quels sont les mécanismes et en quoi sont-ils différents ou similaires de ceux des réseaux fortement cohésifs ?

Dans les parties qui suivent, on va tester plusieurs mécanismes possibles, en fonction de ce qui a pu être postulé dans la littérature qui porte sur des réseaux cohésifs. Pour chacun d’eux, des nuances seront apportées, du fait du peu de cohésion du réseau. Les hypothèses et les méthodes relatives seront développées. Les analyses et les résultats seront discutés en fin de chaque chapitre. On va ainsi voir si cette répartition particulière au réseau universi-taire peut être expliquée par la présence de liens directs et liens réciproques en termes de

Variables UNIGE Extra UNIGE

Âge

Degré d’étude

Genre (Ref. Homme) Femme

0.033 0.139 0.179

-0.012 -0.003 0.270**

discussions. On regardera aussi si la position des individus dans le réseau impacte leur pra-tique personnelle relative aux autres personnes en présence. Enfin, on regardera si la per-ception négative qu’ont les individus sur les autres influence leur pratique, que ce soit au niveau dyadique ou individuel.