• Aucun résultat trouvé

Chapitre 3 : Méthodologie

3.3 Pondération, présentation des variables et des analyses

Afin de pouvoir généraliser les résultats à la population visée par l’ELDEQ 1 et non se restreindre à décrire un échantillon de répondants, une pondération des données est nécessaire. Cette pondération « consiste à assigner à chaque enfant répondant un poids statistique qui correspond au nombre d’enfants qu’il représente au sein de la population visée » (Belleau et al., 2010, p. 7). La pondération prend en considération « les biais potentiels liés à la sélection initiale de l’échantillon et à la non-réponse » (Belleau et al., 2010, p. 7). Elle permet d’inférer à la population visée – jeunes nés au Québec à la fin des années 1990 – les estimations produites à partir des données fournies par les répondants. Puisque la pondération principale offerte par l’ISQ pour le volet 2013 (E16) n’était pas appropriée pour l’analyse des variables du questionnaire autoadministré de la mère (QAAM), une pondération sur mesure a été produite par l’ISQ pour la réalisation de ma recherche. Le poids transversal du cycle E16 a été ajusté afin de tenir compte de la non-réponse au QAAM. À la suite de l’application de la nouvelle pondération, le N valide est de 1 156.

La variable dépendante (VD) dans le cadre de ma recherche est le niveau d’aspirations scolaires du jeune, calculé en fonction du plus haut niveau de scolarité souhaité. Dans le QELJ, lors du volet de 2013 (E16) de l’étude, les jeunes devaient répondre à la question suivante :

Quel est le plus haut niveau de scolarité que tu désires atteindre?

J'arrêterai avant la fin de mes études secondaires 1 Je terminerai mes études secondaires en formation générale (DES) 2 Je ferai des études secondaires en formation professionnelle (DEP) 3 Je ferai des études en formation technique au collégial (DEC) 4

Je ferai des études universitaires 5

Je ne sais pas, cela ne me dérange pas 0

Partant de cette question, j’ai créé deux variables dichotomiques. Pour la première, j’ai regroupé les jeunes en deux catégories : ceux qui souhaitent faire des études postsecondaires (4 et 5) et ceux qui ne le souhaitent pas (0, 1, 2 et 3). Pour la seconde, je me suis intéressée qu’aux études universitaires. J’ai donc conservé les jeunes qui désirent faire des études universitaires dans une catégorie (5) et j'ai regroupé ceux qui ne souhaitent pas se rendre à ce niveau (0 à 4) dans une autre catégorie. Notons qu’il n’y a pas de données manquantes pour ces deux nouvelles variables (N = 1 156). Les jeunes ayant sélectionné « Je ne sais pas, cela ne me dérange pas » sont considérés comme des jeunes ne désirant pas réaliser des études postsecondaires ni des études universitaires (N = 135). Au moment de la collecte, ils ne formulaient pas d’aspirations scolaires pour ces niveaux d’études.

59

Comme variable indépendante (VI), j’utilise, sans y apporter de modification, une variable qui m’a été fournie par l’ISQ. Cette variable regroupe les ménages en quatre catégories (voir tableau 1) selon la taille du secteur de résidence : 1. la région métropolitaine de recensement (RMR) de Montréal, 2. les autres RMR de plus de 100 000 habitants, 3. les agglomérations de recensement (AR) entre 10 000 et 100 000 habitants et 4. les municipalités dont la population est inférieure à 10 000 habitants.

Tableau 1. Taille du secteur de résidence

TAILLE DU SECTEUR DE RÉSIDENCE FRÉQUENCE POURCENTAGE VALIDE

RMR DE MONTRÉAL 543 47,6 AUTRES RMR 208 18,3 AR DE PLUS DE 10 000 126 11,0 RURAL 264 23,1 TOTAL 1140 100,0 N MANQUANT 16

Source : Compilation effectuée à partir de données provenant du © Gouvernement du Québec (ELDEQ 1, volet 2013)

En bref, une RMR ou une AR est un territoire formé d’une ou de plusieurs municipalités adjacentes situées autour d’un centre de population et ayant un degré d’intégration élevé avec ce noyau (Statistique Canada, 2016). Tandis qu’une AR doit avoir un centre de population d'au moins 10 000 habitants, une RMR doit avoir une population totale d'au moins 100 000 habitants et un noyau d’au moins 50 000 habitants. Le degré d’intégration avec le noyau est déterminé selon le pourcentage de navetteurs pour le travail (déplacement entre le domicile et le lieu de travail). Une liste des RMR et des AR de la province de Québec est disponible en annexe.

Par l’utilisation de cette variable de taille du secteur de résidence, je cherche, notamment, à cerner l’effet de la distance entre le lieu de résidence et les établissements postsecondaires (Frenette, 2002), sans toutefois y arriver parfaitement49. En effet, certaines régions urbaines de petite taille peuvent ne pas être bien desservies,

tandis que des secteurs de résidence encore plus petits peuvent se situer relativement près d’un endroit plus populeux où les jeunes peuvent avoir la possibilité de s’y déplacer pour leurs études. Notons toutefois qu’il existe une relation entre la présence d’un établissement dans une communauté, la taille de cette communauté et le taux de participation aux études postsecondaires (Andres et Looker, 2001, p. 12).

Plusieurs variables de contrôle (VC) seront prises en considération lors de mes analyses. Vous trouverez en annexe de l’information sur chacune d'elles. Je me permets ici de simplement les lister.

49 Parmi les variables de l’ELDEQ 1 disponibles pour la réalisation de cette recherche, aucune autre variable ne

60 • Facteurs sociodémographiques

o Sexe de l’enfant

o Langue utilisée pour répondre au questionnaire o Revenu total du ménage

o Scolarité de la mère bio/conjointe o Type de famille

• Rendement et expérience scolaires o Type d’école fréquentée

o Notes par rapport à la moyenne (selon l’enfant) o Redoublement

o Méthodes d’apprentissage o Degré d’attachement à l’école o Indiscipline scolaire

• Rôle des parents

o Relation enfant/parents dans le suivi scolaire (selon l'enfant) o Communication parentale de la valeur de l'école

o Aspirations scolaires réalistes de la mère pour son enfant

Mon choix est fondé sur la revue de la littérature présentée dans le deuxième chapitre de ce mémoire et sur la disponibilité des données dans le volet de 2013 (E16) de l’ELDEQ 1. Notons qu'aucune variable de contrôle ne concerne que le père de l’enfant en raison d’un taux de non-réponse trop élevé (environ 20 %) pour les questions concernant ceux-ci.

Dans le prochain chapitre, des analyses descriptives et des analyses multivariées seront réalisées. Tout d’abord, nous examinerons la relation entre les variables dépendantes (VD), soit les aspirations scolaires postsecondaires et/ou universitaires du jeune, et la variable indépendante (VI), soit la taille du secteur de résidence de l’enfant. Ensuite, des analyses de tableaux bivariés permettront d’examiner l’association entre les variables dépendantes et les variables de contrôle (VC) ainsi qu’entre la variable indépendante et les variables de contrôle. Le test du khi-carré sera utilisé afin de s’assurer que la relation est statistiquement significative. Dans le cadre de cette recherche, le niveau de signification retenu est de 0,05 : « Autrement dit, si la probabilité de trouver une relation dans un échantillon quand il n’y a pas de relation entre les deux variables dans la population est inférieure à 0,05, on rejette l’hypothèse nulle voulant qu’il n’y ait pas de relation » (Fox, 1999, p. 166). Puisque la possibilité de généraliser notre observation à la population ne nous permet pas de juger de l’intensité de la relation, l’utilisation de mesures d’associations est également nécessaire. Le V de Cramer sera utilisé lorsque j'analyserai des tableaux bivariés incluant au moins une variable nominale. Le Gamma sera utilisé dans les autres cas. Dans le cadre de ce travail, les échelles d’interprétation suivante seront employées pour interpréter le V de Cramer (variable entre 0 et 1) et le Gamma (variable entre -1 et +1) :

61 • V de Cramer : o entre 0 et 0,10 = faible o entre 0,10 et 0,20 = moyenne o entre 0,20 et 0,30 = forte o plus de 0,30 = très forte • Gamma : o entre 0 et 0,15 = faible o entre 0,15 et 0,30 = moyenne o entre 0,30 et 0,50 = forte o plus de 0,50 = très forte

Dans un deuxième temps, des analyses multivariées permettront d’estimer l’influence de la taille du secteur de résidence sur les aspirations scolaires, en contrôlant de manière statistique l’effet des variables de contrôle, afin de déceler « l’effet région ». Si les différences d’aspirations scolaires selon la taille du secteur de résidence disparaissent une fois les variables contrôlées incluses dans les analyses, c’est que ces différences s’expliquent par au moins l’une de ces variables de contrôle. À l’inverse, si les différences subsistent après la prise en considération des VC, c’est alors qu’il y a un « effet région » qui ne s’explique pas par la prise en compte des autres variables incluses dans les analyses.

Ces analyses seront réalisées au moyen de la méthode de la régression logistique. Cette méthode permet de prédire la probabilité qu’un événement arrive sur la probabilité qu’il n’arrive pas. Pour ma recherche, le but est de prédire la probabilité que le jeune aspire à des études postsecondaires (ou à des études universitaires) sur la probabilité qu’il n’y aspire pas. Les deux variables en lien avec les aspirations scolaires du jeune ont été dichotomisées (0-1) dans le but de pouvoir réaliser ce type d’analyse multivariée.

Le modèle de base comprendra la variable indépendante uniquement, auquel seront ajoutées ensuite les variables de contrôle dans les modèles subséquents. L’interprétation se fera à partir du coefficient de régression Exp(B) et de son niveau de signification statistique (0,05). Lorsque la valeur de l’Exp(B) sera égale ou proche de 1, nous considérerons que l’influence de la variable est nulle ou très faible (1 = catégorie de référence). En revanche, lorsque la valeur de l’Exp(B) sera supérieure à 1, l’influence sera positive (plus la valeur est élevée, plus l’effet est important) et, à l’inverse, lorsque la valeur de l’Exp(B) sera inférieure à 1, l’influence sera négative (plus la valeur est proche de 0, plus l’effet est important). Une influence positive impliquera que la variable indépendante ou la variable de contrôle contribue à augmenter la probabilité que le jeune désire réaliser des études postsecondaires (ou universitaires). À l’inverse, une influence négative impliquera que la variable contribue à diminuer cette probabilité. De plus, le R2 de Nagelkerke sera utilisé afin

de juger de la pertinence du modèle, soit sa capacité à prédire la variable dépendante. Plus la valeur de cet indicateur est élevée (maximum théorique de 1), plus le modèle est jugé adéquat. Finalement, puisque la

62

variable indépendante et certaines variables de contrôle sont des variables nominales ou ordinales, une dichotomisation de ces variables ainsi que l’omission d’une catégorie de celles-ci lors de l’intégration de ces variables dans le modèle de régression sera nécessaire. La modalité omise sera la catégorie de référence lors de l’analyse. C’est donc en fonction de cette catégorie que l’effet des autres modalités sur la variable dépendante sera interprété.

Finalement, puisque les facteurs qui déterminent les aspirations scolaires chez les garçons et les filles semblent être les mêmes, mais avoir un poids différent selon le sexe (Looker et Thiessen, 2004), les analyses multivariées sont réalisées en deux temps, d’abord pour l’ensemble des jeunes et, ensuite, pour les garçons et les filles séparément. Mon hypothèse est que « l’effet région » sera plus visible sur les aspirations scolaires des garçons que sur les aspirations scolaires des filles, puisqu’il semble avoir un écart important de diplomation au niveau du baccalauréat entre les hommes et les femmes dans certaines régions éloignées (MELS, 2007) et puisque les étudiants sont « moins mobiles » que les étudiantes, selon les résultats de l’enquête provinciale d’Éric Richard (2017, p. 60) sur la mobilité pour études collégiales.

63