• Aucun résultat trouvé

4.4 Attrition et pondération

4.4.1 Pondération spécifique aux analyses de la thèse

vue par les méthodologistes de l’ÉLDEQ et, en réaction, j’ai entrepris de créer mes propres variables de pondération sur un modèle similaire, mais nettement simplifié, à celui employé pour les poids officiels. La difficulté tient au fait que l’enquête continue de solliciter la participation de familles qui n’ont pas répondu à au moins un des passages précédents et donc qu’une part croissante des enfants participants à un passage donné peuvent être décrits comme des décrocheurs tem- poraires (voir l’écart entre les deux lignes de la figure4.5). Lorsque vient le temps de reconstituer les trajectoires individuelles, le traitement statistique de ces dé- crocheurs temporaires est beaucoup plus complexe que celui des non-décrocheurs ou des décrocheurs définitifs :36 que faire en effet de ces épisodes de décrochage ?

Soit un enfant fictif dont les parents ont répondu aux sept premiers passages de l’enquête, ont manqué les deux suivants, mais ont participé de nouveau à partir 36. Le décrochage « définitif » dont il est question ici est évalué du point de vue du treizième passage de l’enquête. Dans les faits, tant que l’enquête prévoira de nouvelles vagues de collecte, il sera impossible de déterminer si le décrochage est effectivement définitif ; un décrocheur aura toujours la possibilité de participer à un éventuel passage de l’enquête.

du dixième passage. L’équipe de l’ELDEQ aurait produit un poids pour cet enfant aux passages 1 à 7 et 10 à 13, mais pas aux passages 8 et 9 puisque l’enfant n’était pas présent à ce moment. Pourtant, l’information déclarée après la reprise de la participation à l’enquête suffit généralement pour retracer les grandes lignes de la trajectoire familiale pendant la période de non-participation, et ce, même si la date de certains événements reste imprécise. Ma posture analytique a été de reconstituer les trajectoires de temps parental de tous les enfants pour la durée la plus longue possible, c’est-à-dire jusqu’au dernier passage où une information sur le partage du temps parental était disponible, peu importe si l’information était disponible à tous les passages précédents. En conséquence, je me suis retrouvé dans une situation où je détenais de l’information sur certaines périodes de la trajectoire d’un enfant sans pouvoir l’utiliser dans mes modèles parce qu’aucune pondération ne me permettait de le faire.

Puisque l’équipe de l’ÉLDEQ déconseille fortement la publication d’estima- tions non pondérées, créer de nouvelles pondérations m’est apparu comme une solution valable à ce problème. Cette solution n’est toutefois pas parfaite puisque, contrairement aux méthodologistes de l’ÉLDEQ, je n’avais pas accès aux données administratives extérieures qui ont servi à calibrer leurs pondérations. Mes pondé- rations sont donc entièrement basées sur les variables disponibles dans l’enquête et devraient permettre d’assurer la cohérence longitudinale de l’échantillon, un peu moins sa représentativité transversale. J’ai créé les pondérations en partant du principe de la probabilité inverse de censure (inverse probability of censoring weights, IPCW), c’est-à-dire que, à chaque passage, j’ai utilisé un modèle logit pour évaluer la probabilité d’avoir de l’information sur l’arrangement de temps parental d’un enfant compte tenu des caractéristiques démographiques et socioé- conomiques de sa famille. J’ai ensuite multiplié la pondération de base par l’inverse de cette probabilité pour obtenir une série de nouvelles pondérations, c’est-à-dire une nouvelle pondération pour chacun des passages à l’exception du premier. Rap- pelons que la pondération de base est la pondération officielle du premier passage de l’enquête qui corrige pour la non-réponse à ce passage, c’est-à-dire pour les différences entre les caractéristiques de la population visée et celles de l’échan- tillon qui a effectivement répondu au premier passage. Les caractéristiques prises en compte lors de la création des nouveaux poids incluent : le sexe de l’enfant, le type d’union des parents à la naissance, le statut de faible revenu à chaque

passage, le fait que les parents soient séparés avant un passage donné, le statut d’immigrant de la mère ainsi que la langue maternelle, le diplôme le plus élevé, l’âge à la naissance, l’activité sur le marché de l’emploi, le plaisir parental et le niveau de symptômes de dépression des deux parents.

Dans le but d’évaluer visuellement ces nouveaux poids, j’ai juxtaposé à la figure 4.6 des estimations effectuées avec différentes pondérations. Les variables représentées ont toutes été mesurées lors du premier passage : proportions de gar- çons, de naissances hors union, de mères immigrantes, de ménages avec un revenu insuffisant et de pères ayant des enfants d’unions antérieures ainsi que l’âge de la mère à la naissance. Sur chaque sous-figure, le tireté noir correspond à l’estimation effectuée avec la pondération de base ; c’est cette valeur que mes variables de pon- dération « maison » visaient à reproduire à partir des sous-échantillons d’enfants toujours présents à chacune des vagues suivantes. En comparaison, les estimations réalisées avec les poids transversaux « officiels » fournis par l’ÉLDEQ ainsi que les estimations non pondérées sont aussi représentées.

L’effet de l’attrition sur la représentativité de l’échantillon est bien visible si l’on compare l’estimation de référence aux estimations non pondérées (ligne fon- cée pleine), en particulier dans les quatre premières sous-figures. Par exemple, les mères immigrantes, déjà sous-représentées lors du premier passage, cessent de participer à l’enquête en nombre proportionnellement plus grand que les mères nées au Canada (sous-figure 4.6c). Les pondérations officielles (lignes vertes/gris moyen), tout comme celles que j’ai construites (lignes jaunes/gris pâle), sont gé- néralement capables de limiter cet effet parce qu’elles donnent un poids plus élevé aux répondants qui ont des caractéristiques similaires à celles des décrocheurs. Dans toutes les situations, à l’exception des derniers passages pour l’âge de la mère (figure4.6f), mes pondérations maison préservent la cohérence longitudinale des estimations aussi bien sinon mieux que les pondérations officielles. Rappelons toutefois que les premières, contrairement aux secondes, ne tiennent pas compte des sorties de la population cible de certains enfants (décès ou émigration per- manente) et d’informations supplémentaires concernant la population cible en provenance de sources extérieures à l’enquête (données administratives).

J’utilise la série de nouvelles pondérations transversales dans les analyses des deux chapitres suivants de la même manière que je l’aurais fait avec les pondéra- tions publiées par l’ÉLDEQ. Mentionnons toutefois d’emblée que l’écart entre les

Figure 4.6 – Comparaison des estimations d’une sélection d’indicateurs, sans pondération, avec les pondérations fournies par l’enquête et avec les pondérations créées spécifiquement pour la thèse. Treize premiers passages de l’ÉLDEQ (1998-2013).

(a) Proportion de garçons

47 48 49 50 51 52 % 0 5 10 15

Âge des enfants (années)

47 48 49 50 51 52 G a rço n s (% ) 0 5 10 15

Âge des enfants (années)

Estimation pondérée au premier passage (réf.) Estimations non pondérées à chaque passage Estimations avec poids officiels à chaque passage Estimations avec poids « maison » à chaque passage

(b) Proportion de naissances hors union

6 7 8 9 % 0 5 10 15

Figure 4.6 – Suite

(c) Proportion d’enfants dont la mère est immigrante

8 10 12 14 16 18 % 0 5 10 15

Âge des enfants (années)

47 48 49 50 51 52 G a rço n s (% ) 0 5 10 15

Âge des enfants (années)

Estimation pondérée au premier passage (réf.) Estimations non pondérées à chaque passage Estimations avec poids officiels à chaque passage Estimations avec poids « maison » à chaque passage (d) Proportion de ménages dont le revenu était insuffisant à 5 mois

20 22 24 26 28 30 % 0 5 10 15

Âge des enfants (années)

Figure 4.6 – Suite

(e) Proportion dont le père a des enfants d’une union antérieure

7 7.5 8 8.5 9 % 0 5 10 15

Âge des enfants (années)

47 48 49 50 51 52 G a rço n s (% ) 0 5 10 15

Âge des enfants (années)

Estimation pondérée au premier passage (réf.) Estimations non pondérées à chaque passage Estimations avec poids officiels à chaque passage Estimations avec poids « maison » à chaque passage (f) Âge de la mère à la naissance de l’enfant

28.7 28.8 28.9 29 29.1 Âg e (a n n é e s) 0 5 10 15

estimations obtenues par cette procédure de pondération statistiquement rigou- reuse, mais complexe, et les estimations pondérées plus simplement avec les poids de base de l’enquête, ou même avec les estimations non pondérées, sont faibles en contexte multivarié.