• Aucun résultat trouvé

Chapitre 3: Données et méthodologie

3.1 Base de données

La base de données utilisée a été créée afin de déterminer l’âge au décès de Canadiens français nés à la fin du XIXe siècle, pour lesquels des renseignements sur le milieu de vie dans l’enfance étaient disponibles (Pilon-Marien et al. 2009; Gagnon et Bohnert 2012). Elle a été construite en s’appuyant sur les données dépouillées par le Canadian Families Project, soit l’échantillon de 5% des demeures sélectionnées au hasard sur des bobines de microfilms du recensement canadien de 1901 (Sager 2001). À partir des informations sur les ménages, la propriété et les individus (Sager 2001), les familles ont été sélectionnées selon les caractéristiques suivantes. Afin de faciliter le jumelage aux actes de décès, seuls les ménages présents au Québec en 1901 pour lesquels le chef était de religion catholique et avait pour langue maternelle le français ont été conservés. Ensuite, dans le but de restreindre l’analyse à l’effet de conditions de vie dans l’enfance, seulement les familles comprenant un enfant de moins de 15 ans le 31 mars 1901, date du recensement, ont été gardées, ce qui correspond à 24 437 individus (Figure 3.1). Pour 85 % d’entre eux, les dates de décès ont été cherchées à partir de l’index des décès de 1926 à 1996 de l’Institut de la statistique du Québec (ISQ) et de la Société de généalogie du Québec. Pour les décès survenus entre 1997 et 2004, c’est le fichier pour les personnes âgées de 85 ans et

30

plus conçu par l’ISQ qui a été utilisé (Pilon-Marien et al. 2009)2. Pour ce mémoire, nous avons sélectionné les 12 085 personnes nées entre 1885 et 1901 (Figure 3.1). Parmi elles, la date de décès a été trouvée pour 5 959 individus, dont la quasi-totalité avait une date de naissance complète. Puis, des 5 334 personnes pour lesquelles l’âge au décès était de 40 ans ou plus, 5 249 ont été sélectionnées pour former l’échantillon final, soit celles qui n’avaient pas de valeurs manquantes pour les variables analysées.

Figure 3.1 : Critères de sélection de l’échantillon et nombre d’individus correspondants

2 Laurence Pilon-Marien, Marianne Desjardins, Josianne Quevillon, Valérie Jarry, Sophie Andrée Piché,

Marie-Pier Cléroux et Isaac Hurtubise ont également travaillé au jumelage des données qui ont servi à notre étude.

Décédé avant 40 ans Décédé à 40 ans ou plus

624 5334

5249 20698

Échantillon de départ ( Individus vivant dans une famille comprenant au

moins 1 enfant de moins de 15 ans au recensement de 1901)

24437

Date de décès cherchée

Information sur le lieu de résidence à la naissance (urbain ou rural) disponible 5959 Nés entre 1885 et 1901 Date de décès trouvée

Date de naissance complète

5958 12085

31

Plusieurs raisons peuvent expliquer la proportion importante de personnes pour lesquelles l’information sur le décès n’a pas été obtenue. D’abord, les décès après 1926, l’année de la création de l’état civil, ont été priorisés dans les recherches, ce qui correspond au décès après l’âge de 40 ans, après 41 ans pour la cohorte de 1885. De plus, les personnes sélectionnées devaient être présentes au Québec en 1901 et décédées dans la province. Celles qui ont émigré et qui sont décédées à l’extérieur du territoire québécois n’ont donc pas été considérées. Aussi, quelques-unes peuvent encore être en vie. Enfin, des problèmes d’identification peuvent avoir causé des difficultés de jumelage avec la date de décès, soit en raison d’un nom et/ou d’un prénom très fréquent ou de dates de naissance qui ne correspondaient pas. Pour corriger les erreurs de déclaration du chef de ménage au recensement de 1901, un projet a colligé ces informations avec celles du recensement de 1911 pour les ménages retrouvés à l’aide du site internet Automated Genealogy (Jarry, Gagnon et Bourbeau 2013; Pilon-Marien et al. 2009; Gagnon et Bohnert 2012).

Deux effets de sélection peuvent découler de la méthode de sélection de l’échantillon. Le premier résulte du fait que, pour les raisons évoquées plus haut, l’âge au décès de certaines personnes n’est pas disponible bien qu’il soit supérieur à 40 ans. Il est difficile de prévoir le sens de ce biais. Toutefois, on peut penser que l’effet de sélection est aléatoire et qu’il aura peu d’importance sur les résultats de nos analyses puisqu’il ne semble pas avoir de lien entre l’exposition à une épidémie tôt dans la vie et les éléments qui ne permettent pas de jumeler un individu à son acte de décès, comme l’émigration hors du Québec par exemple. Le deuxième effet de sélection est lié au fait qu’en considérant seulement les individus décédés après 40 ans dans nos analyses, nous ne tenons pas compte des individus qui ont été exposés à une épidémie tôt dans la vie et qui sont décédés avant l’âge de 40 ans. On ne peut donc pas démontrer, à partir de ces personnes, les effets néfastes à long terme de l’exposition à une épidémie durant la première année de vie et/ou durant la période fœtale. En effet, si les épidémies étudiées ont entraîné une forte mortalité infantile et un taux élevé de fausses couches, l’effet de l’exposition tôt dans l’enfance sur la mortalité plus tard dans la vie sera sous-estimé parce que ces individus décédés ne sont pas considérés dans nos analyses. C’est également le cas si les personnes exposées aux épidémies dans l’enfance ont été exposées à une

32

mortalité élevée lorsqu'elles étaient adultes. L’effet de l’exposition sera sous-estimé puisqu’on ne pourra pas observer chez les individus qui sont décédés à ces âges les effets néfastes à long terme de l’exposition à une épidémie tôt dans la vie. En conséquence, nous pouvons penser que nos estimations de l’effet de l’exposition tôt dans l’enfance seront conservatrices.

Documents relatifs