Analyses statistiques - Volet quantitatif

Méthodologie et données

4.1. Volet quantitatif

4.1.4. Analyses statistiques

4.1.4.1. Analyse des calendriers de transition

Analyser les calendriers sociaux des transitions implique établir une chronologie des marqueurs de transition. Pour nous, cela implique de les situer dans le temps individuel, mesuré par l’âge des individus. Cette approximation est ancrée dans les fondements de l’approche biographique, pour laquelle le sens d’un événement marqueur de transition doit être compris en rapport au temps biographique (Elder et al., 2003).

Afin de surmonter les limites des données transversales, on fait une analyse de « cohorte synthétique ». Cette technique implique de traiter des données transversales comme des données longitudinales, pour rendre compte de tendances à des niveaux agrégés de population (Fussell, 2005). Ceci suppose considérer que, du fait de la proximité de leur année de naissance, les individus concernés ont expérimenté une configuration sociétale semblable. Les indicateurs démographiques les plus utilisés, tels que l’espérance de vie et le taux de fécondité, sont calculés selon cette approche (Le Bras, 2005 ; Shryock et al., 1976)96F96F

97_{. Par}

ailleurs, l’approche par cohorte synthétique est utile pour approcher les transitions biographiques en l’absence de données longitudinales (Elder et Giele, 2009). Elle a notamment été utilisée pour des analyses de transitions liées au passage à l’âge adulte aux Etats-Unis d’Amérique (Stevens, 1990), au Mexique (Fussell, 2005), en Uruguay (Videgain, 2012), en Espagne (Vieira et Gamundi, 2010) et en Chine (Tian, 2016).

Notre unité d’analyse est la cohorte, composée par tout individu entre 18 et 29 ans au cours de l’année 2007. La cohorte inclut tous les individus nés entre 1978 et 1989 pour l’analyse des calendriers au niveau section, et ceux nés entre 1983 et 1989 pour les l’analyses des calendriers au niveau ménage. Respectivement, douze et sept années séparent la naissance des cadets et des ainés au moment du recensement les premiers ont 18 ans et les seconds 29 ans.

En effet, cette technique démographique est basée sur les principes des tables de survie. Par exemple, pour le cas de ce dernier, on considère que les femmes qui ont entre 20 et 24 ans aujourd’hui auront, dans dix ans, autant d’enfants que celles qui ont de nos jours entre 30 et 34 ans. L’hypothèse sous-jacente est que les conditions primordiales qui influencent la fécondité ne vont pas brusquement changer dans la décennie à venir. Les mesures basées sur cette supposition sont amplement utilisées pour analyser des processus sociodémographiques.

Cette tranche d’âge correspond à l’étape post-secondaire à Lima. Lors de la deuxième moitié des années 2000, à 18 ans, 96,4% des jeunes ont finalisé leurs études dans l’enseignement secondaire. A 29 ans, la plupart des individus sont sortis du système d’enseignement. Le seuil de 29 ans est un seuil fréquemment utilisé pour faire référence à la population jeune, puisqu’on considère qu’à partir de cet âge les rôles adultes sont assumés par la plupart des individus (PNUD, 2015).

Un des principaux aspects à prendre en compte est le fait que l’analyse de cohortes synthétiques est sensible à des changements abrupts dans les flux migratoires d’une année à l’autre. Pour le cas des cohortes successives analysées, on observe une régularité des flux migratoires à partir des taux de croissance dans la ville (INEI, 2014b). Pour valider cette approche, on a recours à la constatation de la cohérence intra-cohorte dans une perspective de cycle de vie. Pour cela, nous avons effectué une validation avec en premier la comparaison des données du recensement avec des pseudo-panels construits avec les enquêtes nationales de ménages successives (1996-2010), à partir des années de naissance concernées (Deaton, 1985). Pour ce faire, nous avons suivi la méthodologie proposée par Bourguignon et Moreno (2015). Le second volet a consisté à observer si le critère d’équilibre statistique existe, condition importante pour que l’analyse chronologique soit pertinente avec des données de type transversal (Coleman, 1981). Globalement, les distributions des variables d’intérêt pour ce travail sont caractérisées par des progressions régulières et non-abruptes à travers les âges, ce qui est valable aussi pour les variables utilisées dans les analyses de régression. Nous avons pu constater qu’au-delà des changements individuels dans le temps, les probabilités associées aux prévalences d’états restent stables.

Dans une analyse de cohorte synthétique, l’analyse est basée sur les proportions cumulées. L’unité d’analyse est la cohorte et pas les individus. C’est pourquoi l’évolution des proportions à travers les âges indique une tendance de la cohorte, ne nous permettant pas d’avoir des informations sur les trajectoires individuelles à travers le temps. Il s’agit donc d’une technique utile pour faire l’examen de tendances, notamment avec l’approximation de celles-ci selon les groupes de population spécifiques

Afin de comparer les calendriers masculins et féminins selon le milieu social, nous avons recours à des graphiques car ils facilitent l’identification des écarts et des tendances. Pour décrire les différentes chronologies, les mesures sont celles de « tendance centrale »,

notamment la médiane ajustée et les terciles. Le calcul de la médiane ajustée est basée sur la proportion totale d’individus qui seront concernés par chaque transition, en observant les statuts de la population, âgée de 50 ans, à partir de données récentes97F97F

98_{–cela concerne}

l’emploi et la formation de couple (Shryock et al., 1976). Concernant les terciles, nous utilisons le premier et deuxième tercile, afin de pouvoir comparer les milieux sociaux extrêmes.

Les deux aspects de la chronologie qui sont utilisées pour décrire les calendriers sont le

moment et le rythme. Le premier aspect s’exprime en termes d’âge et sert à rendre compte de

la répartition des individus en emploi et en études à travers le temps. Le deuxième aspect sert à identifier le niveau de concentration dans le temps des changements de statut. Si une grande part de la cohorte passe d’un état à un autre, on parle d’une transition « rapide » ou plus « synchronisée » (Elder et Giele, 2009).

L’analyse des calendriers sociaux prend en compte trois variables clés : le niveau socioéconomique du ménage, l’accès à l’enseignement supérieur des responsables de ménage et l’accès à l’enseignement supérieur dans la section.

Les limites de cette perspective sont la réversibilité, la censure ou la non-expérimentation pour un groupe d’individus et la difficulté de définir clairement la première fois que l’événement a eu lieu (Calvès et al., 2006). La réversibilité indique que la situation au moment de l’enquête est susceptible de changer. Ainsi, certains marqueurs de transition ne sont pas définitifs. Pour les données transversales, le problème de la reversibilité est significatif. Pour les données utilisées dans ce travail, la restriction est plus importante pour la transition dans l’emploi et dans l’éducation supérieure. Car on n’a pas l’histoire personnelle des entrées et sorties du système éducatif et du marché de travail. Par exemple, une situation d’indépendance économique peut basculer dans une dépendance vis-à-vis d’autres personnes comme conséquence de la perte d’un emploi.

98_{Pour calculer l’âge médian d’expérimentation d’une union conjugale, on utilise le pourcentage des femmes}

entre 55 et 60 ans déclarant avoir expérimenté une union dans leur vie lors de l’enquête de ménages de 2014/2015. On repère l’âge à laquelle la moitié des jeunes filles susceptibles de se marier l’ont déjà fait. Si c’est le cas pour 80% d’entre elles, alors cela fait 50% de 85% = 42,5% du total des jeunes filles. C’est ce qu’on considère une médiane ajustée ou une « médiane indirecte » (Massimo, 2007).

4.1.4.2. Analyse multivariée

L’objectif de faire une analyse de facteurs associés est de quantifier les associations entre les marqueurs de transition et les caractéristiques individuelles, familiales et contextuelles. Ainsi, un des buts principaux est d’estimer les associations « nettes » de facteurs individuels, de ménage et de contexte résidentiel.

Nous recourons aux régressions statistiques de type logistique binaire multi-niveau. Le principe des modèles logistiques est d’estimer la probabilité qu’un individu soit dans un état donné. Dans notre cas, les deux états qui nous intéressent sont le fait d’être en études ou d’avoir un emploi rémunéré au moment du recensement. Pour les modèles logistiques, nous avons réalisé une transformation des variables présentées dans la section vers des versions binaires, passant ainsi de plusieurs catégories à deux catégories seulement.

Ce type d’analyse nous permet de mieux estimer les associations à plusieurs niveaux (Courgeau, 2004 ; Golaz et Bringé, 2009). Pour les données mobilisées, l’ensemble de variables qui font partie des modélisations ont des corrélations inférieures à 0,6 (voir détails en annexe 3). Les modèles sont faits à deux niveaux : l’un qui regroupe les variables individuelles et de ménage, l’autre avec les caractéristiques de la section de résidence.

La formulation mathématique de la modélisation générale est la suivante (Snijders, 2011):

logit(P

) = B

+ B

X

+ U

Où :

j

représente chacune des sections censitaires,

i

représente chacun des individus,

Dans le document Transitions postscolaires et inégalité sociale à Lima : poursuite éducative et insertion professionnelle des jeunes de la génération «Ochentas» (Page 150-153)