Caractère endogène de la taille de la famille dans l’investissement scolaire

Chapitre 1 : Revue de littérature sur la relation taille de la famille/scolarisation des enfants

1.2. Problèmes contextuels et méthodologiques que soulève l’analyse de la relation taille de

1.2.3. Caractère endogène de la taille de la famille dans l’investissement scolaire

Au-delà de la mesure de la taille de la famille, les chercheurs s’interrogent également sur des questions liées notamment au caractère endogène de la taille de la famille qui est susceptible d’affecter l’estimation de l’effet (causal) du nombre d’enfants sur leur scolarisation (voir Eloundou-Enyegue & Williams 2006). En effet, les conditions minimales pour soutenir une affirmation causale valide entre une variable indépendante “x” et une variable dépendante “y” sont au nombre de trois (Ní Bhrolcháin & Tim 2007): i) “x” doit précéder “y” temporellement; (ii) “x” doit être corrélé avec “y”; iii) la relation entre “x” et “y” ne doit pas être expliquée par d’autres facteurs. Comme on peut le constater, les deux

premières conditions sont faciles à satisfaire. Par exemple, dans l’étude des liens de causalité entre la taille de la famille et la scolarisation des enfants, la condition d’antériorité est satisfaite, car l’enfant n’est scolarisable qu’après un certain âge (au Burkina Faso par exemple, l’âge officiel d’admission en première année du primaire est de 6 ans). De même, il y a de bonnes raisons de penser que la taille de la famille soit corrélée avec la scolarisation des enfants, dans la mesure où plus d’enfants signifie moins de ressources disponibles pour chaque enfant (hypothèse d’amenuisement des ressources); et cela peut être statistiquement vérifié. A l’opposé, la troisième condition n’est pas évidente, et c’est là que découle le problème d’endogénéité (Antonakis et al. 2010).

L’endogénéité est donc un problème crucial qui menace la validité interne des études de causalité dans les devis de recherche non-expérimentaux, car l’effet d’une variable “x” sur une autre variable “y” ne peut plus être interprété comme une relation causale, puisque cet effet pourrait inclure des facteurs inobservés (Antonakis et al. 2010; Cameron & Trivedi 2005; Fougère 2010; Stock & Watson 2007, 2011). Si les variables “x” et “y” sont endogènes, la relation entre “x” et “y” peut être positive, négative ou nulle sans que l’on soit à mesure de connaître la vraie relation tant que le problème d’endogénéité n’est pas résolu (Antonakis et al. 2010). Malheureusement, la mesure de l’impact de la taille de la famille (x) sur la scolarisation des enfants (y) n’est pas exempte d’un tel problème (biais d’endogénéité), car les décisions des parents en matière de procréation et de scolarisation (qui sont généralement omises ou mal mesurées dans les sources de données usuelles) peuvent être déterminées conjointement. En d’autres termes, l’interprétation des résultats est erronée s’il existe un processus d’auto- sélection par lequel les couples, qui optent pour une meilleure éducation des enfants, optent également pour une faible taille de la famille (Knodel et al. 1990). Cette simultanéité est vraisemblable, car la théorie quality-quantity tradeoff stipule que les parents font un arbitrage entre « qualité » et « quantité » des enfants en fonction de leurs préférences et contraintes (Becker & Lewis 1973). C’est pourquoi, toutes les affirmations causales de la baisse de la fécondité sur la scolarisation des enfants, faites à partir des analyses dans lesquelles le problème d’endogénéité n’a pas été résolu, sont susceptibles d’être invalides.

Pour illustrer statistiquement comment la non-prise en compte de l’endogénéité dans la relation causale entre la taille de la famille et la scolarisation des enfants conduit à des

affirmations erronées, nous empruntons un exemple à Antonakis et al. (2010 :1104-1105) que nous adaptons à la problématique taille de la famille/scolarisation. Supposons que la vraie relation entre la taille de la famille (x) et la scolarisation des enfants (y) soit comme suit (avec une corrélation négative de -0,2 entre x et y):

x = α0 + p + 0,8m + 0,8n +e (1) y = β0 + p -0,2x + u (2)

où α0 et β0 sont des constantes; p, les préférences des parents; m et n, l’ensemble des autres facteurs explicatifs pertinents de la taille de la famille; e et u, les facteurs omis dans chacune des deux équations. En générant une base de données de 10000 individus à partir de ces deux équations, et en estimant la relation entre “x” et “y” à l’aide des moindres carrées ordinaires (OLS) en omettant les préférences des parents (p), on obtient une relation positive de 0,11 (p<0,001) alors que la vraie relation est négative (-0,20). Ainsi, les résultats mitigés autour de la relation entre la taille de la famille et la scolarisation des enfants (positive, nulle, ou négative) dans le contexte africain, peuvent refléter simplement un artéfact statistique, même si les explications fondées sur la prise en charge des enfants au sein de la parentèle élargie semblent vraisemblables.

Outre ce biais d’endogénéité résultant du processus d’auto-sélection lié directement au nombre d’enfants et leur scolarisation, il peut y avoir un autre processus de transmission indirecte du biais d’endogénéité. En effet, supposons que le désir d’éducation soit corrélé avec le statut socioéconomique des parents. Cette hypothèse est vraisemblable, car les parents qui désirent offrir une meilleure éducation à leurs enfants peuvent également opter de travailler davantage pour améliorer leur statut socioéconomique afin de pouvoir faire face aux coûts de la scolarité désirée. Or le statut socioéconomique affecte la taille de la famille (Aassve et al. 2006; Vogl 2013). Ainsi, même si la taille de la famille est exogène par rapport au désir d’éducation (hypothèse peut probable), le statut socioéconomique, s’il est omis ou mal mesuré par exemple dans l’analyse, est susceptible de transmettre indirectement le biais d’endogénéité au coefficient estimé de l’impact du nombre d’enfants sur leur scolarisation (voir partie C de la Figure 1.1). Une mauvaise mesure du statut socioéconomique du ménage et/ou du nombre d’enfants à charge dans le ménage peut donc conduire à la relation nulle et parfois positive

entre le nombre d’enfants et leur scolarisation observée dans la plus part des études antérieures conduites dans le contexte africain.

Figure 1.1 : Comment l’endogénéité affecte les coefficients estimés

Source : Figure adaptée de Antonakis et al. (2010)

La Figure 1.1 ci-dessus illustre d’ailleurs la manière dont l’endogénéité susmentionnée peut affecter directement ou indirectement la vraisemblance du coefficient estimé de l’impact de la taille de la famille sur la scolarisation des enfants. Dans cet exemple (Figure 1.1), “x”

x y

β1= consistent

A: β1est sans biais, car x n’est pas corrélé avec e (Ψ1 = 0).

z y

β2= inconsistent

B: β2est biaisé, car z est corrélé avec e (Ψ2 ≠ 0).

x z y e Ψ1 = 0 Ψ2 ≠ 0 Ψ3 ≠ 0

C: Bien que x ne soit pas corrélé avec e (Ψ1 = 0), β1est biaisé.

En fait, z, qui est corrélé à la fois à e (Ψ2 ≠ 0) et à x (Ψ3 ≠ 0), passe le biais d’endogénéité (endogeneity bias) à x.

x z y e Ψ1 = 0 Ψ2 ≠ 0 Ψ3 = 0

D: β1 est sans biais même si β2 est biaisé, car, z est corrélé à e

(Ψ2 ≠ 0) sans être corrélé à x (Ψ3 = 0); ce faisant, le biais d’endogénéité n’est pas transmis à x. Cette situation révèle que toutes les variables indépendantes d’un modèle explicatif doivent être exogènes afin que leurs effets puissent être sans biais et, donc, interprétables.

représente la taille de la famille, “y”, la scolarisation, “z”, une autre variable indépendante13 (par exemple, le statut socioéconomique des parents), et e, les facteurs omis.

1.3. Approches théoriques pour résoudre le problème d’endogénéité entre taille de

Dans le document Fécondité, réseaux familiaux et scolarisation des enfants en milieu urbain au Burkina Faso (Page 36-40)