Biais de simultanéité - Analyse causale et méthodes quantitatives : une introduction avec R, St

Le quatrième défi de l’inférence causale est appelé biais de simulta- néité, causalité inversée ou causalité bidirectionnelle.1 _{Ce problème}

survient lorsque la variable indépendante cause la variable dépen- dante, et quand la variable dépendante cause aussi la variable indé- pendante (figure 11.1). Lorsque la causalité est bidirectionnelle, une simple analyse de régression par les moindres carrés produit généra- lement des résultats biaisés.

FIGURE 11.1.

Exemple de simultanéité ou causalité bidirectionnelle.

Analyse graphique

Les biais que nous avons étudiés jusqu’à maintenant pouvaient tous être représentés et analysés par des GOA. Ce n’est pas le cas pour le biais de simultanéité. En effet, lorsqu’une analyste parle de simulta- néité, elle fait explicitement référence à un graphe causal avec flèches bidirectionnelles ou avec un circuit. Ceci va à l’encontre de la pro- priété acyclique du GOA. Par conséquent, les conditions d’identification causale présentées dans le chapitre 6 ne pourront pas guider notre

1. Certains chercheurs en sciences sociales appellent ce problème « biais d’endogénéité », mais ce concept est moins précis. Pour plusieurs, l’endogénéité est une catégorie générale qui regroupe toutes les situations où le terme d’erreur d’un modèle est corrélé avec ses variables explicatives.

analyse du biais de simultanéité. Pour bien comprendre le biais de si- multanéité, il faudra nous tourner vers l’analyse algébrique.

Ceci dit, il peut tout de même être utile de représenter le biais de simultanéité graphiquement, afin de développer notre intuition quant à sa source théorique. La figure 11.2 montre quatre exemples.

FIGURE 11.2.

Quatre exemples de simultanéité ou causalité bidirectionnelle.

(A)

Démocratie Croissance

(B)

Dépenses militaires Guerre

(C)

Offre Demande

(D)

Relations sociales Bonheur

Figure 11.2a. Plusieurs chercheurs s’intéressent à l’effet causal des

institutions démocratiques sur le taux de croissance économique. Les pays démocratiques protègent les libertés individuelles, la créativité, les droits de propriété privée et l’entrepreneuriat. Par conséquent, il est raisonnable de croire que de telles institutions promeuvent la croissance économique. De l’autre côté, nous savons que la richesse facilite la consolidation et la persistance des institutions démocratiques. La causalité coule dans les deux directions.

Figure 11.2b. Une augmentation des dépenses militaires peut aug-

menter le risque qu’un rival déclenche une guerre préventive. De l’autre côté, le spectre de la guerre peut pousser un gouvernement à s’armer. La causalité est bidirectionnelle.

Figure 11.2c. Les cours d’introduction à la science économique nous

enseignent que la quantité et le prix d’équilibre sur un marché en concurrence pure et parfaite sont codéterminés par les effets de l’offre et de la demande. Le nombre d’ordinateurs personnels vendus dépend

à la fois de facteurs propres à la demande et de facteurs propres à l’offre. La causalité est mutuelle et simultanée.

Figure 11.2d. Le nombre de relations sociales entretenues par un in-

dividu peut affecter son niveau de bonheur. À l’inverse, le niveau de bonheur d’une personne peut affecter l’énergie qu’elle déploie pour dé- velopper et entretenir ses relations sociales. Encore une fois, la causa- lité semble simultanée.

Est-ce que la simultanéité existe vraiment ?

Il peut parfois être tentant de qualifier une relation de « bidirectionnelle », même si la bidirectionalité n’est pas précisément « simultanée ». Par exemple, considérez la relation entre deux variablesXetY. Ces deux variables sont mesurées aux tempst∈ {1,2,3}. La valeur deXt

affecte la valeur deYt+1lors de la période suivante, et la valeur deYt

affecte la valeur deXt+1lors de la période suivante. Nous avons donc :

Xt=1 Yt=1 Xt=2 Yt=2 Xt=3 Yt=3

Dans cet exemple,X causeY, etY causeX. Mais puisque nous avons défini le mécanisme causal avec suffisamment de granularité temporelle, il est possible de représenter la relation entre ces deux variables à l’aide d’un GOA. De fait, le GOA ci-haut est valide, puisqu’il est orienté et parce qu’il ne comprend pas de cycle. Dans le chapitre 15, nous allons considérer des modèles de régression adaptés aux ob- servations répétées.

Ce GOA motive une mise en garde : avant de postuler qu’une relation entre deux variables est bidirectionnelle et que l’analyse souffre d’un biais de simultanéité, l’analyste doit offrir une théorie claire à cet effet et s’assurer que la supposée simultanéité n’est pas simplement due au fait que le mécanisme causal est mal spécifié ou que la temporalité du phénomène n’est pas spécifiée avec suffisamment de granularité.

Analyse algébrique

Pour bien comprendre la source du biais de simultanéité, il est utile de représenter le problème de façon algébrique. Nous tentons d’estimer l’effet causal deXsurY, mais il y a causalité bidirectionnelle. Cette simultanéité peut être représentée par un système de deux équations. L’équation 11.1 indique queXdétermineY, et l’équation 11.2 indique queY détermineX:

Y = β0+ β1X + ε (11.1)

X = α0+ α1Y + ν (11.2)

Une approche naïve serait d’estimer le modèle 11.1 en ignorant com- plètement l’équation 11.2. Malheureusement, en présence de simulta- néité, ignorer l’équation 11.2 violerait un des postulats qui garantit que l’estimé du coefficient de régressionβ1soit non biaisé.

Dans le chapitre 5, nous avons vu que l’estimé du coefficient de ré- gression par les moindres carrés est libre de biais lorsque la variable explicative est indépendante du terme d’erreur. Pour queE[ ˆβ1] = β1,

il faut queX ⊥ ε.

En présence de simultanéité, cette condition n’est pas satisfaite. Pour illustrer, on substitue l’équation 11.2 dans l’équation 11.1 et on substitue à nouveau l’équation 11.1 dans le résultat :

Y = β0+ β1X + ε

= β0+ β1(α0+ α1Y + ν) + ε

= β0+ β1(α0+ α1(β0+ β1X + ε) + ν) + ε (11.3)

Ce simple exercice de substitution montre queX ̸⊥ ε, puisqueε

fait partie deX. Ainsi, lorsqu’il y a simultanéité, nous n’avons aucune garantie que l’estimé deβ1par les moindres carrés soit non biaisé.

En pratique, il est difficile de quantifier la force du biais de simul- tanéité, ou même d’anticiper sa direction. Si nous estimons le modèle 11.1 en ignorant l’équation 11.2, il est souvent raisonnable de croire que la taille du biais sur l’estimé deβ1est proportionnelle à la force de

la relation causale inverse, soitα1. Cependant, nous n’avons aucune

garantie que ce soit toujours le cas, surtout lorsque nos modèles se complexifient et qu’ils incluent plus de variables explicatives.

Solutions

Comme dans le cas des biais par variable omise et de sélection, la solution idéale pour régler le biais de simultanéité est souvent d’exé- cuter une expérience ou d’employer une méthode quasi expérimentale (chapitres 12, 13). Lorsque ces approches sont impossibles à mettre en œuvre, il est parfois utile d’estimer un modèle de régression par variable instrumentale (chapitre 14).

Partie IV

Chapitre 12

Expériences

Dans les chapitres 6 et 7, nous avons étudié deux cadres théoriques qui permettent de faire le saut entre l’analyse descriptive et l’inférence causale : les graphes orientés acycliques et le modèle Neyman-Rubin. Ensuite, les chapitres 8 à 11 ont analysé quatre obstacles qui se dressent devant les chercheurs qui souhaitent donner une interprétation causale à leurs résultats : biais par variable omise, biais de sélection, biais de mesure et biais de simultanéité. Le reste du livre présente des mé- thodes statistiques qui permettent de contourner ou de minimiser ces biais.

La plus importante méthode d’analyse causale est l’expérience aléa- toire. Dans ce chapitre, nous verrons que l’approche expérimentale est une stratégie flexible, qui permet de répondre à un grand éventail de questions, tout en éliminant plusieurs des biais qui vexent l’analyste. Il existe plusieurs types d’expérience. Ici, nous allons considérer le plus classique : l’essai contrôlé aléatoire.1

Essai contrôlé aléatoire

Un essai contrôlé aléatoire a trois caractéristiques propres. Premiè- rement, il s’agit d’une « expérience » ou d’un « essai » au sens où le chercheur contrôle et manipule la valeur du traitement auquel chaque in- dividu est soumis. Deuxièmement, l’expérience est dite « contrôlée », puisque l’objectif est d’étudier la différence entre les résultats dans un « groupe de traitement » et dans un « groupe de contrôle ». Troisiè- mement, l’essai contrôlé est « aléatoire » car l’analyste fixe la valeur du traitement que chaque participant reçoit en faisant appel au hasard.

1. L’essai contrôlé aléatoire peut aussi être appelé un « essai randomisé contrôlé » ou un « essai comparatif randomisé ».

L’essai contrôlé aléatoire est employé dans la plupart des sciences sociales, où il a permis des avancées scientifiques majeures. À preuve, le Nobel d’économie 2019 a été décerné à Abhijit Banerjee, Esther Duflo et Michael Kremer pour leurs recherches expérimentales sur l’écono- mie du développement et la santé publique. Pour bien saisir l’utilité des expériences dans ces domaines, il est utile de considérer un exemple concret.

Imaginez qu’un chercheur s’intéresse à l’effet causal de moustiquaires imprégnées d’insecticide sur la probabilité de contracter la malaria au Rwanda rural. Pour estimer cet effet, le chercheur choi- sit 50 villages au hasard pour faire partie du groupe de traitement, et 50 villages au hasard pour faire partie du groupe de contrôle. Dans tous les villages du groupe de traitement, le chercheur distribue des moustiquaires gratuits. Les habitants des villages assignés au groupe de contrôle ne reçoivent rien. Un an plus tard, le chercheur estime l’effet causal des moustiquaires en comparant le nombre de cas de malaria dans les deux groupes.

Dans cet exemple, le traitement est une variable binaire égale à 1 pour les villages qui reçoivent des moustiquaires, et 0 pour les villages qui n’en reçoivent pas. La valeur de cette variable explicative est déter- minée purement par hasard, lorsqu’un village est assigné au groupe de traitement ou de contrôle.

Ce type d’expérience aléatoire est souvent considéré comme le Gold

Standard de l’inférence causale. La raison pour laquelle les expé-

riences sont si crédibles est simple. Si les participants sont assignés aux groupes de traitement et de contrôle de façon purement aléatoire, les deux groupes seront, en moyenne, similaires en tous points (p. ex., âge, genre, caractéristiques physiques ou psychologiques).2Si les ca- ractéristiques des deux groupes sont identiques avant le traitement et si on observe une différence entre les groupes après le traitement, il est souvent légitime de conclure que le traitement cause la différence.

La diversité des expériences aléatoires

Notre définition des expériences aléatoires repose sur la manipula- tion aléatoire d’un traitement. En pratique, cette définition minima- liste permet une grande diversité de devis de recherche. De fait, les

2. Ici, « en moyenne » fait référence à la situation hypothétique où le chercheur serait en mesure de répéter l’expérience un grand nombre de fois.

expériences aléatoires prennent plusieurs formes, en fonction du lieu où elles sont exécutées et du type de traitement qui est administré.

Lieu

Le premier lieu où une expérience peut être exécutée est le laboratoire. Les chercheurs qui travaillent en laboratoire bénéficient de plusieurs avantages. D’abord, ils peuvent contrôler l’environnement phy- sique dans lequel le traitement est administré. Ensuite, ils peuvent faire en sorte que les conditions d’administration du traitement soient les mêmes pour tous les participants. Finalement, en exécutant une expé- rience dans un environnement contrôlé, les chercheurs peuvent s’assurer que le protocole expérimental est suivi à la lettre.

Les expériences en laboratoire ont deux principaux désavantages. Premièrement, l’environnement dans lequel le traitement est adminis- tré est souvent différent de celui où le phénomène qui nous intéresse a lieu. Un effet causal observé en laboratoire pourrait ne pas se produire dans un milieu plus naturel. Deuxièmement, puisque les expériences en laboratoire sont coûteuses, le volume des échantillons disponibles est souvent limité.

Pour hausser le réalisme des conditions d’administration d’un traitement, plusieurs chercheurs quittent le laboratoire pour mener des expériences de terrain. Dans ce type d’expérience, une chercheuse continue de manipuler la valeur du traitement de façon aléatoire, mais elle l’administre et mesure ses effets dans un milieu naturel, où les participants vivent au quotidien. Par exemple, une expérience de terrain pourrait avoir lieu en milieu de travail ou dans un espace public.

Comme les expériences en laboratoire, les expériences de terrain ont tendance à être coûteuses. De plus, une chercheuse qui désire mener une expérience de terrain aura souvent besoin de l’autorisation des autorités ou de la collaboration d’acteurs locaux. Comparativement à l’expérience en laboratoire, le protocole expérimental d’une expé- rience de terrain est plus susceptible d’être compromis par un facteur imprévu et hors du contrôle du chercheur.

Pour réduire les coûts d’une expérience et augmenter le volume de leurs échantillons, plusieurs chercheurs évitent le laboratoire ou le terrain, et insèrent des expériences aléatoires dans des sondages. Ces enquêtes peuvent être menées sur le Web, par la poste, ou par téléphone, mais elles reposent sur les mêmes fondations que les expé- riences menées en laboratoire ou sur le terrain : la valeur du traitement

est assignée de façon aléatoire, et l’analyste compare les réponses des membres du groupe de traitement à celles des membres du groupe de contrôle.

Les expériences en sondage ont deux principaux désavantages. Pre- mièrement, le type de traitement qui peut être administré manque souvent de réalisme, et les conclusions sont parfois difficiles à géné- raliser à un contexte plus naturel. Deuxièmement, le niveau d’atten- tion et d’intérêt des répondants à un sondage peut affecter la qualité de l’inférence.

Types de traitements

L’expérience aléatoire peut être exécutée dans plusieurs endroits et elle peut prendre plusieurs formes. L’éventail des traitements possibles est limité seulement par l’imagination, l’éthique et les ressources du chercheur. Par conséquent, nous ne tenterons pas de faire une typo- logie exhaustive des types de traitements. Néanmoins, nous pouvons introduire quelques formes de traitements communes.

Dans une expérience médicale ou thérapeutique classique, les membres du groupe de traitement consomment un médicament ou subissent une intervention médicale, alors que les membres du groupe de contrôle consomment un placebo ou ne sont pas traités du tout. Une expérience visant à traiter une détresse psychologique pourrait offrir aux participants un traitement choisi de façon aléatoire : thérapie cog- nitive comportementale, thérapie humaniste existentielle ou aucune thérapie.

Le traitement n’a évidemment pas besoin d’être thérapeutique. Dans plusieurs disciplines, on s’intéresse à la façon dont les gens répondent à différentes informations. Par exemple, un chercheur pourrait deman- der à des participants de lire une mise en situation ou un article de journal, de visionner une vidéo ou d’écouter une pièce de musique. En manipulant aléatoirement les caractéristiques de ces stimuli, il pourrait mesurer comment les attitudes ou le comportement des participants sont affectés.

Les expériences aléatoires sont souvent mises à profit pour évaluer l’efficacité de politiques publiques, de processus ou de stratégies d’af- faires déployées en entreprise privée. Par exemple, l’accès à un programme de formation professionnelle, l’achat d’un nouveau type de contrat d’assurance ou différentes campagnes publicitaires pourraient être assignés de façon aléatoire.

Exemples

Pour bien saisir à quel point cette approche méthodologique est flexible, il est utile de considérer quelques expériences menées dans différents lieux avec différents types de traitements.

Transferts conditionnels et assiduité scolaire

Plusieurs philosophes et activistes dans la mouvance de l’altruisme efficace soutiennent qu’il faut soumettre les programmes d’aide internationale à des analyses causales rigoureuses afin de comparer leur efficacité (MacAskill, 2015). Selon eux, cette comparaison permet aux donateurs d’identifier et de financer les meilleurs outils disponibles pour améliorer la vie des moins nantis.

Un des programmes d’aide qui a été soumis au plus grand nombre d’analyses causales au cours des dernières années est le transfert en es- pèces. Lorsqu’un Canadien donne 100 $ directement à une personne qui vit dans la pauvreté extrême au Malawi, il y a peu de frais de tran- saction.3 _{De plus, la personne qui reçoit ce transfert peut utiliser sa}

connaissance locale afin d’investir les fonds de façon optimale. Plu- sieurs études suggèrent que ce type de transfert est plus efficace que de nombreuses interventions humanitaires traditionnelles, notamment parce le programme d’aide typique est conçu par des étrangers qui connaissent moins les contraintes et les possibilités locales.

Un des principaux avantages des transferts en espèces est qu’ils permettent aux enfants des familles récipiendaires d’aller à l’école. Dans ce contexte, une question intéressante se pose pour les donateurs : est-ce que les transferts devraient être conditionnels ou universels ?

Baird, McIntosh et Özler (2011) réalisent une expérience pour ré- pondre à cette question. Les chercheurs divisent près de 3000 filles d’âge scolaire au Malawi en trois groupes de façon aléatoire. Le premier groupe ne reçoit rien. Les filles du deuxième groupe reçoivent un paie- ment de 4 à 10 $ par mois en espèce, sans conditionnalité. Celles du troisième groupe reçoivent le même montant, mais perdent le transfert si elles quittent l’école.

Deux ans après le début de l’expérience, les chercheurs mesurent plusieurs caractéristiques saillantes dans les trois groupes et estiment les effets causaux suivants : (a) les deux modes de transferts haussent le

3. Des organisations caritatives comme GiveDirectly facilitent l’identification des récipiendaires et le transfert des fonds.

taux de persévérance scolaire ; (b) l’effet sur la persévérance est légère- ment plus élevé lorsque le transfert est conditionnel ; (c) le nombre de grossesses et de mariages est plus élevé dans le groupe de traitement où les transferts sont conditionnels, parce que les jeunes filles qui quittent l’école perdent leurs revenus et forment plus de couples.

Cette expérience de terrain permet donc d’estimer l’effet causal d’une importante politique d’aide internationale sur la population ci- blée. Grâce à ce type d’analyse, nous sommes en meilleure position pour choisir les programmes d’aide qui ont les retombées les plus bé- néfiques pour les récipiendaires.

Discrimination sur le marché de l’emploi

Dans leur article « Are Emily and Greg More Employable than La-

kisha and Jamal ? », Bertrand et Mullainathan (2004) s’intéressent à

l’effet des perceptions raciales sur l’employabilité des candidats. Pour étudier si les personnes de couleur subissent de la discrimination, les chercheurs composent des curriculum vitæ fictifs et répondent à 1 300 offres d’emploi publiées dans des journaux de Boston et de Chicago.

Chaque offre d’emploi est assignée aléatoirement à un groupe de traitement ou à un groupe de contrôle. Lorsqu’une offre d’emploi fait partie du groupe de traitement, le profil d’emploi fictif que les chercheurs soumettent est associé à un nom commun dans la communauté afro-américaine (p. ex., Lakisha, Jamal, Ebony, Kareem). Lorsqu’une offre d’emploi fait partie du groupe de contrôle, le profil d’emploi fictif que les chercheurs soumettent est associé à un nom commun chez les Américains blancs (p. ex., Emily, Greg, Allison, Brett). Les profils d’emploi fictifs (c.-à-d. diplômes, expériences) sont exactement identiques dans les groupes de traitement et de contrôle, à l’exception du nom du candidat.

Pour mesurer la discrimination, les chercheurs comparent le nombre de candidats (fictifs) qui sont invités à des entrevues dans les groupes de traitement et de contrôle. Ils estiment que les candidats au nom « blanc » ont 50 % plus de chances d’être invités à une entrevue que les candidats au nom « noir ».4

Avantages

Les expériences aléatoires comme celles que nous avons vues pré- cédemment offrent un accès privilégié aux relations de cause à effet, parce qu’elles éliminent plusieurs des biais qui frustrent les chercheurs en sciences sociales. Lorsque la valeur d’une variable indépendante est fixée de façon aléatoire, le coefficient de régression linéaire risque d’être non biaisé, le biais par variable omise est éliminé, le biais de sé- lection dans le traitement n’existe pas, et il ne peut pas y avoir de biais de simultanéité. Nous allons maintenant considérer chacun de ces bé-

Dans le document Analyse causale et méthodes quantitatives : une introduction avec R, Stata et SPSS (Page 175-198)