Evaluations par assignation aléatoire - Formation à l’entrepreneuriat et le travail indépendant

Chapitre 3: Formation à l’entrepreneuriat et le travail indépendant des diplômés universitaires

III.2. Evaluations par assignation aléatoire

Les évaluations d’impact s’inscrivent dans une tendance internationale qui connait une

généralisation de l’approche axée sur les résultats dans la mise en place des politiques publiques.

Elles permettent de fournir des preuves aux décideurs politiques sur la performance des

interventions publiques et le degré d’atteinte des résultats escomptés. L’évaluation d’impact est

ainsi un outil nécessaire pour améliorer la qualité, l’efficience et l’efficacité des politiques

publiques.

L’évaluation d’impact se focalise principalement sur l’effet causal d’un programme sur un

ensemble de résultats. Dans ce sens, les chercheurs tentent généralement d’isoler et de mesurer les

changements observés sur les résultats qui sont causés directement par le programme. La question

primordiale d’une évaluation d’impact est donc : Quel est le changement dans un résultat (Y) qui

est attribué exclusivement au programme (P) ? La réponse à cette question n’est pas toujours une

tâche facile. En effet, d’autres facteurs exogènes au programme peuvent agir sur l’évolution du

résultat (Y). Par exemple, l’évolution du revenu des bénéficiaires d’un programme de formation

professionnelle ne peut être attribuée exclusivement au programme. Le revenu d’un bénéficiaire

pourrait éventuellement augmenter même en absence de ce programme grâce à d’autres facteurs

comme l’évolution de son expérience ou suite à un changement du contexte du marché du travail.

Afin de déterminer d’une manière rigoureuse l’effet d’un programme, il est important d’avoir une

information sur le contrefactuel qui est une estimation du résultat (Y) pour un bénéficiaire en

absence du traitement. Cette estimation constitue généralement la difficulté la plus important dans

les exercices d’évaluation d’impact des politiques publiques.

D’une manière générale, les évaluations d’impact peuvent être regroupées en deux catégories : les

évaluations prospectives et les évaluations rétrospectives. Ces dernières sont élaborées après la

mise en œuvre de l’intervention. Ce type d’évaluation pose souvent des problèmes pour réaliser

une estimation valide du contrefactuel. D’autre part, les évaluations prospectives font

généralement partie intégrante de la mise en œuvre du programme. Plusieurs techniques existent

pour élaborer un contrefactuel valide et réussir ainsi une évaluation d’impact rigoureuse.

Au cours de ces dernières années, l’expérimentation par assignation aléatoire a suscité l’intérêt de

plusieurs chercheurs qui travaillent sur les évaluations d’impact des politiques publiques et plus

particulièrement des politiques éducatives. Le premier argument avancé pour justifier le recours à

cette technique est le problème du biais de sélection souvent rencontré lors des évaluations non

expérimentales. En générale, les participants à un programme sont systématiquement différents

des non participants. En revanche, l’assignation aléatoire du programme aux individus parmi une

population éligible permet de constituer deux groupes : un groupe de bénéficiaires, appelé aussi

« groupe de traitement » et un groupe de non bénéficiaires ou encore « groupe de contrôle ». Grace

à la sélection aléatoire, tous les individus éligibles ont la même chance d’appartenir au groupe de

traitement ou de contrôle. Cette approche permet donc d’avoir deux groupes comparables et de

faciliter ainsi l’obtention d’un contrefactuel solide.

Un deuxième avantage des évaluations d’impact randomisées est le fait que cette approche, basée

sur l’expérimentation, facilite l’étude de l’efficacité de chaque composante d’une politique mise

en œuvre. Il est courant que plusieurs programmes, qui visent le même objectif, soient déployés

au même moment. Ce type de configuration génère une chaîne de causalité multiple et complexe

qui pose des difficultés aux économistes dans l’estimation de l’efficacité de chaque composante.

Ainsi, les décideurs politiques ne peuvent pas savoir quelle composante de leur politique est la

plus efficace. Cependant, quelques expérimentations réalisées à travers le monde ont montré que

l’implication des chercheurs dans la conception et la mise en œuvre de certains programmes a

donné naissance à des instruments innovants dont l’efficacité était inattendue (ALJ-PAL, 2005).

Avec l’évolution remarquable des expérimentations par assignation aléatoire à travers le monde,

une vague de critiques et d’oppositions à cette approche voit le jour. Les premières critiques se

rapportent au coût relativement élevé en termes de temps et de budget pour la mise en œuvre d’une

expérimentation. Toutefois, il est important de noter que la collecte des données non

expérimentales est parfois une tâche couteuse notamment lorsqu’il s’agit de données

longitudinales. De plus, les évaluations randomisées font souvent appel à des méthodes de

collectes de données originales et ne concernent que des échantillons de petites tailles (Banerjee

et Duflo, 2009) ce qui permet de réduire les coûts.

Certaines critiques s’adressent au principe de l’expérimentation randomisée. L’assignation

aléatoire peut constituer une contrainte pour l’adhésion des organismes et des gouvernements dans

la mise en place du programme (Heckman, 1992). Dans certaines situations on évoque même des

problèmes éthiques liés à la sélection aléatoires des candidats. Cependant, les autorités publiques

sont souvent confrontées à des contraintes budgétaires lors de la mise en œuvre des programmes

et, par conséquent, ne peuvent pas couvrir toute la population cible. Dans le cas où la demande

dépasse l’offre, une sélection des bénéficiaires s’impose. La sélection aléatoire des bénéficiaires

peut être considérée comme une règle légitime et transparente.

D’autre part, les expérimentations par assignation aléatoire peuvent être soumises à un biais de

randomisation ou plus particulièrement à l’effet Hawthorne. Ce biais consiste à ce que les

participants et/ou les non participants au programme changent leur comportement parce qu’ils

savent qu’ils font partie d’une intervention soumise à une évaluation (Heckman et Vytlacil, 2008b).

Ce changement de comportement, provoqué par l’évaluation d’impact, peut limiter la validité

externe des résultats. Par exemple, si les individus du groupe témoin savent qu’ils vont bénéficier

du programme incessamment, par anticipation, ils auront tendance à changer leur comportement.

Pour limiter ce biais, qui n’est pas spécifique aux évaluations randomisées, les gestionnaires et les

évaluateurs des programmes ont tendance à ne pas informer les membres des deux groupes qu’il

s’agit d’une expérimentation soumise à une évaluation.

Finalement, les évaluations randomisées peuvent être soumises aussi au biais d’attrition. D’une

manière générale, il s’agit d’un manque de données lié à la non-réponse de certaines unités

statistiques de l’échantillon de l’étude. Dans le contexte des expérimentations avec assignation

aléatoire l’attrition résulte du fait que certains participants ne respectent pas leur assignation à l’un

des deux groupes (groupe de traitement ou groupe de contrôle) ou décident de quitter l’expérience

avant la fin de celle-ci.

Dans le document Contributions à l'étude des rendements de l’éducation (Page 104-107)