• Aucun résultat trouvé

c) Les inconvénients

5.3. L’approche non expérimentale a) Le modèle traditionnel

L’hypothèse de base de l‘approche non-expérimentale est le fait qu’on puisse modéliser le processus de sélection dans le programme et les résultats. Si l’évaluation n’a pas un caractère expérimental, il faut spécifier un modèle qui établisse une corrélation entre les résultats étudiés et le traitement.

Le modèle traditionnel, avec une notation simplifiée, appelé aussi « the dummy endogenous

168 En Suisse, si on observe le nombre de personnes qui touchent des indemnités spécifiques de

remplacement, on doit conclure, qu’au moins au niveau global, il existe une offre de mesures insuffisante face à la demande. Cette situation pourrait justifier une sélection aléatoire des personnes bénéficiant des MMT. On ne sait pourtant pas, si les personnes en attente d’une MMT, sont statistiquement similaires aux participants. Il se peut que les conseillers en personnel fixent un ordre entre les chômeurs, en favorisant les personnes qui pourraient profiter le plus des mesures.

variable model » ou « Index sufficient methods », repose sur deux équations (Heckman et al., 1998a) :

Y1 = g1 (X, U1) et Y0 = go (X, U0)

U1 et U0 sont inobservables. Une équation de sélection est spécifiée afin de déterminer quels

résultats sont observés. On fait l’hypothèse que :

Y1 = g1 (X) + U1 et Y0 = go (X)+ U0 (A-1)

avec E(U1)= E(U0)=0. Ainsi, l’effet moyen du traitement peut s’écrire comme :

E(Y1 - Y0 | X, T =1) = g1(X)- g0(X) + E(U1- U0 | X, T =1)

Les variables observées X peuvent être subdivisées en deux sets de variables (R, Z) ; les variables R apparaissent dans l’équation des résultats et les variables Z dans l’équation de participation.

L’estimation de l’effet moyen du traitement nécessite plusieurs hypothèses, dont l’hypothèse que certaines variables n’apparaissent que dans le set des variables Z (« exclusion restriction »). Autrement dit, au moins une variable doit être explicitement exclue de l’équation résultat et inclue dans l’équation participation. En plus, toute influence de Z sur Y doit se réaliser via un effet de Z sur T. Dans le modèle traditionnel, la variable latente est un indice I, définie comme I=H(Z)-υ, en faisant l’hypothèse que υ est indépendant de Z. T=1 si I>0 et T=0 autrement. La dépendance entre T et (U0,U1 ) ne doit se faire qu’à travers υ. R et Z

doivent être indépendants de (U0,U1 ). On obtient donc que le biais de sélection (B(X)=E(U0 |

Z,R, T =1)- E(U0 | Z,R, T =0)) et le gain moyen rattaché aux variables inobservables E(U1- U0

| Z,R, T =1) ne dépendent de Z qu’a travers l’index H(Z). Ainsi, le biais de sélection et le gain moyen rattaché aux variables inobservables ne dépend de Z qu’à travers la propension à participer à un programme:

B(P(Z))= E(U0 | P(X), T =1)- E(U0 | P(X), T =0)

Cette équation est appelée aussi « the index sufficient representation ». Ces hypothèses rendent l’estimation de l’effet moyen du traitement non biaisé (Heckman et al., 1998a).

Le modèle traditionnel peut être présenté plus précisément suivant Ridell (1991) et Heckman et Robb (1985). L’équation des résultats (« outcome equation ») rapporte la (les) variable(s) concernée(s) (par exemple les gains Y) au traitement (T), aux caractéristiques observables et non observables des participants et des non-participants (comme l’âge, le sexe, le niveau

d’instruction et l’expérience ainsi que la motivation et le sérieux, l’attachement à l’emploi que traduit le vecteur de variables X)169.

La deuxième relation-clé du modèle est l’équation de la participation (ou de sélection) qui explique quels individus participent au programme par un vecteur de variables observables Z

(Z=zit, vecteur de variables représentant les caractéristiques individuelles, familiales et les

facteurs institutionnels) et un vecteur de variables non observables V (V= vit =ρi + κit,

Heckman, 1979). Dans le cas le plus simple, on assume que cette fonction est linéaire en Z:

Iik* = λ Z ik+ Vik =λ Z ik+ U it = λ zik + ρi + κik

où Iik* est une variable latente (non observée) qu’on peut interpréter comme l’intention de

participer au programme ou comme un indice des bénéfices nets de la participation à la mesure dans un modèle d’auto-sélection (Heckman et Smith, 1996). C’est donc l’intention de participer à une mesure du marché de travail qui influence le résultat du traitement. Elle reflète la motivation du participant, la disponibilité de programmes et/ou l’intérêt de l’organisateur de la mesure (Zweimüller et Winter-Ebmer, 1996). L’individu i participe à la mesure (Ti = 1) si Iik* > 0, et il n’y participe pas (Ti = 0), autrement. ρi représente l’effet

spécifique à l’individu (constant dans le temps) et κik est un terme d’erreur aléatoire. On

normalise le vecteur Vik , de telle façon que E(Vik)=0 et var (Vik) =1.

169 Si l’on désigne les individus par i, les périodes de temps par t et le moment où est prise la décision

de participer au programme par k et par n le nombre de périodes pour lesquelles les données de X sont disponibles pour chaque observation, on obtient l’estimateur suivant (« linear control function estimator » ) :

Y it = ßit Tit + µ X it+ U it où Tit = 1 si Dik* > 0

Tit = 0 sinon

et t=0,1,....,n

où ß, µ sont des paramètres ou des vecteurs de paramètres inconnus. Si l’effet du programme est égal pour tout le monde, alors ßit= ßt. U it est un terme d’erreur non corrélé avec T et X et E(U it)=0. Si on

pouvait mesurer X et T sans erreur, il n’y aurait pas besoin d’expérimentation sociale ou d’un modèle économétrique. L’estimation des moindres carrée produirait un estimateur non biaisé de ßit , l’effet du

programme. On transforme l’équation des résultats, en redéfinissant le vecteur X par les seules caractéristiques observables des individus et U les facteurs non mesurables qui influencent les gains,

Y it = ß it Ti + µ X it+ U it où Tit = 1 si Dik* > 0

Tit = 0 sinon

Heckman, Hotz (1989) assument que l’effet du traitement est invariant parmi les individus, mais il varie avec le temps (ßit=ßt) et que E(Uit¦Xi)=0 pour tout i et t , c’est-à-dire que Xt est exogène. Ces

Avec l’hypothèse que ρi ~ N (0, σ2ρ) et κik ~ N (0, σ2κ) , on obtient la probabilité suivante de

participer à une mesure :

Pr (Tit =1¦ Z=zit) = ps ( zit ) = Φ(( zit λ+ ρi )/ σκ) où Φ est la distribution

normale standard170

dénommée par Rosenbaum et Rubin (1983) propension à la participation (voir infra). L’estimation du coefficient λ nous donne de combien chaque caractéristique influence la probabilité individuelle de participer à une mesure. L’équation de la participation peut également être spécifiée dans le cadre d’un modèle d’auto-sélection qui se base sur l’hypothèse que l’individu fait un calcul sur les gains attendus avec et sans programme pour

décider de postuler pour une MMT171. Mais la participation à un cours ou à un programme

d’occupation n’est pas un événement aléatoire. L’individu qui remplit les critères pour la participation doit notamment d’abord décider qu’il aimerait y participer (postuler); des places

doivent être disponibles et l’organisateur de la mesure doit accepter sa candidature172. Par

ailleurs, puisque l’autorisation à participer à une MMT est donnée normalement par le conseiller en personnel, la participation à une MMT dépend également des préférences des conseillers en personnel des ORP173 (cf. annexe C)174.

170 Il existe d’autres possibilités, telles qu’une distribution logistique.

171 Dans la version plus simple, l’organisateur accepte toute personne qui veut participer à la mesure et

toutes les personnes actualisent le flux des gains par un même facteur (1/1+r). Pendant la mesure, le participant reçoit une indemnité S, alors que pendant la période k, où il y a l’opportunité de décider de participer à la mesure, il ne reçoit rien. Si la mesure augmente les gains d’un facteur Ω pour chaque période, la valeur actuelle (anticipée) des gains pour une personne qui ne profite pas de la mesure est : PV(0)= Ek-1 [ ∑j=0∞(1/(1+r))j y0,k+j] et

et pour le participant à la mesure :

PV(1)= Ek-1 [ ∑j=1∞(1/(1+r))j y0,k+j+ ∑j=1∞Ω / (1+r)j ]

où la décision est prise sur la base des informations disponibles à la période précédente la période k. L’individu, neutre face au risque, décide donc de participer à la mesure (T=1) lorsque PV(1)>PV(0), c’est-à-dire lorsque :

Dik = PV(1)-PV(0)= Ek-1 [ S -Yk + Ω/r) > 0.

Cette règle de décision est valable, si la personne peut prévoir ses gains avec certitude (cf. Heckman et Robb, 1985, p. 182, si au contraire la personne vit dans un monde d’incertitude).

172 Heckman et Robb (1985, p.183) formalisent la possibilité d’avoir plusieurs règles de décision pour

la participation, en particulier ils considèrent que la personne doit aussi être acceptée par l’organisateur de la mesure.

173 Heckman et al. (1996) ont cherché à analyser les préférences des conseillers en modélisant la

probabilité d’accepter la candidature d’un individu. En particulier, ils ont cherché à vérifier si les conseillers favorisaient les individus les plus pauvres ou s’ils sélectionnaient les personnes susceptibles de profiter le plus de la MMT. Sur la base des équations de résultat basées sur les revenus et les gains nets résultant du cours corrigées par la sélection et une équation modélisant la décision d’accepter le candidat prenant en compte les résultats escomptés, ils aboutissent à la conclusion que la première hypothèse est la plus probable. Même en présence d’incitations financières pour améliorer la

Heckman, Hotz (1989) analyse le cas, où il y a dépendance entre le terme d’erreur Uit et la

variable muette de participation Ti (E(Uit /Ti)≠ 0), c’est-à-dire lorsqu’il y a biais de sélection.

Cette dépendance peut être issue d’une dépendance entre le terme d’erreur et les variables

observables qui déterminent la propension à la participation (Zi) ou entre le terme d’erreur et

les variables inobservables qui déterminent la propension à la participation (Vit). Le biais de

sélection dû aux variables observables

E (U it ¦ Ti , X i) ≠ 0 et E (U it ¦ Ti , X i, Zi) ≠ 0

peut être supprimé par l’introduction dans le modèle d’une équation de participation. L’hypothèse implicite de ce modèle est la suivante :

(Y1 , Y0) ⊥ T¦ Z,X

où ⊥ signifie que « conditional on Z and X,Y1 and Y0 are statistically indépendant of T » 175.

Il suffit que E (U it ¦ Ti)=0 ; il n’est pas nécessaire que E (U it ¦ X)=0 (Heckman et al., 1997a).

Autrement dit, s’il existe un biais de sélection, ce dernier ne doit résulter que de la sélection sur les variables observables. On obtient alors, que

E [Y ¦ T, X, Pr (T=1¦Z,X)] = µ X + ß T + E [U ¦ Pr (T=1¦Z,X)].

La procédure en deux étapes de Heckman, développée pour faire face à un échantillon tronqué (Heckman, 1979), permet sur la base de l’estimation de la propension à la participation de corriger, sous certaines conditions, le biais de sélection (pour plus détails, cf.

Heckman et Robb, 1985)176. Elle fait pourtant l’objet de critiques (par exemple, Barnow, 1987

performance du service public de l’emploi, les conseillers en personnel se comportent comme des assistants sociaux en favorisant les personnes les plus démunies.

174 Dans les années quatre-vingts plusieurs tests de spécification du modèle traditionnel ont été mis au

point: équation des gains antérieurs, équation des gains postérieurs et le test de surspécification. Le test des gains antérieurs vérifie si le fait de participer (T) à une mesure entre déjà dans l’équation des gains dans la période avant le traitement. Dans ce cas, il faut conclure qu’il y a des différences inobservables entre les futures participants et les non-participants (ßt est significativement différent de

zéro). On ne peut donc rien conclure sur l’effet du traitement sur les gains. Formellement, le test est satisfait si dans le modèle des effets constants, la différence entre Y it - Y ip n’est pas statistiquement

différente de zéro avant le traitement. Le test sur les gains postérieurs est semblable à celui des gains antérieurs, sauf que la période considérée se situe après la période du traitement. Le test est satisfait, si ni pour les membres du groupe de contrôle et ni pour ceux de traitement le coefficient ßt n’est

significativement différent de zéro si le traitement n’a pas eu lieu. Pour le troisième test, on combine les données des personnes qui n’ont pas pu participer au traitement (semblable aux participants) avec les données des membres du groupe témoin.

175 Une hypothèse plus souple prévoit que E(Y

1 ¦D=1, Z,X) = E(Y1 ¦ Z,X) et E(Y0 ¦D=1, Z,X) = E(Y0 ¦

Z,X).

176 Plus précisément, si pour chaque observation (individu) de l’échantillon des participants, on

calcule le paramètre âi (le « inverse Mill’s ratio ») et si, par la suite, on estime par simple régression

des moindres carrés de y sur X et λ, on corrige le fait qu’on ne dispose que d’observations des résultats pour le sous-échantillon des personnes participant au traitement. Dans la littérature

et Puhani, 1997), en raison des difficultés à identifier une variable instrumentale qui expliquerait la participation à une MMT et qui n’influencerait pas le résultat de la MMT. Par ailleurs, il existe un modèle alternatif avec des équations simultanées de la participation à une MMT et de l’emploi (voir Fitzenberger et Prey, 1996).

Enfin, Heckman et al. (1998), sur la base des données expérimentales et non-expérimentales du JTPA et une méthode d’estimation non-paramétrique du biais de sélection, vérifient l’hypothèse centrale à la base du modèle traditionnel. Ils montrent que l’hypothèse de l’« index sufficient » est satisfaite pour ces données, mais il serait nécessaire de la vérifier sur un échantillon de taille supérieur. Par contre, l’hypothèse à la base du modèle de Heckman (1979) avec une estimation paramétrique du biais de sélection est à rejeter.