Comment résumer les phénomènes de sélection sous-jacent ?

6- I/ Méthodologie pour l’évaluation

6.2 Comment résumer les phénomènes de sélection sous-jacent ?

Si dans la littérature, le cas d’un seul traitement pose peu de problèmes pour la détermination des scores de propension (Smith [1997]), dans celui de plusieurs programmes, le choix du modèle devient critique. Dans le cadre binaire, il est en effet possible de recourir à n’importe quelle régression de type linéaire, choix discret, etc. Les modèles logit/probit85 l’emportent sur les autres modèles notamment le modèle linéaire. Aussi, ils fournissent des résultats d’évaluation similaires (Caliendo et Kopeinig [2008]).

Nous discutons trois stratégies alternatives couramment mobilisées dans la littérature : le logit et probit resp. multinomial et une série de modèles probits simples. Cette dernière a été proposée par Lechner [2001a] comme étant une alternative à la complexité d’estimation des probits multinomiaux. En effet, malgré que la procédure d’estimation des modèles de choix discrets multiples ait été automa- tisée (commande mlogit/mprobit pour logit/probit multinomial), ce dernier reste compliqué quand le nombre de modalités dépasse quatre (Logiciel Stata). La stratégie d’estimation est celle du maximum de vraisemblance simulé (simulateur GHK) ou bien les intégrales de Montecarlo. Elles permettent d’approximer numériquement le calcul des intégrales de grandes dimensions (cf. Börsh-Supan [1993] et Geweke, Keane, Runkle [1994]). Nous pouvons par ailleurs mobiliser les modèles de durée à risques concurrents (Brodaty et al. [2001] et Sianesi [2004]). Ceux-ci sont toutefois impossibles à utiliser dans notre cas à cause d’un problème de données touchant le fichier des individus de contrôle (variables de transition, Sect. 5.4).

Lorsque la variable de traitement est dichotomique, on estime la probabilité d’être traité ou non (score de propension). Dans notre cas, l’individu, sur le marché du travail, fait face à cinq stratégies différentes : participer à l’un des programmes suivants : SIFE (formation générale), CIE (contrat aidé dans le secteur marchand), resp. non marchand (CES) et CQ (formation en alternance), ou de continuer individuellement sa recherche d’emploi.

En recourant à un modèle logit ou probit multinomial, nous estimons simultanément l’ensemble des probabilités de participation (vecteur de dimension 5). En effet, les modèles polytomiques de choix discrets non ordonnés constituent a priori les modèles les plus adaptés pour notre configuration. Dans ces derniers, un des traitements doit être exclu (choix de référence) ; de même, pour les variables explicatives qualitatives ayant plus de deux modalités (c’est à dire retenir une modalité de réf.). Néanmoins, le choix entre le premier ou le deuxième modèle doit être discuté. Avant de proposer la solution adéquate, il importe de discuter la légitimité statistique de recourir à un logit multinomial. Dans ce modèle, outre le fait que nous supposons que le demandeur d’emploi doit faire un choix parmi un ensemble discret d’alternatives possibles, il est contraint par l’hypothèse des états non pertinents (IIA). Cette dernière est-elle valide dans notre cas ?

Les termes d’erreurs sont indépendamment et identiquement distribués selon la loi normale centrée réduite pour le modèle probit et la loi logistique pour le modèle logit.

6.2.1 Plausibilité de l’hypothèse des états non pertinents

Le logit multinomial, d’application aisée, est toutefois contraint par l’hypothèse IIA. En effet, nous supposons que la corrélation entre les termes d’erreur des fonctions d’utilité indirectes est nulle. En d’autres termes, le choix entre deux alternatives ne dépend que des attributs de celles-ci (indépen- damment des caractéristiques offertes par toute nouvelle alternative). En conséquence, ajouter une nouvelle alternative ou modifier les caractéristiques d’une déjà figurante parmi l’ensemble des choix proposés aux agents ne changera en rien le ratio des probabilités entre deux autres alternatives.

Afin d’éclaircir cette hypothèse, nous fournissons un exemple. Supposons que nos demandeurs d’emploi choisissent de participer à l’un des trois programmes suivants (et non à quatre afin de simpli- fier le calcul des probabilités relatives) : CIE avec P = 6/10, CES (P = 1/10) et le non traitement (P = 3/10). D’après l’IIA, la probabilité relative du CIE à la non participation doit rester la même quelque soit le scénario (6/3 = 2). Si l’on supprime par exemple le CES, cette nouvelle donne ne modifiera en rien le rapport entre la probabilité de participer au CIE et celle de la non participation. Les nouvelles probabilités seraient alors de 2/3 pour le CIE et de 1/3 pour le non traitement. Cependant, on ne voit pas pourquoi une partie des demandeurs d’emploi pour laquelle le CES procure une utilité maximale (par rapport à la non participation) aurait à choisir le non traitement parce qu’il n’existe maintenant que le CIE. En conséquence, le logit multinomial n’est pas spécialement ‘séduisant’ pour contraindre le comportement des individus.

Pour m modalités, S(( = *) =_∑(₍)

)

par exemple, si m= 3 nous avons S⁄ = SS ⁄ = SS ⁄ S

L’idée du test proposé par Hausman et McFadden [1984] repose sur le fait que si l’hypothèse IIA est valide, les paramètres des modèles logit multinomiaux estimés sur différents sous-ensembles de l’espace total des choix ne doivent pas être alors statistiquement différents.

Sous l’hypothèse nulle de cette propriété résultante, la statistique du test de Hausman et Mac Fadden suit la loi du χ2 dont le nombre de degrés de liberté est égal au rang de la matrice (− ) où

est la matrice variance covariance du modèle contraint et est celle du modèle de l’espace total des choix. En pratique, on choisit C (contrainte à opérer ou encore alternative à supprimer) en excluant de A un choix qui ressemble à un autre dans C. Dans notre cas, il s’agit de l’un des deux programmes suivants qui doit être écarté : CIE vs. CES et CES vs. SIFE (1997,1998 et 1999). Il faut répéter enfin le test sur les autres sous-ensembles possibles de A. Si l’on ne peut en effet rejeter l’hypothèse nulle sur une seule configuration, cela ne veut pas dire que la propriété IIA est valide. Si l’hypothèse nulle est en revanche rejetée une seule fois, il faut alors se tourner vers d’autres modèles des choix qualitatifs (Probit multinomial, etc.).

Tab. 6.1 : Test de la propriété d’indépendance des états non pertinents86

Choix supprimé y Nombre de degrés de liberté S > y Résultat CES -11.679 35 0.000 Rejet de Ho CIE 112,206 35 0.000 Rejet de Ho

Nous rejetons l’hypothèse nulle dès la première configuration. Nous poussons l’analyse en se concentrant sur nos programmes. Nous discutons intuitivement les caractéristiques de ces programmes. Notre objectif est montrer que d’un échantillon de traités à un autre, dans le modèle d’explication des choix d’entrée, les caractéristiques de ces traitements ne sont pas identiques. Il s’agit en effet de divers programmes distincts à évaluer. L’IIA est en conséquence difficilement acceptable. Le CES a été mis en place en 1989. Il s’agit d’un CDD de 3 à 12 mois reconductible jusqu’à concurrence de 3 ans. Sa durée, a été réduite en 1998 à 24 mois par la loi de lutte contre les exclusions (un seul renouvel- lement au maximum) : donc changement de ses attributs. Concernant le CIE, son public prioritaire a été fixé en août 1995. Il a été ensuite ouvert à un public plus large en mai 1996 (jeunes ayant moins de 26 ans, individus sans emploi non indemnisés, etc.). Toujours dans le cadre de la loi de lutte contre les exclusions, le public du CIE a été de nouveau recentré en 1998. En conséquence, durant la période d’observation (1997-1998-1999), ni les caractéristiques du CIE ni celles du CES n’ont pas été identiques. Les demandeurs d’emploi en 1997 avaient le choix plus spécifiquement entre un CIE et un CES reconductible 36 mois alors que ceux de 1998 et 1999 entre un CIE (recentré) et un CES reconductible 24 mois. En 1999, le CIE ne figure plus parmi l’éventail des alternatives proposées aux demandeurs d’emploi auxquels nous nous intéressons (traités) : suppression d’un choix et intro- duction d’une nouvelle alternative. Nous nous limitons à l’évaluation du CES et du SIFE. En se concentrant sur les types des contrats, nos CIE, CES et SIFE constituent par ailleurs des contrats aidés assez atypiques. Le CIE (1997) est un contrat long alors que celui de 1998 est un contrat court (Section 4.3.1 b). Au sein des CES, nous distinguons en outre les CES d’un an, les CES de deux ans et plus et les CES courts. Nos SIFE ont par ailleurs une durée de 3 à 6 mois alors que la majori- té des SIFE (1999) sont plus courts ou plus longs (de Palmas et Zamora [2004]).

6.2.2 La solution adéquate

Outre le Probit multinomial qui permet le dépassement de l’hypothèse IIA non valide dans notre cas, Lechner [2001a] propose une solution pratique qui consiste en une estimation de plusieurs modèles probit simples. En d’autres termes, transformer le probit polytomique non ordonné en une série de probit de base. Bryson, Dorsett et Purdon [2002] ont soulevé en revanche que cette dernière

Il existe un autre test de l’IIA, celui de Small-Hsiao [1985] qui a donné le même résultat de rejet de l’IIA. Le test a été réalisé après avoir spécifié le modèle (Section 6.12).

solution comporte un inconvénient. Le nombre de modèles devient rapidement plus élevé propor- tionnellement au nombre d’alternatives retenues. Dans notre cas, nous estimons 9 modèles. Pour / alternatives, nous construisons en effet 0,5r/(/ − 1)s probit simples. En 1997 nous nous intéressons aux CIE/CES/témoins, de même pour 1998 et en 1999 (CES/ SIFE/témoins) : (Tab. 6.2). Dans la Section 4.3.1a), nous avons par ailleurs écarté les bénéficiaires du CQ. Si ce programme avait été inclus, nous aurions à spécifier 12 modèles. En résumé, nous estimons 6 modèles, les trois derniers sont : CIE/CES (1997), CIE/CES (1998) et CES/SIFE (1999). Ceux-ci relèvent de la recherche de l’efficacité relative des traitements (Sect. 6.7).

Selon Lechner [2001a], lorsque la spécification retenue pour l’explication des comportements de participation aux différents traitements est identique aussi bien pour le probit multinomial que pour la série des modèles probit, ces deux derniers enregistrent une infime différence. Les programmes que nous évaluons ne différent que sensiblement en termes de critères d’éligibilité. Nous nous permettons en conséquence de retenir une spécification unique ; donc le recours a priori à un probit multinomial. On comprend bien alors que cette possibilité de différencier les modèles selon les types des traitements et par catégories de demandeurs d’emploi constitue bien l’avantage de la série des modèles probit. Dans le cadre multinomial, la spécification ne peut être que commune. L’omission d’une variable pertinente dans ce dernier se traduit plus pacifiquement par l’estimation d’un score de propension peu précis. Alors que cette oublie dans un des modèles de la série ne peut compromettre la performance de celle-ci.

En termes d’arbitrage, nous avons donc pour chacune des deux solutions un avantage et un inconvénient : coût (-) et flexibilité (+) pour la série des probit simples ; et moins coûteux (+) et omission d’une variable pertinente (-) et pour le probit multinomial ; néanmoins fournissant des résultats très proches lorsque la spécification est commune. Nous recourons aux deux méthodes surtout parce que la recherche de la meilleure spécification possible est basée sur les probit simples. Dans l’Annexe A et B, nous fournissons les résultats des estimations des probabilités de participation selon ces deux méthodes87.

Tab. 6.2 : Répartition des tailles des échantillons (par dates d’entrées et par type de traitement)

1997 1998 1999

CIE 1228 ₁₉₀ _-

CES 584 619 544

SIFE _- _- 1488

Témoins 2022 701 744

Source : Panel des bénéficiaires – DARES

Les estimations sont effectuées en indiquant l’option robust qui permet de corriger les t de student de l’hétéroscédasticité selon la méthode de White.

Dans le document Evaluation des politiques de l'emploi : analyse théorique et micro-économétrique (Page 180-184)