• Aucun résultat trouvé

Appariement par score de propension avec traitement multiple

Chapitre 2 Impact des droits de propriété foncière sur l’adoption des innovations agro-environnementales chez

2.2. Cadre conceptuel et économétrique

2.2.2. Appariement par score de propension avec traitement multiple

Notre étude consiste à évaluer l'impact des traitements multiples (4 traitements) sur l’adoption d’innovations agro-environnementales : (i) le prêt ou don ; (ii) la location ; (iii) le métayage et (iv) la pleine propriété foncière. Notre objectif est d’isoler les différences initiales entre les caractéristiques des producteurs et de leurs parcelles de l’effet réel de chaque traitement sur la décision d’adoption. La littérature économique a prouvé l’efficacité de la méthode d’appariement par score de propension pour contrôler le biais de sélection sur les caractéristiques observables. La méthode est généralement utilisée dans le cas des traitements binaires où les individus du groupe de traitement sont comparés à ceux du groupe de contrôle qui ont en moyenne les mêmes scores de propension. Dans le cas du traitement binaire, l’effet moyen de traitement sur les traités est formalisé comme suit :

(5)

( )xE Y( TYC |D1,Xx)E Y( T |D1,Xx)E Y( C|D 1,Xx)

50

Où YT et YC représentent respectivement le résultat potentiel des individus du groupe

traitement (D=1) et ceux du groupe de contrôle (D=0) et X l’ensemble des variables

observables. Puisque le résultat moyen du contrefactuel E Y( C |D1,Xx) est

inobservable, 𝜃(𝑥) ne peut être estimé par la méthode d’appariement que si conditionnel aux caractéristiques observables, les résultats potentiels des individus non traités sont indépendants du traitement (hypothèse d’indépendance conditionnelle). De façon formelle, l’hypothèse d’indépendance conditionnelle (CIA) peut être écrite comme suit :

(6)

Y

C

D X|

x

 x

Où Ц représente l’indépendance. Rubin (1977) et Rosembaum et Rubin (1983) montrent que sous l’hypothèse CIA, il n’est pas nécessaire d’apparier sur les caractéristiques observables, mais seulement sur la probabilité d’être traité conditionnelle aux caractéristiques observables (le score de propension). Ce qui permet de réduire la dimension de l’estimation à un.

Dans le cas d’un traitement multiple de (M+1) traitements mutuellement exclusif, les résultats potentiels sont représentés par {𝑌0, 𝑌1, … , 𝑌𝑀}. Pour chaque individu, nous ne pouvons observer que l’un des résultats potentiels de l’ensemble {𝑌0, 𝑌1, … , 𝑌𝑀}. Ce qui signifie que pour M=0, nous observons Y0 et les autres M résultats sont des contrefactuels. L’effet moyen

du traitement m relativement au traitement l pour les participants au traitement m est

formalisé comme suit :

(7) ,

( )

(

|

,

)

(

|

,

)

(

|

,

)

m l m l m l

x

E Y

Y

D

m X

x

E Y

D

m X

x

E Y

D

m X

x

Où 𝐷 ∈ {0,1 … . , 𝑀} représente le type de traitement. L'équation (7) ci-dessus représente l'effet attendu pour un individu tiré au hasard parmi la population des participants au traitement m. L'équation (7) montre que le problème de l’évaluation est également un

problème de données manquantes dans le cas d’un traitement multiple puisque le résultat

potentiel 𝐸(𝑌𝑙|𝐷 = 𝑚, 𝑋 = 𝑥) n’est pas observable pour un même individu (Contrefactuel).

Soit l’individu est dans le traitement m ou il est dans le traitement l. Comme dans le cas des

traitements binaires, l’hypothèse CIA permet d’utiliser les résultats des participants au traitement l (𝑌𝑙) pour inférer les résultats du contrefactuel, permettant ainsi d’estimer 𝜃𝑚𝑙(𝑥).

51

Selon Imbens (2000) et Lechner (2001, 2002), l’hypothèse CIA implique que tous les résultats potentiels sont indépendants du traitement étant donné les caractéristiques observables. Autrement dit :

(8)

Y Y

0

,

1

,...,Y

M

D X|

x

 x

Imbens (2000) et Lechner (2001, 2002) montrent que les propriétés du score de propension du traitement binaire sont aussi valides pour les traitements multiples. L’hypothèse CIA pour estimer 𝜃𝑚,𝑙(𝑥) devient :

(9)

Y

l

D p|

l ml|

( ),x D m l,

 x

Lechner (2001) montre que l’effet moyen du traitement m relativement au traitement l pour

les participants au traitement m définit dans l’équation (7), peut être estimé par :

(10) |

, | ( )

(

|

)

l ml

|

( ),

|

m l m l l ml p x

E Y

D

m

E

E Y

p

x D

l

D

m

et (11)

p

l ml|

( )x

p

l ml|

(Dl D|

 m l,

,X

x)

p x

l

( ) /p x

l

( )

p

m

( )x

Comme dans le cas des traitements binaires, l’équation 10 peut être estimée par l’appariement sur les scores de propension balancés 𝑝𝑙|𝑚𝑙(𝑥).

En termes d’application empirique de cette théorie sur les effets de traitement multiple, deux approches émergent dans la littérature. Une première approche est celle de Imbens (2000) et Lechner (2001, 2002) où le score de propension est estimé par un modèle logit ou probit multinomial. Lechner (2001, 2002) a développé un protocole similaire au cas de traitement binaire pour vérifier que les scores de propension balancent entre les groupes de traitement. Une deuxième approche est d’utiliser une série de modèles binomiaux pour estimer les scores de propension. Selon Lechner (2002), cette approche nécessite l’estimation de M (M-1) /2 modèles de score de propension. Dans notre cas, cela implique d’estimer 6 modèles de score de propension (M=4). L’avantage des modèles binomiaux est que leurs hypothèses sont moins restrictives que le logit multinomial. En effet le logit multinomial repose sur l'hypothèse de l'indépendance des alternatives non pertinentes (Independence of Irrelevant alternatives-IIA). Cette hypothèse indique dans le cas de notre étude que la probabilité de choisir un mode d’accès à

52

la terre ne dépend pas de la présence ou de l'absence de mode d’accès alternatifs supplémentaires, c’est-à-dire autres que les trois modes d’accès que nous avons considérées. De plus, selon Lechner (2002), les modèles binomiaux sont moins sensibles aux spécifications que le modèle multinomial. L’auteur a également montré de façon empirique que les modèles binomiaux produisent des résultats similaires au modèle multinomial. Toutefois, cette seule étude empirique n’est pas suffisante pour généraliser le résultat. Pour plus de flexibilité, nous avons opté pour les modèles binomiaux.

Notre approche a suivi trois principales étapes. En premier lieu, nous avons estimé les scores de propension avec un modèle logit binomial pour chaque paire de modes d’accès à la terre. Les scores de propension sont simplement la probabilité que le ménage ait accès à la terre par le mode d’accès choisie comme traitement dans la paire du mode d’accès à la terre considérée, 𝑃(𝐷 = 1|𝑋, 𝑊). Les scores de propension sont obtenus en régressant le vecteur des caractéristiques socio-économiques du ménage, X et les caractéristiques de la parcelle W, sur P le mode d’accès à la terre.

(12) |, , , ,

l ml

w h w h w h w h

p

X

W



Pour s’assurer que l’hypothèse CIA est vérifiée, nous avons incluse dans les équations d’estimation des scores de propension les variables qui sont susceptibles d’influencer à la fois l’adoption d’innovations agroenvironnementales et le choix du mode d’accès à la terre. Ces variables ont été identifiées à partir de la littérature récente sur les droits fonciers et l’adoption d’innovations agro-environnementales. Avec chaque modèle, pour s’assurer que le groupe traitement et contrôle sont comparables sur la base des covariables, nous avons fait des tests d’équilibre (balancing test) avant et après l’appariement. Les tests d’équilibre avant appariement consistent à diviser les scores de propension en groupe de décile (block) et à vérifier dans chaque groupe avec des tests t de student s’il existe de différence significative entre traitement et contrôle au seuil de 0.10 pour cent pour chaque covariable. Le test d’équilibre est satisfait lorsqu’aucune différence significative n’est observée. Lorsque le test d’équilibre n’est pas satisfait, nous changeons la spécification modèle en supprimant les variables qui ne satisfont pas le test d’équilibre ou en ajoutant des variables d’interaction jusqu’à ce que la condition d’équilibre soit satisfaite (Rosembaum et Rubin, 1984). Cette procédure nous a aidés à trouver les meilleures spécifications des modèles pour estimer les scores de propension, mais a conduit

53

à des spécifications différentes d’un modèle à un autre. Les distributions des scores de propension des six modèles binomiaux sont présentées en annexe 2.1.

Les scores de propension estimés sont utilisés pour faire l’appariement. Mais avant l’appariement, nous devons nous assurer que l’hypothèse de support commun est vérifiée. Ainsi dans une seconde étape, nous avons supprimé les observations dont le score de propension est en dehors du support commun. Ceci implique que les observations qui sont en dehors du support commun dans au moins une des paires du mode d’accès à la terre ont été supprimées.

La troisième et dernière étape est l’appariement pour chaque paire de modes d’accès à la terre. En suivant Bravo-Ureta et al. (2012), avec chaque paire de mode d’accès à la terre, nous avons apparié les individus traités aux individus témoin 1 à 1 par la méthode du "voisin le plus proche

sans remplacement". Nous avons utilisé la commande PSMATCH2 dans stata pour faire

l’appariement. Nous avons utilisé les options «nonreplacement », « common » et « caliper (0.01). L’option «nonreplacement » signifie qu’une observation du groupe témoin ne peut être utilisée qu’une seule fois pour l’appariement. L’option « common » signifie qu’avant l’appariement, nous supprimons toutes les observations du groupe traitement dont les scores de propension sont à l’extérieur de l’intervalle des scores de propension du groupe témoin. L’option « caliper (0.01) signifie que pour cherchons à apparier une observation de traitement avec une observation témoin dans un rayon de 0.01.

Pour tester la qualité de notre appariement, nous avons considéré deux facteurs. Premièrement, en suivant Leuven et Sianesi (2003) et Bravo-Ureta et al. (2012), nous avons fait des tests t de moyenne entre le groupe traité et le groupe témoin dans chaque paire de modes d’accès à la terre pour tester l’hypothèse nulle d’égalité de moyenne. Les résultats présentés en annexe 2.2 montrent que la moyenne de la plupart des covariables ne sont pas statistiquement différente suggérant que la propriété d’équilibre sur les covariables est satisfaite (Leuven et Sianesi, 2003 ; Bravo-Ureta et al., 2012). En deuxième lieu, nous avons utilisé le biais médian normalisé et le pseudo-R² en suivant Calia et al. (2016). Comme le montre le Tableau 2.1, pour toutes les paires de modes d’accès à la terre, le biais médian normalisé et le pseudo-R² sont plus petit après l’appariement qu’avant l’appariement. De plus, après l’appariement, le pseudo-R² est toujours proche de zéro, ce qui suggère que les covariables

54

n’ont aucun pouvoir de prédiction de la décision du choix par le producteur du mode d’accès à la terre avec les données appariées (Calia et al., 2016). Ceci confirme que l’appariement a efficacement éliminé les différences de caractéristiques observables (caractéristiques socio- économiques et caractéristiques de parcelle) entre les producteurs détenant les différents droits de propriété.

Tableau 2.1. Mesure de la qualité de l’appariement (Voisin le plus proche sans remplacement)

Comparaison Traité Contrôle Observation hors du support commun

Pseudo-R² Biais médian

Avant Après Avant Après Prêt versus Location 449 1028 58 0.201 0.093 13.5 5.0 Prêt versus métayage 70 1028 212 0.117 0.011 14.4 2.2 Prêt versus propriétaire 1028 2721 10 0.072 0.012 8.6 2.6 Location versus métayage 70 449 44 0.197 0.092 18.5 8.8 Location versus propriétaire 449 2721 323 0.262 0.009 17.1 2.3 Métayage versus propriétaire 70 2721 1036 0.120 0.072 11.1 9.1

2.3. Variables, source des données et statistiques descriptives