• Aucun résultat trouvé

Le modèle de choix multiples et la correction du biais de sélection dans les équations de salaires

Dans le document The DART-Europe E-theses Portal (Page 128-133)

Section 2 La méthodologie d’analyse des différentiels salariaux par type de propriété d’entreprise

2.2 Le modèle de choix multiples et la correction du biais de sélection dans les équations de salaires

Comme au niveau individuel, le choix du type d’entreprise et la rémunération espérée sont fortement liés. L’estimation d’équations de salaires pour différents types d’entreprises devrait prendre en compte des biais de sélection. Néanmoins en Chine, jusqu’en 1995, les travailleurs étaient encore affectés administrativement selon les plans de l’Etat, le choix de l’emploi ne pouvait pas être complètement considéré comme un choix individuel107. En même temps, dans notre base de données, nous ne disposons pas de variables satisfaisantes comme instruments exogènes pour identifier le choix du type d’entreprise. Nous choisissons d’effectuer d’abord un ensemble d’estimations avec la correction du biais de sélection en utilisant les variables disponibles. Ensuite nous réalisons un autre ensemble d’estimations sans la correction de biais de sélection.

Dans cette sous-section, nous allons dans un premier temps présenter le modèle Logit multinomial pour les choix multiples. Nous montrerons dans un deuxième temps les différentes méthodes de la correction du biais de sélection avec le modèle de choix Logit multinomial.

107 Avec les données d’une enquête des ménages en 1996, Zhao (2002) teste la sélection par une méthode à deux étapes de type Heckman (1979) et trouve que les estimations par MCO des équations de salaires ne sont pas sérieusement biaisées par la sélection du type d’entreprise.

2.2.1 Le modèle de choix Logit multinomial

Le modèle de choix non ordonné est basé sur une fonction de l’utilité stochastique comme suit :

is is

is V

U = + µ (4.9)

, où Vis est un composant déterministe qui dépend des attributs observables du choix et des caractéristiques observables des individus, µis représente les effets du comportement aléatoire des individus et les attributs et caractéristiques non observables.

La probabilité que l’individu i choisisse de travailler dans l’entreprise du type s peut s’écrire comme suit :

) (

ProbUis >Uikks

Dans un modèle Logit multinomial, nous modélisons

i s

is C

V = λ' (4.10)

, où le vecteur C contient les variables explicatives du choix, et λ's est un vecteur de coefficients. Sous l’hypothèse que les µis sont indépendants et identiquement distribués (I.I.D.), nous avons :

Utilisons

Y

is comme une variable qui indique le choix de l’individu i, nous obtenons : 4

Nous codifions les choix par 0, 1, 2, 3, et 4, qui représentent respectivement les SOEs au niveau central ou provincial, les SOEs au niveau local, les entreprises collectives urbaines, les entreprises privées et individuelles, et les entreprises à investissements étrangers.

Prenons les travailleurs dans les SOEs au niveau central ou provincial comme le groupe de référence. En faisant la normalisation (λ0 = 0 ), nous obtenons :

=

Notre modèle contient donc les équations de salaires dans chaque type d’entreprise et les équations du choix du type d’entreprise :

is

wis (le salaire d’un individu i dans l’entreprise s) est seulement observé quand s

Yis* = (l’individu i travaille dans l’entreprise s). Le modèle est identifié par l’exclusion de certaines variables dans le vecteur C du vecteur X. S’il y a des caractéristiques non observés des individus qui affectent à la fois leur choix du type d’entreprise et leur salaire, les termes d’erreur εis et µis seront corrélés et l’estimation des βs dans l’équation 4.15 par le moindre carré ordinaire (MCO) sera biaisée.

2.2.2 La correction du biais de sélection avec le modèle Logit multinomial

Heckman (1979) établit une méthode d’estimation à deux étapes pour corriger le biais de sélection dans le modèle du choix binaire. La généralisation du modèle de Heckman (1979) pour les choix multiples a été réalisée par Lee (1983) et Dubin et McFadden (1984)108. Le modèle de Lee (1983)

Nous présentons d’abord la méthode de Lee (1983) avec le modèle de sélection Logit multinomial.

108 Plus récemment, Dahl (2002) a proposé une méthode semi-paramétrique pour la correction du biais de sélection.

La catégorie s est choisie quandυs <0.

Nous pouvons faire la transformation suivante de sorte que les υs suivent la loi normale :

, où Φ1est une fonction cumulative de la loi normale standard inversée.

Ainsi, nous pouvons suivre le même principe de la méthode de Heckman (1979) pour obtenir l’espérance des termes d’erreurεs , sous condition que la catégorie s est choisie :

)

Ensuite nous estimons l’équation suivante par le MCO pour obtenir les βs non biaisés : Le modèle de Dubin et McFadden (1984)

Le modèle de Dubin et McFadden est basé sur une hypothèse de linéarité différente en termes de µj

plutôt que de υs :

∑ ∑

Avec le modèle Logit multinomial :

s , où Pj est la probabilité de l’alternative j calculée avec un modèle Logit multinomial.

Ensuite le modèle est estimé par le MCO selon :

s La comparaison des deux méthodes

La méthode de Lee (1983) est la plus couramment utilisée pour la correction du biais de sélection dans les modèles des choix multiples, à cause de sa simplicité de calcul. Mais cela est obtenu sous des hypothèses assez restrictives. Il est supposé que la corrélation (ρs) entre εs et Js est indépendante de toutes les autres alternatives Γ (independence of irrelevant alternatives, I.I.A.). Par conséquent, la corrélation entre εs et (µj −µs)

est du même signe pour tout j. Cela implique que les déterminants non observables du choix de l’alternative s contre tout autre alternative doivent être corrélés dans le même sens avec les déterminants non observables dews.

Différent du modèle de Lee (1983), Dubin et McFadden (1984) n’ont pas fait d’hypothèse sur la covariance entre εs et les termes d’erreur de l’équation de sélection. En revanche, ils ont imposé une forme spécifique de linéarité entre εs et les µj qui suivent la loi de Gumbel.

Par les tests de Monte-Carlo, Schmertmann (1994) et Bourguignon et al. (2007) ont comparé la robustesse des différentes méthodes et leurs limites. Ces deux études mettent en évidence les avantages de la méthode de Dubin et McFadden (1984) par rapport à celle de Lee (1983)109 pour la correction du biais de sélection dans le cas du modèle Logit Multinomial.

109 Et aussi par rapport à la méthode de Dahl (2002).

Nous choisissons donc la méthode de Dubin et McFadden (1984) pour la correction du biais de sélection.

En résumé, l’application pratique de la méthode de décomposition comporte les phases suivantes :

i) L’estimation des équations de salaire

ii) L’estimation des équations de nombre d’heures travaillées.

iii) La simulation des revenus contrefactuels

iv) La décomposition des différences de salaires entre les entreprises de différents types de propriété

Dans la première étape, dans un premier temps, nous réalisons les estimations en tenant compte du biais de sélection. Nous modélisons le choix du type d’entreprise à l’aide d’un modèle Logit multinomial et nous estimons des équations de salaires de type Mincer pour chaque type d’entreprises, en corrigeant les biais de sélection à l’aide de la méthode proposée par Dubin et McFadden (1984), lorsque cela est nécessaire. Dans un deuxième temps, nous effectuons les estimations des équations de salaires pour chaque type d’entreprises par le MCO, sans tenir compte du biais de sélection. Dans les troisième et quatrième étapes, nous présentons parallèlement les simulations et décompositions basées sur les estimations avec la correction du biais de sélection et celles basées sur les estimations sans la correction du biais de sélection. Nous simulons les revenus contrefactuels pour tous les travailleurs observés, chaque type d’entreprise et chaque modèle d’heures travaillées. Nous décomposons ensuite des revenus contrefactuels moyens selon les équations 4.6-8.

Dans le document The DART-Europe E-theses Portal (Page 128-133)