• Aucun résultat trouvé

2.5 L’approche empirique

2.5.1 Sp´ecification ´econom´etrique et estimation

Une caract´eristique saillante des d´epenses de sant´e est que l’on observe une quan- tit´e non n´egligeable de z´eros : beaucoup d’individus n’ont aucune d´epense de sant´e durant la p´eriode d’observation. L’analyse descriptive a montr´e la forte proportion d’individus n’ayant aucune d´epense d’hˆopital. Pour ce qui est des consultations et des d´epenses de pharmacie, la proportion d’individus n’ayant aucune d´epense, bien que beaucoup plus faible, est non n´egligeable. Une telle configuration n´ecessite des techniques d’estimation particuli`eres. Un grand nombre d’articles sont consacr´es au choix entre le sample-selection model ou Heckit (Heckman 1979) et le two-part model (Dow et Norton 2002, Leung et Yu 1996, Manning, Duan, et Rogers 1987)11. Leung et Yu (1996) ont montr´e que les per-

formances du sample-selection model d´ependent de fa¸con cruciale du degr´e de colin´earit´e entre l’inverse du ratio de Mill et les variables explicatives de seconde ´etape. Lorsqu’il n’y

11

2.5 L’approche empirique 65

a pas de colin´earit´e, un test de Student du coefficient de l’inverse du ratio de Mill peut ˆetre utilis´e pour choisir entre les deux sp´ecifications. En revanche, si des probl`emes de coli- n´earit´e surviennent, le two-part model est plus fiable car ses performances sont meilleures que le sample-selection model en terme d’erreur quadratique moyenne.

Nos donn´ees sont caract´eris´ees par une forte corr´elation entre l’inverse du ratio de Mill et les variables explicatives de seconde ´etape : le coefficient de corr´elation est situ´e entre 0,85 et 0,87, selon le type de d´epense de sant´e concern´e. Nous avons donc choisi le two- part model, qui pr´esente un autre avantage : il permet l’utilisation d’un GLM (generalized linear model) pour estimer le niveau de d´epense conditionnel `a la participation. Les GLM permettent de prendre en compte assez facilement certaines caract´eristiques des d´epenses de sant´e, comme la dissym´etrie (skewness) de la variable d´epense non transform´ee, les distributions `a queue ´epaisse, et les r´esidus h´et´erosc´edastiques. En effet, l’approche par GLM permet (i) d’´eviter les difficult´es li´ees `a la retransformation des variables exprim´ees en log (voir chapitre 1) (ii) de prendre en compte les distributions `a queues ´epaisses et les erreurs h´et´erosc´edastiques, en prenant comme lois de la variable expliqu´ee des distributions de type Poisson ou Gamma (Manning et Mullahy 2001).

Soit l’individu i appartenant au groupe d’ˆage j. Soit Pij la variable dichotomique

codant la participation et Cij la consommation de soins. Consid´erons le mod`ele en deux

´equations : Pij = IP∗ ij>0 avec P ∗ ij = Wij′ c + Mij′ b + aj + uij = X1,ij′ d + uij , (2.1) o`u uij ∼ N(0, σ2).      Cij = I(Pij=1). h C∗ ij i avec E( C∗ ij ¯ ¯ ¯ X′

2,ij) = exp(Zij′ γ + Mij′ β + αj) = exp(X2,ij′ δ)

Nous avons d´ecid´e d’utiliser pour (2.2) un lien log : E( C∗ ij

¯ ¯ ¯ X′

2,ij) est d´efini comme

une fonction exponentielle de X′

2,ijδ. En effet, les observations strictement positives des

d´epenses de sant´e sont fortement dissym´etriques (la skewness varie entre 4,50 et 15,47, selon l’ann´ee et le type de d´epense consid´er´es). Prendre le log des d´epenses r´eduit la skewness `a des valeurs situ´ees entre -0,26 et 0,01. De plus, nous avons utilis´e pour C∗

ij une

distribution Gamma. Ce choix est fond´e sur les r´esultats de tests de Park que nous avons men´es, en suivant l’approche sugg´er´ee par Manning et Mullahy (2001) (voir chapitre 1).

L’´equation (2.1) d´ecrit la d´ecision de faire appel au syst`eme de soins et l’´equation (2.2) d´ecrit le niveau de consommation. X′

1,ij et X2,ij′ sont les variables explicatives des

´equations respectivement de participation et de consommation conditionnelle. Ces r´egres- seurs incluent des indicatrices d’ˆage aj et αj relatives aux groupes d’ˆage, et des indicateurs

de morbidit´e M′

ij. De plus, les ´equations (2.1) et (2.2) comprennent des variables explica-

tives relatives aux caract´eristiques socio-´economiques de l’individu (respectivement W′ ij et

Z′

ij). La liste des indicateurs de morbidit´e potentiellement utilis´es dans les estimations com-

prend l’invalidit´e, le risque vital, le nombre de maladies, la note auto-attribu´ee sur l’´etat de sant´e, et des indicatrices codant pour la pr´esence des pathologies suivantes : diab`ete, broncho-pneumopathies chroniques obstructives et emphys`eme, cardiopathies isch´emiques, hypertension art´erielle, maladies des art`eres, troubles du m´etabolisme des lipides, d´epres- sion, troubles du sommeil, cataracte, et arthrites, arthropathies et dorsopathies. La liste des indicateurs socio-´economiques potentiellement utilis´es comprend le niveau de revenu, la cat´egorie socio-professionnelle, le niveau d’´etudes, la pr´esence d’une couverture compl´e- mentaire, le sexe, la taille du m´enage, et le statut matrimonial. La liste effective d´epend de l’´equation consid´er´ee ((2.1) ou (2.2)) et du type de d´epense ´etudi´e (d´epenses de consul- tations, de pharmacie, ou d’hˆopital) : les variables pertinentes sont s´electionn´ees grˆace `a un processus d´etaill´e dans l’annexe B.2.

Les maladies chroniques sont vraisemblablement exog`enes. En revanche, les indi- cateurs synth´etiques d’´etat de sant´e comme le degr´e d’invalidit´e, le degr´e de risque vital ou le nombre de maladies peuvent ˆetre non-exog`enes. De plus, la possession d’une couverture

2.5 L’approche empirique 67

compl´ementaire peut ´egalement ˆetre non exog`ene, car elle peut r´esulter (du moins en par- tie) d’une d´ecision individuelle. Nous avons choisi de conserver uniquement les r´egresseurs exog`enes, afin de ne pas ajouter de difficult´e m´ethodologique `a une approche relativement complexe.

Grˆace `a la richesse de nos donn´ees, nous avons pu effectuer des tests d’Hausman pour les d´epenses de consultations, de pharmacie et d’hˆopital. Ceci n’a ´et´e possible que sur l’´echantillon de l’ann´ee 2000. Nous ne disposions pas d’un nombre suffisant d’instruments pour l’´echantillon de 1992, o`u l’enquˆete n’´etait pas aussi riche qu’en 2000. N´eanmoins, il apparaˆıt l´egitime de supposer que l’exog´en´eit´e v´erifi´ee sur l’´echantillon de 2000 le serait ´egalement sur l’´echantillon de 1992. Soulignons que dans les estimations, l’´elimination des variables non exog`enes n’introduit pas de biais de variable omise : les tests d’exog´en´eit´e sont r´ealis´es de telle sorte que l’exog´en´eit´e des variables retenues est v´erifi´ee.

Nous avons utilis´e des variables instrumentales pour construire un test d’Haus- man, en suivant l’approche de Rivers et Vuong (1988) pour l’´equation de participation, et un mod`ele log-lin´eaire pour l’´equation de consommation conditionnelle. Nous avons utilis´e un test de Sargan pour v´erifier la validit´e des instruments utilis´es. De plus, nous avons v´erifi´e que cette proc´edure n’´etait pas remise en cause par un probl`eme d’instru- ments faibles (Staiger et Stock 1997). Pour cela, nous avons test´e la significativit´e globale des instruments dans un syst`eme d’´equation (SU RE12) comprenant autant d’´equations

que de variables instrument´ees, o`u chaque variable instrument´ee est expliqu´ee par les ins- truments et les r´egresseurs exog`enes. La liste d´etaill´ee des instruments et les r´esultats des tests sont fournis en annexe B.2. Les r´esultats montrent que la corr´elation partielle entre les instruments et les indicateurs de morbidit´e est hautement significative, avec des statistiques ´elev´ees et des degr´es de significativit´e inf´erieurs `a 10−3. Des tests de Sargan

ont valid´e l’exog´en´eit´e des instruments. La couverture par une compl´ementaire apparaˆıt exog`ene pour les consultations et la d´epense pharmaceutique (elle ne constitue pas un r´e- gresseur significatif pour l’hˆopital). L’exog´en´eit´e est rejet´ee pour le degr´e d’invalidit´e dans

12

le cadre des d´epenses de consultation. Elle est ´egalement rejet´ee pour le risque vital dans le cadre des d´epenses pharmaceutiques.