5.2 La méthodologie d’analyse de la relation IDE - investissement local
5.2.2 La méthode des moments généralisée (GMM)
Dans cette section, nous présentons les choix méthodologiques que nous avons faits ainsi que
les raisons de leur utilisation pour notre problématique. Comme approche empirique générale,
nous avons préférée les techniques d’estimation en panel, présentant de nombreux avantages
dans notre cas. Le panel combine la dimension temporelle et interindividuelle des données et
fournit plus de variabilité. Ainsi on a un nombre plus élevé de degrés de liberté et on réduit la
colinéarité entre les variables explicatives (Hsiao, 2003).
Dans le tableau 5.3, ci-après, nous observons la différence entre le contenu informationnel des
deux dimensions (à titre d'illustration, nous avons choisi quelques-unes des variables prises en
compte). Ainsi, quand nous passons d’une estimation en séries temporelles (within) à une
estimation en panel (total), on observe une augmentation de l’écart-type (par exemple, pour la
variable GFCF la plupart de l’information est donnée par la variation entre pays et non pas par
la variation temporelle, 17,72 contre 8,82). La différence est encore plus notable quand on
passe d'une estimation en coupe transversale (between) au panel.
21L’investissement greenfield se réfère à la création d’entreprise ex nihilo. Les fusions et acquisitions (M&A) consiste dans la prise de participation dans une entreprise qui existe déjà.
Tableau 5.3 La variance inter et intra individuelle des différentes variables
Variable GFCF GROWTH FDI PORTF LOANS INTEREST
Interindividuelle
(between) 17.72 0.61 6.05 1.25 1.30 15.05
Intra-individuelle
(within) 8.82 43.56 41.2 8.64 9.55 194.6
Total 25.70 44.89 46.8 9.80 10.63 208.5
Remarque : la variance interindividuelle (between) est la variance des moyennes individuelles et
montre comment la variable varie entre les différents individus. La variation intra-individuelle (within)
est la moyenne des variances individuelles et montre comment la variable varie dans le temps. La
variance totale comprend les deux dimensions. En raison d'ajustement des degrés de liberté et de la
structure non-cylindrée du panel, ce n'est pas la somme des deux.
Une fois sélectionnée la structure de panel, nous nous sommes intéressée à la méthode
d'estimation. La structure dynamique de l'équation (5.1), imposée par la présence de la
variable dépendante retardée GFCF
i,t-1,soulève des problèmes liés à l’application de la
méthode des MCO. L’introduction de la variable dépendante retardée est essentielle pour des
raisons théoriques, mais aussi parce qu'elle a l'avantage technique de contrôler le risque de
variables omises. En revanche, dans un modèle autorégressif, tant l'estimateur MCO que ceux
Within, Between ou MCO généralisé ne sont plus convergents (Wooldridge, 2005; Hsiao,
2003, Rodman, 2009a).
Le problème de non-convergence des estimateurs MCO est expliqué principalement par deux
phénomènes. Le premier souci est le bias de panel dynamique (Nickel, 1981). La variable
GFCF
i,t-1est corrélée avec les effets fixes individuels ν
i, donnant lieu à l'auto-corrélation des
résidus ε
it. Le deuxième problème apparait lorsque certaines variables explicatives sont
endogènes. Puisque la causalité peut aller dans les deux sens, les régresseurs peuvent être
corrélés avec les résidus et violer de nouveau les hypothèses MCO. Un exemple lié a notre
problématique est le fait que les IDE peuvent être attirés par des taux élevés de croissance,
tout en restant un déterminant de la croissance.
L’estimation efficace d’un panel dynamique est possible en utilisant l’estimateur GMM (la
méthode des moments généralisée), proposé par Arellano et Bond (1991), Arellano et Bover
(1995) et Blundell et Bond (1998). Ce type d'estimateur est devenu très populaire dans la
recherche empirique, car il permet de détendre la plupart des hypothèses MCO. La méthode
GMM corrige l’endogénéité des variables autorégressives et permet de déterminer des
paramètres efficaces, même en présence de variables explicatives endogènes. L'avantage
majeur par rapport aux techniques classiques des variables instrumentales est la génération en
interne des instruments. En pratique, les valeurs retardées des variables sont des instruments
pour expliquer leurs valeurs présentes.
Il convient de mentionner que cette méthode permet de corriger l’endogénéité au sens faible,
mais pas l’endogénéité forte. Elle suppose que certaines des variables explicatives sont
prédéterminées, c'est à dire qu'elles peuvent être affectées par les réalisations passées et
présentes de la variable dépendante, mais pas par les réalisations futures. Nous considérons
pertinent d’illustrer cette hypothèse, avec une application au cas des IDE. Si l'on considère les
flux d’IDE comme variable prédéterminée, alors nous supposons que les décisions des
investisseurs étrangers ne sont pas indépendantes de l'évolution macroéconomique passée et
présente des pays d'accueil. C’est hypothèse est d’ailleurs très plausible. Toutefois, Carkvic et
Levine (2005) affirme que cette hypothèse n'exclut pas les anticipations des investisseurs
étrangers quant à l’évolution future de la situation économique. Elle dit juste que les futurs
chocs non-anticipés n'affectent pas le niveau actuel des IDE.
Pour la suite, nous présentons le principe de construction de l’estimateur GMM. L'équation
qui caractérise un panel dynamique homogène avec des effets fixes individuels est indiquée
ci-dessous :
it it t i i ity X
y
0
,1
(5.2)
Où y
itest la variable dépendante (dans ce cas ca serait GFCF), X
itest un vecteur de variables
explicatives,
0est une constante,
iindique les effets fixes individuels et
itest le résidu. La
présence du terme autorégressif y
i,t1est justifiée par des phénomènes d'ajustement, la prise
en compte des anticipations et l'hystérèse au niveau des variables macroéconomiques. Cette
équation ne peut être estimée par les MCO en raison des arguments déjà évoqués. Arellano et
Bond (1991) proposent tout d’abord d'éliminer les effets fixes individuels par différenciation.
Il en résulte :
(5.3)
Ou, de manière plus simplifié : y
ity
i,t1X
it
itLa différenciation permet d'éliminer les effets fixes individuels, mais elle n'élimine pas pour
autant le problème de corrélation entre le nouveau terme résiduel (
it
i,t1) et la variable
)
(
)
(
)
(
, 1 , 2 , 1 , 1 1 ,
it it it it it it it ity y y X X
y
dépendante retardée (y
i,t1y
i,t2). A cet égard, Arellano et Bond (1991) proposent
d’instrumenter les différences (de la variable dépendante retardée, ainsi que des variables
explicatives) avec les valeurs passées des mêmes variables. Cet astuce annule en effet la
corrélation des explicatives avec le résidu courant, mais garde la corrélation avec le résidu
passé.
Les conditions proposées par Arellano et Bond (1991) pour identifier les coefficients sont
appelés des conditions de moments (d'où le nom de la méthode des moments généralisée) et
sont présentées sous la forme suivante :
pour și t = 3,4…T (5.4)
pour și t = 3,4…T (5.5)
Les estimateurs proposés par Arellano et Bond (1991) pour et sont efficaces à condition
que le résidu
itsoit i.i.d. et les variables explicatives X
itne soient pas corrélées aux
réalisations futures de
it. Il existe une deuxième version de l'estimateur, proposé
ultérieurement par Arellano et Bover (1995), en utilisant une autre méthode pour éliminer les
effets fixes. Au lieu de considérer les différences premières, ils transforment l'équation en
déviations orthogonales
22. Basée sur l'hypothèse d’endogénéité faible, cette transformation
permet d'éliminer plus rapidement la corrélation des variables explicatives avec les résidus.
De plus, cet estimateur présente de meilleures propriétés sur de petits échantillons et modélise
mieux les séries persistantes (Arellano et Bover, 1995).
L’efficacité de l’estimateur GMM repose sur la validation de deux hypothèses, l’exogénéité
des instruments et la non-corrélation des résidus. La validité des instruments est vérifiée à
l’aide des tests Hansen / Sargan et l'auto-corrélation des résidus est testée un test proposé par
Arellano et Bond. Il convient de noter que la construction de l'équation en différences
introduit une auto-corrélation de premier ordre. La vérification de l’auto-corrélation des
résidus se fait donc à partir du deuxième ordre. Les tests de Sargan / Hansen sont connus pour
leur manque de fiabilité lorsqu’un grand nombre d'instruments est utilisé
23. Pour éviter cet
22
Cette transformation est une forme de différenciation. Les différences sont construites entre la valeur actuelle de la variable et la moyenne de ses réalisations futures (Arellano et Bover, 1995).
23 Lorsqu’on construit un ensemble d'instruments pour chaque période et pour chaque variable (en remplaçant les observations manquantes avec zéro), le nombre d'instruments augmente de façon exponentielle.
0
)]
(
[y
i,ts it
i,t1
E s2
0
)]
(
[X
i,ts it
i,t1
E s2
inconvénient, nous limitons le nombre d'instruments par condensation de la matrice à une
seule colonne, tel que suggéré par Rodman (2009a
24).
Bien que ces estimateurs soient fondés sur la quasi-stationnarité des variables, en pratique,
cette hypothèse tend à être ignorée. Premièrement, la méthode GMM est conçue pour des
séries temporelles relativement courtes (d’ailleurs c’est la raison principale pour utiliser un
panel). Ainsi, la stationnarité des séries peut être difficilement évaluée
25. Deuxièmement, le
GMM consiste à transformer l'équation initiale en différences, d’où la disparition
d’éventuelles tendances de non-stationnarité des variables en niveau. Ajoutons à ces deux
arguments une troisième remarque : la plupart des variables que nous utilisons devrait
théoriquement être stationnaires. Le taux d'investissement (GFCF/PIB), par exemple, peut
enregistrer des variations de court terme, mais il est limité dans son évolution de long terme
(étant une part du revenu, il ne peut pas enregistrer une tendance permanente à la hausse ou à
la baisse).
En vertu des arguments présentés, la pertinence des tests de racine unitaire dans le cadre de
notre problématique est relativement limitée. En prenant en compte la dimension temporelle
maximale de nos séries est de 21 ans (1990- 2010), nous sommes toute de même rigoureux
dans l’approche empirique, en vérifiant la stationnarité des séries avant de procéder à
l'estimation empirique. A cet effet, nous utilisons plusieurs tests de racine unitaire développés
en panel. Les tests utilisés sont ceux de Levin, Lin Chu (2002) - LLC, Im, Pesaran et Shin
(2003) - IPS et Choi (2001) - de type Fisher. La description de ces tests et les résultats obtenus
sont présentés de manière détaillée en annexe. Ils seront brièvement rappelés dans la section
des résultats. Celle-ci comprendra aussi d'autres considérations méthodologiques liées aux
24
Le problème des instruments nombreux est clairement reconnu dans la littérature empirique. Pourtant, il n’y a pas d’indication précise sur ce qui est « trop d’instruments ». Rodman (2009a) suggère de garder le nombre d'instruments inférieur au nombre de pays. Le même auteur, Rodman (2009b), reconnaît quand même qu'il s'agit d'une indication pratique, sans justification théorique précise. Par conséquent, nous essayons de garder au minimum le nombre d'instruments, considérant qu’un maximum de 15 instruments est raisonnable. À cet égard, nous utilisons l’option collapse correspondante au programme xtabond2 écrit par Rodman (2009a).
25Selon la théorie des séries temporelles, les tests de racine unitaire sont basés sur les propriétés asymptotiques du processus générateur lorsque la dimension temporelle tend vers l'infini. Or les séries habituellement disponibles dans les recherches macro-économiques sont relativement courtes. Ainsi, on risque de capter uniquement une partie du cycle économique, ce qui est insuffisant pour étudier les propriétés de long terme de la série. Par exemple, de nombreuses séries macro-économiques relatives aux PECO ne sont disponibles qu’à partir de 1995. Or cette période représente la phase d'ascension économique. Ignorer la phase de récession correspondant à la première période de transition peut déterminer l’acceptation à tort de l’hypothèse de non-stationnarité.