La méthode des moments généralisée (GMM)

5.2 La méthodologie d’analyse de la relation IDE - investissement local

5.2.2 La méthode des moments généralisée (GMM)

Dans cette section, nous présentons les choix méthodologiques que nous avons faits ainsi que

les raisons de leur utilisation pour notre problématique. Comme approche empirique générale,

nous avons préférée les techniques d’estimation en panel, présentant de nombreux avantages

dans notre cas. Le panel combine la dimension temporelle et interindividuelle des données et

fournit plus de variabilité. Ainsi on a un nombre plus élevé de degrés de liberté et on réduit la

colinéarité entre les variables explicatives (Hsiao, 2003).

Dans le tableau 5.3, ci-après, nous observons la différence entre le contenu informationnel des

deux dimensions (à titre d'illustration, nous avons choisi quelques-unes des variables prises en

compte). Ainsi, quand nous passons d’une estimation en séries temporelles (within) à une

estimation en panel (total), on observe une augmentation de l’écart-type (par exemple, pour la

variable GFCF la plupart de l’information est donnée par la variation entre pays et non pas par

la variation temporelle, 17,72 contre 8,82). La différence est encore plus notable quand on

passe d'une estimation en coupe transversale (between) au panel.

21L’investissement greenfield se réfère à la création d’entreprise ex nihilo. Les fusions et acquisitions (M&A) consiste dans la prise de participation dans une entreprise qui existe déjà.

Tableau 5.3 La variance inter et intra individuelle des différentes variables

Variable GFCF GROWTH FDI PORTF LOANS INTEREST

Interindividuelle

(between) ^17.72 ^0.61 ^6.05 ^1.25 ^1.30 ^15.05

Intra-individuelle

(within) ^8.82 ^43.56 ^41.2 ^8.64 ^9.55 ^194.6

Total _25.70 _44.89 _46.8 _9.80 _10.63 _208.5

Remarque : la variance interindividuelle (between) est la variance des moyennes individuelles et

montre comment la variable varie entre les différents individus. La variation intra-individuelle (within)

est la moyenne des variances individuelles et montre comment la variable varie dans le temps. La

variance totale comprend les deux dimensions. En raison d'ajustement des degrés de liberté et de la

structure non-cylindrée du panel, ce n'est pas la somme des deux.

Une fois sélectionnée la structure de panel, nous nous sommes intéressée à la méthode

d'estimation. La structure dynamique de l'équation (5.1), imposée par la présence de la

variable dépendante retardée GFCF

i,t-1,

soulève des problèmes liés à l’application de la

méthode des MCO. L’introduction de la variable dépendante retardée est essentielle pour des

raisons théoriques, mais aussi parce qu'elle a l'avantage technique de contrôler le risque de

variables omises. En revanche, dans un modèle autorégressif, tant l'estimateur MCO que ceux

Within, Between ou MCO généralisé ne sont plus convergents (Wooldridge, 2005; Hsiao,

2003, Rodman, 2009a).

Le problème de non-convergence des estimateurs MCO est expliqué principalement par deux

phénomènes. Le premier souci est le bias de panel dynamique (Nickel, 1981). La variable

GFCF

_i,t-1

est corrélée avec les effets fixes individuels ν

, donnant lieu à l'auto-corrélation des

résidus ε

. Le deuxième problème apparait lorsque certaines variables explicatives sont

endogènes. Puisque la causalité peut aller dans les deux sens, les régresseurs peuvent être

corrélés avec les résidus et violer de nouveau les hypothèses MCO. Un exemple lié a notre

problématique est le fait que les IDE peuvent être attirés par des taux élevés de croissance,

tout en restant un déterminant de la croissance.

L’estimation efficace d’un panel dynamique est possible en utilisant l’estimateur GMM (la

méthode des moments généralisée), proposé par Arellano et Bond (1991), Arellano et Bover

(1995) et Blundell et Bond (1998). Ce type d'estimateur est devenu très populaire dans la

recherche empirique, car il permet de détendre la plupart des hypothèses MCO. La méthode

GMM corrige l’endogénéité des variables autorégressives et permet de déterminer des

paramètres efficaces, même en présence de variables explicatives endogènes. L'avantage

majeur par rapport aux techniques classiques des variables instrumentales est la génération en

interne des instruments. En pratique, les valeurs retardées des variables sont des instruments

pour expliquer leurs valeurs présentes.

Il convient de mentionner que cette méthode permet de corriger l’endogénéité au sens faible,

mais pas l’endogénéité forte. Elle suppose que certaines des variables explicatives sont

prédéterminées, c'est à dire qu'elles peuvent être affectées par les réalisations passées et

présentes de la variable dépendante, mais pas par les réalisations futures. Nous considérons

pertinent d’illustrer cette hypothèse, avec une application au cas des IDE. Si l'on considère les

flux d’IDE comme variable prédéterminée, alors nous supposons que les décisions des

investisseurs étrangers ne sont pas indépendantes de l'évolution macroéconomique passée et

présente des pays d'accueil. C’est hypothèse est d’ailleurs très plausible. Toutefois, Carkvic et

Levine (2005) affirme que cette hypothèse n'exclut pas les anticipations des investisseurs

étrangers quant à l’évolution future de la situation économique. Elle dit juste que les futurs

chocs non-anticipés n'affectent pas le niveau actuel des IDE.

Pour la suite, nous présentons le principe de construction de l’estimateur GMM. L'équation

qui caractérise un panel dynamique homogène avec des effets fixes individuels est indiquée

ci-dessous :

it it t i i it

y X

y 

₀

 

_,_₁

 

(5.2)

Où y

est la variable dépendante (dans ce cas ca serait GFCF), X

est un vecteur de variables

explicatives, 

₀

est une constante, 

indique les effets fixes individuels et 

_it

est le résidu. La

présence du terme autorégressif y

_i_,_t_₁

est justifiée par des phénomènes d'ajustement, la prise

en compte des anticipations et l'hystérèse au niveau des variables macroéconomiques. Cette

équation ne peut être estimée par les MCO en raison des arguments déjà évoqués. Arellano et

Bond (1991) proposent tout d’abord d'éliminer les effets fixes individuels par différenciation.

Il en résulte :

(5.3)

Ou, de manière plus simplifié : y

_it

y

_i_,_t_₁

X

_it



_it

La différenciation permet d'éliminer les effets fixes individuels, mais elle n'élimine pas pour

autant le problème de corrélation entre le nouveau terme résiduel (

_it



_i_,_t_₁

) et la variable

)

(

)

(

)

(

_, ₁ _, ₂ _, ₁ _, ₁ 1 ,





 



 



_i_t _i_t _i_t _it _i_t _it _i_t it

y y y X X

y    

dépendante retardée (y

_i_,_t_₁

y

_i_,_t_₂

). A cet égard, Arellano et Bond (1991) proposent

d’instrumenter les différences (de la variable dépendante retardée, ainsi que des variables

explicatives) avec les valeurs passées des mêmes variables. Cet astuce annule en effet la

corrélation des explicatives avec le résidu courant, mais garde la corrélation avec le résidu

passé.

Les conditions proposées par Arellano et Bond (1991) pour identifier les coefficients sont

appelés des conditions de moments (d'où le nom de la méthode des moments généralisée) et

sont présentées sous la forme suivante :

^pour ^și^t^{= 3,4…T} ^(5.4)

pour și t = 3,4…T (5.5)

Les estimateurs proposés par Arellano et Bond (1991) pour  et  sont efficaces à condition

que le résidu 

_it

soit i.i.d. et les variables explicatives X

_it

ne soient pas corrélées aux

réalisations futures de

_it

. Il existe une deuxième version de l'estimateur, proposé

ultérieurement par Arellano et Bover (1995), en utilisant une autre méthode pour éliminer les

effets fixes. Au lieu de considérer les différences premières, ils transforment l'équation en

déviations orthogonales

. Basée sur l'hypothèse d’endogénéité faible, cette transformation

permet d'éliminer plus rapidement la corrélation des variables explicatives avec les résidus.

De plus, cet estimateur présente de meilleures propriétés sur de petits échantillons et modélise

mieux les séries persistantes (Arellano et Bover, 1995).

L’efficacité de l’estimateur GMM repose sur la validation de deux hypothèses, l’exogénéité

des instruments et la non-corrélation des résidus. La validité des instruments est vérifiée à

l’aide des tests Hansen / Sargan et l'auto-corrélation des résidus est testée un test proposé par

Arellano et Bond. Il convient de noter que la construction de l'équation en différences

introduit une auto-corrélation de premier ordre. La vérification de l’auto-corrélation des

résidus se fait donc à partir du deuxième ordre. Les tests de Sargan / Hansen sont connus pour

leur manque de fiabilité lorsqu’un grand nombre d'instruments est utilisé

. Pour éviter cet

Cette transformation est une forme de différenciation. Les différences sont construites entre la valeur actuelle de la variable et la moyenne de ses réalisations futures (Arellano et Bover, 1995).

23 Lorsqu’on construit un ensemble d'instruments pour chaque période et pour chaque variable (en remplaçant les observations manquantes avec zéro), le nombre d'instruments augmente de façon exponentielle.

0 )]

(

[y

_i_,_t__s _it



_i_,_t_₁



E   s2

0 )]

(

[X

_i_,_t__s _it



_i_,_t_₁



E   s2

inconvénient, nous limitons le nombre d'instruments par condensation de la matrice à une

seule colonne, tel que suggéré par Rodman (2009a

).

Bien que ces estimateurs soient fondés sur la quasi-stationnarité des variables, en pratique,

cette hypothèse tend à être ignorée. Premièrement, la méthode GMM est conçue pour des

séries temporelles relativement courtes (d’ailleurs c’est la raison principale pour utiliser un

panel). Ainsi, la stationnarité des séries peut être difficilement évaluée

. Deuxièmement, le

GMM consiste à transformer l'équation initiale en différences, d’où la disparition

d’éventuelles tendances de non-stationnarité des variables en niveau. Ajoutons à ces deux

arguments une troisième remarque : la plupart des variables que nous utilisons devrait

théoriquement être stationnaires. Le taux d'investissement (GFCF/PIB), par exemple, peut

enregistrer des variations de court terme, mais il est limité dans son évolution de long terme

(étant une part du revenu, il ne peut pas enregistrer une tendance permanente à la hausse ou à

la baisse).

En vertu des arguments présentés, la pertinence des tests de racine unitaire dans le cadre de

notre problématique est relativement limitée. En prenant en compte la dimension temporelle

maximale de nos séries est de 21 ans (1990- 2010), nous sommes toute de même rigoureux

dans l’approche empirique, en vérifiant la stationnarité des séries avant de procéder à

l'estimation empirique. A cet effet, nous utilisons plusieurs tests de racine unitaire développés

en panel. Les tests utilisés sont ceux de Levin, Lin Chu (2002) - LLC, Im, Pesaran et Shin

(2003) - IPS et Choi (2001) - de type Fisher. La description de ces tests et les résultats obtenus

sont présentés de manière détaillée en annexe. Ils seront brièvement rappelés dans la section

des résultats. Celle-ci comprendra aussi d'autres considérations méthodologiques liées aux

Le problème des instruments nombreux est clairement reconnu dans la littérature empirique. Pourtant, il n’y a pas d’indication précise sur ce qui est « trop d’instruments ». Rodman (2009a) suggère de garder le nombre d'instruments inférieur au nombre de pays. Le même auteur, Rodman (2009b), reconnaît quand même qu'il s'agit d'une indication pratique, sans justification théorique précise. Par conséquent, nous essayons de garder au minimum le nombre d'instruments, considérant qu’un maximum de 15 instruments est raisonnable. À cet égard, nous utilisons l’option collapse correspondante au programme xtabond2 écrit par Rodman (2009a).

25Selon la théorie des séries temporelles, les tests de racine unitaire sont basés sur les propriétés asymptotiques du processus générateur lorsque la dimension temporelle tend vers l'infini. Or les séries habituellement disponibles dans les recherches macro-économiques sont relativement courtes. Ainsi, on risque de capter uniquement une partie du cycle économique, ce qui est insuffisant pour étudier les propriétés de long terme de la série. Par exemple, de nombreuses séries macro-économiques relatives aux PECO ne sont disponibles qu’à partir de 1995. Or cette période représente la phase d'ascension économique. Ignorer la phase de récession correspondant à la première période de transition peut déterminer l’acceptation à tort de l’hypothèse de non-stationnarité.

instruments, ainsi qu’à l'introduction d'autres variables externes. Celles-ci dérivent

directement des résultats obtenus.

Dans le document Investissement direct étranger, transfert de technologie et croissance économique en Europe Centrale et Orientale (Page 105-110)

La méthode des moments généralisée (GMM)

5.2 La méthodologie d’analyse de la relation IDE - investissement local

5.2.2 La méthode des moments généralisée (GMM)

Dans cette section, nous présentons les choix méthodologiques que nous avons faits ainsi que

les raisons de leur utilisation pour notre problématique. Comme approche empirique générale,

nous avons préférée les techniques d’estimation en panel, présentant de nombreux avantages

dans notre cas. Le panel combine la dimension temporelle et interindividuelle des données et

fournit plus de variabilité. Ainsi on a un nombre plus élevé de degrés de liberté et on réduit la

colinéarité entre les variables explicatives (Hsiao, 2003).

Dans le tableau 5.3, ci-après, nous observons la différence entre le contenu informationnel des

deux dimensions (à titre d'illustration, nous avons choisi quelques-unes des variables prises en

compte). Ainsi, quand nous passons d’une estimation en séries temporelles (within) à une

estimation en panel (total), on observe une augmentation de l’écart-type (par exemple, pour la

variable GFCF la plupart de l’information est donnée par la variation entre pays et non pas par

la variation temporelle, 17,72 contre 8,82). La différence est encore plus notable quand on

passe d'une estimation en coupe transversale (between) au panel.

Tableau 5.3 La variance inter et intra individuelle des différentes variables

Variable GFCF GROWTH FDI PORTF LOANS INTEREST

Interindividuelle

(between) 17.72 0.61 6.05 1.25 1.30 15.05

Intra-individuelle

(within) 8.82 43.56 41.2 8.64 9.55 194.6

Total 25.70 44.89 46.8 9.80 10.63 208.5

Remarque : la variance interindividuelle (between) est la variance des moyennes individuelles et

montre comment la variable varie entre les différents individus. La variation intra-individuelle (within)

est la moyenne des variances individuelles et montre comment la variable varie dans le temps. La

variance totale comprend les deux dimensions. En raison d'ajustement des degrés de liberté et de la

structure non-cylindrée du panel, ce n'est pas la somme des deux.

Une fois sélectionnée la structure de panel, nous nous sommes intéressée à la méthode

d'estimation. La structure dynamique de l'équation (5.1), imposée par la présence de la

variable dépendante retardée GFCF

soulève des problèmes liés à l’application de la

méthode des MCO. L’introduction de la variable dépendante retardée est essentielle pour des

raisons théoriques, mais aussi parce qu'elle a l'avantage technique de contrôler le risque de

variables omises. En revanche, dans un modèle autorégressif, tant l'estimateur MCO que ceux

Within, Between ou MCO généralisé ne sont plus convergents (Wooldridge, 2005; Hsiao,

2003, Rodman, 2009a).

Le problème de non-convergence des estimateurs MCO est expliqué principalement par deux

phénomènes. Le premier souci est le bias de panel dynamique (Nickel, 1981). La variable

GFCF

est corrélée avec les effets fixes individuels ν

, donnant lieu à l'auto-corrélation des

résidus ε

. Le deuxième problème apparait lorsque certaines variables explicatives sont

endogènes. Puisque la causalité peut aller dans les deux sens, les régresseurs peuvent être

corrélés avec les résidus et violer de nouveau les hypothèses MCO. Un exemple lié a notre

problématique est le fait que les IDE peuvent être attirés par des taux élevés de croissance,

tout en restant un déterminant de la croissance.

L’estimation efficace d’un panel dynamique est possible en utilisant l’estimateur GMM (la

méthode des moments généralisée), proposé par Arellano et Bond (1991), Arellano et Bover

(1995) et Blundell et Bond (1998). Ce type d'estimateur est devenu très populaire dans la

recherche empirique, car il permet de détendre la plupart des hypothèses MCO. La méthode

GMM corrige l’endogénéité des variables autorégressives et permet de déterminer des

paramètres efficaces, même en présence de variables explicatives endogènes. L'avantage

majeur par rapport aux techniques classiques des variables instrumentales est la génération en

interne des instruments. En pratique, les valeurs retardées des variables sont des instruments

pour expliquer leurs valeurs présentes.

Il convient de mentionner que cette méthode permet de corriger l’endogénéité au sens faible,

mais pas l’endogénéité forte. Elle suppose que certaines des variables explicatives sont

prédéterminées, c'est à dire qu'elles peuvent être affectées par les réalisations passées et

présentes de la variable dépendante, mais pas par les réalisations futures. Nous considérons

pertinent d’illustrer cette hypothèse, avec une application au cas des IDE. Si l'on considère les

flux d’IDE comme variable prédéterminée, alors nous supposons que les décisions des

investisseurs étrangers ne sont pas indépendantes de l'évolution macroéconomique passée et

présente des pays d'accueil. C’est hypothèse est d’ailleurs très plausible. Toutefois, Carkvic et

Levine (2005) affirme que cette hypothèse n'exclut pas les anticipations des investisseurs

étrangers quant à l’évolution future de la situation économique. Elle dit juste que les futurs

chocs non-anticipés n'affectent pas le niveau actuel des IDE.

Pour la suite, nous présentons le principe de construction de l’estimateur GMM. L'équation

qui caractérise un panel dynamique homogène avec des effets fixes individuels est indiquée

ci-dessous :

y X

y 

 

 

(5.2)

Où y

est la variable dépendante (dans ce cas ca serait GFCF), X

est un vecteur de variables

explicatives, 

(between) ^17.72 ^0.61 ^6.05 ^1.25 ^1.30 ^15.05

(within) ^8.82 ^43.56 ^41.2 ^8.64 ^9.55 ^194.6

Total _25.70 _44.89 _46.8 _9.80 _10.63 _208.5

^pour ^și^t^{= 3,4…T} ^(5.4)