• Aucun résultat trouvé

Chapitre 3. Présentation de la méthodologie et de la littérature sur l’analyse des

3.2. Les fondements théoriques de la modélisation VAR et de la cointégration

3.2.2. La modélisation dynamique VAR et VECM

3.2.2.2. La cointégration et modélisation à correction d’erreur

Engle et Granger (1987) ont proposé le concept de cointégration pour analyser et comprendre les relations d’équilibre de long terme entre des variables économiques temporelles. D’après leur intuition, si des variables sont « cointégrées », elles doivent suivre un sentier d’équilibre de long terme, bien qu’à court terme elles puissent diverger substantiellement de l’équilibre.

À la vue des fortes relations qui lient les produits pétrochimiques le long de la chaine de transformation et de leur dépendance aux prix du pétrole, il semble crédible qu’une ou plusieurs relations de long terme puissent exister entre ses produits. Dès lors que nous parvenons à estimer cet équilibre de long terme, Engle et Granger (1987) puis Johansen (1988, 1991) ont montré qu’il est possible d’utiliser cette relation de long terme dans des modèles à correction d’erreur afin d’optimiser les prévisions.

i. La cointégration entre deux variables

Selon Engle et Granger (1987) deux séries temporelles x et t y sont dites t

« cointégrées » si les deux conditions suivantes sont vérifiées :

- Elles sont affectées d’une tendance stochastique de même ordre d’intégration d

- Une combinaison linaire de ces séries permet de se ramener à une série d’ordre d’intégration inférieur.

Pour tester l’existence d’une relation d’intégration dans le cas de deux variables intégrées du même ordre d, Engle et Granger (1987) proposent une procédure en deux

• Tester l’ordre d’intégration

Une condition nécessaire de cointégration est que les séries soient intégrées de même ordre. Dans le cas contraire, elles ne peuvent pas être cointégrées. Il faut donc étudier avec beaucoup de rigueur la non stationnarité des variables et leur degré d’intégration à l’aide des tests de racines unitaires DF et ADF que nous avons présentés précédemment.

• Estimation de la relation d’équilibre de long terme

Si les deux variables sont intégrées du même ordre, nous pouvons estimer par les MCO la relation de long terme entre les variables en niveau :yt =a1xt +a0 +εt

Pour que l’existence d’une relation de cointégration soit acceptée, le résidu e issu de t

la régression précédente doit être stationnaire. Nous pourrons tester la stationnarité du résidu à l’aide des tests DF et ADF.

Une fois l’existence de la relation de cointégration confirmée nous pourrons estimer un modèle à correction d’erreur (ECM). Engle et Granger ont démontré dans le théorème de la représentation de Granger que toutes les séries cointégrées peuvent être représentées à l’aide d’un ECM.

Si nous prenons l’exemple de deux variables y et t xtI(1), l’estimation de l’ECM

se fait en deux étapes :

- Estimation par les MCO de la relation de long terme qui doit être stationnaire :

t t

t x e

y =

α

ˆ +

β

ˆ +

- Estimation par les MCO de la relation dynamique de court terme :

t t t t x e u y = ∆ + + ∆ α1 α2 1 avec

α

2 <0

Dans le modèle ainsi obtenu,

α

2est appelée la force de rappel vers l’équilibre. Elle doit être significativement négative afin de permettre une convergence qui tend vers la relation de long terme. Nous pouvons tester la significativité des coefficients de manière classique avec les statistiques de Student. Nous pouvons également ajouter des variables explicatives supplémentaires qui ne rentrent pas dans la relation de long terme.

ii. La cointégration entre plusieurs variables

Nous avons montré que les prix des matières plastiques peuvent dépendre de plusieurs autres prix des matières premières qui appartiennent à la chaine pétrochimique. La généralisation du modèle ECM de deux à plusieurs variables semble donc nécessaire. Johansen (1988, 1991), et Johansen et Juselius (1990, 1992) ont développé une méthode d’estimation systématique de modèles dynamiques à variables cointégrées. Elle se base sur l’estimation de modèle VAR avec un terme de correction d’erreur (VECM) par la méthode du maximum de vraisemblance.

Dans le cadre d’un VAR(p) à k variables la représentation VECM (p-1) peut être

formalisée de la manière suivante : Sous forme matricielle :

ε + + + + + = t t p tp t A AY AY AY Y 0 1 1 2 2 ...

Avec Y un vecteur de dimension t k×1constitué des k variables (y1t,y2t,...,ykt)

Avec A un vecteur de dimension 0 k×1 Avec A un vecteur de dimension i k×k

Ce modèle peut s’écrire en différences premières :

ε π + + ∆ − + + + + + ∆ − + + ∆ − + = ∆Yt A0 (A1 I) Yt1 (A2 A1 I) Yt2 ... (Ap1 ... A2 A1 I) Ytp+1 Ytp avec       − =

= p i i I A 1

π

La matrice

π

est fondamentale et nous permet de déterminer s’il y a cointégration entres les k variables. Elle peut se réécrire π =αβ' où le vecteur

α

est la force de rappel vers la relation d’équilibre de long terme et le vecteur β est constitué des coefficients des relations de long terme des variables. Chaque combinaison linéaire représente donc une relation de cointégration.

Le rang de

π

est compris entre 0 et k. Il peut alors y avoir r relations de cointégration

possibles61 avec : 0<r<k.

Pour tester la cointégration dans le cas de modèle à plusieurs variables et déterminer le nombre de relations de cointégration r, nous utiliserons le test proposé par Johansen

61 Si tous les éléments de

π

sont nuls, sont rang est égale à 0 , on se retrouve dans le cas d’un modèle VAR sur série stationnaire.

Si le rang de

π

est égale à k, cela signifie que toutes les variables sont I(0) stationnaires, on peut alors estimer un modèle VAR avec les variables en niveau.

et Juselius (1990) qui utilise les statistiques de la « Trace » et de la « Valeur Propre Maximum » (Maximum Eigen Value).

Pour synthétiser, la procédure d’estimation d’un VECM est la suivante :

- Détermination du nombre de retard p optimal à introduire dans le modèle VAR en

utilisant les variables en niveau ou en logarithme. Nous choisirons le retard qui minimise les critères AIC ou SC.

- Test de cointégration de Johansen et Juselius (1990) pour déterminer le nombre de relation de long terme. Il faudra choisir parmi les spécifications de modèles proposés en fonction du type de non stationnarité des variables que nous aurons identifié précédemment.

- Estimation du Modèle VECM par la méthode des maximums de vraisemblance. - Validation du modèle à l’aide des tests usuels de significativité des coefficients et

vérification des résidus.

La méthodologie multivariée de Johansen et Juselius présente plusieurs avantages par rapport à l’algorithme en deux étapes d’Engle et Granger (Masih & Masih, 1999). Elle n’impose pas d’hypothèse restrictive sur le nombre de relations de cointégration existantes entre les variables. De plus, elle propose un test pour déterminer le nombre de relations de cointégration significatives dans le système. Enfin, à la différence d’Engle et Granger toutes les variables sont traitées de façon endogène notamment dans la relation de cointégration (Fève, 2006).

Gonzalo (1994) a évalué cinq méthodes alternatives d’estimation des relations d’équilibre de long terme : les moindres carrés ordinaires d’Engle et Granger (1987), les moindres carrés non linéaires de Stock (1987), le maximum de vraisemblance de Johansen (1988), les composantes principales de Stock et Watson (1988), les corrélations canoniques de Bossaerts (1988). Il a examiné les distributions asymptotiques des estimateurs résultant de chacune des méthodes de cointégration et a justifié la supériorité de la méthode de maximum de vraisemblance de Johansen (1988) pour déterminer le rang de cointégration entre des variables. Ses travaux sont cohérents aves les résultats théoriques de Phillips et Loretan (1991) qui montraient que la meilleure méthode d’estimation d’un système cointégré est une estimation complète du système par maximum de vraisemblance, qui incorpore toutes les informations préalables sur la présence de racine unitaire. Gonzalo confirme ainsi que

l’approche de Johansen (1988) assure que les coefficients estimés sont symétriquement distribués, de moyenne non biaisée, asymptotiquement efficaces, et que les tests d’hypothèses peuvent être réalisés avec des tests asymptotiques du Chi- deux.