Effets des révisions sur la modélisation et la prévision macroéconomiques

3.1 Introduction

Après avoir identifié et décrit la révision des données, les statisticiens professionnels et les analystes, qu’ils soient économistes ou prévisionnistes, ont cherché à aller plus loin dans l’ex-plication du phénomène. Nous avons vu dans les chapitres précédents que la révision pouvait affecter plusieurs variables macroéconomiques ainsi donc que la Comptabilité Nationale. Un nombre important d’indicateurs sont concernés par ce problème. Les études que nous avons présentées ci-dessus ont un caractère essentiellement descriptif ; elles mettent en évidence l’ampleur et l’évolution du processus de révision au cours du temps. Si les dernières analyses montrent une baisse tendancielle de l’importance des révisions cours du temps, suite à l’amé-lioration des techniques de collecte et d’estimation ainsi qu’au progrès en informatique, leur niveau reste néanmoins non négligeable dans la majorité des cas.

Quand les révisions sont importantes, en plus d’influer sur les estimations, elles auront un impact sur la spécification et les caractéristiques des modèles économétriques :

– les coefficients estimés peuvent changer selon la version d’une série introduite dans un modèle. L’estimation sera d’autant plus modifiée que les séries utilisées correspondent aux estimations les plus anciennes ;

– la spécification d’un modèle peut être modifiée. Si nous devons, selon un critère de sé-lection, choisir le nombre de retards dans une modélisation temporelle autorégressive, le nombre de retards peut changer et les tests de validation seront influencés ;

– si les révisions sont sensibles, les prévisions des variables concernées en seront affectées avec une augmentation de l’erreur de prévision.

Dans ce chapitre, nous exposerons les études relatives aux techniques de modélisation tem-porelle et économétrique, dans le but de montrer l’influence de la révision des données à la fois sur les modèles eux-mêmes et sur les résultats obtenus avec ces modèles.

Dans la deuxième section, nous nous intéressons aux effets de la révision des données sur les modèles économétriques. Nous verrons comment de telles modifications peuvent remettre en question leur spécification ainsi que l’estimation des coefficients.

Nous présenterons dans la troisième section l’effet de la révision des données sur la prévi-sion. Il s’agit de montrer l’incidence de la révision, quand le choix des versions des variables (non révisées, partiellement révisées ou totalement révisées) par les utilisateurs est différent pour effectuer leurs prévisions.

Nous formaliserons enfin les conclusions auxquelles nous conduisent les résultats de ces études.

3.2 Effet des révisions sur les modèles économétriques

Les premières analyses concernent l’influence qu’a le choix des séries selon leur version sur l’estimation d’un modèle et son utilisation en prévision. Ce sont des versions simplifiées des modèles macroéconométriques à équations simultanées, utilisés dans les organismes de

prévision. Des premières études sont effectuées par Frank T. Denton et John Kuiper (1965) pour les Comptes Nationaux, puis par Frank T. Denton et Ernest H. Oksanen (1972, 1973a) qui reprennent la même technique pour l’appliquer à plusieurs économies dans un but comparatif. L’étude de l’influence sur les modèles macroéconométriques a été reprise par Oliver (1979) pour les Comptes Nationaux du Royaume-Uni.

Paradoxalement, l’analyse de l’influence des révisions sur les équations économétriques es-timées par les Moindres Carrés Ordinaires, apparait tardivement comparées aux analyses des modèles à équations simultanées, initiées par Denton et Kuiper en 1965. Burns (1973) et Mc Donald (1974) comparent les éventuels changements des estimations par les MCO des équa-tions de la consommation des ménages australiens. Robert J. Barro et Zvi Hercowitz (1980) effectuent des régressions afin de tester l’influence des révisions des agrégats monétaires sur les indicateurs de la croissance économique américaine, à savoir le PNB réel et le chômage. Ross D. Milbourne et Gregor W. Smith (1989) utilisent la même technique pour effectuer une analyse du comportement des agrégats monétaires canadiens, influencés par leurs révisions successives.

D’autres études sont consacrées à la modélisation des séries temporelles : elles concernent essentiellement les techniques de prévision basées sur l’algorithme de Box et Jenkins comme dans les études de John McDonald (1974, 1975, 1976) qui utilise la modélisation ARIMA pour comparer leurs spécifications (nombre de retards retenus selon des critères de sélection) appli-quée au PIB australien. Holden et Peel (1982) utilisent cette même technique pour le PIB du Royaume-Uni ainsi que ses composantes (Comptes Nationaux).

En ce qui concerne les comptes américains, H. O. Stekler (1987), reprend l’étude de Hol-den et Peel (1982) exploitant la modélisation ARIMA influencée par la révision des données. Son approche diffère cependant de celle de Holden et Peel dans le choix des échantillons et l’intégration des versions - révisées ou non - des données. Athanasios Orphanides (1998) quant à lui, tente de comprendre l’influence des révisions sur les décisions de politique économique en utilisant comme modèle un processus autorégressif d’ordre 1 (AR(1)).

Plus récemment, une modélisation temporelle multivariée est utilisée par Dean Croushore et Charles L. Evans (2006), qui retiennent une technique de modélisation vectorielle autorégres-sive structurelle (Modèles VAR structurels), pour interpréter la modification des chocs d’offres dans l’activité économique quand le choix des versions des variables est différent.

Nous présenterons dans cette section d’abord les études basées sur l’estimation d’équation par les MCO, avant d’aborder celles basées sur les modèles macroéconométriques et enfin les modèles de séries temporelles.

3.2.1 Effet des révisions sur les estimations par les MCO

Burns (1973), met en garde les utilisateurs sur le choix des données dans la modélisation des séries macroéconomiques. À un instant donné, les séries ne sont pas totalement révisées. Si l’on effectue des prévisions avec ces données, il y aura un décalage au moment où les derniers chiffres publiés viendront modifier les séries en question. Afin de montrer ce décalage, l’auteur effectue une modélisation de la consommation des ménages expliquée par le revenu disponible, en utilisant différents échantillons, selon que les séries soient complètement révisées ou pas.

Trois échantillons différents selon le nombre de révisions effectuées sont utilisés pour esti-mer économétriquement la consommation en fonction du revenu. Les T de Student de signifi-cativité des coefficients sont exprimés entre parenthèses. Le coefficient de détermination ainsi que la statistique de Durbin-Watson d’autocorrélation d’ordre un sont également proposés :

– la première équation concerne la période 1954-1968 avec des données préliminaires non révisées.

– la deuxième équation concerne le même échantillon ayant été révisé à sept reprises. Ce qui signifie que cette deuxième équation concerne un mix de données dans l’échantillon, une première partie non révisées et une autre révisée en partie 7 fois mais non d’une manière définitive.

fois¹. Premier échantillon : C_t= 38, 4 + 0, 894Y_t (0,17) (36,5) R²= 0, 997, D.W = 2.36 Deuxième échantillon : C_t= 36, 0 + 0, 893Y_t (0,14) (38,8) R²= 0, 997, D.W = 2.34 Troisième échantillon : C_t= 278, 9 + 0, 880Y_t (1,60) (46,1) R²= 0, 998, D.W = 0.87

Ainsi, si les deux premières équations présentent des similitudes, la troisième présente une statistique de D.W (Durbin et Watson) d’autocorrélation d’ordre 1 totalement différente des deux premières. Les coefficients de régression obtenus sont également différents.

Mc Donald (1974) dans son analyse, tente de dépasser l’analyse de Burns (1973) pour montrer l’influence des révisions sur les coefficients estimés économétriquement par les MCO,

1. Nous ne pouvons pas employer l’expression données finales, car toujours susceptibles d’être révisées encore une fois exceptionnellement. Elles sont finales dans le sens où les révisions périodiques n’ont plus lieu d’être.

en reprenant en partie le même échantillon utilisé par Burns, ainsi que d’autres périodes : les révisions nombreuses et successives des variables amènent chaque utilisateur à se retrouver face à un certain nombre de séries représentant la variable choisie. Quelle série prendre ? Burns dans son analyse préconise de choisir les séries de variables ayant subi le même nombre de révisions, afin de garantir une homogénéité et une continuité des estimations. En effet, si elles ont été révisées différemment, l’une plus que l’autre, un risque d’introduction de biais pourrait fausser les résultats. Afin de tester ce choix (préconisé par Burns), Mc Donald teste cette hypothèse en effectuant plusieurs régressions en mettant comme variable endogène la consommation et comme variable explicative le revenu de l’économie australienne.

Supposons que :

X_ti= X_t^∗+ X_ti^∗∗ Y_ti= Y_t^∗+Y_ti^∗∗

Où X_ti et Y_ti sont les ièmes estimations de la variable exogène et de la variable endogène, pour la période t et X_ti^∗∗et Y_ti^∗∗ sont leurs erreurs correspondantes.

Posons :

X_ti^∗∗= a₁(i) + u_t Y_ti^∗∗ = a₂(i) + v_t

Où a₁(i) et a₂(i) sont des fonctions déterministes du nombre de révisions et u_t et v_t sont des bruits blancs (perturbations de moyennes nulles et de variances constantes respectives σ_u² et σ_v²).

Ainsi, l’erreur observée de chaque variable dépend de deux choses : du nombre de révisions et de la période à laquelle elle est considérée. Si la révision est constante, alors elle évoluera et diminuera ou augmentera en fonction de l’évolution de i.

Reprenons maintenant la relation linéaire simple entre deux variables :

Y_t^∗= β0+ β1X_ti^∗∗+ εt

Les estimateurs par les MCO des coefficients par identification aux premières relations dépendent des a(i). Mc Donald effectue 19 régressions sur cette équation en prenant 19 échan-tillons différents :

– les 15 premiers échantillons contiennent les mêmes séries de la même période, où chaque échantillon est révisé une fois chaque année, en reprenant la même période d’estimation reprise dans l’analyse de Burns (1973), à savoir, de 1954-55 à 1967-68. Ainsi les deux variables X_t et Y_t sont révisées équitablement du même nombre sur chacun de ces 15 échantillons.

– quatre autres échantillons de régression sont utilisés où les variables sont représentées par un mix de données entre séries préliminaires et révisées, tirés chacun de 4 publications différentes, à savoir août 1968, février 1969, février 1970 et avril 1971.

Chacun des coefficients varie globalement sur les 15 échantillons passant de 0,875 à 0,906 avec des écart-types variant faiblement de 0,019 à 0,017. Sur les échantillons mixés, les coef-ficients passent de 0,84 à 0,907, pour des écart-types de 0.016 globalement. On remarque en effet que les coefficients évoluent progressivement à chaque fois que la révision est incrémen-tée d’un point, mais sur les mêmes échantillons de données australiennes estimées par Burns, il constate que les valeurs des coefficients présentent des différences assez faibles, et qu’ils ne sortiraient pas d’un intervalle de confiance pour une erreur de première espèce de 5 %.

Malgré les constats de Burns et les résultats constatés ici pour les données australiennes, Mc Donald conclue que concernant ces données, l’évolution des révisions dépend ici de la méthode d’estimation australienne et des observations empiriques.

Robert J. Barro et Zvi Hercowitz (1980), tentent d’expliquer en partie les fluctuations de la croissance économique américaine par les révisions affectant la croissance monétaire. La

modélisation concerne la relation entre la croissance monétaire affectée par sa partie révisée et deux indicateurs économiques : le taux de chômage et l’output (PNB réel).

Dans une première partie, les auteurs décrivent le phénomène des révisions affectant l’agré-gat monétaire M1, sans considérer les révisions induites par les changements de coefficients saisonniers. Afin de filtrer les révisions non périodiques dues à des correctifs antérieurs de sé-ries ainsi que des changements de définitions, les sésé-ries sont exprimées en taux de variation de chaque mois par rapport à la moyenne annuelle. Trois séries successives sont prises en considé-ration : une série préliminaire parue un mois - ou deux après - le mois considéré (s’il s’agit de la publication du mois de janvier, il sera publié en février ou mars, par exemple), une deuxième série intermédiaire, parue une année plus tard et une troisième "finale" incluant toutes les révi-sions parues plus tardivement. Les moyennes annuelles sont calculées et comparées. La période considérée est de 1947 à 1977.

Afin d’analyser l’effet des révisions de la croissance monétaire, les auteurs estiment des relations économétriques entre cette croissance avec le taux de chômage et l’output. Les ré-gressions effectuées n’ont pas pu montrer un effet des révisions de la croissance de la monnaie sur les variables étudiées.

Ross D. Milbourne et Gregor W. Smith (1989), tentent de trouver une relation entre les données préliminaires et les données finalisées des agrégats monétaires canadiens M1, M2 et M3 en données mensuelles, sur la période allant de janvier 1968 à décembre 1983, extraites de différentes publications canadiennes. Ils effectuent plusieurs régressions entre différentes révi-sions et les agrégats, pour tenter de trouver des relations entre leur taux de croissance mensuels, comme valeurs prédites par les données préliminaires.

Les séries préliminaires peuvent être utilisées comme de bons estimateurs des séries fina-lement révisées. Les régressions effectuées présentent de bonnes propriétés. Néanmoins, deux constats intéressants peuvent être soulignés :

– il existe une relation entre les révisions des agrégats et les différences secondes des taux d’intérêt. Les taux d’intérêts exprimés en différence seconde peuvent être ainsi utilisés

pour anticiper l’évolution des révisons des agrégats.

– la révision successive présente un phénomène saisonnier durant quelques mois dans l’an-née. Des variables indicatrices introduites dans les équations économétriques montrent la significativité des mois de décembre avec un coefficient positif ; les mois de novembre et de janvier eux sont significatifs avec des coefficients négatifs.

3.2.2 Effet des révisions sur les modèles macroéconométriques à

Dans le document Le problème de la révision des données statistiques : le cas des données douanières mensuelles du commerce extérieur français (Page 127-135)