• Aucun résultat trouvé

Frank T. Denton et John Kuiper (1965), se proposent d’estimer le degré d’influence des données préliminaires sur les estimations des modèles macroéconomiques. Pour ce faire, ils exploitent les révisions des Comptes Nationaux annuels canadiens sur la période allant de 1949 à 1958. En effet, 1958 est la date à laquelle les données ont subi tout le processus régulier des révisions pour cette période. Les données utilisées sont exprimées en différence première, en unité monétaire courante et non constante, car pendant cette période, les services statistiques canadiens ne publiaient pas de révisions pour les variables en volume.

Notons le fait que si une révision est plus forte qu’une autre, cela ne veut pas forcément impliquer que la dernière estimation sera meilleure : ces données révisées peuvent contenir encore des erreurs d’estimation.

Un modèle macro économétrique en différence première est estimé, avec six équations structurelles et six identités. Il est calculé utilisant deux méthodes différentes, par les doubles moindres carrées et par les MCO. Les modèles sont estimés à trois reprises différemment selon le choix des versions des données : pour les mêmes variables, ils estiment ces modèles en utilisant :

– d’abord des séries préliminaires, non encore corrigées,

– ensuite une estimation avec un mix de trois séries, préliminaires, ayant subi des révisions intermédiaireset finales,

– et une troisième fois en utilisant uniquement des séries "totalement"révisées.

Le but de cette procédure d’estimations permet de se retrouver en temps réel, à la date à laquelle un utilisateur exploitera des données qui seront différentes selon la période de leur diffusion.

Au vu des résultats obtenus, nous constatons que :

– le choix des deux méthodes d’estimation ne change pas significativement les résultats des coefficients obtenus.

– nous avons vu dans les études précédentes qu’il pouvait y avoir des erreurs d’estimations non seulement dans le niveau des chiffres mais aussi dans leur signes (points de retourne-ment) : les séries exposées ici ne présentent pas beaucoup de signes contradictoires entre les séries préliminaires et celles révisées.

– les coefficients estimés sont différents dans leur niveau : beaucoup plus différents quand les séries sont changées que par rapport aux deux méthodes d’estimation. Leur niveau de significativité est modifié selon les cas. Ce qui était prévisible selon les auteurs, les co-efficients sont plus proches entre les estimations des séries mixées et finalement révisées que les séries préliminaires.

Denton et Kuiper donnent ici un aperçu d’une utilisation non prudente des données qui pourrait conduire à des résultats contradictoires. Cependant, nous resterons prudents sur les propriétés statistiques des séries utilisées ainsi que sur les coefficients estimés, à partir du mo-ment où l’échantillon utilisé est très court. La nature des données fait que les résultats sont aussi discutables. Elles sont exprimées en valeur et non pas en volume, non corrigées des variations saisonnières : le but ici n’est pas d’effectuer une estimation d’un modèle macroéconomique mais surtout de voir si les données préliminaires sont de bons estimateurs des données finale-ment révisées.

Tendanciellement, nous dirons qu’elles sont corrélées et évoluent en général de la même manière. Notons également que comme nous l’avions constaté dans le chapitre 2, que les erreurs d’estimations ont tendance à diminuer dans le temps, surtout concernant les données récentes.

Notons également que les données sont exprimées en valeur, l’effet des prix présents dans les variables aurait-il pu fausser les résultats ?

Des révisions exceptionnelles pourraient engendrer des valeurs aberrantes donnant de mau-vaises propriétés statistiques des coefficients. Il serait souhaitable d’affiner le traitement des séries utilisées, de reconsidérer la qualité des modèles estimés, voire d’utiliser d’autres mé-thodes de modélisation (séries temporelles par exemple), avant même de tenter de donner des interprétations concernant la nature et les caractéristiques des estimations.

En conclusion, l’utilisation de données publiées à des dates différentes, donc pouvant être complètement révisées ou pas du tout, pourrait induire en erreur l’interprétation des coeffi-cients estimésdans les modèles macroéconomiques.

Frank T. Denton et Ernest H. Oksanen (1972, 1973a), reprennent le même principe que l’analyse de Frank T. Denton et John Kuiper (1965) et effectuent une comparaison des résultats pour 21 pays. Les séries proviennent des statistiques publiées par les Nations Unies pour la période 1955-1964 en données annuelles. Ils constituent deux périodes issues de publications différentes pour prendre en compte la différence entre les séries non encore révisées et ces mêmes séries révisées, issues respectivement de la publication de l’année 1965 et celle de 1968.

Après une présentation rapide des propriétés statistiques des révisions, ils présentent le modèle macroéconomique annuel simple à estimer pour les 21 pays. Comme pour la première étude de Denton et Kuiper, ils reprennent le modèle macroéconomique à équations simultanées.

Les résultats obtenus présentent des similitudes par rapport aux analyses précédentes pour le modèle canadien. Les auteurs restent prudents néanmoins et souhaitent que le lecteur soit conscient de la simplicité du modèle estimé (tests statistiques, variables choisies etc.) et sur la période très courte des données estimées.

– les différences de signes des coefficients estimés selon que l’on utilise des données non révisées et révisées sont très rares.

– les coefficients estimés des variables explicatives sont assez proches sans pour autant être exactement identiques. Leur niveau de significativité peut également changer.

– les termes constants sont par contre différents, pouvant même avoir des signes différents concernant plusieurs pays.

Oliver (1979), exploite la modélisation macroéconomique des Comptes Nationaux anglais pour analyser la volatilité des coefficients estimés en utilisant des séries macroéconomiques éditées à différentes périodes pour introduire l’effet des révisions induites par des changements de bases. À chaque changement de base, les données sont en effet revisitées, afin de réguler les erreurs d’estimation et les réadapter à la nouvelle base.

Oliver utilise un échantillon allant de 1956 à 1976. Cette même période est prise à des dates différentes : les séries en base 1970 publiées en 1977, les séries en base 1975 publiées en 1978 et enfin les séries toujours en base 1975 cette fois publiées en 1979. Oliver calcule un modèle à équations simultanées de la même manière que les études vues précédemment (Denton et Kuiper 1965 ; Denton et Oksanen 1972), utilisant les trois séries de variables publiées à des dates différentes.

Quand il s’agit de comparer des coefficients estimés sans prise en compte de changement de base, Oliver arrive aux mêmes résultats que ceux retrouvés chez Denton et Kuiper : des erreurs faibles dans les estimations sans aucun changement de signe de part et d’autres des coefficients2.

Par contre, en passant d’une base à une autre, ce qui signifie que les séries comprennent les révisions cumulées à la fois périodiques et celles induites par le changement de base, nous retrouvons des différences dans les estimations des coefficients.

Pour la consommation par exemple, nous avons :

2. Oliver calcule également les élasticités de chaque variable (par identification) pour les trois publications différentes des séries.

Les écart-types des coefficients sont mis entre parenthèse.

Données de 1977 aux prix de 1970 :

Ct= 1, 2764 + 0, 6531Ct−1+ 0, 1921Yt−1+ 0, 4078∆Yt

(0,7385) (0,3091) (0,1819) (0,1181)

s (écart-type) = 0,3846, R2= 0, 9939

Données de 1978 aux prix de 1975 :

Ct= 2, 5859 + 0, 7756Ct−1+ 0, 1117Yt−1+ 0, 3462∆Yt

(1,7267) (0,3716) (0,2115) (0,1185)

s (écart-type) = 3,7833, R2= 0, 9920

Données de 1979 aux prix de 1975 :

Ct= 2, 2201 + 0, 8711Ct−1+ 0, 0574Yt−1+ 0, 3504∆Yt

(1,8236) (0,3953) (0,2253) (0,1279)

s (écart-type) = 0,8021, R2= 0, 9920

Remarquons le fait que les coefficients estimés soient modifiés en changeant de base. Le terme constant passe du simple à pratiquement au double. Les écart-types estimés sont égale-ment modifiés.

volume certes mais l’échantillon compte à peine 10 points. Nous retenons par contre les dif-férences des estimations en utilisant les mêmes séries sur les mêmes périodes, mais publiées à des dates différentes.

3.2.3 Effet des révisions sur les modèles de séries temporelles

En plus des MCO, John McDonald (1974, 1975, 1976) utilise la méthode Box-Jenkins afin de modéliser le processus des séries des révisions du PIB australien. Cette technique permet d’analyser le comportement du processus en analysant son autocorrélation sérielle. Un proces-sus ARMA3est identifié en calculant le nombre de retards adéquat pour "blanchir" les résidus des séries analysées. Les fonctions d’autocorrélation et d’autocorrélation partielle sont analy-sées d’une manière approfondie afin de comprendre le comportement du processus de révision et de déterminer le nombre de retards du processus ARMA. Un retard trimestriel est également introduit dans le modèle de prendre en compte la désaisonnalisation des séries4.

Les résultats obtenus mènent McDonald à conclure sur des résultats non satisfaisants, à cause des mauvaises propriétés statistiques des processus.

K. Holden et D. A. Peel (1982), utilisent une modélisation ARIMA5et examinent la modi-fication des séries temporelles, quand de nouvelles informations sont introduites dans le proces-sus. En d’autres termes, on cherche à savoir si au moment où les séries sont modifiées par des révisions successives, comment évolue chaque processus représentant les différentes variables composantes du PIB anglais trimestriel.

Les variables sélectionnées sont corrigées des variations saisonnières en prix constants à savoir : le PIB, les dépenses totales en biens et services, les dépenses de consommation des ménages, les dépenses publiques, la FBCF, les importations et les exportations.

Holden et Peel choisissent différentes périodes d’estimation en fonction de leurs dates de

3. ARIMA, après avoir stationnarisé les séries. 4. Modèle SARMA.

publication annuelle allant de 1970 à 1976. Au-delà de 1976, les données ne sont pas encore révisées. Ils s’arrêtent au second trimestre de la fin de chaque échantillon, de sorte à ce que l’introduction des révisions soit prise en compte progressivement d’une année vers une autre. Ainsi, 7 échantillons de 46 points ont été sélectionnés :

1970 : 1959.I - 1970.II 1971 : 1960.I - 1971.II 1972 : 1961.I - 1972.II 1973 : 1963.I - 1973.II 1974 : 1964.I - 1974.II 1975 : 1965.I - 1975.II 1976 : 1966.I - 1976.II

La modélisation ARIMA6 se fait en deux étapes. Il faut d’abord identifier le nombre de retards nécessaires pour que les résidus des modèles présentent de bonnes caractéristiques (bruit blanc). L’identification du nombre de retards se fait en analysant les fonctions d’autocorrélation et d’autocorrélations partielles des processus temporels. Ensuite la seconde étape consiste à estimer ces modèles.

Pour chaque échantillon et pour chaque variable, les auteurs déterminent les retards des processus. Ils sont différents en passant d’une période à une autre. Ces périodes ne sont pas identiques car des informations ont été introduites, à cause des révisions (désaisonnalisation et/ou révision par enrichissement et/ou changement de base). Pour le PIB par exemple, pour les séries des années 1975 et 1976, des AR(4) ont été retenus. Un seul retard pour les anciennes périodes (AR(1)).

Afin de montrer les changements de comportement des modèles induits par les révisions, les auteurs effectuent des prédictions des derniers chiffres publiés progressivement pour chaque échantillon, afin de les comparer à ceux réellement publiés à ce moment-là. Ils calculent les erreurs quadratiques moyennes entre les chiffres prédits et les chiffres publiés.

Ils constatent qu’il est préférable d’utiliser les séries préliminaires plutôt que de prendre les séries partiellement révisées entre deux périodes.

Les comportements des processus changent surtout concernant les dernières années où 4 retards sont nécessaires alors qu’ils n’était que d’un seul avant ces dates : les auteurs constatent que l’introduction d’informations supplémentaires (révisions) alors qu’il s’agit des mêmes sé-ries, change le comportement des modèles.

H. O. Stekler (1987), reprend l’étude de Holden et Peel (1982) et effectue une analyse de l’influence des révisions sur la modélisation ARIMA des séries macroéconomiques améri-caines. Il a une approche différente de ses prédécesseurs en exploitant des indicateurs mensuels couramment utilisés dans l’analyse conjoncturelle : un indicateur composite (ILI, ou Index Of Leading Indicators) et l’indice de production de la FRB (Federal Reserve Bank).

L’échantillon sélectionné par Stekler prend en compte les données mensuelles de 1948 à 1975. 12 nouvelles données sont publiées entre 1975 et 1976 et quelques points avant 1975 sont révisés. Stekler prend progressivement des échantillons différents uniquement vers la fin de leur publication : 1975, ensuite 1976 et ainsi de suite jusqu’à arriver à 1948-1979.

À la différence de Holden et Peel, la date de départ des échantillons ne change pas. Les données sont enrichies par l’arrivée de nouvelles informations : les nouveaux mois ne sont pas encore révisés mais ceux qui les précèdent le sont progressivement une à plusieurs fois.

Les séries ont été fortement révisées dans les années 1980. Afin de prendre en compte ces révisions, le dernier échantillon 1948-1979 est également estimé dans sa publication de 1983. Cette date est reprise par Stekler pour effectuer une estimation supplémentaire,

permet-tant d’observer l’effet des révisions induites par un changement de base.

Après identification, Stekler retient la meilleure représentation du ILI et du FRB : un AR(2) est retenu pour le ILI et un ARMA(1,1) pour le FRB.

En gardant le début des échantillons inchangé, cela permet de mieux voir l’influence des révisions. Les résultats obtenus démontrent que les processus ARIMA ont de plus en plus de mal à s’ajuster aux données réelles, à force d’introduire des informations supplémentaires. En dépit de la robustesse des ARIMA, Stekler encourage les analystes à approfondir le sujet en appliquant cette même technique à d’autres variables économiques.

Athanasios Orphanides (1998), tente d’expliquer l’influence des révisions dans les mo-dèles de décisions de politiques monétaires. Il suppose que la révision de l’output peut être considérée comme un bruit venant entacher les données et l’estime par un processus AR(1). Le modèle de politiques monétaires est représenté par une équation de type courbe de Phillips.

Dans ses conclusions, il précise qu’il avait pris uniquement le cas où la révision des don-nées est considérée comme un bruit, non comme une innovation. Avec la mise en garde aux utilisateurs, sur quelles données utiliser et à quel moment elles sont publiées, car pouvant ne pas remettre en cause l’évolution de long terme des variables mais plutôt sur le court terme.

Dean Croushore et Charles L. Evans (2006), utilisent la modélisation vectorielle auto-régressive, pour montrer l’influence des révisions dans les réponses aux chocs d’offre dans l’activité économique. La modélisation VAR7comprend deux variables, l’offre de monnaie et le PIB réel. L’idée est de voir la sensibilité du modèle au fait de choisir des variables écono-miques sur la même période mais révisées à plusieurs reprises (le même échantillon mais à plusieurs versions). Il suffit pour répondre à cette question de voir la réaction des fonctions d’implusion-propagation (impluse response function) des chocs de monnaie, aux changements de données estimées à différents stages (révisées).

Les auteurs reprennent deux études similaires montrant les difficultés à cerner la réaction

aux chocs des variables estimées par la modélisation VAR en utilisant des données révisées. Les deux méthodes en question concernent :

Un premier modèle VAR de six variables de Christiano, Eichenbaum et Evans (1996). La matrice de passage est calculée en utilisant la décomposition de Choleski8. Les auteurs re-prennent ces études en choisissant des échantillons précis afin de voir la réaction de ces modèles en fonction d’une même période d’estimation mais sur des données issues de 4 publications dif-férentes ayant subi des révisions durant chaque publication. L’échantillon est le même, allant du premier trimestre de 1960 au troisième trimestre de 1983, pour 4 stages différents. Les gra-phiques des fonctions de réponses aux chocs sont différentes. Elles évoluent globalement de la même manière tendanciellement, mais d’amplitudes significativement différentes.

Le second modèle VAR de quatre variables est repris des travaux de Gali (1992). Il est es-timé sur le même échantillon que le premier modèle et utilise les mêmes séries révisées (quatre différentes). La matrice de passage a été identifiée en imposant des contraintes de long terme et de court terme (VAR structurel)9. Les chocs simulés pendant cette phase sont structurels. Comme pour la première estimation VAR, les chocs de monnaie répondent d’une manière dif-férente aux changements de données.

3.3 Influence de la révision des données sur les prévisions

Dans cette section, nous allons exposer chronologiquement en fonction de leur date de pa-rution, les études consacrées à l’effet des révisions sur les prévisions des données économiques. L’aspect chronologique de notre présentation permet de remarquer l’évolution progressivement des travaux effectués dans ce domaine.

Nous présenterons dans un premier temps les premières analyses comme celles de Rosanne

8. Matrice de passage triangulaire où la partie à droite de la diagonale est formée de zéros, qui permet l’esti-mation du modèle VAR.

9. On contraint la matrice de passage en annulant une partie de ses paramètres en se basant sur des hypothèses issues de la théorie économique. Si théoriquement une variable n’as pas d’influence sur une autre, on annule son coefficient correspondant dans la matrice de passage.

Cole (1969) reprise dans d’autres études apparues plus tard, basées essentiellement sur l’exé-cution de régressions linéaires simples, afin de tester l’effet progressif des différentes versions des séries sur leurs prévisions futures.

Nous terminerons par la suite en présentant des études plus récentes comme celles de Crou-shore (2005) qui exploite une base de données riche où toutes les versions de chaque variable clé de l’économie américaine sont empilées, ce qui permet de disposer d’une banque de don-née remarquable, que tout analyste pourra exploiter en vue d’analyser l’effet des révisions des données sur leurs prévisions futures.

3.3.1 Les premières tentatives

Rosanne Cole (1969), du NBER a consacré un ouvrage complet de plusieurs chapitres sur la performance des prévisions économiques. En plus de montrer toutes les étapes de conception des Comptes Nationaux américains, elle effectue une analyse de leurs révisions en se basant sur les relations linéaires entre les versions préliminaires et révisées des données. Son analyse est citée dans plusieurs articles consacrés au problème de la révision.

Toutes les versions estimées des comptes sont expliquées en montrant les mécanismes de leurs révisions périodiques étalées sur trois années, succédant à chaque période. Le processus de révision est formalisé sous forme d’un modèle linéaire qui met en relation les différentes séries de chaque variable, mettant en évidence leur impact sur les propriétés des modèles éco-nométriques et sur l’erreur de la prévision.

D’un point de vue descriptif, après avoir exposé les différentes variables constituant les Comptes Nationaux, Cole explore les caractéristiques de leur révision. Six versions pour chaque série sont décrites10 par calcul de statistiques usuelles sur un échantillon allant du second tri-mestre 1947 au quatrième tritri-mestre 1961. Cole compare les erreurs moyennes et leur évolution cyclique, avec un intérêt porté sur leurs changements de direction.

10. Les versions exploitées par Cole ont déjà été utilisées auparavant dans des études comme celle de Zellner (1958)

Les estimations de la corrélation des erreurs entre les différentes versions sont similaires aux techniques proposées par Zellner (1958) et Zarnowitz (1969), basées sur des estimations par les moindres carrés ordinaires de relations linaires entre les versions. Des statistiques d’erreur de prévision sont calculées afin de monter l’influence du choix de la version d’une série quand elle est préliminaire ou finalement révisée, dans la prévision des Comptes Nationaux.

Elle effectue des prévisions de la consommation des ménages selon plusieurs versions et compare ses résultats avec des prévisions de professionnels (business forecast). Cole aboutit à plusieurs résultats :

– les révisions peuvent être considérées comme une extrapolation d’erreurs. L’erreur in-duite dans l’estimation préliminaire du PIB et de ses composantes se répercute sur les