Le problème de la révision des données statistiques : le cas des données douanières mensuelles du commerce extérieur français

(1)

ECONOMIE, ORGANISATIONS, SOCIÉTÉ

Doctorat en Sciences économiques

Zohir MELZI

LE PROBLÈME DE LA RÉVISION DES DONNÉES

STATISTIQUES :

LE CAS DES DONNÉES DOUANIÈRES MENSUELLES DU

COMMERCE EXTÉRIEUR FRANÇAIS

Soutenue, le 14/12/2012

Professeur Raymond COURBIS, Université Paris Ouest-Nanterre La Défense., Directeur

Professeur Bernard FUSTIER,Université Pasquale Paoli, Corte, Rapporteur

(2)

(3)

(4)

(5)

(6)

(7)

Au cours de mes travaux de recherche et de récolte d’informations, j’ai contacté ensuite rencontré de nombreuses personnes dans des institutions publiques, comme la Direction Géné-rale des Douanes et Droits Indirects et la Banque de France. En plus des discussions que nous avons menées qui concernaient directement l’objet de mes recherches, j’ai pu comprendre avec leur contribution les différentes méthodes d’élaboration des variables macroéconomiques, en particulier celles du commerce extérieur.

Au niveau de la Direction Générale des Douanes et Droits Indirects, j’ai pu rencontrer ma-dame Isabelle Vial, que je remercie sincèrement pour son accueil avec toute son équipe. Je me suis déplacé à plusieurs reprises au sein des locaux de la DGDDI et j’ai reçu toute l’attention de la part de madame Vial, ce qui m’a permis de mener à bien mon projet de reconstituer une rétrospective longue des nouvelles séries mensuelles du commerce extérieur et de comprendre tous les mécanismes de leur collecte et de leur constitution.

Je remercie monsieur Roland Ricart, chef de département de statistiques à la Banque de France, pôle Balance des Paiements. Une entrevue avec monsieur Ricart m’a permis de com-prendre les méthodes d’élaboration de la Balance des Paiements, notamment le poste "Ser-vices" exportés et importés.

Je tiens à remercier également Messieurs les Professeurs, Bernard Fustier et Michel Ter-raza. Monsieur Fustier par son intérêt porté au sujet, m’a donné des idées sur la manière de synthétiser les différents points abordés dans la thèse. Monsieur Terraza a pour sa part exposé de nombreuses critiques, afin d’améliorer certains points abordés dans la thèse. Sa lecture mi-nutieuse m’a permis de corriger sur la forme certaines omissions, ainsi que des améliorations concernant les différents tests et calculs effectués.

Je remercie mon directeur, Monsieur le Professeur Raymond Courbis, qui au fil des dis-cussions, m’a convaincu de l’intérêt pouvant être porté à un sujet nouveau comme la révision des données macroéconomiques. Mes remerciements lui sont adressés également, pour m’avoir soutenu lors de mes travaux de recherche avec tous ses encouragements.

Je tiens enfin à remercier les membres du GAMA, plus particulièrement David Perreira, ainsi que Rodolphe Buda qui par son intérêt au sujet que je traite, n’a pas cessé de m’encoura-ger, tout en me proposant des astuces et des morceaux de programmes LA_{TEX, ce qui m’a permis}

de gagner du temps lors de la compilation de ma thèse.

Z. M Clichy, le 28 décembre 2012

(8)

(9)

qu’elle soit périodique ou non. La première partie, retrace la littérature qui aborde la problématique de la révi-sion des données, où nous exposons les principaux résultats dans la description statistique du phénomène dès les premières analyses, en les confrontant aux études plus récentes, afin de reconnaître son évolution. Nous exposons à la fois les résultats obtenus dans la prédictibilité du processus de révision, en détaillant toutes les techniques de modélisation ainsi que toutes les variables macroéconomiques qui sont concernées par ce phénomène, et son in-fluence dans l’amélioration de la qualité de la prévision et des techniques de modélisation. La deuxième partie est consacrée aux séries mensuelles du commerce extérieur de la France, concernées par le phénomène de la révision des données. Nous décrivons les propriétés statistiques de la révision périodique de nos variables d’intérêt, en appliquant nos analyses à une base de données importante, retraçant l’évolution historique selon une ancienne et une nouvelle classifications. Nous nous exerçons ensuite dans une troisième et dernière partie, à pouvoir prédire le processus régulier de la révision, pour exploiter ces résultats dans l’amélioration de la qualité de la prévision à court terme.

Mots clés : Révision des données, modèles ARIMA, prévision macroéconomique, commerce extérieur, Écono-métrie.

Summary

-In this thesis, we tackle the problem of data revision. The nonfinal character of the macroecono-mic statistics is analyzed, of kind to being able to identify the various aspects of their revision, that it is periodic or not. The first part recalls the literature which approaches the problems of data revision, where we expose the principal results in the statistical description of the phenomenon as of the first analyses, by confronting them with the more recent studies, in order to recognize its evolution. We expose at the same time, the results obtained in the predictibility of the process of revision, by detailing all the techniques of modeling as all the macroeconomic variables which are concerned by this phenomenon, and its influence in the improvement of quality of the fore-cast and the techniques of modeling. The second part will relate to the monthly series of foreign trade of France, concerned with the phenomenon of data revision. We describe the statistical properties of the periodic revision of our variables of interest, by applying our analyses to an important database, recalling the historical evolution according to an old and a new classifications. We are exerted then in a third and last part, to be able to predict the regular process of revision, for exploiting these results in the improvement of the quality of short-term forecasts. Key-words : Data révision, ARIMA Models, macroeconomic forecasting, international trade, Econometrics. JEL classification : C01, C15, C22, C82, F17

(10)

(11)

Introduction Générale 5

I

Les différentes analyses de la révision des données des variables

macroéconomiques : une revue de la littérature

15

1 Les premières analyses descriptives de la révision des variables macroéconomiques 19

Bibliographie du premier chapitre 51

2 Les développements récents de l’analyse descriptive des processus de révision 55 Annexe 2 : Informations générales sur la révision des données économiques 107

Bibliographie du deuxième chapitre 111

3 Effets des révisions sur la modélisation et la prévision macroéconomiques 117

Bibliographie du troisième chapitre 159

4 Les techniques de modélisation et de prévision des processus de révision 165 Annexe 3-4 : Analyse de séries temporelles : quelques rappels et définitions 203

Bibliographie du quatrième chapitre 217

II

Les données : analyse et description de la révision des séries du

commerce extérieur

223

5 Collecte et estimation des données du commerce extérieur de la France 227 Annexe 5.A : Documentation sur la révision des séries du commerce extérieur 269 Annexe 5.B : Anticipations des révisions des statistiques douanières par l’INSEE 275

Bibliographie du cinquième chapitre 279

6 Présentation des données mensuelles des Douanes pour le commerce extérieur

français 281

(12)

Annexe 6.A : Statistiques descriptives des séries mensuelles du commerce

exté-rieur selon la nomenclature de synthèse NES 16 339

Annexe 6.B : Programmes informatiques pour la construction et le traitement

statistique des données du commerce extérieur 371

Annexe 6.C : Programmes de tests de stabilité des données du commerce extérieur389

Bibliographie du sixième chapitre 399

7 Reconstitution d’un rétrospectif des 13 dernières versions des principaux agré-gats des flux d’exportations et d’importations françaises 401

Annexe 7.A : Statistiques descriptives des séries mensuelles du commerce exté-rieur selon la nouvelle nomenclature en vigueur, la NAF-CPF Rév.2 (17 agrégats) 445

Annexe 7.B : Programmes SQL pour l’interrogation de bases de données 473

III

La prévision du processus de révision et son intégration dans un

modèle de prévision des séries du commerce extérieur

479

8 Analyse de la corrélation des révisions des données du commerce extérieur 483 Annexe 8.A : Distribution de la loi de probabilité des séries de révision des

produits du commerce extérieur 539

Annexe 8.B : Analyse de la corrélation des révisions des données du commerce

extérieur par régression linéaire 565

Bibliographie du huitième chapitre 583

9 Détection d’un effet saisonnier et d’effets de calendrier dans les révisions des

données du commerce extérieur 585

Annexe 9 : Programmes d’analyse de la saisonnalité et des effets de calendrier

par régression linaire 623

Bibliographie du neuvième chapitre 631

10 Prévision du processus de révision des données du commerce extérieur 633 Annexe 10 : Résultats statistiques et graphiques de la prévision des processus de révision à 24 mois des produits du commerce extérieur 695 11 Analyse des résultats de la prévision des données du commerce extérieur avec et

sans prise en compte des révisions statistiques 719

Bibliographie des dixième et onzième chapitres 771

Conclusion générale 773

(13)

Liste des tableaux 791

(14)

(15)

Si avec les travaux de J. Tinbergen (1939) pour les Pays-Bas et - plus tard - pour les États-Unis, la modélisation économétrique a débuté dans les années trente, son essor date véritable-ment des années soixante. L’utilisation de ces techniques, essentiellevéritable-ment basées sur l’interpré-tation de corrélations empiriques entre les variables, a rencontré ses premières difficultés avec le problème de pouvoir concilier la mathématique et la réalité économique. Si la confrontation de la théorie aux applications empiriques repose sur des hypothèses fortes qui peuvent s’éloi-gner de la réalité, elle permet néanmoins de trouver des réponses plausibles rapprochées, qui permettent de donner un fil conducteur sur lequel nous pouvons nous appuyer, pour définir les politiques économiques à mener et pour anticiper le futur.

À ces problèmes, s’ajoutent en outre les délais d’obtention des données statistiques, même si ceux-ci sont devenus progressivement au fil du temps, de plus en plus réduits. Le pas des modèles macroéconométriques est passé à partir des années soixante, de l’annuel au trimes-triel et l’accent est mis de plus en plus sur le très court terme. Ceci nécessite une réduction des délais d’obtention des données. Les pouvoirs publics ont commencé dès la première moi-tié du vingtième siècle - notamment aux États-Unis d’Amérique -, à mettre plus de pression sur les organismes statistiques, pour leur fournir rapidement les données. Ceci a raccourci pro-gressivement les opérations de collecte et d’obtention des données, où il est devenu impossible dans certains cas, sinon dans un nombre important de cas, de pouvoir disposer de l’information complète qui va permettre de construire ces statistiques.

(16)

Suite à cette contrainte, les statistiques périodiques sont publiées sous une forme non défi-nitive : elles sont soit estimées par rapprochement avec des indicateurs et calées sur les données de périodicité annuelle de même nature, soit publiées telles quelles, en attendant la disponibi-lité de l’information manquante. Ainsi, régulièrement, les statistiques subissent des révisions visant à les corriger des erreurs commises durant les périodes précédentes.

La révision est une préoccupation récente, qui explique l’intérêt porté par les théoriciens et les praticiens (statisticiens, macro-économistes, analystes, conjoncturistes, prévisionnistes) au cours de ces vingt dernières années, où nous retrouvons de plus en plus de publications et de recherches à ce sujet. Si la modélisation économétrique existe depuis les années 1930, il aura fallu près de quarante ans avant de commencer à s’intéresser à ce problème crucial de la révision des données.

L’ampleur des révisions peut progressivement se cumuler et atteindre des valeurs très importantes, biaisant ainsi l’évolution des variables économiques. Si nous considérons par exemple les séries du commerce extérieur de la France (qui font l’objet de nos recherches), leur révision porte sur 36 mois. Elle peut atteindre des valeurs importantes, qu’on peut estimer en moyenne à 3 % environ, mais qui peut atteindre les 4 à 5 % dans certains cas. La non-prise en compte de ce biais pratiquement toujours négatif, conduit à une vision erronée et systéma-tiquement pessimiste de la tendance des séries du commerce extérieur. Il est donc essentiel de comprendre le comportement du processus régulier des révisions systématiques des séries du commerce extérieur, afin de pouvoir anticiper leur évolution et de réduire ce biais.

"Qui numerare incipit Errare Incipit"1 : cette citation du célèbre homme de chiffres le Professeur O. Morgenstern (1963), résume toutes les critiques qu’on peut adresser au système statistique et à la collecte des données, à leur construction et à leur diffusion. L’erreur qui correspond à l’écart entre les valeurs observées et les données progressivement révisées, peut avoir des origines variées selon la phase dans laquelle chaque variable est construite, sinon se-lon sa nature. On ne peut donc pas déterminer avec certitude les valeurs réelles des variables

1. "Celui qui commence à compter, commence à se tromper" Oskar Morgenstern, (Octobre, 1963), Ed. Fortune, N. 68, 143 pages.

(17)

macroéconomiques. Il est néanmoins possible de pouvoir les améliorer de manière à réduire cette erreur. Tout repose sur le problème d’identification de la nature des révisions afin de pou-voir déceler ses parties prévisibles et proposer une, sinon plusieurs techniques, qui permettent de réduire le biais systématique qui existe dans les variables économiques concernées par ce problème.

L’objet de notre thèse, est de prendre les séries du commerce extérieur de la France, comme un exemple de variables macroéconomiques affectées d’un processus progressif des révisions. Nous définirons ce processus après l’avoir identifié, en décrivant son ampleur et son évolution temporelle. Nous montrerons qu’il est possible de l’anticiper et l’exploiter comme information supplémentaire, qui permette d’améliorer la qualité des données.

La première partie de notre étude, a pour objet de présenter les études les plus importantes, qui retracent toutes celles consacrées simplement à décrire le phénomène de la révision et celles plus avancées, disposant de plus de recul, qui présentent des techniques de modélisation utili-sées de part et d’autre, soit dans l’explication du phénomène de la révision et de son influence sur la prévision, soit dans la capacité des modèles économétriques à pouvoir l’anticiper.

Les deux premiers chapitres (chapitres 1 et 2) décrivent respectivement les premières ana-lyses descriptives (qui ont posé le problème), et celles, plus récentes, qui viennent compléter les premières, car disposant de plus d’information pour pouvoir comparer l’évolution de la révision des données :

– il s’agira dans un premier temps d’identifier les principales raisons et origines qui conduisent à réviser les données, pour ensuite décrire statistiquement leur ampleur ainsi que leur évolution ;

– nous exposerons par la suite, les analyses descriptives plus récentes, qui montrent com-ment le phénomène de la révision a évolué depuis les premiers résultats à des études plus actuelles, profitant d’une information plus importante et des historiques plus longs, ainsi que le progrès technique notamment en informatique, qui a permis de disposer de plus de possibilités et d’un gain de temps dans les traitements ;

(18)

– l’analyse de la révision sera détaillée selon les secteurs étudiés. En effet, selon les va-riables choisies, le comportement et la nature des révisions peuvent différer selon les cas traités.

Les deux chapitres suivants (chapitres 3 et 4), sont consacrés aux études qui dépassent le caractère purement descriptif et qui se penchent sur la révision des données, comme une information qui influe sur la modélisation et sur la prévision.

Nous nous intéressons dans le troisième chapitre aux conséquences des révisions sur les estimations, quand nous utilisons une version d’une série économique plutôt qu’une autre :

– la première question a pour objet l’effet des révisions sur la modélisation économétrique. Si pour une même série sur la même période ses valeurs venaient à changer - à être ré-visées -, ce changement serait d’une telle importance qu’il pourra modifier à la fois la spécification des modèles utilisés et les résultats des estimations (coefficients et statis-tiques) de ces mêmes modèles ;

– la seconde question concerne l’effet direct sur les résultats de prévision, qui seront dif-férents selon les versions utilisées des séries à prévoir ; nous verrons qu’une partie im-portance de l’erreur de prévision, trouve précisément ses origines dans la révision des données économiques.

Si les chapitres précédents présentent les études qui décrivent la révision des données, celles présentées dans le quatrième chapitre, s’interrogent sur la capacité des différentes techniques de modélisation économétrique, à pouvoir prévoir les révisions futures avant leur diffusion :

– dans un premier temps, nous exposerons toutes les techniques de modélisation qui per-mettent d’appréhender les révisions. Elles peuvent concerner d’une part leur description et d’autre part, l’anticipation de ses valeurs futures, avec l’exploitation des différentes combinaisons possibles des versions des séries économiques. Si nous disposons d’une base de données qui permet de reconstituer l’historique de toutes les versions d’une -ou plusieurs - série(s) pendant une période précise, il est alors possible d’effectuer des simulations "temps-réel" et de comparer les résultats des estimations ;

(19)

– une section de ce chapitre sera consacrée à la possibilité de prévoir les valeurs futures du processus de révision. Plusieurs techniques de modélisation ainsi que des combinaisons différentes selon les cas traités, seront comparées afin de répondre à la question fonda-mentale, qui consiste à pouvoir anticiper les révisions et réduire l’erreur de prévision des variables qui les concernent.

La seconde partie a pour objet de décrire les caractéristiques des séries mensuelles du commerce extérieur de la France, utilisées dans la thèse comme exemple de variables éco-nomiques affectées par un processus de révision. Nous exposerons leur constitution ainsi que les différentes étapes qui nous ont permis de construire une base de données des révisions. Nous analyserons par la suite les propriétés statistiques de ces révisions, de manière à pouvoir comprendre leur ampleur ainsi que leur comportement au cours du temps.

Dans le cinquième chapitre, nous décrirons les différentes étapes de collecte et de constitu-tion des données, des trois organismes statistiques en France :

– la Direction Générale des Douanes et Droits Indirects collecte et publie les séries du commerce extérieur et mène sa propre politique de révision. Il s’agit uniquement des échanges internationaux de biens ; les services ne sont pas concernés ;

– la Banque de France pour élaborer la Balance des Paiements, exploite plusieurs infor-mations comme les enquêtes et utilise entre autre les échanges de biens fournis par les Douanes pour construire la rubrique afférente, en plus des autres branches, comme les échanges de services et les mouvements de capitaux ;

– l’INSEE utilise de son coté les séries du commerce extérieur pour construire les données des Comptes Nationaux français (trimestriels et annuels), relatifs au commerce extérieur. La méthodologie de travail (comme pour les Douanes et la BdF) sera présentée en détail.

Le sixième chapitre est consacré aux travaux que nous avons effectués pour la constitution de la base de données, qui regroupe toutes les 36 versions de chacun des produits du commerce extérieur, sur un échantillon globalement important. La fiabilité des tests et trai-tements statistiques ainsi que la prévision, reposent sur des échantillons relativement grands.

(20)

Les méthodes de désaisonnalisation sont basées sur l’application successive de plusieurs filtres moyennes mobiles, qui érodent un nombre important des observations de la série à traiter. Les logiciels de référence qui regroupent les deux techniques appliquées dans tous les organismes à travers le monde, la méthode Census X12 et Tramo-Seat, recommandent des échantillons de huit à dix ans, voire plus pour que les résultats qui en découlent soient fiables.

Cette exigence oblige à collecter les séries mensuelles du commerce extérieur en temps-réel, mois par mois, pendant plus de dix ans. La Direction Générale des Douanes et Droits Indirectsne sauvegarde en effet les données pour lesquelles le grand public a accès, que pour treize des publications de chaque série du commerce extérieur ; elle propose des CD-ROM comme support de sauvegarde. Nous étions donc obligés de sauvegarder et empiler toutes les séries étalées sur une longue période, dépassant les dix années.

– une première étape consiste à décrire les étapes de constitution, qui décrit en même temps les caractéristiques des données affectées par un processus de révisions ;

– une seconde étape consiste à décrire statistiquement la révision des données, où nous cal-culons des statistiques usuelles qui nous donneront un nombre important d’informations, sur l’ampleur et l’évolution des révisions des séries mensuelles du commerce extérieur. Nous analyserons également la rupture possible de la tendance des séries mensuelles du commerce extérieur en fin de période, à cause de leurs révisions, en effectuant différents tests classiques de stabilité.

Le septième chapitre de cette seconde partie sera entièrement consacré à la constitution d’une rétrospective, de toutes les séries de révisions des séries du commerce extérieur, à la suite d’une modification importante qui a remis en cause toute la classification et les valeurs des données. L’harmonisation des systèmes statistiques à un niveau européen, voire mondial, a contraint les organismes statistiques français à reconsidérer les données. Nous avons dû de ce fait, exploiter pas moins de 120 CD-ROM (mis obligeamment à notre disposition par les Douanes), afin de reconstituer les séries de révisions basées sur la nouvelle classification.

(21)

De la même manière que dans le sixième chapitre, afin de décrire les révisions à la suite de cette modification des données, nous calculerons des statistiques descriptives et constaterons les éventuels changements que ces données auraient pu subir.

Une troisième et dernière partie est consacrée à la possibilité d’exploiter les résultats ob-tenus dans les parties précédentes, quant à l’appréhension de l’évolution du processus de révi-sion, afin de l’intégrer comme information supplémentaire qui améliore la qualité de la prévi-sion des séries mensuelles du commerce extérieur.

Dans le huitième chapitre, nous analyserons les propriétés statistiques des processus de révision et la corrélation entre différentes combinaisons des révisions.

1. nous étudierons dans un premier temps, la distribution de la loi de probabilité de chaque série de révision, en fonction de sa position dans le processus de 36 mois. Les premières révisions les plus importantes, seront essentiellement analysées et décrites, afin d’aboutir à des conclusions sur les lois qui régissent leur comportement au cours du temps ; 2. en ce qui concerne la corrélation des séries de révisions, il s’agit d’identifier les relations

pouvant exister entre une série de révisions pour un mois donné et celles qui la précèdent. Pour ce faire, nous effectuerons un nombre important de régressions linéaires, afin de traiter le maximum de cas possibles et pouvoir in fine, exploiter ces relations pour une meilleure anticipation des processus.

Le neuvième chapitre est consacré aux tests et à l’analyse de la saisonnalité et des effets de calendrier dans les processus de révision. Leur caractère périodique (car diffusés mensuelle-ment), amène à s’interroger sur l’existence de ces phénomènes temporels, qui peuvent de ce fait aider à contrôler une partie importante de leur variation au cours du temps. Une fois présentées, nous appliquerons différentes méthodes de désaisonnalisation et de traitements d’effets calen-daires sur ces séries. Nous effectuerons également dans ce chapitre, une analyse et un traitement des valeurs aberrantes qui par leur caractère atypique, chahutent fortement nos séries.

(22)

L’amélioration de la qualité des prévisions des séries mensuelles du commerce extérieur sera traitée dans les deux derniers chapitres. Nous exploiterons des techniques de modélisation temporelle basées sur les modèles ARIMA, ainsi que les méthodes avancées de désaisonnali-sation et de filtrage des séries, afin de prévoir à la fois les séries de révisions et les données elles-mêmes du commerce extérieur.

La prise de conscience de l’INSEE de l’existence d’un biais systématique et des révisions successives des données de base du commerce extérieur, l’a conduit à anticiper ces révisions grâce à une approche économétrique simple, de manière à ne pas biaiser l’évolution récente des chiffres du commerce extérieur dans les Comptes Nationaux Trimestriels. Ces analyses ont été présentées dans un document de travail interne, que nous exposerons au chapitre 5.

Depuis janvier 2004, la Direction Générale des Douanes et Droits Indirects - en collabora-tion avec l’INSEE -, anticipe régulièrement les révisions des données du commerce extérieur en utilisant une méthode de ré-échantillonnage, que nous présenterons en détail également au chapitre 5.

Après analyse du document de travail de l’INSEE paru en 1998, nous avions de notre coté dès le début envisagé d’anticiper les révisions. En effet, leur comportement au cours du temps, conduit à penser qu’il était possible d’appliquer des techniques de modélisation temporelle et de prévision. Nous avons décomposé ces séries et nous avons constaté qu’elles étaient affectées d’un mouvement saisonnier et d’une tendance à une décroissance sur le long terme. Après la grande étape consacrée à l’analyse descriptive des processus de révision des données du commerce extérieur et celle destinée à plusieurs traitements statistiques comme l’analyse de la corrélation, la détection de ruptures de tendance et la corrélation des révisions, une autre partie est totalement consacrée à prévoir d’abord les révisions, pour ensuite effectuer une comparaison des prévisions des données du commerce extérieur elles-mêmes, avec ou sans intégration des révisions.

Nous exploiterons les nouvelles techniques de désaisonnalisation et de projection future dans le dixième chapitre, afin de les comparer à la méthode en vigueur utilisée actuellement

(23)

par la Direction Générale des Douanes et Droits Indirects. Les résultats obtenus satisfaisants, confortent la possibilité d’anticipation des révisions futures des séries du commerce extérieur et encouragent tout utilisateur intéressé, à exploiter d’autres techniques de modélisation afin d’améliorer la qualité des données.

Ces résultats de prévision seront directement exploités par la suite dans le onzième et der-nier chapitredans une prévision de court terme, également basée sur les mêmes techniques de prévision et de filtrage, afin de comparer les résultats en temps réel, sans la prise en considéra-tion de la prévision des révisions, en utilisant les données telles qu’elles seraient disponibles au moment de l’exécution de la prévision et celles avec l’intégration de la prévision des révisions, comme information supplémentaire.

Une conclusion générale regroupera les discussions sur la possibilité d’améliorer la qualité des données, par l’appréhension des processus de révision qui affectent les séries mensuelles du commerce extérieur français. Un bilan du travail effectué et des résultats obtenus seront exposés et complétés par la proposition de pistes de recherche, ainsi que des prolongements, afin d’encourager les utilisateurs - comme les conjoncturistes et les statisticiens -, à prendre en compte l’analyse de la révision pour améliorer la qualité et la fiabilité des données qu’ils pourront utiliser.

(24)

(25)

Les différentes analyses de la révision des

données des variables macroéconomiques :

une revue de la littérature

(26)

(27)

vue de la littérature, les études qui ont concerné la révision des

données économiques.

Nous verrons dans un premier temps les analyses descriptives qui

montrent pourquoi les organismes statistiques sont obligés de

ré-viser les données, pour ensuite conclure sur une description de

ces révisions, en sachant qu’elles sont intrinsèquement liées à la

fois à la collecte préalable de l’information et à la construction

des variables économiques.

Nous verrons par la suite que si les premières études ont concerné

la description du phénomène, des questions plus avancées ont

pro-gressivement émergé, sur l’influence de ces révisions sur la

modé-lisation et sur la prévision des variables. La littérature riche dans

ce domaine, permet d’aborder le sujet sous plusieurs angles, à la

fois concernant les différentes techniques de modélisation et les

différentes variables affectées.

(28)

(29)

Les premières analyses descriptives de la

révision des variables macroéconomiques

1.1 Introduction

Durant les années trente, l’analyse économique a connu un bouleversement dès lors que les Présidents des États-Unis d’Amérique, Hoover et Roosevelt, avaient décidé de mener des politiques pour combattre la situation de crise, survenue à la suite de la Grande dépression de 1929. Il fallait disposer d’indicateurs de l’activité, pour quantifier la situation économique et d’éviter des interprétations flouées par des suppositions hypothético-déductives. Le Department of Commerce avait désigné le Professeur Kuznets (1934) du National Bureau of Economic Research, pour développer des statistiques représentatives de l’économie américaine. À la tête d’une équipe du NBER, le Professeur Kuznets avait réussi à construire les premières estimations du Revenu National, présentées dans un rapport au Sénat en 1934. Ces estimations retracent le Revenu National - ainsi que quelques unes de ses principales composantes - sur la période 1929 - 19321.

1. Il s’en est suivi un ouvrage complet détaillant les approches ainsi que les méthodes d’estimations de ces variables. S. Kuznets, National Income And Its Composition, pp. 501-537.

(30)

Ce travail a été salué par toute la communauté politique et scientifique mais n’avait pas pour autant pu éviter l’œil critique d’experts, car ce fut le début de longues discussions sur la capacité d’un chiffre estimé à refléter de manière fiable l’état de l’économie. Les premières dis-cussions reviennent à Milton et Jaszi (1948), directement concernés par la question, signalant des erreurs d’estimations contenues dans les chiffres.

Suite à une modification des méthodes d’estimation, le Department of Commerce publie pour la première fois dans son périodique Survey of Current Business, consacré aux Comptes de la Nation, un numéro spécial en juillet 1947 qui présente les statistiques du Revenu National pour la période 1929-1946. Le Revenu National, le Produit National Brut et leurs principales composantes sont proposées en périodes trimestrielle et annuelle, exprimées en dollars cou-rants. Dans ce même numéro, nous retrouvons deux versions de ces comptes, découlant d’une ancienne méthode d’estimation et d’une autre plus récente, afin de montrer les modifications qu’ont pu subir les estimations en passant d’une version à l’autre.

Kuznets reprend les chiffres publiés et précise que des erreurs pouvaient effectivement exis-ter, mais que la plus grande part revenait non pas essentiellement à des erreurs d’estimation, mais plutôt à des modifications méthodologiques et à la définition des variables, par l’ajout de nouvelles grandeurs qui ne faisaient pas partie de l’information utilisée auparavant. Les Comptes Nationaux subissent des révisions et toute la question repose sur la possibilité de ré-duire les erreurs des estimations. Il faut donc identifier la nature de cette erreur, à travers une analyse approfondie de son caractère périodique - ou non -, ainsi que ses différentes origines.

Le professeur Oskar Morgenstern (1963), est le premier qui dans son ouvrage, "On the ac-curacy of economic observations"2 traite d’une manière explicite du problème de la fiabilité des données. Il remet en cause le pouvoir d’une statistique à refléter d’une manière précise une situation économique. Morgenstern retrace toutes les origines des différentes erreurs que contient l’estimation des variables économiques, en citant des exemples parlants qui montrent que durant sa période d’analyse, plusieurs incertitudes persistaient sur les Comptes Nationaux

2. La première édition de l’ouvrage, date de 1950. Il existe une traduction en français de ce livre : Précision et incertitude des données économiques. Cet ouvrage de référence est toujours d’actualité, car la critique de la précision des séries macroéconomiques, est à ce jour suivie avec intérêt.

(31)

américains et les échanges extérieurs. Il est en revanche conscient de la possibilité d’améliorer la qualité des données à mesure que le système statistique qui régit la fabrication des statis-tiques, considéré d’une manière globale, pourra s’améliorer au fil du temps à cause des gains de performances générés par l’apprentissage des statisticiens, par des techniques de collecte et de diffusion de l’information plus performantes et par l’amélioration des méthodes d’estima-tion.

Avant de pouvoir expliquer (dans les chapitres 3 et 4) les mécanismes et les effets des révi-sions, nous verrons dans le premier chapitre les premières analyses qui ont permis d’identifier ce phénomène, en décrivant dans un premier temps ses origines et analyser statistiquement son ampleur et son évolution au cours du temps.

La deuxième section de ce chapitre aura pour objet de citer les origines des erreurs dans les variables économiques, essentiellement présentées d’une manière détaillée dans les travaux du Professeur O. Morgenstern (1963). La compréhension du problème implique en effet l’iden-tification préalable des raisons qui amènent les organismes statistiques à réviser les données.

La troisième section concernera les études des économistes précurseurs, qui ont exposé le phénomène des révisions comme un problème inhérent à la fiabilité des données. Nous aborde-rons les questions posées sur la nature et l’ampleur des révisions dans les comptes américains les plus avancés de l’époque, qui ont probablement été le point de départ pour d’autres expé-riences à travers le monde. Nous exposerons ensuite, les analyses relatives aux comptes fran-çais et nous verrons qu’elles retrouvent des similitudes comparées aux analyses américaines. Quelques études particulières attireront notre attention comme les travaux de Stekler (1967) et Stekler et al. (1968), qui ont tenté d’analyser les révisions des variables à fréquence mensuelle, qui sont utilisées comme des indicateurs servant à estimer les Comptes Trimestriels. En effet, la révision des indicateurs impliquerait celle des Comptes Nationaux.

(32)

1.2 Origine des révisions

Plusieurs origines conduisent les organismes statistiques à réviser les données macroéco-nomiques. Nous pouvons les classer en deux grands groupes :

– des révisions périodiques, qui interviennent à intervalles réguliers (mois, trimestre, an-née), afin de corriger des erreurs qui concernent l’évolution des données : les données sont révisées pour corriger des erreurs3commises antérieurement.

– des révisions non périodiques, qui interviennent lorsque des mises à jour, qui s’imposent à la suite de modifications nouvelles.

1.2.1 Les révisions périodiques

Les révisions peuvent dépendre de phénomènes d’ajustement et d’enrichissement de don-nées. Ce sont des révisions routinières qui résultent essentiellement de retards d’enregistre-ments des entreprises pendant une période, qui sont rajoutés les périodes suivantes4. Par exemple, les informations fiscales des entreprises ne peuvent être totalement disponibles qu’en fin d’exercice une fois l’année écoulée. Le statisticien est contraint d’effectuer des estimations approchées afin de diffuser les statistiques en respectant les délais de diffusion.

D’autres révisions régulières existent lorsqu’il s’agit de traitements statistiques périodiques comme la correction des variations saisonnières. Les organismes statistiques corrigent les va-riables des effets saisonniers, de sorte à pouvoir les filtrer, pour en extraire une tendance plus facilement interprétable. Les contraintes imposées dans les modèles économétriques font que les coefficients saisonniers ne soient pas définitifs. Un seul point ajouté dans une série modifiera

3. La notion d’erreur ici est assez ambiguë car elle est considérée comme telle d’un point de vue calculatoire. Une mauvaise estimation engendre une erreur certes, mais une part importante contenue dans cette erreur revient à un enrichissement des données, à cause des délais courts qui obligent les statisticiens à les diffuser sans que l’information complète ne soit totalement disponible.

4. Le statisticien chargé d’estimer une variable sera confronté à un arbitrage entre attendre le temps que toutes les informations nécessaires à son estimation soient disponibles et la périodicité de la variable en question, qui conditionne sa diffusion.

(33)

toute la saisonnalité estimée. Les développements récents en informatique ainsi que l’améliora-tion des techniques de désaisonnalisal’améliora-tion, permettent actuellement aux organismes statistiques de corriger les coefficients plus rapidement, tous les trimestres en général, alors que la correc-tion se déroulait une fois par an précédemment. Ainsi, une partie de la révision des variables estimées revient à la révision périodique de leurs coefficients saisonniers.

1.2.2 Les révisions non périodiques

D’autres raisons conduisent à réviser les variables "exceptionnellement". Plusieurs raisons peuvent en être la cause, comme l’intégration des économies dans une communauté où l’on souhaite harmoniser le système statistique des pays membres et demander une classification générale commune et comparable à toutes les variables. L’harmonisation des systèmes sta-tistiques peut intervenir à un niveau mondial, par la classification des variables économiques selon des nomenclatures proposées par des organismes comme le Fonds Monétaire Internatio-nalou bien l’Organisation des Nations Unies. Les changements de définition, de concepts et des méthodes d’estimations, conduisent également à réviser les variables économiques.

Les changements de basesmodifient les données notamment lorsqu’elles sont reconsidérées conceptuellement et que la nouvelle base remet en cause les anciennes valeurs afin de garantir leur actualisation. Ces modifications qui interviennent sur le moyen et long termes, peuvent conduire à des travaux lourds de calcul de rétrospectives longues (dix ans en général), afin de mettre à jour des estimations anciennes, devenues obsolètes. L’homogénéité des données ainsi que leur cohérence, sont les éléments privilégiés par les statisticiens et les comptables nationaux, quand il s’agira d’effectuer des analyses conjoncturelles, d’effectuer des prévisions et/ou simuler des politiques économiques. Cette priorité oblige les statisticiens à effectuer des arbitrages décisifs, qui conditionnent le comportement d’un processus de révision au cours du temps.

(34)

1.2.3 Les incertitudes d’estimation des données économiques : la nature

des erreurs

La création de statistiques requiert des moyens considérables et engendre des coûts impor-tants qui peuvent décourager les intentions d’approcher avec précision les réalités économiques. De plus, ces statistiques reflètent une estimation de l’activité des entreprises et des institutions publiques, plus qu’elle ne reflètent la réalité d’un phénomène auquel un économiste s’intéres-serait. Ce sont des grandeurs ou des sous-produits issus des résultats de l’activité, basés sur des concepts et des définitions légaux plutôt qu’économiques. Pouvoir concilier la science écono-mique et ces concepts légaux, rend difficile la tâche du statisticien qui calcule les statistiques économiques et l’utilisateur final, qui souhaite mesurer un secteur donné, ou l’état de l’écono-mie d’une manière globale. D’autre part, les données économiques sont des séries temporelles, où un chiffre est analysé relativement à ses valeurs antérieures et sur des périodes longues. Le nombre important en masse de l’information, qui doit être cumulé périodiquement pour construire une statistique économique, rend extrêmement difficile la tâche d’un utilisateur qui souhaite remonter toutes les étapes de collecte et de définition, et de savoir comment les don-nées ont été obtenues dans le passé. Lorsque des erreurs sont commises dans plusieurs de ces étapes, il est difficile voire impossible d’identifier avec précision toutes les sources d’erreurs contenues dans les chiffres.

Si plusieurs analyses descriptives se sont consacrées à l’énumération des principales ori-gines qui conduisent les statisticiens à réviser les statistiques économiques, le Professeur Mor-genstern (1963) dans son ouvrage, détaille toutes les incertitudes sur leur précision, en étalant les erreurs que l’on peut commettre de la collecte d’information jusqu’à la constitution et la publication finale destinée aux utilisateurs.

[...]Les statistiques économiques sont souvent collectées non par des observateurs haute-ment formés mais par un personnel engagé pour l’occasion. Ceci est une source de la forme la plus sérieuse d’erreurs en masse.

(35)

[...] L’interdépendance entre la théorie, les mesures et la collecte des chiffres, devrait être aussi forte en économie qu’elle l’est en physique, mais nous sommes loin d’avoir atteint cet état. Il y a cependant de plus en plus d’indices que l’économie se déplace dans cette direction.

Ces deux extraits de l’ouvrage du Professeur Morgenstern (1963), résument à eux seuls un nombre important de sources d’erreurs qui peuvent être rencontrés à plusieurs niveaux. Nous pouvons résumer les origines des erreurs proposées par le Professeur selon les différents stades de la création des statistiques :

1. Lors de la collecte :

– des erreurs peuvent naitre à la source, lors de la collecte, car des milliers d’observateurs sont chargés de fournir des chiffres qui serviront à construire des agrégats macroéco-nomiques par la suite. La formation insuffisante ou l’inaptitude de ces observateurs à récolter ou à donner des réponses à des questions spécifiques, génèrent des erreurs qui peuvent même être cumulatives (refont la même erreur qui progressivement se cumule avec les erreurs précédentes de même nature). La complexité et la lourdeur de l’infor-mation à récolter nécessitent une expérience importante. L’observateur inexpérimenté chargé de collecter les données, commettra des erreurs, s’il ne connaît pas exactement à quel niveau une statistique devrait être enregistrée ;

– des vérités peuvent être occultées ce qui entraine des décalages avec la réalité. Nous citerons des exemples comme les fausses réponses aux enquêtes, le souhait d’échap-per à une fiscalité, ou même les gouvernements qui cachent l’information par souci stratégique avec leurs partenaires, adversaires ou concurrents, sinon quand il s’agit des secrets militaires.

2. Lors de la conception et la diffusion :

– les outils ainsi que les méthodes d’estimations peuvent être mal adaptés et génèrent par la suite une révision des données une fois la mise en place d’outils améliorés et/ou plus adaptés. La quantification des grandeurs économiques rend très difficile la tâche du statisticien qui y est destiné, ce qui le conduira irrémédiablement à mener des approches qui ne seront jamais dénuées de toute erreur de mesure, qu’elle que soit sa

(36)

nature ;

– les contraintes de définition et de classification des variables ne sont pas toujours en concordance avec les variables à construire ou à estimer. Ces contraintes peuvent à un moment donné remettre en cause le niveau d’un ou plusieurs agrégats macroéco-nomiques. Nous pouvons citer comme exemple l’enregistrement d’un produit ou d’un service dans une catégorie qui par la suite sera déplacé dans une autre, des définitions qui ne correspondent pas exactement aux données collectées pour construire les va-riables, ou bien, lorsqu’un nouveau produit est ajouté à d’autres, qui remet en question leur classification ;

– il arrive que le même phénomène qui est historiquement unique mais devant être in-terprété par des acteurs différents, à des endroits différents, ou alors qui utilisent des moyens différents, qui se retrouve en contradiction. Nous rencontrons souvent des cas où les mêmes grandeurs sont présentées par deux organismes de statistiques indépen-dants et non collaboratifs, qui diffusent chacun des chiffres différents ;

– les délais de diffusion courts sont souvent en décalage avec le temps consacré à la col-lecte d’information. Les statisticiens sont tenus de diffuser des données en respectant ces délais qui sont conditionnés par la périodicité des statistiques à construire, ce qui leur impose des estimations rapprochées entachées d’erreurs, qui ne peuvent être cor-rigées qu’à la suite de révisions successives, une fois l’information manquante rendue disponible.

Les origines des erreurs exposées par le Professeur Morgenstern (1963) permettent d’avoir une vision globale sur leur complexité, qui doit être intégrée dans toute analyse statistique. Il est nécessaire de connaître ces origines avant de pouvoir prétendre comprendre la nature et le comportement des erreurs contenues dans les variables. Même si l’on sait qu’actuellement, à plus d’un demi siècle plus tard (plus de soixante ans), que l’erreur par ses différentes natures -existe toujours et est difficilement mesurable, voire même pratiquement impossible à anticiper dans certains cas, il est possible de la réduire par une meilleure compréhension de toutes les conséquences inhérentes à ses origines diverses. Outre les erreurs dites irrégulières induites par des modifications exceptionnelles, où leur diminution est envisageable par une amélioration

(37)

des techniques de collecte et d’estimation, l’analyse et le traitement des erreurs dites régulières nécessitent une exploitation de méthodes économétriques avancées qui peuvent formaliser leur comportement au cours du temps. Cependant, plusieurs problèmes suscitent des interrogations sur les propriétés statistiques des erreurs périodiques compte tenu de leur complexité.

– Premièrement, si une erreur est mal identifiée, son cumul temporel conduit à des écarts importants entre les premières estimations des variables et leurs versions qui seront dif-fusées ultérieurement. Quel serait alors la méthode statistique qui pourrait formaliser son niveau ainsi que son évolution au cours du temps ?

– Deuxièmement, un problème concerne le cas où plusieurs erreurs à la fois de natures différentes pourraient affecter les séries macroéconomiques. Une préparation faite de plusieurs ingrédients mixés aura un aspect et une teneur qui lui est propre. Revenir en arrière pour tenter de séparer ces ingrédients relève parfois de l’impossible. Nous irons encore plus loin dans la difficulté quand nous ne connaissons pas au préalable le dosage de chaque ingrédient. Serait-il possible d’extraire une partie de l’erreur et de pouvoir anticiper son comportement ?

– Il arrive enfin que la révision résulte d’un effet de compensation des valeurs d’un même produit ou bien entre celles de deux produits. L’analyse temporelle et des relations entre produits permettent de déceler ces liaisons, pour les anticiper et réduire l’erreur dans les enregistrements.

1.3 Le processus de révision des Comptes Nationaux

Si les premières analyses se sont consacrées à énumérer les sources de révision des don-nées économiques, elles se sont complétées par la description de la nature de ces révisions. Les Comptes Nationaux sont directement concernés par ce phénomène à cause du nombre im-portant de sources de données ainsi que la lourdeur des calculs. Les Professeurs Kuznets et Morgenstern ont exploité deux versions des Comptes Nationaux américains apparues dans le SCB de juillet 1947. Une comparaison simple entre ces deux versions a permis de constater

(38)

des différences dans l’ampleur des écarts et dans les points de retournements. Dans la même lignée, des études plus avancées, basées essentiellement sur la même technique d’analyse des-criptive, exploitent non plus deux mais toutes les publications des Comptes Nationaux. Il s’agit de séries préliminaires et provisoires qui sont ensuite publiées "finalement"5sur une période de trois années. Des analyses comme celles de Zellner (1958) et Jaszi (1963) reprennent les mêmes techniques d’analyse statistique de la révision des comptes, reprises ensuite par Stekler (1967) et Young (1974) sur des périodes différentes.

1.3.1 Les Comptes Nationaux des Etats-Unis d’Amérique

Erreurs et incertitudes dans les Comptes Nationaux et analyse du processus de révision

Afin de décrire la nature des révisions qui affectent les Comptes Nationaux Américains, le Professeur Kuznets (1948) utilise une approche dite d’"avis d’experts", qui résume des informations importantes, plutôt que d’utiliser des méthodes de calcul complexes. Ces "avis d’experts" donnent des marges d’erreur de l’ordre de 20 % que Kuznets trouvait exagérées. Par conséquent, il estime qu’"une marge moyenne d’erreur sur les estimations de Revenu National d’environ 10 %, était raisonnable".

Au vu de ce constat, même si cette marge d’erreur est de l’ordre de 10 %, plus faible que celle constatée par les experts, le professeur Morgenstern rappelle que cet ordre de grandeur n’est pas pour autant négligeable et peut même s’avérer très important. 5 % du Revenu National américain représentait à l’époque 550 milliards de dollars. C’est plus que toute la production électronique américaine. 10 % dépasserait le budget total de la Défense Nationale de l’époque. Ces ordres de grandeurs montrent l’ampleur que pourrait atteindre l’erreur dans le Revenu Na-tional, d’autant plus qu’elle pourrait durant certaines périodes ou même à niveau désagrégé,

5. La notion de révision finale ici concerne le processus régulier qui affecte les variables, étalé sur trois an-nées, basé essentiellement sur les corrections régulières qui découlent des estimations des comptes par projection d’indicateurs, corrigés par la suite quand l’information manquante devient disponible. Cette révision n’est donc pas définitive en réalité, car d’autres révisions surviendront quand il s’agira de changements irréguliers ou excep-tionnels comme les changements de bases, de définitions ou de méthodes d’estimation.

(39)

dépasser largement ces seuils. Au vu des résultats d’analyse, Morgenstern considère que les séries révisées, à supposer qu’elles le soient correctement, ne sont pas systématiquement moins élevées que les séries préliminaires. Il arrive que les révisions soient plus fortes en passant d’une année à une autre et inversement sur une autre période. Les points de retournement éga-lement sont mal anticipés, car les variations constatées entre les séries préliminaires et les séries réviséeschangent de signe et ne sont jamais régulières. Néanmoins, Morgenstern estime qu’il est important de considérer ce problème et que des analyses plus avancées pourraient réduire les écarts entre les versions préliminaires et révisées.

L’information rudimentaire obtenue jusqu’ici sur les erreurs des statistiques de Revenu Na-tional montre que ces importantes statistiques ont tout particulièrement besoin d’améliorations décisives.

Notion de divergence statistique

Le Produit National Brut est calculé selon deux approches : une en termes de revenus, ou l’on somme les revenus de tous les facteurs de production (salaires, loyers, profits, intérêts nets, impôts indirects et provisions sur dépréciation du capital ainsi que d’autres quantités plus faibles), et une autre en termes de revenus dépensés (dépenses de consommation, investisse-ment privé, dépenses gouverneinvestisse-mentales et de l’investisseinvestisse-ment extérieur net). Il est supposé retrouver l’égalité parfaite entre les deux. Or, un compte supplémentaire apparaît afin d’équili-brer les comptes de la nation, intitulé divergence statistique ou discrepancy.

A.J. Gartaganis et A. S. Goldberg (1955), ont été parmi les premiers à analyser la di-vergence existant entre les deux approches, produit/dépenses, dans l’estimation des Comptes Nationaux, suivies de deux études analogues de Peter E. de Janosi (1961) et de F. Gerard Adams et Peter E. de Janosi (1966).

Gargatanis et al. ont tenté de comprendre le comportement de la divergence en effectuant des tests de normalité et d’autocorrélation ainsi de sa corrélation avec le Produit Intérieur Brut. Mise à part quelques années exceptionnelles, la divergence présentait une irrégularité avec un

(40)

changement de signe. Janosi (1961) et Janosi et al. (1966)6 ont effectué les mêmes analyses sur des échantillons plus importants et plus récents moyennant une application économétrique, et considèrent que cette divergence aurait tendance à diminuer une fois les comptes révisés.

Description des propriétés statistiques des processus de révision

Zellner (1958), après les études de Kuznets, Milton, Jaszi et Morgenstern, s’est intéressé à la description statistique et le comportement temporel des révisions, qui affectent les Comptes Nationauxaméricains. Il constate que ceux publiés dans le SCB sont provisoires. Ils subissent des révisions tous les mois de juillet, une année après l’année de leur première publication, considérés à ce moment-là comme étant des chiffres préliminaires.

Zellner analyse 16 des agrégats constituant les Comptes Nationaux, corrigés des variations saisonnières7, du second trimestre 1947 au quatrième trimestre 1955. À la suite de son ana-lyse, il définit trois erreurs de natures différentes qui peuvent être décelées en comparant les différentes estimations des Comptes Nationaux, préliminaires ensuite révisées :

1. Des erreurs en niveau. C’est une erreur d’estimation engendrée par le retard dans la collecte des données qui évolue de trimestre en trimestre, révisée au fur et à mesure que l’information devient de plus en plus complète.

2. Des erreurs en termes de variations. Zellner suppose qu’il est possible de se tromper d’un trimestre d’une année vers celui d’une autre année. Ceci implique une corrélation directe entre ces trimestres. En effet, si un trimestre est erroné, sa prochaine estimation aura pour objet de le corriger et le rendre plus proche de la réalité.

3. Et enfin, une erreur de changement de signe, dans le sens où il est possible que la donnée préliminaire soit relativement croissante alors que la donnée révisée du même point soit décroissante, et inversement.

6. Une même analyse est effectuée concernant les Comptes Nationaux Annuels et Trimestriels, en dollars courants et en dollars constants par D. J. Smyth (1964).

7. Zellner aurait préféré analyser les séries brutes afin de prendre en compte la modification temporelle des coefficients saisonniers, qui pourrait provoquer des révisions non négligeables, mais qui n’étaient pas publiées dans le SCB à ce moment-là.

(41)

Afin de décrire et de quantifier le comportement du processus de révisions entachant les Comptes Nationaux Trimestriels, Zellner calcule les erreurs moyennes absolues | ¯e| d’estima-tion entre les données préliminaires et révisées, leur pourcentage ainsi que leur écart-type. Où l’erreur d’une série pendant une même période i est définie par : ei= |Pi− Ri|. Avec Pila version

préliminairedu Compte et Risa version révisée.

Dans la majorité des cas, les données préliminaires sont inférieures aux données révisées. Les erreurs moyennes absolues sont de 1.1 % (3 milliard de dollars) pour le PNB8, avec un écart-type de 2.4 milliards, pouvant atteindre les 10 % voire plus concernant des séries plus désagrégées.

Zellner calcule ensuite le nombre de points de retournements mal estimés. Cinq trimestres de signes différents concernent le PNB. Ce nombre de points sera plus important en ce qui concerne les autres séries désagrégées. Ce constat délicat remet en cause la fiabilité des pre-mières estimations des Comptes Nationaux dans le sens où elles risqueraient de donner une information erronée sur l’évolution de la croissance économique américaine. Ces chiffres pré-liminairesannonceraient par exemple une récession alors que ce n’est pas le cas.

L’analyse de Zellner porte sur une dizaine d’années (moins de 40 points), sur des séries corrigées des variations saisonnières. Il sera donc impossible de prendre en compte la révision des données induite par la révision des coefficients saisonniers. Néanmoins, elle montrera l’im-portance du phénomène de révisions car les estimations préliminaires pourraient conduire à fausser la réalité de la situation ainsi que la croissance économique américaine.

D’autres études comme celles de Zellner ont été présentées dans le cadre d’une conférence internationale9 consacrée aux problèmes de la fiabilité des Comptes Nationaux, où plusieurs intervenants de pays différents ont exposé les mécanismes de leurs révisions :

1. Jaszi (1963) aborde le problème des révisions des Comptes Nationaux américains dans un article qui présente des résultats similaires à ceux trouvés par Zellner. En tant

qu’ac-8. Produit National Brut.

(42)

teur actif dans l’élaboration des techniques d’estimations des Comptes Nationaux au sein du BEA10, Jaszi a tenté de répondre aux remarques faites par le professeur Kuznets, quant à leur fiabilité ainsi que leur continuité dans le temps. Son étude porte sur le calcul de statistiques descriptives des différentes versions publiées dans le SCB. Il exploite les parutions des Comptes Trimestriels, corrigés des variations saisonnières, sur la période 1947-1961.

Comme pour l’analyse descriptive de Zellner, Jaszi aboutit aux mêmes constats, sur les différences importantes entre les premières estimations préliminaires et leurs révisions. Jaszi trouve néanmoins qu’il y a une amélioration dans la phase de collecte des données, car l’écart entre les séries préliminaires et révisées avait tendance à baisser au cours du temps. Cette amélioration est le fruit d’une sensibilisation des statisticiens du BEA concernant la fiabilité des données, comme réponse aux exigences des décideurs poli-tiques américains. Il constate que la parution du SCB de 1958, les révisions présentaient de meilleures caractéristiques que celles publiées précédemment de ce même périodique. 2. K. D. ARNDT (1963), effectue une analyse de l’ampleur des révisions pour les Comptes Trimestrielsallemands (Allemagne de l’ouest) de 1950 à 1961. Les données brutes sont exprimées en valeur. La première publication des Comptes Trimestriels de l’Allemagne de l’ouest avait débuté en 1950 et la période d’estimation allait jusqu’en 1963. Arndt décèle d’importantes erreurs d’estimation avec beaucoup de mauvaises anticipations dans les changements de directions quand on comparait les séries préliminaires et les séries révisées.

3. E. Niitamo (1963), pour les Comptes Trimestriels de la Finlande sur la période 1953-1960, expose dans le détail la manière dont les Comptes finlandais sont estimés ensuite révisés11. Il traite également le problème de la correction des variations saisonnières et des jours ouvrables et de leur influence dans les estimations des séries trimestrielles. En conclusion, Niitamo met l’accent sur les techniques d’estimations pouvant être remises en cause afin d’améliorer les résultats.

4. S. A. Goldberg, H. J. Adler, J. D. Randall, et P. S. Suuga (1963), présentent la révision

10. Jaszi a dirigé le BEA durant les années soixante-dix.

(43)

des Comptes canadiens de 1953 à 1960. Les mêmes constats seront observés que ceux rencontrés chez les autres auteurs des autres pays à savoir des révisions importantes et des mauvaises anticipations dans les séries préliminaires des points de retournements.

Considérée comme étant une étude de référence, l’analyse de Zellner a été également reprise par Stekler (1967), où il considère 12 des 16 agrégats trimestriels américains analysés par Zellner et effectue cette analyse sur la période du premier trimestre 1956 au premier trimestre 1964. Cela permet de voir d’une part une évolution globale du phénomène des révisions sur une période plus importante allant du second trimestre 194712au premier trimestre 1964. Cela permet d’autre part, de comparer deux analyses avec pratiquement la même approche sur deux historiques différents mais qui présentent un nombre d’observations similaire13 et voir ainsi l’évolution des révisions sur ces deux périodes.

Stekler porte plus son intérêt sur l’utilisation des données par les prévisionnistes et ne se soucie pas - comme Zellner - de la première erreur en niveau des trimestres. Il prend en compte uniquement les points de retournement et les erreurs dans la variation des estimations. Elles s’avèrent être plus importantes pour un prévisionniste, qui risqueraient de compromettre ses résultats de prévision.

Toutes les données sont publiées dans le SCB et la publication d’un trimestre apparaît deux mois plus tard, à la date de la publication du périodique. Comme les révisions s’effectuent tous les mois de juillet, un prévisionniste se retrouvera avec 11 mois non encore révisés donc sus-ceptibles d’être modifiés. Notons également qu’en plus des révisions des trimestres de l’année précédant la publication du SCB, la révision peut affecter les séries en remontant plus loin dans leurs historiques.

Les données préliminaires donnent pratiquement le même nombre de points de retourne-ments mal anticipés que les données provisoires14 mais avec un biais moindre. Nous nous

12. L’étude de Zellner portait sur la période du second trimestre 1947 au quatrième trimestre 1955. 13. 33 trimestres pour Zellner et 32 pour Stekler.

14. Ce sont des données intermédiaires découlant d’estimations qui seront par la suite révisées et publiées au mois de juillet de l’année n+1, n étant l’année du trimestre considéré.

(44)

retrouvons globalement avec le même souci de fiabilité, dans le sens où les séries "finalement" révisées sont mal anticipées par ces estimations préliminaires et provisoires. Stekler, beaucoup plus optimiste que Morgenstern, qui lui avait effectué une critique plus sévère concernant la construction des variables macroéconomiques, arrive à la conclusion que les estimations des révisions se sont améliorées au fil du temps et qu’il était possible de les utiliser comme infor-mation pour effectuer des prévisions de la tendance, en expliquant que l’erreur de la prévision ne soit pas réellement pénalisante, comme Morgenstern le prétendait. Utilisant les mêmes mé-thodes comparatives que Zellner, Stekler trouve finalement que sur une période plus récente, les révisions se sont améliorées présentant des erreurs moindres entre les séries préliminaires et celles révisées.

En complément des analyses précédentes, Allan H. Young (1974), effectue une analyse de révisions assez avancée sur une période plus récente. Après avoir exposé d’une manière ex-plicite les erreurs engendrées par la confrontation des méthodes d’estimation des profits des entreprises, il met en évidence le processus de révisions des Comptes Nationaux américains sur la période trimestrielle 1964-1971. Young compare ses résultats avec ceux obtenus par Jaszi (1963) et Cole (1969). Il en résulte une similarité sur les deux périodes comparées, sur la moyenne des erreurs, leur changement de signe et sur leur dispersion. De même que pour Stek-ler (1967), Young constate également que la révision des Comptes Nationaux s’est améliorée dans le temps.

Description du processus de révisions des indicateurs de l’économie américaine

H. O. Stekler ET Susan W. Burch (1968) tentent d’approfondir l’analyse descriptive des révisions en se penchant sur les estimations des indicateurs mensuels, qui servent de base pour l’estimation des Comptes Trimestriels. Ils trouvent intéressant d’analyser la révision des indi-cateurs mensuels afin d’améliorer la qualité des Comptes Trimestriels, traitée d’une manière globale sans dissocier les différentes origines15.

(45)

Les ventes en détail, la variation de stocks de biens intermédiaires et de l’activité dans le commerce ainsi que l’emploi hors secteur agricole, trois séries corrigées des variations saison-nières, sont analysées sur la période 1957-1965. Les deux premières séries sont directement utilisées dans l’estimation des Comptes Nationaux et la série de l’emploi est utilisée comme un bon indicateur sans que celle-ci n’intervienne directement dans l’estimation. Les auteurs calculent la différence entre les taux de variations des séries, de trois versions mensuelles des trois indicateurs. Ils comparent ensuite le niveau de l’erreur d’estimation en niveau, ainsi que le nombre de points de retournement mal anticipés. Ils arrivent concluent que les séries finalisées seraient meilleures que les séries préliminaires. Le prévisionniste qui utilise des indicateurs mensuels pour anticiper l’évolution des Comptes Trimestriels aura donc plus intérêt à prendre les séries révisées que les séries préliminaires. La fiabilité de ces indicateurs sera donc favo-rable à des délais de diffusion plus longs.

Stekler et Stekler (1979), seront les premiers à changer de registre et appliquer l’analyse descriptive du processus de révision des séries macroéconomiques en étudiant ce phénomène sur les flux de transactions internationales, à savoir, les échanges de marchandises ainsi que les flux de capitaux, corrigés des variations saisonnières. En calculant les écarts entre séries préliminaireset révisées, Stekler et al. constatent que :

– Les exportations et les importations de marchandises sont plus révisées que les capitaux entrants/sortants.

– Les révisions s’améliorent au fur et à mesure que la collecte des données est complétée par l’information tardive manquante des entreprises.

– Les écarts entre les séries préliminaires et révisées exprimées en brut sont moins im-portants que ceux des séries CVS : la révision permanente des coefficients saisonniers augmente l’amplitude des révisions.

(46)

Erreurs et incertitudes dans les données du commerce extérieur

Identifier les erreurs entachant les statistiques est une chose. Pouvoir les quantifier selon leur nature en est une autre. La difficulté est d’autant plus importante quand il s’agira de séries temporelles, ce qui est le cas de toutes les variables clés de la macroéconomie. En effet le comptable national (ou le statisticien spécialisé) doit estimer les variables économiques. Il en résulte que les erreurs seraient de plus en plus complexes dans le sens où leur caractère temporel pourrait rendre difficile leur compréhension. Morgenstern (1963) expose les erreurs qui peuvent affecter les différents secteurs de l’activité économique. Dans son analyse, il expose tous les problèmes rencontrés dans les statistiques du chômage, des prix, de l’activité agricole ainsi que d’autres secteurs. Il prête une attention particulière aux statistiques du Commerce Extérieur et aux statistiques du Revenu National. Il compare les statistiques des pays partenaires deux à deux et constate des disparités importantes dans les enregistrements.

Il est à noter qu’un pays ne possède pas systématiquement la même classification que son pays partenaire. Les montants des exportations pour l’un sont différents des importations de l’autre parce que enregistrées dans des agrégats différents. En plus de la différence dans la classification, il arrive également à ce que de nouveaux produits fassent leur apparition et qui ne soient pas encore reconnus à part entière par un des pays partenaires, donc comptabilisés chez l’un mais pas - encore - chez l’autre.

Des erreurs peuvent survenir quand il s’agit de rétention d’information et de mensonges stratégiques. Nous ne verrons pas apparaître une complémentarité comptable dans une tran-saction entre deux pays quand il s’agit pour l’un ou l’autre de ne pas souhaiter diffuser les montants exacts de la transaction en question. De plus, la complexité ainsi que le nombre très important d’enregistrements découlant de plusieurs sources ajoute à cela une difficulté dans la déclaration et par la suite la comptabilisation des opérations. Un exemple simple mais parlant est représenté dans le tableau 1.1 qui décrit les disparités entre les importations et les expor-tations du commerce mondial global. Les exporexpor-tations à un niveau mondial doivent égaler les importations. Or, le tableau montre des différences significatives entre ces deux flux globaux.