• Aucun résultat trouvé

Les incertitudes d’estimation des données économiques : la nature des erreurs

Les premières analyses descriptives de la révision des variables macroéconomiques

1.2 Origine des révisions

1.2.3 Les incertitudes d’estimation des données économiques : la nature des erreurs

La création de statistiques requiert des moyens considérables et engendre des coûts impor-tants qui peuvent décourager les intentions d’approcher avec précision les réalités économiques. De plus, ces statistiques reflètent une estimation de l’activité des entreprises et des institutions publiques, plus qu’elle ne reflètent la réalité d’un phénomène auquel un économiste s’intéres-serait. Ce sont des grandeurs ou des sous-produits issus des résultats de l’activité, basés sur des concepts et des définitions légaux plutôt qu’économiques. Pouvoir concilier la science écono-mique et ces concepts légaux, rend difficile la tâche du statisticien qui calcule les statistiques économiques et l’utilisateur final, qui souhaite mesurer un secteur donné, ou l’état de l’écono-mie d’une manière globale. D’autre part, les données économiques sont des séries temporelles, où un chiffre est analysé relativement à ses valeurs antérieures et sur des périodes longues. Le nombre important en masse de l’information, qui doit être cumulé périodiquement pour construire une statistique économique, rend extrêmement difficile la tâche d’un utilisateur qui souhaite remonter toutes les étapes de collecte et de définition, et de savoir comment les don-nées ont été obtenues dans le passé. Lorsque des erreurs sont commises dans plusieurs de ces étapes, il est difficile voire impossible d’identifier avec précision toutes les sources d’erreurs contenues dans les chiffres.

Si plusieurs analyses descriptives se sont consacrées à l’énumération des principales ori-gines qui conduisent les statisticiens à réviser les statistiques économiques, le Professeur Mor-genstern (1963) dans son ouvrage, détaille toutes les incertitudes sur leur précision, en étalant les erreurs que l’on peut commettre de la collecte d’information jusqu’à la constitution et la publication finale destinée aux utilisateurs.

[...]Les statistiques économiques sont souvent collectées non par des observateurs haute-ment formés mais par un personnel engagé pour l’occasion. Ceci est une source de la forme la plus sérieuse d’erreurs en masse.

[...] L’interdépendance entre la théorie, les mesures et la collecte des chiffres, devrait être aussi forte en économie qu’elle l’est en physique, mais nous sommes loin d’avoir atteint cet état. Il y a cependant de plus en plus d’indices que l’économie se déplace dans cette direction.

Ces deux extraits de l’ouvrage du Professeur Morgenstern (1963), résument à eux seuls un nombre important de sources d’erreurs qui peuvent être rencontrés à plusieurs niveaux. Nous pouvons résumer les origines des erreurs proposées par le Professeur selon les différents stades de la création des statistiques :

1. Lors de la collecte :

– des erreurs peuvent naitre à la source, lors de la collecte, car des milliers d’observateurs sont chargés de fournir des chiffres qui serviront à construire des agrégats macroéco-nomiques par la suite. La formation insuffisante ou l’inaptitude de ces observateurs à récolter ou à donner des réponses à des questions spécifiques, génèrent des erreurs qui peuvent même être cumulatives (refont la même erreur qui progressivement se cumule avec les erreurs précédentes de même nature). La complexité et la lourdeur de l’infor-mation à récolter nécessitent une expérience importante. L’observateur inexpérimenté chargé de collecter les données, commettra des erreurs, s’il ne connaît pas exactement à quel niveau une statistique devrait être enregistrée ;

– des vérités peuvent être occultées ce qui entraine des décalages avec la réalité. Nous citerons des exemples comme les fausses réponses aux enquêtes, le souhait d’échap-per à une fiscalité, ou même les gouvernements qui cachent l’information par souci stratégique avec leurs partenaires, adversaires ou concurrents, sinon quand il s’agit des secrets militaires.

2. Lors de la conception et la diffusion :

– les outils ainsi que les méthodes d’estimations peuvent être mal adaptés et génèrent par la suite une révision des données une fois la mise en place d’outils améliorés et/ou plus adaptés. La quantification des grandeurs économiques rend très difficile la tâche du statisticien qui y est destiné, ce qui le conduira irrémédiablement à mener des approches qui ne seront jamais dénuées de toute erreur de mesure, qu’elle que soit sa

nature ;

– les contraintes de définition et de classification des variables ne sont pas toujours en concordance avec les variables à construire ou à estimer. Ces contraintes peuvent à un moment donné remettre en cause le niveau d’un ou plusieurs agrégats macroéco-nomiques. Nous pouvons citer comme exemple l’enregistrement d’un produit ou d’un service dans une catégorie qui par la suite sera déplacé dans une autre, des définitions qui ne correspondent pas exactement aux données collectées pour construire les va-riables, ou bien, lorsqu’un nouveau produit est ajouté à d’autres, qui remet en question leur classification ;

– il arrive que le même phénomène qui est historiquement unique mais devant être in-terprété par des acteurs différents, à des endroits différents, ou alors qui utilisent des moyens différents, qui se retrouve en contradiction. Nous rencontrons souvent des cas où les mêmes grandeurs sont présentées par deux organismes de statistiques indépen-dants et non collaboratifs, qui diffusent chacun des chiffres différents ;

– les délais de diffusion courts sont souvent en décalage avec le temps consacré à la col-lecte d’information. Les statisticiens sont tenus de diffuser des données en respectant ces délais qui sont conditionnés par la périodicité des statistiques à construire, ce qui leur impose des estimations rapprochées entachées d’erreurs, qui ne peuvent être cor-rigées qu’à la suite de révisions successives, une fois l’information manquante rendue disponible.

Les origines des erreurs exposées par le Professeur Morgenstern (1963) permettent d’avoir une vision globale sur leur complexité, qui doit être intégrée dans toute analyse statistique. Il est nécessaire de connaître ces origines avant de pouvoir prétendre comprendre la nature et le comportement des erreurs contenues dans les variables. Même si l’on sait qu’actuellement, à plus d’un demi siècle plus tard (plus de soixante ans), que l’erreur par ses différentes natures -existe toujours et est difficilement mesurable, voire même pratiquement impossible à anticiper dans certains cas, il est possible de la réduire par une meilleure compréhension de toutes les conséquences inhérentes à ses origines diverses. Outre les erreurs dites irrégulières induites par des modifications exceptionnelles, où leur diminution est envisageable par une amélioration

des techniques de collecte et d’estimation, l’analyse et le traitement des erreurs dites régulières nécessitent une exploitation de méthodes économétriques avancées qui peuvent formaliser leur comportement au cours du temps. Cependant, plusieurs problèmes suscitent des interrogations sur les propriétés statistiques des erreurs périodiques compte tenu de leur complexité.

– Premièrement, si une erreur est mal identifiée, son cumul temporel conduit à des écarts importants entre les premières estimations des variables et leurs versions qui seront dif-fusées ultérieurement. Quel serait alors la méthode statistique qui pourrait formaliser son niveau ainsi que son évolution au cours du temps ?

– Deuxièmement, un problème concerne le cas où plusieurs erreurs à la fois de natures différentes pourraient affecter les séries macroéconomiques. Une préparation faite de plusieurs ingrédients mixés aura un aspect et une teneur qui lui est propre. Revenir en arrière pour tenter de séparer ces ingrédients relève parfois de l’impossible. Nous irons encore plus loin dans la difficulté quand nous ne connaissons pas au préalable le dosage de chaque ingrédient. Serait-il possible d’extraire une partie de l’erreur et de pouvoir anticiper son comportement ?

– Il arrive enfin que la révision résulte d’un effet de compensation des valeurs d’un même produit ou bien entre celles de deux produits. L’analyse temporelle et des relations entre produits permettent de déceler ces liaisons, pour les anticiper et réduire l’erreur dans les enregistrements.

1.3 Le processus de révision des Comptes Nationaux

Si les premières analyses se sont consacrées à énumérer les sources de révision des don-nées économiques, elles se sont complétées par la description de la nature de ces révisions. Les Comptes Nationaux sont directement concernés par ce phénomène à cause du nombre im-portant de sources de données ainsi que la lourdeur des calculs. Les Professeurs Kuznets et Morgenstern ont exploité deux versions des Comptes Nationaux américains apparues dans le SCB de juillet 1947. Une comparaison simple entre ces deux versions a permis de constater

des différences dans l’ampleur des écarts et dans les points de retournements. Dans la même lignée, des études plus avancées, basées essentiellement sur la même technique d’analyse des-criptive, exploitent non plus deux mais toutes les publications des Comptes Nationaux. Il s’agit de séries préliminaires et provisoires qui sont ensuite publiées "finalement"5sur une période de trois années. Des analyses comme celles de Zellner (1958) et Jaszi (1963) reprennent les mêmes techniques d’analyse statistique de la révision des comptes, reprises ensuite par Stekler (1967) et Young (1974) sur des périodes différentes.

1.3.1 Les Comptes Nationaux des Etats-Unis d’Amérique

Erreurs et incertitudes dans les Comptes Nationaux et analyse du processus de révision

Afin de décrire la nature des révisions qui affectent les Comptes Nationaux Américains, le Professeur Kuznets (1948) utilise une approche dite d’"avis d’experts", qui résume des informations importantes, plutôt que d’utiliser des méthodes de calcul complexes. Ces "avis d’experts" donnent des marges d’erreur de l’ordre de 20 % que Kuznets trouvait exagérées. Par conséquent, il estime qu’"une marge moyenne d’erreur sur les estimations de Revenu National d’environ 10 %, était raisonnable".

Au vu de ce constat, même si cette marge d’erreur est de l’ordre de 10 %, plus faible que celle constatée par les experts, le professeur Morgenstern rappelle que cet ordre de grandeur n’est pas pour autant négligeable et peut même s’avérer très important. 5 % du Revenu National américain représentait à l’époque 550 milliards de dollars. C’est plus que toute la production électronique américaine. 10 % dépasserait le budget total de la Défense Nationale de l’époque. Ces ordres de grandeurs montrent l’ampleur que pourrait atteindre l’erreur dans le Revenu Na-tional, d’autant plus qu’elle pourrait durant certaines périodes ou même à niveau désagrégé,

5. La notion de révision finale ici concerne le processus régulier qui affecte les variables, étalé sur trois an-nées, basé essentiellement sur les corrections régulières qui découlent des estimations des comptes par projection d’indicateurs, corrigés par la suite quand l’information manquante devient disponible. Cette révision n’est donc pas définitive en réalité, car d’autres révisions surviendront quand il s’agira de changements irréguliers ou excep-tionnels comme les changements de bases, de définitions ou de méthodes d’estimation.

dépasser largement ces seuils. Au vu des résultats d’analyse, Morgenstern considère que les séries révisées, à supposer qu’elles le soient correctement, ne sont pas systématiquement moins élevées que les séries préliminaires. Il arrive que les révisions soient plus fortes en passant d’une année à une autre et inversement sur une autre période. Les points de retournement éga-lement sont mal anticipés, car les variations constatées entre les séries préliminaires et les séries réviséeschangent de signe et ne sont jamais régulières. Néanmoins, Morgenstern estime qu’il est important de considérer ce problème et que des analyses plus avancées pourraient réduire les écarts entre les versions préliminaires et révisées.

L’information rudimentaire obtenue jusqu’ici sur les erreurs des statistiques de Revenu Na-tional montre que ces importantes statistiques ont tout particulièrement besoin d’améliorations décisives.

Notion de divergence statistique

Le Produit National Brut est calculé selon deux approches : une en termes de revenus, ou l’on somme les revenus de tous les facteurs de production (salaires, loyers, profits, intérêts nets, impôts indirects et provisions sur dépréciation du capital ainsi que d’autres quantités plus faibles), et une autre en termes de revenus dépensés (dépenses de consommation, investisse-ment privé, dépenses gouverneinvestisse-mentales et de l’investisseinvestisse-ment extérieur net). Il est supposé retrouver l’égalité parfaite entre les deux. Or, un compte supplémentaire apparaît afin d’équili-brer les comptes de la nation, intitulé divergence statistique ou discrepancy.

A.J. Gartaganis et A. S. Goldberg (1955), ont été parmi les premiers à analyser la di-vergence existant entre les deux approches, produit/dépenses, dans l’estimation des Comptes Nationaux, suivies de deux études analogues de Peter E. de Janosi (1961) et de F. Gerard Adams et Peter E. de Janosi (1966).

Gargatanis et al. ont tenté de comprendre le comportement de la divergence en effectuant des tests de normalité et d’autocorrélation ainsi de sa corrélation avec le Produit Intérieur Brut. Mise à part quelques années exceptionnelles, la divergence présentait une irrégularité avec un

changement de signe. Janosi (1961) et Janosi et al. (1966)6 ont effectué les mêmes analyses sur des échantillons plus importants et plus récents moyennant une application économétrique, et considèrent que cette divergence aurait tendance à diminuer une fois les comptes révisés.

Description des propriétés statistiques des processus de révision

Zellner (1958), après les études de Kuznets, Milton, Jaszi et Morgenstern, s’est intéressé à la description statistique et le comportement temporel des révisions, qui affectent les Comptes Nationauxaméricains. Il constate que ceux publiés dans le SCB sont provisoires. Ils subissent des révisions tous les mois de juillet, une année après l’année de leur première publication, considérés à ce moment-là comme étant des chiffres préliminaires.

Zellner analyse 16 des agrégats constituant les Comptes Nationaux, corrigés des variations saisonnières7, du second trimestre 1947 au quatrième trimestre 1955. À la suite de son ana-lyse, il définit trois erreurs de natures différentes qui peuvent être décelées en comparant les différentes estimations des Comptes Nationaux, préliminaires ensuite révisées :

1. Des erreurs en niveau. C’est une erreur d’estimation engendrée par le retard dans la collecte des données qui évolue de trimestre en trimestre, révisée au fur et à mesure que l’information devient de plus en plus complète.

2. Des erreurs en termes de variations. Zellner suppose qu’il est possible de se tromper d’un trimestre d’une année vers celui d’une autre année. Ceci implique une corrélation directe entre ces trimestres. En effet, si un trimestre est erroné, sa prochaine estimation aura pour objet de le corriger et le rendre plus proche de la réalité.

3. Et enfin, une erreur de changement de signe, dans le sens où il est possible que la donnée préliminaire soit relativement croissante alors que la donnée révisée du même point soit décroissante, et inversement.

6. Une même analyse est effectuée concernant les Comptes Nationaux Annuels et Trimestriels, en dollars courants et en dollars constants par D. J. Smyth (1964).

7. Zellner aurait préféré analyser les séries brutes afin de prendre en compte la modification temporelle des coefficients saisonniers, qui pourrait provoquer des révisions non négligeables, mais qui n’étaient pas publiées dans le SCB à ce moment-là.

Afin de décrire et de quantifier le comportement du processus de révisions entachant les Comptes Nationaux Trimestriels, Zellner calcule les erreurs moyennes absolues | ¯e| d’estima-tion entre les données préliminaires et révisées, leur pourcentage ainsi que leur écart-type. Où l’erreur d’une série pendant une même période i est définie par : ei= |Pi− Ri|. Avec Pila version préliminairedu Compte et Risa version révisée.

Dans la majorité des cas, les données préliminaires sont inférieures aux données révisées. Les erreurs moyennes absolues sont de 1.1 % (3 milliard de dollars) pour le PNB8, avec un écart-type de 2.4 milliards, pouvant atteindre les 10 % voire plus concernant des séries plus désagrégées.

Zellner calcule ensuite le nombre de points de retournements mal estimés. Cinq trimestres de signes différents concernent le PNB. Ce nombre de points sera plus important en ce qui concerne les autres séries désagrégées. Ce constat délicat remet en cause la fiabilité des pre-mières estimations des Comptes Nationaux dans le sens où elles risqueraient de donner une information erronée sur l’évolution de la croissance économique américaine. Ces chiffres pré-liminairesannonceraient par exemple une récession alors que ce n’est pas le cas.

L’analyse de Zellner porte sur une dizaine d’années (moins de 40 points), sur des séries corrigées des variations saisonnières. Il sera donc impossible de prendre en compte la révision des données induite par la révision des coefficients saisonniers. Néanmoins, elle montrera l’im-portance du phénomène de révisions car les estimations préliminaires pourraient conduire à fausser la réalité de la situation ainsi que la croissance économique américaine.

D’autres études comme celles de Zellner ont été présentées dans le cadre d’une conférence internationale9 consacrée aux problèmes de la fiabilité des Comptes Nationaux, où plusieurs intervenants de pays différents ont exposé les mécanismes de leurs révisions :

1. Jaszi (1963) aborde le problème des révisions des Comptes Nationaux américains dans un article qui présente des résultats similaires à ceux trouvés par Zellner. En tant

qu’ac-8. Produit National Brut.

teur actif dans l’élaboration des techniques d’estimations des Comptes Nationaux au sein du BEA10, Jaszi a tenté de répondre aux remarques faites par le professeur Kuznets, quant à leur fiabilité ainsi que leur continuité dans le temps. Son étude porte sur le calcul de statistiques descriptives des différentes versions publiées dans le SCB. Il exploite les parutions des Comptes Trimestriels, corrigés des variations saisonnières, sur la période 1947-1961.

Comme pour l’analyse descriptive de Zellner, Jaszi aboutit aux mêmes constats, sur les différences importantes entre les premières estimations préliminaires et leurs révisions. Jaszi trouve néanmoins qu’il y a une amélioration dans la phase de collecte des données, car l’écart entre les séries préliminaires et révisées avait tendance à baisser au cours du temps. Cette amélioration est le fruit d’une sensibilisation des statisticiens du BEA concernant la fiabilité des données, comme réponse aux exigences des décideurs poli-tiques américains. Il constate que la parution du SCB de 1958, les révisions présentaient de meilleures caractéristiques que celles publiées précédemment de ce même périodique. 2. K. D. ARNDT (1963), effectue une analyse de l’ampleur des révisions pour les Comptes Trimestrielsallemands (Allemagne de l’ouest) de 1950 à 1961. Les données brutes sont exprimées en valeur. La première publication des Comptes Trimestriels de l’Allemagne de l’ouest avait débuté en 1950 et la période d’estimation allait jusqu’en 1963. Arndt décèle d’importantes erreurs d’estimation avec beaucoup de mauvaises anticipations dans les changements de directions quand on comparait les séries préliminaires et les séries révisées.

3. E. Niitamo (1963), pour les Comptes Trimestriels de la Finlande sur la période 1953-1960, expose dans le détail la manière dont les Comptes finlandais sont estimés ensuite révisés11. Il traite également le problème de la correction des variations saisonnières et des jours ouvrables et de leur influence dans les estimations des séries trimestrielles. En conclusion, Niitamo met l’accent sur les techniques d’estimations pouvant être remises en cause afin d’améliorer les résultats.

4. S. A. Goldberg, H. J. Adler, J. D. Randall, et P. S. Suuga (1963), présentent la révision

10. Jaszi a dirigé le BEA durant les années soixante-dix.

des Comptes canadiens de 1953 à 1960. Les mêmes constats seront observés que ceux rencontrés chez les autres auteurs des autres pays à savoir des révisions importantes et des mauvaises anticipations dans les séries préliminaires des points de retournements.

Considérée comme étant une étude de référence, l’analyse de Zellner a été également reprise par Stekler (1967), où il considère 12 des 16 agrégats trimestriels américains analysés par Zellner et effectue cette analyse sur la période du premier trimestre 1956 au premier trimestre 1964. Cela permet de voir d’une part une évolution globale du phénomène des révisions sur une période plus importante allant du second trimestre 194712au premier trimestre 1964. Cela