• Aucun résultat trouvé

Chapitre troisième : Possibilité d'utilisation pratique de l'information sectorielle

A DAFSA-PRO ®

La seule donnée sectorielle contenue dans la base de données DAFSA-PRO® est le chiffre d'affaires12. Cette situation résulte vraisemblablement des obligations légales françaises selon lesquelles seule cette donnée doit être désagrégée. La base prévoit une répartition du chiffre d'affaires en secteurs d'activité et secteurs géographiques avec un historique maximum de cinq exercices.

Au delà de cette information, la base fournit les communiqués de presse émis par les entreprises pour l'exercice écoulé. Dans ces communiqués, on trouve parfois la décomposition sectorielle d'autres variables. Enfin la base présente une description détaillée de l'activité, des ressources et de l'historique de l'entreprise. Ces rubriques comportent de nombreuses informations sectorielles. Toutefois, ces informations ne sont

9

La version étudiée est celle d'avril 1997.

10

La version étudiée est celle de février 1997.

11

Notre propos n'est pas de juger la qualité des bases de données étudiées mais d'évaluer l'opportunité d'utiliser ces bases dans le cadre de l'information sectorielle, plutôt que les rapports annuels.

12

pas standardisées. Elles ne peuvent donc être utilisées dans le cadre d'un traitement automatique et global des données.

La comparaison entre les informations sectorielles des rapports annuels des 53 entreprises citées dans l'annexe 2 (page 411) et celles de la base de données montre que :

 les informations contenues dans la base peuvent être issues des comptes ou de la partie textuelle du rapport ;

 dans la base, le chiffre d'affaires est parfois décomposé en moins de secteurs que dans les rapports annuels ;

 la base pâtit d'interruptions d'historiques. Pour 15 entreprises, les données sont présentées sur moins de 5 exercices alors que dans 80% des cas ces données sont disponibles dans les rapports annuels.

L'information sectorielle standardisée contenue dans cette base de données n'apparaît pas assez développée pour enrichir l'analyse issue de son utilisation. La limitation de la désagrégation au seul chiffre d'affaires aurait pu être compensée par un nombre plus important de secteurs et un long historique. Or le nombre de secteurs est moins important que dans les rapports annuels et que dans la base de données Worldscope® (voir Tableau 1-19). De plus, pour certaines entreprises, l'historique est plus court que celui qui peut être obtenu en utilisant les rapports annuels.

B - Worldscope Global®

La base de données Worldscope Global® prévoit une information sectorielle relativement complète. Pour chaque entreprise il est prévu, au maximum, 5 codes SIC et une décomposition en 10 secteurs d'activité et 10 secteurs géographiques du chiffre d'affaires, du résultat opérationnel, du total de l'actif, des dépenses d'investissement et des amortissements. Au delà des ces informations standardisées, la base contient une description de l'activité.

Bien que relativement complète, cette information comporte deux limites : il n'y a pas d'historique sur les données qui ne sont disponibles que pour un exercice et il y a déconnexion entre les codes SIC et les secteurs d'activités dans lesquels les données sont réparties. Ces limites atténuent considérablement les modes d'analyse automatique possible

puisqu'il n'est pas possible de conduire une approche historique13 et que la mesure de la diversité, qui aurait pu être automatisée à partir des codes SIC sera plus complexe.

La comparaison entre les informations sectorielles des rapports annuels des 53 entreprises citées dans l'annexe 2 (page 411) et celles de la base de données montre que :

 la perte du nombre de secteurs lors du passage des rapports annuels à la base de données est moins forte que dans le cas précédent spécialement en ce qui concerne les secteurs géographiques ;

 dans la plupart des cas, l'information sectorielle présentée dans la base est issue des comptes, toutefois si le rapport de gestion est plus complet, elle sera tirée de ce dernier document (c'est le cas pour 8 entreprises de l'échantillon). Toutefois, malgré l'utilisation des deux parties du rapport annuel, pour 7 entreprises la base de données aurait pu être complétée par des informations contenues dans ces rapports annuels.

Tableau 1-19 : Comparaison du nombre moyen de secteurs dans DAFSA-PRO® et dans Worldscope®.

Base de données Worldscope® DAFSA PRO® Probabilité d'égalité Secteurs d'activité géographique d'activité géographique d'activité géographique

Echantillon 4,04 3,60 3,60 1,91 27,9 % 0,1 %

Groupe1 (CAC 40) 4,50 4,27 3,54 2,69 13,5 % 0,7 %

Groupe 2 (Autres) 3,54 2,87 3,67 1,50 79,6 % 4,7 %

Le test d'égalité effectué est un test de Student.

Bien que l'absence d'historique soit une limite importante à son utilisation, la base de données Worldscope® présente une information sectorielle assez riche tant du point de vue du nombre de secteurs que des données disponibles. Pour reprendre la typologie construite dans la section précédente, on retrouve une décomposition sectorielle de variables permettant de mesurer l'activité (chiffre d'affaires), le résultat (résultat opérationnel) et le potentiel d'activité (total de l'actif, investissement, dotation aux amortissements). Ainsi, il nous est apparu utile d'étendre les résultats obtenus à la section

13

précédente sur les données de cette base afin d'évaluer les possibilités d'utilisation de l'information sectorielle dans un cadre international.

§2 Information sectorielle disponible au plan international.

L'analyse globale de la base de données Worldscope® peut nous permettre d'identifier l'information sectorielle disponible au plan international. En effet, cette base contient des informations sectorielles sur plus de 13 000 sociétés originaires de 47 pays. Nous avons donc effectué une extraction de ces données sectorielles pour l'ensemble des entreprises constituant la base (A) puis, nous avons tenté d'étendre les résultats obtenus de l'analyse des rapports annuels des 53 sociétés françaises (B).

Bien entendu, cette étude ne permet pas de connaître toute l'information sectorielle disponible pour chaque société étudiée mais d'identifier la richesse des données contenues dans la base. Comme nous l'avons vu au paragraphe précédent, l'information sectorielle de la base Worldscope® est limitée, en comparaison de celle contenue dans les rapports annuels.

PACTER [1994] a étudié les données sectorielles contenues dans cette base de données. Cette étude est présentée au chapitre précédent (page 68). Les objectifs et la période étudiée sont différents de notre approche. En effet, PACTER [1994] travaille sur les comptes 1991-1992 et mesure des taux de publication des données sectorielles alors que notre étude est effectuée sur les comptes 1995-1996 et cherche à évaluer la richesse de ces données dans le cadre de leur utilisation.

A - Récupération des données et traitement.

La version de février 1997 de la base de données comporte des informations sur 13 680 sociétés réparties en 47 pays. Toutefois, parmi ces entreprises, certaines n'exercent plus d'activité. L'utilisation des données sectorielles apparaissant peu utile pour des entreprises inactives, nous avons limité notre étude aux 12 414 qui étaient considérées comme actives lors de la dernière actualisation de la base de données. Pour ces entreprises, nous avons extrait les données suivantes :

 les 5 codes activité SIC ;

 les données pour les 10 secteurs d'activité (pour chaque secteur, le nom, le chiffre d'affaires, le résultat, l'actif, l'investissement et les dotations pour dépréciation) ;  les données pour les 10 secteurs géographiques (comme pour les secteurs d'activité).

Les données brutes ainsi extraites ont été vérifiées puis mise en forme. Les vérifications ont permis de corriger certaines anomalies inévitables lors d'une extraction aussi importante. Pour effectuer ces contrôles, nous avons réalisé trois extractions globales que nous avons confrontées entre-elles ; puis par tris successifs, nous avons vérifié que chaque donnée présentait les caractéristiques souhaitées. Nous avons ainsi vérifié que :

 les noms d'entreprise, leur nationalité et la définition des secteurs correspondaient à des chaînes de caractères comportant des lettres ;

 les données sectorielles et les codes activité à des chaînes de caractères ne comportant que des chiffres ;

 les données qui devaient être positives (toutes sauf le résultat) l'étaient bien.

Les anomalies détectées ont été corrigées à partir des données d'origine contenues dans la base. De plus, ces contrôles ont fait apparaître la nécessité d'effectuer un traitement supplémentaire correspondant à l'élimination de secteurs indésirables. En effet, la base contient parfois des noms de secteurs pour lesquels les données ne sont pas disponibles et des secteurs correspondant à un calcul nécessaire pour effectuer le rapprochement entre la décomposition sectorielle des données et sa valeur consolidée. Ces deux éléments ne pouvaient être considérés comme de réels secteurs et nous avons procédé à leur élimination.

Ne pouvant analyser individuellement toutes les données, nous avons supprimé les secteurs :

 dont le chiffre d'affaires été inférieur ou égal à 0 si les autres données étaient inférieures ou égales à 014 ;

14

Un résultat inférieur à 0 ne correspond pas au fait que l'on n'est pas en présence d'une décomposition sectorielle. Nous avons vérifié individuellement ces cas.

 comportant dans leur description littérale des mots15 permettant d'identifier ces secteurs comme n'étant qu'un calcul permettant de rapprocher la décomposition sectorielle aux données consolidées.

Sur l'ensemble des données, nous avons ainsi éliminé 593 secteurs d'activité et 627 secteurs géographiques.

Les données ainsi obtenues ont été mises sous la forme de trois matrices (décrites dans l'annexe 7, page 425), une pour les données par secteurs d'activité, une pour les données par secteurs géographiques et une comportant des données générales.

B - Analyse et résultats.

Les bases de données sont constituées d'informations qui peuvent subir deux types de distorsion. En effet, la qualité des données contenues dans la base peut être influencée par deux éléments subjectifs :

 le choix de la source des données utilisée pour alimenter la base ;  l'interprétation de ces données par l'analyste alimentant la base.

Dans le cadre de notre étude, certains problèmes peuvent surgir du deuxième élément. En effet, l'information sectorielle peut prendre diverses formes alors que la base de données est standardisée. Un travail de mise en forme devra être réalisé par plusieurs analystes qui peuvent ne pas avoir la même sensibilité vis-à-vis de l'information à retranscrire dans la base de données. Notre expérience acquise lors du dépouillement des données sectorielles contenues dans les rapports annuels et la comparaison que nous avons effectuée entre les données que nous avons relevées dans ces rapports et celles contenues dans les bases de données nous conduisent à penser que, malgré des protocoles précis de constitution de ces bases, l'interprétation subjective des données sectorielles lors de leur mise en forme peut influencer la qualité des informations contenues dans la base.

15

Ces mots ont été définis en observant le nom du dernier secteur d'un nombre important d'entreprises. Cette identification a été effectuée à partir des mots suivantes : Adjustment, Consolidation, Companies,

Toutefois, travaillant sur un grand nombre d'entreprises, cette subjectivité sera atténuée car les différentes distorsions possibles peuvent se compenser dans le cadre d'une approche globale16.

A partir des matrices de données, nous avons tenté de généraliser au cadre international certains résultats obtenus lors de notre étude des rapports annuels. Nous avons ainsi analysé le nombre de secteurs présents dans la base de données (a) et les variables disponibles (b). Ces deux caractéristiques sont fondamentales pour évaluer les possibilités d'utilisation des données sectorielles.

1 - Nombre de secteurs.17

La base peut contenir au plus des informations sur 10 secteurs. Pour chaque type de décomposition, on peut ranger les entreprises étudiées en trois groupes :

 celles pour lesquelles aucun secteur n'est présenté ; cette situation signifie que l'analyste n'a identifié aucune donnée sectorielle, soit parce que l'entreprise n'exerce qu'une seule activité, soit parce qu'elle ne présente aucune information sectorielle correspondant à celle pouvant figurer dans la base ;

 celles pour lesquelles un seul secteur est présenté ; cette situation signifie que l'analyste n'a pu identifier qu'un seul secteur représentant a priori l'activité principale de l'entreprise ;

 celles pour lesquelles au moins deux secteurs sont présentés ; ces entreprises sont les seules pour lesquelles nous considérerons que des données sectorielles sont disponibles18.

Le Tableau 1-20 présente le nombre d'entreprises appartenant à chacune de ces catégories. La présence de données par secteurs d'activité est plus fréquente que celle des données par secteurs géographiques. En effet, 65,43% des entreprises présentent la

16

Cette atténuation n'apparaît pas dans le cadre d'une approche individuelle, d'un travail sur un petit échantillon ou d'une sélection d'entreprises. Ainsi, dans ces cas, la subjectivité de l'interprétation des données constitue une des limites de l'utilisation des bases de données.

17

Le nombre de secteurs étudié correspond à celui calculé après élimination des secteurs indésirables.

18

Pour les secteurs géographiques, nous considérerons cependant qu'il n'y a pas de données sectorielles si la répartition se fait sur deux secteurs dont le deuxième ne correspond pas à une zone particulière mais simplement à une notion d'exportation.

répartition de données comptables dans au moins deux secteurs d'activité contre 21,73% pour les secteurs géographiques.

Tableau 1-20 : Nombres de secteurs dans Worldscope®.

Secteurs d'activité Secteurs Géographiques Quantité % Quantité % Nombre d'entreprises sans secteur. 2 244 18,08% 2 889 23,27% Nombre d'entreprises à 1 secteur. 2 048 16,50% 5 623 45,30%

Correction deuxième secteur géographique. 1 205 9,71%

Nombre total d'entreprises sans données sectorielles 4 292 34,57% 9 717 78,27%

Nombre d'entreprises à 2 secteurs. 2 113 17,02% 1 745 14,06% Correction deuxième secteur géographique. -1 205 -9,71%

Nombre d'entreprises à 2 secteurs après correction. 2 113 17,02% 540 4,35% Nombre d'entreprises à 3 secteurs. 2 820 22,72% 857 6,90% Nombre d'entreprises à 4 secteurs. 1 565 12,61% 572 4,61% Nombre d'entreprises à 5 secteurs et plus. 1 624 13,08% 728 5,86%

Nombre total d'entreprises avec données sectorielles 8 122 65,43% 2 697 21,73%

NOMBRE TOTAL D'ENTREPRISES 12 414 100,00% 12 414 100,00% moyenne écart type moyenne écart type Nombre de secteurs de toutes les entreprises 2,45 1,87 1,47 1,53 Nombre de secteurs des entreprises avec données sect. 3,49 1,44 3,80 * 1,55

La correction du deuxième secteur géographique correspond aux 1 205 cas pour lesquels le deuxième et dernier secteur ne correspond pas réellement à un secteur clairement défini mais aux 'exportations'. Notons toutefois que pour certains de ces cas, d'autres données que le simple chiffre d'affaires sont décomposées dans les deux secteurs. Si l'on maintient ces cas dans le groupe des entreprises avec données sectorielles géographiques, la part de ce groupe passe de 21,73% à 31,43%.

*

après la correction du deuxième secteur géographique. Sans cette correction, le nombre moyen de

secteurs serait de 3,25.

Le nombre moyen de secteurs pour l'ensemble des entreprises n'est pas un élément fondamental. En effet, pour l'utilisateur, il est plus important d'appréhender cette notion à partir des entreprises pour lesquelles les données sectorielles sont disponibles. Ces entreprises présentent en moyenne 3,49 secteurs d'activité et 3,80 secteurs géographiques (avec un mode identique égal à 3).

Nos résultats sont très proches de ceux de l'étude de PACTER [1994]19 malgré la

différence entre les entreprises sur lesquelles portent les deux analyses. En effet, alors que notre étude porte sur la totalité des entreprises actives de la base, celle de PACTER [1994]

19

Voir page 68 : 62% des entreprises de l'échantillon présentent au moins deux secteurs d'activité et 33% au moins deux secteurs géographiques. Ces entreprises présentent en moyenne 3,6 secteurs d'activité et 3,8 secteurs géographiques.

porte sur un échantillon de 1 062 sélectionnées en fonction de l'importance de leur chiffre d'affaires. Etant donné l'importance de l'effet taille dans l'intensité de la politique de publication de données sectorielles, on aurait pu s'attendre à des taux de publication plus faibles que ceux que nous avons observés. Nos résultats sont donc soit liés à une absence de l'effet taille dans notre cas20 ou plus simplement à une évolution générale vers plus de publications de données comptables sectorielles de la part des entreprises.

Nous avons vu dans la section précédente les arguments qui militent en faveur de l'importance du nombre de secteurs pour l'utilisateur. Ces arguments ne sont valides que d'un point de vue général. En effet, pour les secteurs d'activité, le nombre idéal de secteurs dépend vraisemblablement du degré de diversité de l'entreprise. Ainsi, il apparaît intéressant de comparer le nombre de secteurs pour lesquels les données sont disponibles avec le nombre d'activités menées par l'entreprise21. Cette deuxième grandeur dépend essentiellement de la largeur attribuée à la notion d'activité.

La base de données contient des codes activités SIC attribués par l'analyste. Le nombre de codes SIC attribués à une entreprise correspond au nombre d'activités que l'analyste attribue à cette entreprise. L'échelle entre les analystes étant commune et considérant que le défaut de subjectivité des analystes présenté ci-dessus est atténué, nous avons comparé le nombre de secteurs d'activité avec le nombre de codes SIC attribués par l'analyste. Les résultats de cette confrontation sont présentés dans le Tableau 1-21.

20

Cette absence peut être liée au domaine d'étude ou à la taille des échantillons étudiés. Ces arguments sont en contradiction avec les travaux théoriques et empiriques analysés dans le second chapitre.

21

Nous avons vu que certains travaux ont tenté de mesurer l'indépendance entre les activités (voir Tableau 1- 6 page 91). Nous n'utiliserons pas les mesures développées dans ces travaux car la notion que nous souhaitons cerner, le nombre d'activités, est quelque peu différente de l'indépendance entre les activités.

Tableau 1-21 : Nombre de secteurs d'activité et nombre d'activités.

Nombre de codes SIC attribués 1 2 3 4 5

Nombre d'entreprises à 0 ou 1 secteur. 1 160 1 089 839 602 602 Nombre d'entreprises à 2 secteurs. 343 568 446 375 381 Nombre d'entreprises à 3 secteurs. 723 416 549 436 696 Nombre d'entreprises à 4 secteurs. 236 190 263 323 553 Nombre d'entreprises à 5 secteurs et plus. 179 126 182 246 891 Somme de la diagonale : 3 491

au dessus de la diagonale : 6 019 au dessous de la diagonale : 2 904

Si l'on considère que le nombre de codes SIC attribués par l'analyste représente le nombre d'activités conduites, nous remarquons que notre population d'entreprises peut se décomposer en trois groupes pour lesquels le nombre de secteurs d'activités dans lesquels se répartissent les données comptables est :

 égal au nombre d'activités : 3 491 entreprises (28,12% de la population) ;  inférieur au nombre d'activités : 6 019 entreprises (48,49% de la population) ;  supérieur au nombre d'activités : 2 904 entreprises (23,39% de la population).

En négligeant les éventuels problèmes de l'affectation des codes SIC, on peut conclure que, pour la moitié des entreprises, la délimitation des secteurs d'activité est plus grossière que la définition des codes SIC à quatre chiffres, pour un quart, elle est moins grossière et pour le quart restant, elle est équivalente.

L'opportunité du nombre de secteurs peut aussi être appréhendée à travers la part relative du chiffre d'affaires de chaque secteur par rapport au chiffre d'affaires global de l'entreprise. Les coefficients ainsi calculés peuvent être un indicateur de l'opportunité d'une décomposition en de nombreux secteurs. Ces coefficients moyens et leur écart type sont présentés dans le Tableau 1-22.

Tableau 1-22 : Taille relative des secteurs en fonction de leur nombre.

Nombre de

Part du sect. 1 Part du sect. 2 Part du sect. 3 Part du sect. 4 Part des autres sect. secteurs... Moy. Ec. Ty. Moy. Ec. Ty. Moy. Ec. Ty. Moy. Ec. Ty. Moy. Ec. Ty.

d'activité 0 ou 1 1 0 2 .7959 .1812 .2041 .2098 3 .6844 .1796 .2212 .1470 .0944 .1006 4 .6150 .1918 .2222 .1166 .1046 .0824 .0582 .0782 5 ou plus .5349 .1732 .2102 .0913 .1236 .0713 .0728 .0568 .0585 .0616 géographiques 0 ou 1 1 0 2 .7628 .2222 .2372 .2228 3 .6267 .2233 .2648 .1861 .1085 .1203 4 .5274 .2383 .2522 .1647 .1481 .1222 .0723 .0924 5 ou plus .4352 .2372 .2375 .1496 .1300 .1013 .1006 .0873 .0967 .1301

sect. : secteur ; Moy. : moyenne ; Ec. Ty. : écart-type.

Les résultats présentés dans ce tableau montrent que plus le nombre de secteurs est important, plus la taille relative des premiers secteurs est faible. Ce résultat qui paraît évident une fois obtenu est rassurant, il signifie que plus les activités secondaires sont importantes, plus le nombre de secteurs dans lesquels les données comptables seront réparties est important.

Le chiffre d'affaires apparaît mieux réparti dans les secteurs géographiques que dans les secteurs d'activité. Ce résultat est vraisemblablement lié au fait que le nombre de secteurs géographiques est plus faible que le nombre de secteurs d'activité.

Si l'on devait appliquer le critère des 10% posé par l'IASC, à la part moyenne du chiffre d'affaires réalisé dans chaque secteur, les entreprises pourraient se limiter à ne présenter que 4 secteurs22. Cependant, si l'on observe la part moyenne du dernier secteur (ou des derniers secteurs au delà de 5) et celle de l'avant dernier secteur, la décomposition en 5 secteurs peut paraître souhaitable. Toutefois ces éléments doivent être atténués à cause de l'importance des écarts-types par rapport aux moyennes. Ces dernières

22

Le critère de 10% s'applique à la répartition du chiffre d'affaires mais aussi au résultat et au total de l'actif. Ainsi, une activité (ou zone géographique) ne représentant que 5% du chiffre d'affaires mais plus de 10%