• Aucun résultat trouvé

CHAPITRE 5 ANALYSES DES ESTIMATIONS DE RÉPUTATION DES ENTREPRISES DU S&P500 ET STRATÉGIES D’INVESTISSEMENT

5.2 Statistiques descriptives

Avant de passer aux études économétriques, il convient de passer un instant sur la base de données et d’en ressortir quelques statistiques aidant à mieux l’appréhender et à mieux la comprendre.

Une première information intéressante est la taille des fichiers contenant les tweets extraits. Ces tailles donnent une bonne idée du nombre de messages échangés sur une journée. Cette information est disponible sous forme de graphique sur les figures 5.2 et 5.3.

Figure 5.3 : Tailles des fichiers de données (en Mégaoctets) entre le 14 août et le 13 octobre 2015 On note quelques pics d’activités intéressants, situés pour la plupart, les mercredis et jeudis. De la même façon, on observe des baisses du nombre de messages échangés les samedis et plus particulièrement les dimanches. La taille des fichiers oscille autour de 75MB/jour, ce qui

correspond à environ 22 000 tweets par jour. Sur l’ensemble des deux périodes, environ 1 672 000 tweets ont donc été analysés.

Une autre information intéressante réside dans la question suivante : comment est réparti le nombre de messages mentionnant les compagnies entre les différentes industries du S&P500 ? La figure 5.4 illustre cette répartition pour l’ensemble des messages téléchargés durant les 108 jours d’étude. On peut se rendre compte que les deux industries les plus représentées au sein des entreprises du S&P500 ne sont pas nécessairement celles qui sont les plus mentionnées sur Twitter. Par exemple, les services financiers (17% de la totalité de S&P500), ne représentent que 6% des mentions sur Twitter. À l’inverse, les technologies de l’information (13% de la totalité de S&P500) sont très présentes sur le réseau social avec 52% des mentions.

Figure 5.4 : Répartition du nombre de messages mentionnant les compagnies dans les différentes industries du S&P500

Pour entrer un peu plus profondément dans l’analyse statistique de la base de données, il est nécessaire de se pencher sur les scores de réputation. Pour rappel, pour chacune des 9 clés d’analyse, un score de réputation est calculé, score correspondant à la moyenne de la polarité de chacun des messages pertinents.

Les statistiques concernant l’ensemble de ces scores sont présentés sur la figure 5.5. Ce diagramme présente le minimum, le maximum et les quartiles de chacune des séries de données. Les valeurs aberrantes, s’étalant de entre -4 et 4, sont trop dispersées pour être visualisées. On peut remarquer que les scores sont généralement très faibles. Cela est dû à la surabondance de messages neutres par rapport aux nombres de messages positifs ou négatifs, mais ce constat n’affecte pas le résultat. On peut aussi noter que les scores sont généralement plus positifs que négatifs ce qui a tendance à montrer que, sur la période étudiée, les entreprises du S&P500 dans leur ensemble ont su conserver une réputation correcte.

Biens!de! consommation!non! cycliques! 19%! Biens!de! consommations! cycliques! 6%! Énergie! 6%! Services!;inanciers! 6%! Santé! 6%! Produits!industriels! 1%! Technologies!de! l'information! 52%! Matériaux!de!base! 1%! Services!de! Télécommunication! 2%! Services!publics! 1%!

Figure 5.5 : Diagrammes en boîtes des différents scores de réputation des 9 clés d'analyse Il est ensuite intéressant de séparer les entreprises par industrie, de refaire ces calculs et de confronter les résultats. La figure 5.6 présente, pour chacune des clés d’analyse, la moyenne et l’intervalle de confiance des séries de données par industrie.

!!!!!!!!!!!A!:!Vente!au!détail! ! D!:!Services!financiers! G!:!Technologies!de!l’information! J!:!Services!publics! ! !!!!!!!!!!!B!:!Biens!de!base!!!!!!!! ! E!:!Santé! ! ! H!:!Matériaux!de!base!

!!!!!!!!!!!C!:!Énergie!! ! ! F!:!Produits!industriels! I!:!Services!de!télécommunication! ! !

Figure 5.6 : Moyennes et intervalles de confiance des scores de réputation calculés par industrie et sur la période 1 (mai-juin) pour chacune des clés d'analyse

On peut remarquer qu’une société du secteur des services de communication par exemple va devoir être particulièrement attentive à sa réputation en terme de qualité de son exécutif, de sa compétitivité et de sa gestion des individus. On ne parle pas ici d’impact sur la société mais bien des possibles variations de réputation.

Pour donner un second exemple, une entreprise du secteur des matériaux de base devra contrôler de très près sa réputation en terme de compétitivité, tant l’intervalle de confiance est large.

On peut mener cette même analyse en ne comparant plus par industrie mais par date. Les résultats sont présentés sur la figure 5.7 suivante :

Figure 5.7 : Moyennes et intervalles de confiance des scores de réputation calculés chaque jour et sur la période 1 (mai-juin) pour chacune des clés d'analyse!

Cette fois, c’est une indication sur les journées ayant connu les plus grandes volatilités des scores de réputation. On peut voir que le 16 mai 2015, les entreprises du S&P500 ont connu de grandes variations de réputation en terme d’innovation et dans la perception de la qualité des exécutifs de ces mêmes entreprises. Ces résultats permettent de déterminer les industries et les jours pour lesquels les scores de réputation de chacune des 9 clés sont les plus volatiles.

Mais un calcul de réputation n’est pas vraiment significatif sur un trop grand échantillon d’entreprises. Il est donc plus intéressant de diviser ces entreprises par industrie et d’observer les variations journalières de réputation. Les résultats sont présentés sur la figure 5.8.

Figure 5.8 : Moyennes des scores de réputation calculées par industrie et à chaque jour sur la période 1 (mai-juin) pour chacune des clés d'analyse!

La figure 5.8 permet de se rendre compte de la volatilité des résultats pour chacune des industries et à chaque jour. En terme de compétitivité par exemple, ce sont les entreprises de l’industrie des biens au détail qui semblent avoir la plus grande volatilité de réputation au contraire des entreprises TI qui ont des scores plus stables.

Finalement, le plus pertinent serait de pouvoir analyser les mouvements de réputation d’une entreprise seule et de comparer ces variations à celles des autres entreprises du même secteur. Sur la figure 5.9, un exemple de ce type d’analyse compare la réputation de quatre entreprises TI sur une période de 34 jours.

Figure 5.9 : Moyennes des scores de réputation calculées par compagnie et à chaque jour sur la période 1 (mai-juin) pour la clé "Utilisation des actifs"

Ces tests permettent de mieux comprendre la base de données et de mieux appréhender les études économétriques.