Description des données - L'effet de contagion des événements médiatiques liés aux fraudes fina

La base de données utilisée est construite à partir de la banque de données de la bibliothèque de l’université de Sherbrooke. L’objectif est d’obtenir les articles concernant les fraudes corporatives parues dans le Wall Street Journal pour une période allant de 1984 à 2014. Pour ce faire, en premier lieu un filtre est effectué à l’intérieur de la base de données de l’université pour obtenir uniquement les articles provenant du Wall Street

Journal. Par la suite, pour être retenu, il faut que l’article contienne les mots « fraud »

ou « crime » ou « scandal ». Nous avons également choisi d’exclure les articles contenant les mots congress, senate, election, terrorism, death, murder, iran, afghanistan, army, military, assault, rape, drug, weapon, gun ou north korea. Par la suite, chaque article fut analysé pour identifier s’il était pertinent. Si ce n’était pas le cas, l’article est exclu de la base de données. Cette analyse permet également de coter la pertinence de l’article2_.

En deuxième étape, une lecture individuelle de chacun des articles de cette base de données est effectuée pour en obtenir le nom des fraudeurs et des victimes impliquées, leurs cotes NAICS et SIC, leurs symboles boursiers, le nombre de mots de l’article, est-ce que l’article est à la une du journal. À la lumière de ces 12 000 articles, nous avons également identifié si plusieurs nouvelles concernent une même fraude, le cas échéant un regroupement est effectué sous un même numéro d’événement.

2Légende: Une cote de 1 est reliée à un article hautement pertinent. Le premier article d'un crime financier ou d'un scandale possède cette cote habituellement. Une nouvelle de haute importance, mais qui n'est pas la première nouvelle peut également posséder une cote de 1. Une cote de 2 est un article pertinent qui peut être de grandes nouvelles reliées à des décisions judiciaires (lecture des actes d'accusation, plaidoyer de culpabilité ou de non-culpabilité, verdict du juge, saisie des actifs du défendant en attendant le verdict ou tout autre évènement qui affecte notablement le déroulement du procès). Une nouvelle qui suit la première annonce et qui lui ajoute de l'information a généralement une cote de 2. Une cote de 3 est généralement une nouvelle qui est peu pertinente ou qui n'est pas pertinente. Ce sont des articles très accessoires à l'évènement. Il se peut que la base de données contienne des articles non pertinents. Les articles ayant une cote de 3 sont souvent des articles très longs. La lecture du titre, du résumé de l'article, des premières lignes de l'article et des mots-clés de l'article ont pu amener un verdict tout de même peu clair sur la pertinence. Dans ce cas, je gardais l'article avec une cote de 3 dans la base de données pour ne pas perdre trop de temps sur un seul article.

En troisième étape, nous avons utilisé trois types de classification pour identifier les différents événements d’illégalité. La première classification est celle proposée par l’ACFE, soit corruption, manipulation d’états financiers, détournement de fonds, vendeurs malhonnêtes, clients malhonnêtes, piratage, vol d’information, fraude d’impôt, fraude de faillite, fraude d’assurance, fraude de soin de santé, fraude au niveau des prêts ou autres. La deuxième classification est davantage en lien avec le type de victime rencontré lors de l’événement c’est-à-dire, entreprise, gouvernement, clients, employés, fournisseurs, franchisé et société. Troisièmement, nous voulons bien identifier le type de finalité juridique obtenu pour un même événement soit, suivi ou pas de suivi juridique, accusation, entente hors cours, verdict d’acquittement, verdict de culpabilité. Il est important de noter que la totalité de l’information utilisée provient du Wall Street

Journal. Si de l’information concernant une fraude ne se retrouve pas dans les articles du

quotidien, elle ne se retrouvera pas dans la base de données, que ce soit en lien avec la finalité juridique, une compagnie frauduleuse, etc. De plus, parmi les 12000 articles retenus initialement, nous avons obtenu un total de 5500 nouvelles concernaient des entreprises cotées à la bourse américaine.

Un événement est défini par l’ensemble des nouvelles concernant une compagnie pour la même illégalité. Cette façon de procéder nous permet de diviser cette dernière en quatre catégories soit la durée, la quantité, la qualité et le nombre de mots. La durée sera définie par le nombre de temps séparant la première nouvelle rapportée et la dernière identifiée et la quantité est identifiée par le nombre de nouvelles pour un même événement. Quant-a-t-elle, la qualité de la nouvelle est définie par le ratio de nombres de nouvelles à une du journal sur le nombre de nouvelles totales et finalement le nombre de mots est obtenu par le total de mots répertorié pour l’ensemble des articles d’une nouvelle. Les prix des titres concernés sont obtenus à l’aide de Bloomberg et seulement les événements concernant les entreprises ayant déjà été cotées au S&P 500 sont retenus dans le cadre de ce mémoire.

Finalement, notons que les 12 000 articles répertoriés nous ont permis d’obtenir 941 événements différents.

Nous avons éliminé les articles qui datent avant 1990, car nous avions des difficultés à obtenir des entreprises jumelles. La recherche de comparable par secteur à l’aide de cote SIC sur Bloomberg nous permet seulement de voir les groupements en date du jour. Retourner trop longtemps dans le passé enlève trop de crédibilité au comparable et souvent il n’en existait pas. Cette procédure a eu pour effet d’éliminer 112 événements. Lors de la recherche de données, nous avions des contraintes de données à respecter soit, avoir des prix pour toute la durée de l’événement deux ans avant la première nouvelle d’un événement et deux ans après la dernière nouvelle de l’événement et ce, pour l’entreprise concernée et l’entreprise jumelle. Résultats sans éliminer les événements avant 1990. Ceci a eu pour effet d’éliminer 157 événements. Finalement, nous avons éliminé les événements où la durée était moins de 300 jours. Ceci nous permet de nous concentrer sur les événements où nous avons un nombre significatif d’observations dans un contexte d’effet contagion. Ceci a eu pour effet d’éliminer 532 événements en laissant 94 à analyser. Nous pouvons voir au tableau O les statistiques reliées à la classification des événements utilisée pour les analyses proposées.

Tableau 11. Statistiques d’exclusions des événements répertoriés de la base de données de nouvelles de fraudes

Ce tableau nous indique les statistiques d’exclusions des événements répertoriés de la base de données de nouvelles de fraudes en fonctions de chacune des règles. La base de données totale contient 941 événements. De ce total nous excluons 1) Les événements où nous avons un manque de données en considérant que nous avons besoin des rendements pendant l’événement et 500 jours avant et après l’événement pour l’entreprise impliquée dans l’événement et l’entreprise jumelle. 2) Nous excluons également les événements débutants avant 1990. 3) Nous excluons aussi les événements où la durée est moindre de 300 jours. Notons que la durée nous est donnée par le nombre de jours entre la date de parution de la première nouvelle et la dernière nouvelle sur l’événement de fraude.

Ainsi, nous obtenons le nombre final d’événements analysés dans le cadre de ce mémoire.

Événements totaux

Manque de données avant la première nouvelle

Manque de données après la

première nouvelle Événement débutant avant 1990 Durée moindre de 300 jours Événements analysés Entreprise impliquée Entreprise jumelle Entreprise impliquée Entreprise jumelle 941 57 52 48 0 112 532 94

Dans le document L'effet de contagion des événements médiatiques liés aux fraudes financières sur le risque des entreprises (Page 89-92)