• Aucun résultat trouvé

Chapitre 5 L’ APPLICATION DE LA TAXONOMIE DU LOBBYING AUX CAS FRANÇAIS ET ANGLAIS

1. Préambule sur la méthode d’analyse des données appliquée au lobbying

1.2. L’application aux actions politiques des entreprises

1.2.2 Une seconde étape : la classification automatique

Nous complèterons l’analyse des correspondances multiples par une classification automatique. Cette technique d’analyse typologique permettra en effet d’éclairer la description des actions politiques des entreprises françaises et anglaises. En particulier, nous serons en mesure de tester nos deux premières hypothèses de recherche relatives aux types de

stratégie de lobbying.

a. Pourquoi une classification automatique ?

La justification de l’utilisation conjointe de l’analyse factorielle et de la classification est particulièrement bien posée par Lebart, Morineau et Piron (1997). Nous nous inspirerons donc ici très largement de leurs travaux.

Face à de très grands tableaux de données, il est indispensable de pratiquer une analyse factorielle exploratoire pour disposer d’une vue d’ensemble de la base d’information. En outre, cette analyse permet de filtrer les dimensions essentielles à la compréhension du phénomène.

Cependant, ces méthodes présentent différentes insuffisances listées par Lebart , Morineau et Piron :

1. « difficultés d’interprétation », en particulier au-delà du plan principal ;

2. « compression excessive et déformation » par la limitation à quelques axes qui peut entraîner des distorsions et des superpositions de points occupant des positions distinctes dans l’espace ;

3. « manque de robustesse » (des points aberrants peuvent notablement influencer les facteurs) ;

4. « graphiques factoriels inextricables », dans la mesure où le nombre d’individus est élevé (679 dans notre cas).

Or, une classification peut remédier à ces défauts. Concernant les points 1. et 2., les classes prennent en compte la dimension réelle du nuage de point et corrigent donc certaines déformations dues à l’opération de projection. Pour 3., l’algorithme de la classification hiérarchique est dit localement robuste : les parties basses des dendogrammes produits sont indépendantes des points marginaux isolés. Enfin, le regroupement des individus en classes moins nombreuses permet de simplifier la présentation et l’interprétation des projections graphiques sur les axes factoriels (4).

b. Quelle classification automatique ?

« Les méthodes de classification ou de typologie (dont la science s’appelle taxinomie) ont pour but de regrouper les individus en un nombre restreint de classes homogènes. Il s’agit donc de décrire des données en procédant à une réduction du nombre des individus. »

(Bouroche, 1994)

En classification automatique, les classes sont obtenues au moyen d’algorithmes formalisés et suivant deux grands types de méthodes.

La classification non hiérarchique (partition produite directement en un nombre fixé de classes)

Il s’agit de regrouper des individus en classes de sorte que les individus d’une même classe soient les plus semblables possibles et que les classes soient bien séparées.

La classification hiérarchique (suite de partitions en classes de plus en plus vastes)

Il s’agit de construire, par exemple de manière ascendante, une suite de partitions en n classes, n-1 classes, n-2 classes… emboîtées les unes dans les autres. La partition en k classes est obtenue en regroupant deux des classes de la partition en k+1 classes. La suite des partitions obtenues peut être représentée sous la forme d’un arbre de classification.

Il convient de définir le critère de regroupement de deux classes ce qui revient à définir une distance entre classes. Deux grandes méthodes sont couramment utilisées : Le critère de l’inertie par la méthode de Ward et les distances non euclidiennes.

1. Dans le premier cas, une bonne partition est celle pour laquelle l’inertie interclasse est forte et l’inertie intraclasse faible. Ce critère est la traduction du fait qu’une typologie est d’autant meilleure que les classes sont ramassées (faible variance intraclasse) et qu’elles sont nettement séparées (forte variance interclasse). Leur somme étant constante et égale à la variance totale, il est équivalent de minimiser la variance intraclasse ou de maximiser la variance interclasse. Pour un grand nombre de classes il n’est cependant pas garanti que la partition obtenue par troncature de la classification ascendante hiérarchique optimise ce critère.

2. Lorsque les distances ne sont pas euclidiennes, la notion d’inertie n’a plus de sens. Il existe donc d’autres méthodes pour calculer la distance entre deux classes. Par exemple, une formule tend à favoriser le regroupement de deux classes dès qu’elles possèdent des points proches. La principale difficulté de la classification réside cependant dans le choix adéquat de ces définitions de distance entre individus (surtout quand ils sont décrits par des caractères qualitatifs).

Dans le cas des actions de lobbying, nous cherchons précisément à connaître le nombre de classes existant par une démarche empirique. C’est pourquoi, la méthode hiérarchique, en particulier ascendante, semble davantage adaptée.

Nous aurons finalement recours au logiciel SPAD qui présente les résultats les plus complets et combine ACM et classification. Il met en œuvre dans ce cadre le critère de l’inertie par la méthode de Ward. En outre, nous choisirons de ne réaliser cette classification que sur les premiers axes retenus pour l’analyse des correspondances multiples. Cela

présente en effet selon Lebart, Morineau et Piron l’avantage d’éliminer des fluctuations aléatoires qui constituent en général l’essentiel de la variance recueillie dans les derniers axes.

2. La constitution d’une base de données sur les actions politiques des

entreprises françaises et anglaises

Nous souhaitons utiliser les techniques de l’ACM et de la classification pour décrire de manière structurée le lobbying des entreprises françaises et anglaises. Cependant, il n’existe pas de base pré-construite regroupant un nombre important de données sur le sujet. C’est pourquoi, il nous faut constituer notre propre base de renseignement sur les actions politiques des entreprises françaises et anglaises à partir d’une source de données primaire, la presse.

Outline

Documents relatifs