• Aucun résultat trouvé

Propriétés du filtrant ne renvoyant pas à un modèle

CHAPITRE 3 LES DONNEES ONT DES PROPRIETES FORMELLES : L’ANALYSE DE SIMILITUDE VA LES METTRE EN EVIDENCE

3.3 RECHERCHE DE PROPRIETES PARTICULIERES SUR LE FILTRANT DES CLIQUES MAXIMALES

3.3.2 Propriétés du filtrant ne renvoyant pas à un modèle

L’analyse du filtrant, conçue comme une représentation des données, vise à valider le ou les graphes que retient l’analyste pour exposer les données. On met ici à jour des propriétés plus pauvres que celles des modèles précédents. On en présentera trois que l’on retrouve assez souvent et qui permettent une interprétation formelle des similitudes. Nous nous servirons ici d’un exemple tiré d’une étude de représentations sociales de l’économie chez les étudiants. Le questionnaire demandait de mettre en relation onze notions économiques. La fréquence de ces relations donnait une matrice de similitude dont on reproduit ici le filtrant des cliques de valeurs supérieures à 13 (soit données par 7% des 200 sujets)

3.3.2.1. Les sous-ensembles « fermées » pour l’inclusion.

La première propriété que l’on peut mettre en évidence est celle des sous-ensembles de variables que l’on peut appeler « fermées » pour l’inclusion : un ensemble de cliques se retrouvent toutes incluses dans une seule clique de valeur minimum. Ici par exemple (figure 32) les cliques (4,7,11) et (4,5,7) se retrouvent dans la clique (4,5,7,11) au seuil de 29. Cette dernière clique n’a pas de descendant. de même les cliques (1,6,7), (5,6,7), (1,5,6,7) et (5,6,10), (1,6,10), (1,5,6,10) se trouvent toutes incluses dans la clique (1,5,6,7,10) au seuil 21. On peut identifier un autre ensemble inclus dans la clique (3,5,7,8,10) mais dans cette zone du filtrant les dérivations (5,7,8,11), (3,5,7,8,11) et (3,5,9,10) n’en font pas partie. La totalité de cet ensemble n’est donc pas fermé.

La constitution de ces ensembles dépend, évidemment du seuil minimum du filtrant (ici 14). Nous reviendrons plus loin sur ce point de définition du seuil du filtrant, dans la mesure où le dessin du filtrant complet n’est pas utilisable et même n’est pas souhaitable car il tient compte de valeurs non significatives ou non intéressantes. On reste toujours fidèle au principe de privilégier les valeurs maximales.

La projection des deux « parties fermées » les plus à gauche du filtrant sur le graphe au seuil de 16%

est intéressante (figure 33) : on y trouve une zone assez centrale dans le graphe (1,5,6,7,10) où se trouvent associés les éléments économiques relatifs aux trois principaux acteurs de l’économie : l’état (7), la

Figure 32 : Les relations économique : Exemple de filtrant

finance (1,6) et l’entreprise (5,10). Cette partie du filtrant se développe entre les seuils de 10% et 25% des sujets, mais aucune de ces cliques n’est rigide sur l’arbre ; pour qu’elles le soient il faudrait éliminer le terme chômage. De la même manière la clique (4,5,7,11) n’est pas rigide sur l’arbre alors qu’elle est fermée et qu’elle découpe une zone intéressante, celle des rapports de l’état avec les entreprises (en haut et à gauche de la figure 32 et au bas de la figure 33).

La clique la plus à gauche (3,5,9,10) de la figure 33est bien particulière. C’est la clique de quatre sommets la plus élevée (55 soit 28%) dans le filtrant mais elle n’a pas de descendance. Elle décrit l’ensemble des éléments économiques de l’entreprise. Mais l’articulation de ses éléments avec le reste de l’économie ne se fait que de manière partielle et particulière. C’est ainsi que le profit (9) est exclu de la zone se fermant sur la clique (3,5,7,8,10), zone qui associe le fonctionnement de l’entreprise à l’état et au chômage. Cette zone a la particularité de n’être constituée que de cliques rigides sur l’arbre comme le montre la figure 34. Mais cette zone ne peut être une partie fermée comme nous l’avons vu plus haut.

La clique exprimant l’activité (35%) mais elle est quasiment sans descendance. Il faut attendre le seuil de 7% pour voir s’associer à cette clique le sommet entreprise (5).

Cet exemple montre deux choses : d’une part les propriétés de rigidité et d’identification d’une partie fermée du filtrant ne sont pas équivalentes, chacune a son intérêt ; d’autre part le filtrant nous permet d’étudier la matrice de similitude à des seuils bien inférieurs à celui de l’arbre ou à celui permis par la lisibilité des graphes-seuil. Compte tenu de cela il faut alors faire attention au fait que les regroupements identifiés ne sont pas des catégories car les cliques se recouvrent le plus souvent comme dans cet exemple.

Figure 33 : Les relations économiques : le graphe-seuil à 16%.

On a indiqué les valeurs des arêtes en nombre de sujets et dessiner trois cliques

Figure 34 : Les relations économiques : l’arbre maximum. On a aussi tracé la clique fermant la partie droite du filtrant

3.3.2.2. Autres formes d’organisation : des propriétés locales.

A coté des ensembles fermés de cliques qui se regroupent par inclusion on peut mettre en évidence des propriétés moins formelles. On peut alors distinguer :

- les de cliques majoritaires (apparues à des seuils élevés). Elles indiquent, comme dans la figure 11, les zones saillantes du graphe de similitude ;

- les sous-ensembles qui engendrent une descendance : ils mettent en évidence des variables génératrices et des variables secondaires.

- les sous-ensembles qui, inversement, se retrouvent bien isolées quand on diminue le seuil ; on identifie alors des variables qui forment à elles seules une dimension de l’univers des données.

Ces différents modes d’organisation des sommets du graphe montrent bien l’intérêt de la démarche

« locale » de l’analyse de similitude. Chaque type de regroupement comme précédemment chaque type d’organisation autour d’un axe n’a pas la même propriété. Ici en particulier ils indiquent comment les deux principaux agents économiques (l’Etat et l’entreprise) ont un univers propre (clique apparue à un seuil élevé et sans descendance), et comment leur mise en relation peut prendre sens autour d’un thème donné : ici les rapports entre l’Etat et l’entreprise se font d’une part autour du thème de la monnaie, d’autre part autour de la redistribution des revenus et enfin autour du chômage. Cette diversité des modes de ressemblance ne peut s’exprimer dans une analyse globale qui est obligée de pondérer ces diverses proximités locales à travers une boite noire que ne contrôle pas l’analyste.

Cette approche à partir des modes d’organisation des cliques du filtrant, peut se compléter par l’identification des types de variables à travers leur place dans le filtrant comme on l’a montré dans la figure 10 sur l’exemple des 10 valeurs de Schwartz.