• Aucun résultat trouvé

Analyse des Correspondances Multiples (ACM)

SECTION II : OUTILS D’ANALYSE

4. Analyse des Correspondances Multiples (ACM)

A partir des travaux de Benzécri (1992), Bry (1995), (Lebart, Grangé, & Burtschy, 1994), Lebart et al. (2006) et Ambapour (2006), on note :

𝐼 = Ensemble des sujets i ayant répondu à un questionnaire : 𝐶𝑎𝑟𝑑 𝐼 = 𝑛 ; 𝑄 = Ensemble des questions 𝑞 ;

𝐽𝑞 = Ensemble de modalités de réponses à la question 𝑞 ;

𝐽 ∪ {𝐽𝑞|𝑞 ∈ 𝑄} est l’ensemble des modalités de réponse à toutes les questions. 𝑐𝑎𝑟𝑑 𝐽 = 𝑝 ;

𝑋 = Tableau de réponses à 𝑛 lignes et 𝑝 colonnes ; 𝑥𝑖𝑗 = 1 ou 𝑥𝑖𝑗 = 0 selon que le sujet 𝑖 a choisi la modalité de la question 𝑞 ou non. Un tel tableau est appelé tableau disjonctif complet, il est la juxtaposition de 𝑄 sous-tableaux : 𝑋 = [𝑋1, 𝑋2, … , 𝑋𝑞, … , 𝑋𝑄].

L’analyse des correspondances multiples est l’analyse des correspondances du tableau 𝑋 ou du tableau 𝐵 = 𝑋𝑋 appelé tableau de contingence de Burt de terme général :

𝑏𝑗𝑗 = ∑ 𝑥𝑖𝑗

𝑛

𝑖=1

𝑥𝑖𝑗 (32)

Il y a équivalence entre les deux analyses.

Les marges en ligne du tableau 𝑋 sont constantes et égales au nombre Q de questions :

𝑥𝑖. = ∑ 𝑥𝑖𝑗 = 𝑄

𝑃

𝑗=1

(33)

Les marges en colonne correspondent au nombre de sujets ayant choisi la modalité 𝑗 de la question 𝑞 :

133 𝑥.𝑗 = ∑ 𝑥𝑖𝑗

𝑛

𝑖=1

(34)

Pour chaque sous tableau 𝑋𝑞, l’effectif total est :

𝑥𝑞 = ∑ 𝑥.𝑗= 𝑛

𝑗∈𝑞

(35)

La somme des marges donne l’effectif total 𝑥 du tableau 𝑋, soit :

𝑥 = ∑ ∑ 𝑥𝑖𝑗 = 𝑛𝑄 𝑝 𝑗=1 𝑛 𝑖=1 (36)

On muni chaque individu 𝑖 d’une masse identique égale à 𝑚𝑖 = 1

𝑛 et chacune des modalités 𝑗 est pondérée par sa fréquence 𝑚𝑗 = 𝑥.𝑗

𝑛𝑄

4.2. Distance du 𝝌𝟐

Dans un repère 𝑅𝑛, la distance du 𝜒2 entre deux modalités s’écrit de la manière suivante :

𝑑2(𝑗, 𝑗) = ∑ 𝑛 (𝑥𝑖𝑗 𝑥.𝑗 𝑥𝑖𝑗 𝑥.𝑗) 2 𝑖∈𝐼 (37)

Dans le repère 𝑅𝑝, l’expression de la distance entre deux individus 𝑖 et 𝑖 est donnée par :

𝑑2(𝑖, 𝑖) = 1 𝑄 𝑛 𝑥.𝑗(𝑥𝑖𝑗 − 𝑥𝑖𝑗) 2 𝑗∈𝐽 (38)

La distance entre la modalité 𝑗 et le centre de gravité du nuage g s’écrit :

𝑑2(j, g) = 𝑛 𝑑2(𝑗, g) = 𝑛 ∑ (𝑥𝑖𝑗 𝑥.𝑗 1 𝑛) = 𝑛 𝑥.𝑗− 1 𝑛 𝑖=1 (39)

4.3. Axes factoriels et facteurs

Si l’on note par 𝐷 la matrice d’ordre (𝑗, 𝑗) ayant les mêmes éléments diagonaux (effectifs correspondant à chacune des modalités) que 𝐵, pour trouver les axes factoriels, on procède à la diagonalisation de la matrice :

𝑉 = 1 𝑄𝑋

𝑋𝐷−1 (40)

134 1

𝑄𝑋

𝑋𝐷−1𝑢𝛼 = 𝜆𝛼𝑢𝛼 (41)

L’équation du 𝛼è𝑚𝑒 facteur 𝜑𝛼 se présente de la façon suivante : 1

𝑄𝐷

−1𝑋𝑋𝜑𝛼= 𝜆𝛼𝜑𝛼 (42)

De même, l’équation du 𝛼è𝑚𝑒 facteur 𝜓𝛼 dans 𝑅𝑛 est : 1

𝑄𝑋𝐷

−1𝑋𝜓𝛼= 1 𝑄𝑋𝐷

−1𝑋 = 𝜆𝛼𝜓𝛼 (43)

Entre les deux facteurs, on a des relations de transition suivantes :

𝜑𝛼 = 𝜆𝛼−1/2𝐷−1𝑋𝜓𝛼 (44)

𝜓𝛼= 1 𝑄𝜆𝛼

−1/2

𝑋𝜑𝛼 (45)

La coordonnée factorielle de l’individu 𝑖 sur l’axe 𝛼 s’écrit :

𝜓𝛼𝑖 = 𝜆𝛼−1/2𝑥𝑖𝑗 𝑥𝑖. 𝑝 𝑗=1 𝜑𝛼𝑗 = 1 𝑄𝜆𝛼 −1/2 ∑ 𝜑𝛼𝑗 𝑝 𝑗∈𝑝(𝑖) (46)

Où 𝑝(𝑖) désigne l’ensemble des modalités choisies par l’individu 𝑖.

De même, la coordonnée de la modalité 𝑗 sur l’axe 𝛼 est donnée par l’expression suivante :

𝜑𝛼𝑗 = 𝜆𝛼−1/2𝑥𝑖𝑗 𝑥.𝑗𝜓𝛼𝑖 = 1 𝑥.𝑗𝜆𝛼 −1/2 ∑ 𝜓𝛼𝑖 𝑛 𝑖∈𝐼(𝑗) 𝑛 𝑖=1 (47)

Où 𝐼(𝑗) désigne l’ensemble des individus ayant choisi la modalité 𝑗.

4.4. Inertie du nuage des modalités L’inertie noté 𝐼𝑛(𝑗) de la modalité 𝑗 vaut :

𝐼𝑛(𝑗) = 𝑚𝑗𝑑2(𝑗, g) = 1 𝑄(1 −

𝑥.𝑗

𝑛) (48) Quant à l’inertie de la question 𝑞, son expression est la suivante :

𝐼𝑛(𝑞) = ∑ 𝐼𝑛(𝑗) = 1

𝑄(𝐽𝑞− 1)

𝑗∈𝐽𝑞

(49)

Ainsi on peut déduire l’inertie totale sous la forme suivante :

𝐼𝑇 = ∑ 𝐼𝑛(𝑞) = ∑𝑥.𝑗 𝑛𝑄𝑑 2(𝑗, g) = 𝑝 𝑄− 1 𝑝 𝑗=1 𝑞 (50)

135 liaisons entre les variables.

Dans cette recherche, pour la détermination de l’indice de privation relative et l’indice de patrimoine, nous allons faire une adaptation de l’indice composite développé par Asselin (2002). Ainsi, pour le ménage (i) l’indice composite aura la forme fonctionnelle suivante :

𝐶𝑖 = 𝑊𝑗 𝑞 𝑗∈𝐽𝑞 𝑥𝑗𝑞 𝑄 𝑞=1 𝑄 (51)

Tel que défini, cet indicateur apparaît pour un ménage 𝑖 comme une moyenne des poids des variables 𝑥𝑗𝑞. Le poids 𝑊𝑗𝑞 à attribuer à chaque composante de l’indice 𝐶𝑖 est le score

(coordonnées factorielles sur le premier axe) normalisé (score

𝜆1 1 2

) de la modalité 𝑥𝑗 obtenu après

application d’une analyse des correspondances multiples.

Il faut noter que la construction d’un tel indicateur s’opère à partir d’une approche dont les étapes successives sont les suivantes :

− Il faut réaliser une première ACM sur un ensemble de variables disponibles et pertinentes caractérisant les conditions de vie des ménages. Le premier axe factoriel de cette ACM permet de mettre en lumière le phénomène de la pauvreté et d’identifier certaines variables d’analyse de l’indicateur composite ;

− On procède sur la base de certains critères, à une réduction du nombre de variables issues de la première ACM. Le critère qui est appliqué est la consistance ordinale sur le premier axe (COPA). Cette propriété consiste pour un indicateur partiel à voir sa structure ordinale de bien-être respectée par la structure ordinale des coordonnées de ses modalités sur le premier axe factoriel. Après quoi, on réalise une deuxième ACM, qui en principe est censée améliorer le pouvoir explicatif du premier axe factoriel.

On construit l’indice composite de pauvreté à partir des résultats issus de la deuxième ACM. On définit également un seuil de pauvreté qui peut se faire à partir d’une méthode non arbitraire. Cette méthode consiste en une classification des ménages en deux classes selon le critère d’inertie. En d’autres termes, si nous notons par 𝑄 une partition de l’ensemble des ménages, noté 𝐼 en 𝑞 classes (avec 𝑞 = 2 ; pauvres et non pauvres) ; 𝑄 est un ensemble fini de parties non vides 𝑞 de 𝐼 deux à deux d’intersection vide et dont la réunion est 𝐼. Mathématiquement cela peut se présenter sous la forme suivante :

136 ∀𝑞 ∈ 𝑄: 𝑞 ⊂ 𝐼; ∀𝑞, 𝑞 ∈ 𝑄: 𝑞 ∩ 𝑞= ∅ ⇔ 𝑞 ≠ 𝑞; 𝐼 =∪ {𝑞|𝑞 ∈ 𝑄}

Soit gq le centre de gravité de la classe 𝑞. L’inertie de la classe 𝑞 par rapport à son propre centre de gravité gq est :

𝐼𝑛(𝑞) = ∑ 𝑚𝑞𝑑2(𝑥𝑖, g𝑞)

𝑥𝑖∈𝑞

(52)

Cette quantité est appelée « inertie intra-classe ».

Si nous supposons maintenant que les g𝑞 sont munis de masses 𝑚𝑞, on peut définir l’inertie des g𝑞 par rapport au centre de gravité g du nuage 𝑁(𝐼) :

𝐼𝑛(g𝑞) = ∑ 𝑚𝑞 𝑞𝑑2(g𝑞, g) est appelé « inertie interclasse ». On montre donc que

𝐼𝑛(g) = 𝐼𝑛(𝑞) + 𝐼𝑛(g𝑞) (53)

Pour juger de la qualité globale de la partition, il est important d’accorder une attention particulière à l’homogénéité à l’intérieur des classes. Dans la mesure où 𝐼𝑛(g) est une quantité constante, il s’agit par conséquent de minimiser la quantité relative à l’inertie intra-classes, ou encore à maximiser l’inertie inter-classes.

Ainsi, la détermination du seuil de pauvreté multidimensionnel est faite à partir de la spécification suivante :

𝑠𝑒𝑢𝑖𝑙 𝐼𝐶𝑃 = max 𝐶𝑖𝑃𝑚𝑖𝑃 + min 𝐶𝑖𝑁𝑃𝑚𝑖𝑁𝑃 (54) où :

max 𝐶𝑖𝑃 est la valeur maximale de l’ICP dans la classe pauvre ; min 𝐶𝑖𝑁𝑃 est la valeur minimale de l’ICP dans la classe non pauvre ; 𝑚𝑖𝑃 est le poids de la classe pauvre

𝑚𝑖𝑁𝑃 est le poids de la classe non pauvre

Une fois le seuil de pauvreté déterminé, les indices de pauvreté standard peuvent être calculés à partir de la spécification de Foster-Greer-Thorbecke (FGT).

Dans le cadre de cette thèse, la construction des classes homogènes de ménages selon leur niveau de bien-être, a été réalisée grâce à la méthode de Classification Ascendante Hiérarchique (CAH), notamment en raison de ce qu’elle permet d’éliminer le plus possible l’arbitraire. L’objectif de la CAH est de constituer de façon cohérente, à partir de variables et d’indicateurs, des groupes d’individus, les plus homogènes possibles. Cela pourra se faire soit directement,

137 soit à travers les axes factoriels déduits de l’ACM. En d’autres termes, on choisira parmi les partitions possibles, celle qui assure la variance interclasse maximale, ou, ce qui revient au même, la variance intra-classe minimale. Cette partition est obtenue au moyen d’un algorithme itératif : à chaque étape, un élément est agrégé à une classe, sur la base d’une règle de décision fondée sur un critère de distance minimale. Plusieurs critères d’agrégation (de similitude ou de dissimilitude) et de distances entre les individus et entre les classes sont proposés à ce niveau. Appliquée à l’analyse de la pauvreté, la CAH est effectuée à la suite d’une ACM pour constituer le plus souvent la classe des pauvres et celle des non pauvres. Cette méthode est appliquée aux données des enquêtes niveau de vie des ménages en Côte d’Ivoire de 2002 et 2008 pour déterminer les indices de pauvreté de privation relative et de patrimoine.