• Aucun résultat trouvé

L’Analyse Factorielle Discriminante (AFD)

N/A
N/A
Protected

Academic year: 2022

Partager "L’Analyse Factorielle Discriminante (AFD)"

Copied!
3
0
0

Texte intégral

(1)

L’Analyse Factorielle Discriminante (AFD)

I. Données

L’analyse factorielle discriminante (AFD) est une méthode descriptive et explicative, apparentée à l’analyse en composantes principales (ACP), s’appliquant à des données quantitatives sur lesquelles est déjà définie une typologie ou partition.

Par exemple des indicateurs associés à des clients d'une banque classés comme

"bons payeurs", "mauvais payeurs" ou "ayant fait faillite".

II. Méthode

Le but de la méthode, comme en ACP, est de réduire le nombre de dimensions des données, en recherchant celles suivant lesquelles les classes se séparent le mieux. Les directions factorielles discriminantes successives sont déterminées, tandis que des graphiques factoriels plans permettent ici encore de visualiser les individus ou les variables. Divers indicateurs et tests sont également calculés, qui permettent de juger de l'intérêt et de la pertinence des résultats obtenus.

III. Mise en œuvre en SAS

La procédure SAS qui opère l'analyse factorielle discriminante est la procédure CANDISC. Sa syntaxe de base est la suivante :

PROC CANDISC / options;

CLASS groupe;

VAR variables;

Dans l'instruction CLASS, la variable groupe est la variable à items définissant la partition, tandis que les variables de l'instructions VAR sont les variables quantitatives utilisées.

IV. Détails mathématiques

Il existe plusieurs présentations mathématiques équivalentes de l'AFD, on donne ici l'une d'entre elles.

1

(2)

Ayant N individus, répartis en k groupes, sur lesquels ont été relevées p variables quantitatives, on note :

yih , élément de Rp, est le h-ième individu du groupe i

ni est l'effectif du groupe i

yi. , élément de Rp, est le centre de gravité u groupe i

y.. , élément de Rp, est le centre de gravité de l'ensemble

Les différents vecteurs sont reliés par des relations barycentriques non rappelées ici.

En convenant de noter les vecteurs précédents de Rp en ligne, on définit d'autre part les différentes matrices de variances-covariances :

T =

Σ

(yih - y..)'.(yih - y..) / N totale

i,h

Wi =

Σ

(yih - yi.)'.(yih - yi.) / ni. du groupe i h

W =

Σ

ni..Wi / N intraclasse i

B =

Σ

ni..(yi. - y..)'.(yi. - y..) / N interclasse i

et on a l'égalité matricielle : T = W + B

relation déjà rencontrée en classification automatique, avec des notations légèrement différentes toutefois.

On munit enfin l'espace Rp des observations de la métrique T-1, dite métrique de Mahalanobis, pour laquelle le nuage total est isotrope (ou de même inertie dans toutes les directions).

L'inertie totale dans une direction de vecteur u, T-1-unitaire, de Rp (noté en colonne) est en effet :

Iu = u'.T -1.T.T-1.u = 1 et se décompose en :

Iu = u'.T-1.W.T-1.u + u'.T-1.B.T-1.u Ou, en notant a le vecteur T-unitaire T-1.u :

Iu = a'.W.a + a'.B.a

2

(3)

Le pouvoir discriminant de la direction u sera d'autant meilleur que l'inertie interclasse a'.B.a est grande, ou ce qui revient au même que l'inertie intraclasse a'.W.a est faible.

On est donc conduit au problème classique d'optimisation sous contrainte : Max a'.B.a avec a'.T.a = 1

qui a pour solution les vecteurs propres associés aux valeurs propres décroissantes successives λ de la matrice T-1.B . Les aλ sont T-orthogonaux et les uλ correspondants T-1-orthogonaux.

Pouvant être considérée comme une ACP du nuage des k centres de gravité pour une métrique particulière, l'AFD ne peut obtenir plus de k-1 directions discriminantes, et donne par ailleurs lieu aux diverses représentations et indices communs en ACP.

----===ooOoo===----

(03.07.2009)

3

Références

Documents relatifs

Naive Bayes with density estimation.. Example:

Dans le cas d’une classification des individus, ou d’une représentation suivant les modalités d’une variable, un autre groupe apparaît : celui.. des centres de

Nous avons considéré que les variables initiales étaient centrées; cette transformation conserve le centrage, par contre les nouvelles variables ne sont pas réduites

Id ´ee : si a d ´esigne un axe de projection, les k centres de gravit ´e doivent ˆetre le plus s ´epar ´es possible alors que l’inertie de chaque nuage projet ´e issu de E k

1°) Entre les deux classes actuelles q et q', en lesquelles sont ré- partis les individus de I, peut-on dans E placer une cloison du type fixé (e.g. hyperplane : il est essentiel

Les critères basés sur les valeurs propres du chapitre précédent mettent en évidence une propriété d'optimalité des directions princi- pales dans la classe des directions

Résumé : L’objet de cet article est de proposer une nouvelle technique, l’analyse factorielle discriminante de Tableaux Multiples, qui généralise l’analyse factorielle

En 1961,Box et Hunter [10],[11] ont présenté un ensemble de résultats fondamen- taux pour la caractérisation et la construction des plans factoriels fractionnaires 2 k−p , notés