• Aucun résultat trouvé

Nous d´esignons par Ω la population que l’on cherche `a classifier.X , X = {X1, X2, . . . , Xk} d´esigne l’ensemble des variables d´efinies sur Ω. Pour des raisons de simplicit´e dans l’expos´e, nous supposons que toutes les variables sont quantitatives, cela ne changerait cependant rien au discours si certaines de ces variables ´etaient des variables qualitatives. Chaque va-riable Xi est associ´ee `a une fonction Pi dite fonction d’agr´egation et d´efinie de la mani`ere

suivante :

D´efinition 6.1. Fonction de classement ´el´ementaire Pi

∀i, i = 1, 2, . . . , k. Pi : Ω× Ω → E = {1, 2} telle que Pi(x, y) = 1 si et seulement si x et y sont dans la mˆeme classe d´efinie par Xi et Pi(x, y) = 2 sinon.

Exemple 6.1. X = {X1, X2, X3}, Ω = {a, b, c, d, e}.

La partition engendr´ee par X1 est {{a, b}, {c, d, e}}, la partition engendr´ee par X2 est {{a, b}, {c, d}, {e}} et la partition engendr´ee par X3 est {{a, b, c}, {d, e}}. Les fonctions de classification associ´ees sont :

P1 a b c d e a 1 1 2 2 2 b 1 1 2 2 2 c 2 2 1 1 1 d 2 2 1 1 1 e 2 2 1 1 1 P2 a b c d e a 1 1 2 2 2 b 1 1 2 2 2 c 2 2 1 1 2 d 2 2 1 1 2 e 2 2 2 2 1 P3 a b c d e a 1 1 1 2 2 b 1 1 1 2 2 c 1 1 1 2 2 d 2 2 2 1 1 e 2 2 2 1 1

De mani`ere g´en´erale, nous d´esignerons par P la famille de toutes les applications de Ω× Ω dans E, et E est appel´e l’ensemble des ”codes”.

Si nous connaissons les fonctions d’agr´egation Pi associ´ees `a chacune des variables Xi, nous avons une information sur la fonction de classification de la population des variables, prises individuellement. Bien ´evidemment, ces fonctions Pi sont enti`erement d´etermin´ees par la m´ethode de classification qui est utilis´ee avec la variable Xi : changer de m´ethode de classification am`ene `a changer de fonction Pi.

D´efinition 6.2. Fonction de classification

Nous appelons ”fonction de classification” toute application P : Ω× Ω × P0(X ) → E = {1, 2} qui traduit cette information, P0(X ) d´esignant la famille des parties non vides de X . Une fonction de classification correspond donc au proc´ed´e qui permet de classifier une population `a partir d’un ensemble non vide de variables mesur´ees sur cette population. Les applications Pi d´efinies pr´ec´edemment sont des cas particuliers de fonctions de clas-sification correspondant `a la situation o`u on n’utilise qu’une seule variable. Pour cette raison, on pourra les appeler ”fonctions ´el´ementaires de classification”.

Si nous revenons au probl`eme initial, il est clair que proposer une classification de la population `a partir de k variables Xi revient `a agr´eger les k fonctions ´el´ementaires de classification Pi en une fonction de classification P . Ceci suppose l’existence d’un proc´ed´e d’agr´egation, d’o`u la d´efinition suivante.

D´efinition 6.3. Fonction d’agr´egation :

On appelle fonction d’agr´egation toute fonction Ag qui associe aux fonctions de classifi-cation ´el´ementaires Pi une fonction de classification que nous noterons AgP .

Ainsi, la fonction d’agr´egation Ag est une application qui, `a toute famille{Pi}i=1,...,kde fonctions ´el´ementaires de classification, associe une fonction de classification not´ee AgP . Le propos dans la suite de ce chapitre ne sera pas de proposer un proc´ed´e de construction de cette fonction Ag, mais plutˆot d’examiner les propri´et´es qu’un tel proc´ed´e d’agr´ega-tion devrait ou pourrait poss´eder, `a partir desquelles il serait possible soit de contrˆoler le proc´ed´e, soit d’obtenir des r´esultats `a priori sur la classification obtenue.

Nous appellerons ”agr´egation” la proc´edure qui prend en charge les fonctions ´el´ementaires de classification et fournit une fonction de classification associ´ee `a la population des va-riables. Nous d´esignons par G la famille de toutes les fonctions d’agr´egation, c’est-`a-dire l’ensemble des proc´ed´es qui permettent de d´efinir une classification globale de la popula-tion `a partir des classificapopula-tions obtenues variable par variable.

Ceci ´etant pos´e, il est ´evident que les fonctions Pi correspondent en fait `a des relations d’´equivalence. Elles poss`edent donc certaines propri´et´es que nous allons traduire en pro-pri´et´e de sym´etrie et propro-pri´et´e de transitivit´e.

D´efinition 6.4. Propri´et´e de sym´etrie

∀i, i = 1, 2, . . . , k, la fonction Pi poss`ede la table de sym´etrie Si suivante : Si a Si(a)

1 1

Ceci traduit la propri´et´e de sym´etrie de la relation d’´equivalence.

D´efinition 6.5. Propri´et´e de transitivit´e

∀i, i = 1, 2, . . . , k, la fonction Pi poss`ede la table de de transitivit´e Ti suivante :

Ti Pi(y, z)

1 2

Pi(x, y) 1 {1} {2}

2 {2} {1,2}

Cette table de transitivit´e Ti est une multiapplication de E2 dans E (application de E dans P(E)) qui traduit le fait que :

– Si x et y sont dans la mˆeme classe, si y et z sont la mˆeme classe, n´ecessairement x et z sont dans la mˆeme classe,

– Si x et y sont dans la mˆeme classe et y et z dans deux classes diff´erentes, n´ecessai-rement x et z sont dans deux classes diff´erentes, ou l’inverse,

– Si x et y sont dans deux classes diff´erentes, si y et z sont dans deux classes diff´erentes, `a priori on ne peut rien dire quant `a x et z : ils peuvent ˆetre dans deux classes diff´erentes comme appartenir `a la mˆeme classe.

Bien ´evidemment, il existe des conditions de compatibilit´e entre les tables de sym´etrie et les tables de transitivit´e. Pour des raisons de simplicit´e dans l’´ecriture, l’indice i est omis dans les lignes qui suivent.

En particulier, si on note pour α et β dans E = {1, 2}, S(α, β) = (S(α), S(β)), on peut d´eterminer T S. Plusieurs cas sont `a consid´erer :

T S(1, 1) = T (S(1), S(1)) = T (1, 1) = 1 T S(1, 2) = T (S(1), S(2)) = T (1, 2) = 2 T S(2, 1) = T (S(2), S(1)) = T (2, 1) = 2 T S(2, 2) = T (S(2), S(2)) = T (2, 2) ={1, 2} = E Parall`element, d´eterminons ST : ST (1, 1) = S(1) = 1 ST (1, 2) = S(2) = 2 ST (2, 1) = S(2) = 2 ST (2, 2) = S({1, 2}) = {1, 2} = E Il vient donc une premi`ere propri´et´e. Lemme 6.1.

Posons i(α, β) = α et j(α, β) = β pour tout α et tout β dans E et calculons T (T (α, β), S(i(α, β)). T (T (1, 1), S(i(1, 1)) = T (1, 1) ={1} 3 j(1, 1) T (T (1, 2), S(i(1, 2)) = T (2, 1) ={2} 3 j(1, 2) T (T (2, 1), S(i(2, 1)) = T (2, 2) ={1, 2} 3 j(1, 2) T (T (2, 2), S(i(2, 2)) = T (2, 2) ={1, 2} 3 j(1, 2) On obtient donc : Lemme 6.2. ∀α, α ∈ E, ∀β, β ∈ E, j(α, β) ∈ T (T (α, β), S(i(α, β)) On en d´eduit en particulier le r´esultat suivant.

Lemme 6.3.

– ∀α, α ∈ E, ST (α, S(α)) = T (S(α), α) – ∀α, α ∈ E, α ∈ T (T (α, S(α), α)

Remarque : dans le cas plus g´en´eral o`u on ne travaille pas avec une relation d’´equi-valence, ce dernier r´esultat n’implique pas n´ecessairement que T (α, β) = T (β, α).

6.3 Etude de la structure des familles de variables