Position du probl`eme - Contribution aux méthodes de classification non supervisée via des appr

Nous désignons par Ω la population que l’on cherche à classifier.X , X = {X1, X2, . . . , Xk} désigne l’ensemble des variables définies sur Ω. Pour des raisons de simplicité dans l’exposé, nous supposons que toutes les variables sont quantitatives, cela ne changerait cependant rien au discours si certaines de ces variables étaient des variables qualitatives. Chaque va-riable Xi est associée à une fonction Pi dite fonction d’agrégation et définie de la manière

Définition 6.1. Fonction de classement élémentaire Pi

∀i, i = 1, 2, . . . , k. Pi : Ω× Ω → E = {1, 2} telle que Pi(x, y) = 1 si et seulement si x et y sont dans la mˆeme classe d´efinie par Xi et Pi(x, y) = 2 sinon.

Exemple 6.1. X = {X1, X2, X3}, Ω = {a, b, c, d, e}.

La partition engendrée par X1 est {{a, b}, {c, d, e}}, la partition engendrée par X2 est {{a, b}, {c, d}, {e}} et la partition engendrée par X3 est {{a, b, c}, {d, e}}. Les fonctions de classification associées sont :

P1 a _b c _d e a ₁ ₁ ₂ ₂ ₂ b 1 1 2 2 2 c ₂ ₂ ₁ ₁ ₁ d 2 2 1 1 1 e ₂ ₂ ₁ ₁ ₁ P2 a _b c _d e a ₁ ₁ ₂ ₂ ₂ b 1 1 2 2 2 c ₂ ₂ ₁ ₁ ₂ d 2 2 1 1 2 e ₂ ₂ ₂ ₂ ₁ P3 a _b c _d e a ₁ ₁ ₁ ₂ ₂ b 1 1 1 2 2 c ₁ ₁ ₁ ₂ ₂ d 2 2 2 1 1 e ₂ ₂ ₂ ₁ ₁

De manière générale, nous désignerons par P la famille de toutes les applications de Ω× Ω dans E, et E est appelé l’ensemble des ”codes”.

Si nous connaissons les fonctions d’agrégation Pi associées à chacune des variables Xi, nous avons une information sur la fonction de classification de la population des variables, prises individuellement. Bien évidemment, ces fonctions Pi sont entièrement déterminées par la méthode de classification qui est utilisée avec la variable Xi : changer de méthode de classification amène à changer de fonction Pi.

D´efinition 6.2. Fonction de classification

Nous appelons ”fonction de classification” toute application P : Ω× Ω × P0(X ) → E = {1, 2} qui traduit cette information, P0(X ) désignant la famille des parties non vides de X . Une fonction de classification correspond donc au procédé qui permet de classifier une population à partir d’un ensemble non vide de variables mesurées sur cette population. Les applications Pi définies précédemment sont des cas particuliers de fonctions de clas-sification correspondant à la situation où on n’utilise qu’une seule variable. Pour cette raison, on pourra les appeler ”fonctions élémentaires de classification”.

Si nous revenons au problème initial, il est clair que proposer une classification de la population à partir de k variables Xi revient à agréger les k fonctions élémentaires de classification Pi en une fonction de classification P . Ceci suppose l’existence d’un procédé d’agrégation, d’où la définition suivante.

D´efinition 6.3. Fonction d’agr´egation :

On appelle fonction d’agrégation toute fonction Ag qui associe aux fonctions de classifi-cation élémentaires Pi une fonction de classification que nous noterons AgP .

Ainsi, la fonction d’agrégation Ag est une application qui, à toute famille{Pi}i=1,...,kde fonctions élémentaires de classification, associe une fonction de classification notée AgP . Le propos dans la suite de ce chapitre ne sera pas de proposer un procédé de construction de cette fonction Ag, mais plutôt d’examiner les propriétés qu’un tel procédé d’agréga-tion devrait ou pourrait posséder, à partir desquelles il serait possible soit de contrôler le procédé, soit d’obtenir des résultats à priori sur la classification obtenue.

Nous appellerons ”agrégation” la procédure qui prend en charge les fonctions élémentaires de classification et fournit une fonction de classification associée à la population des va-riables. Nous désignons par G la famille de toutes les fonctions d’agrégation, c’est-à-dire l’ensemble des procédés qui permettent de définir une classification globale de la popula-tion à partir des classificapopula-tions obtenues variable par variable.

Ceci étant posé, il est évident que les fonctions Pi correspondent en fait à des relations d’équivalence. Elles possèdent donc certaines propriétés que nous allons traduire en pro-priété de symétrie et propro-priété de transitivité.

Définition 6.4. Propriété de symétrie

∀i, i = 1, 2, . . . , k, la fonction Pi poss`ede la table de sym´etrie Si suivante : Si a Si(a)

1 1

Ceci traduit la propriété de symétrie de la relation d’équivalence.

Définition 6.5. Propriété de transitivité

∀i, i = 1, 2, . . . , k, la fonction Pi poss`ede la table de de transitivit´e Ti suivante :

Ti Pi(y, z)

1 2

Pi(x, y) 1 {1} {2}

2 {2} {1,2}

Cette table de transitivit´e Ti est une multiapplication de E2 dans E (application de E dans P(E)) qui traduit le fait que :

– Si x et y sont dans la même classe, si y et z sont la même classe, nécessairement x et z sont dans la même classe,

– Si x et y sont dans la même classe et y et z dans deux classes différentes, nécessai-rement x et z sont dans deux classes différentes, ou l’inverse,

– Si x et y sont dans deux classes différentes, si y et z sont dans deux classes différentes, à priori on ne peut rien dire quant à x et z : ils peuvent être dans deux classes différentes comme appartenir à la même classe.

Bien évidemment, il existe des conditions de compatibilité entre les tables de symétrie et les tables de transitivité. Pour des raisons de simplicité dans l’écriture, l’indice i est omis dans les lignes qui suivent.

En particulier, si on note pour α et β dans E = {1, 2}, S∗(α, β) = (S(α), S(β)), on peut déterminer T S∗. Plusieurs cas sont à considérer :

T S∗(1, 1) = T (S(1), S(1)) = T (1, 1) = 1 T S∗(1, 2) = T (S(1), S(2)) = T (1, 2) = 2 T S∗(2, 1) = T (S(2), S(1)) = T (2, 1) = 2 T S∗(2, 2) = T (S(2), S(2)) = T (2, 2) ={1, 2} = E Parallèlement, déterminons ST : ST (1, 1) = S(1) = 1 ST (1, 2) = S(2) = 2 ST (2, 1) = S(2) = 2 ST (2, 2) = S({1, 2}) = {1, 2} = E Il vient donc une première propriété. Lemme 6.1.

Posons i(α, β) = α et j(α, β) = β pour tout α et tout β dans E et calculons T (T (α, β), S(i(α, β)). T (T (1, 1), S(i(1, 1)) = T (1, 1) ={1} 3 j(1, 1) T (T (1, 2), S(i(1, 2)) = T (2, 1) ={2} 3 j(1, 2) T (T (2, 1), S(i(2, 1)) = T (2, 2) ={1, 2} 3 j(1, 2) T (T (2, 2), S(i(2, 2)) = T (2, 2) ={1, 2} 3 j(1, 2) On obtient donc : Lemme 6.2. ∀α, α ∈ E, ∀β, β ∈ E, j(α, β) ∈ T (T (α, β), S(i(α, β)) On en d´eduit en particulier le r´esultat suivant.

Lemme 6.3.

– ∀α, α ∈ E, ST (α, S(α)) = T (S(α), α) – ∀α, α ∈ E, α ∈ T (T (α, S(α), α)

Remarque : dans le cas plus général où on ne travaille pas avec une relation d’équi-valence, ce dernier résultat n’implique pas nécessairement que T (α, β) = T (β, α).

6.3 Etude de la structure des familles de variables

Dans le document Contribution aux méthodes de classification non supervisée via des approches prétopologiques et d'agrégation d'opinions (Page 145-149)