• Aucun résultat trouvé

Classification ascendante hiérarchique (CAH)

N/A
N/A
Protected

Academic year: 2022

Partager "Classification ascendante hiérarchique (CAH)"

Copied!
80
0
0

Texte intégral

(1)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

François Husson

Laboratoire de mathématiques appliquées - Agrocampus Rennes

[email protected]

(2)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique 3 Exemple

4 Algorithme de partitionnement : les K-means 5 Compléments

6 Caractérisation des classes d’individus

(3)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique

3 Exemple

4 Les K-means : un algorithme de partitionnement

5 Compléments

Consolidation de partition

Classification sur des données de grandes dimensions

(4)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique

3 Exemple

4 Algorithme de partitionnement : les K-means

5 Compléments

6 Caractérisation des classes d’individus

(5)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Introduction

• Définitions :

Classification : action de constituer ou construire des classes

Classe : ensemble d’individus (ou d’objets) possédant des traits de caractères communs (groupe, catégorie)

• Exemples

de classification : règne animal, disque dur d’un ordinateur, division géographique de la France, etc.

de classe : classe sociale, classe politique, etc.

• Deux types de classification :

hiérarchique : arbre, CAH

(6)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Exemple de hiérarchie : le règne animal

(7)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique

3 Exemple

4 Algorithme de partitionnement : les K-means

5 Compléments

(8)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Quelles données pour quels objectifs ?

La classification s’intéresse à des tableaux de données individus×variables quantitatives

Objectifs : production d’une structure (arbo- rescence) permettant :

• la mise en évidence de liens hiérarchiques entre individus ou groupes d’individus

• la détection d’un nb de classes

« naturel » au sein de la population A C B D E F G H

01234

(9)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Critères

Ressemblance entre individus :

• distance euclidienne

• indice de similarité

• . . .

Ressemblance entre groupes d’individus :

• saut minimum ou lien simple (plus petite distance)

• lien complet (plus grande distance)

• critère de Ward

x x

x x

x x x

x x

x x x x

x

(10)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Critères

Ressemblance entre individus :

• distance euclidienne

• indice de similarité

• . . .

Ressemblance entre groupes d’individus :

• saut minimum ou lien simple (plus petite distance)

• lien complet (plus grande distance)

• critère de Ward

x x

x x

x x x

x x

x x x x

x

(11)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Algorithme

ABC D E FG D 4.72

E 5.55 1.00 FG 4.07 2.01 1.81 H 4.75 3.16 2.90 1.12

ABC DE FG DE 4.72

FG 4.23 1.81 H 4.07 2.90 1.12

ABC DE DE 4.72

FGH 4.07 1.81 ABC DEFGH 4.07

4eregroupement 5eregroupement 6eregroupement 7eregroupement

{ABC},{DE},{FG},{H}

{ABC},{DE},{FGH}

{ABC},{DEFGH}

{ABCDEFGH}

1234

ABC D E F G D 4.72

E 5.55 1.00 F 4.07 2.01 2.06 G 4.68 2.06 1.81 0.61 H 4.75 3.16 2.90 1.28 1.12 3eregroupement

{A},{B},{C},{D},{E},{F},{G},{H}

{AC},{B},{D},{E},{F},{G},{H}

{ABC},{D},{E},{F},{G},{H}

{ABC},{D},{E},{FG},{H}

{ABC},{DE},{FG},{H}

A C B D E F G H

01

(12)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Arbres et partitions

Les arbres finissent tous ... par être coupés ! ! !

En définissant un niveau de coupure, on construit une partition

0.00.51.01.5

Hierarchical Clustering

inertia gain

Casarsa ParkhomenkoYURKOV Lorenzo NOOLBOURGUIGNON MARTINEAU KarlivansBARRAS Uldal HERNU TuriKarpov Clay SebrleSchoenbeck Ojaniemi BarrasQi Smirnov GomezZsivoczky Macey SmithMcMULLEN Bernard ZSIVOCZKYHernu KARPOV SEBRLETerek Pogorelov Korkizoglou CLAYBERNARD Nool WarnersDrews WARNERS SchwarzlAveryanov

0.00.51.01.5

Click to cut the tree

Remarque : vu le mode de construction, la partition n’est pas optimale mais est intéressante

(13)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Arbres et partitions

Les arbres finissent tous ... par être coupés ! ! !

En définissant un niveau de coupure, on construit une partition

0.00.51.01.5

Hierarchical Clustering

inertia gain

0.51.01.5

Click to cut the tree

(14)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

Quand une partition est-elle bonne ?

• Si les individus d’une même classe sont proches

• Si les individus de 2 classes différentes sont éloignés

Et mathématiquement ça se traduit par ?

• Variabilité intra-classe petite

• Variabilité inter-classe grande

=⇒Deux critères, lequel choisir ?

(15)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

Quand une partition est-elle bonne ?

• Si les individus d’une même classe sont proches

• Si les individus de 2 classes différentes sont éloignés

Et mathématiquement ça se traduit par ?

• Variabilité intra-classe petite

• Variabilité inter-classe grande

=⇒Deux critères, lequel choisir ?

(16)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

Quand une partition est-elle bonne ?

• Si les individus d’une même classe sont proches

• Si les individus de 2 classes différentes sont éloignés

Et mathématiquement ça se traduit par ?

• Variabilité intra-classe petite

• Variabilité inter-classe grande

=⇒Deux critères, lequel choisir ?

(17)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

¯

xk moyenne de xk, ¯xqk moyenne de xk dans la classeq

Q

X

q=1 I

X

i=1

(xiqkx¯k)2

| {z } Inertie totale

=

Q

X

q=1 I

X

i=1

(xiqkx¯qk)2

| {z } Inertie intra

+

Q

X

q=1 I

X

i=1

xqkx¯k)2

| {z } Inertie inter

x x1 x2

x

(18)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

¯

xk moyenne de xk, ¯xqk moyenne de xk dans la classeq

Q

X

q=1 I

X

i=1

(xiqkx¯k)2

| {z } Inertie totale

=

Q

X

q=1 I

X

i=1

(xiqkx¯qk)2

| {z } Inertie intra

+

Q

X

q=1 I

X

i=1

xqkx¯k)2

| {z } Inertie inter

x x1 x2

x

x3

=⇒1 seul critère !

(19)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

La qualité d’une partition est mesurée par : 0≤ Inertie inter

Inertie totale ≤1

Inertieinter

Inertietotale = 0 =⇒ ∀q,¯xqk = ¯xk : les classes ont même moyennes Ne permet pas de classifier

Inertieinter

Inertietotale

= 1 =⇒ ∀q,∀i,xiqk = ¯xqk : individus d’1 classe identiques Idéal pour classifier

Attention: ce critère ne peut être jugé en absolu car il dépend du nb d’individus et du nb de classes

(20)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

La qualité d’une partition est mesurée par : 0≤ Inertie inter

Inertie totale ≤1 Inertieinter

Inertietotale = 0 =⇒ ∀q,¯xqk = ¯xk : les classes ont même moyennes Ne permet pas de classifier

Inertieinter

Inertietotale

= 1 =⇒ ∀q,∀i,xiqk = ¯xqk : individus d’1 classe identiques Idéal pour classifier

Attention: ce critère ne peut être jugé en absolu car il dépend du nb d’individus et du nb de classes

(21)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

La qualité d’une partition est mesurée par : 0≤ Inertie inter

Inertie totale ≤1 Inertieinter

Inertietotale = 0 =⇒ ∀q,¯xqk = ¯xk : les classes ont même moyennes Ne permet pas de classifier

Inertieinter

Inertietotale

= 1 =⇒ ∀q,∀i,xiqk = ¯xqk : individus d’1 classe identiques Idéal pour classifier

Attention: ce critère ne peut être jugé en absolu car il dépend du nb d’individus et du nb de classes

(22)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Qualité d’une partition

La qualité d’une partition est mesurée par : 0≤ Inertie inter

Inertie totale ≤1 Inertieinter

Inertietotale = 0 =⇒ ∀q,¯xqk = ¯xk : les classes ont même moyennes Ne permet pas de classifier

Inertieinter

Inertietotale

= 1 =⇒ ∀q,∀i,xiqk = ¯xqk : individus d’1 classe identiques Idéal pour classifier

Attention: ce critère ne peut être jugé en absolu car il dépend du nb d’individus et du nb de classes

(23)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Méthode de Ward

• Initialisation : 1 classe = 1 individu =⇒ In. inter = In. totale

• A chaque étape : agréger les classesa et b qui minimisent la diminution de l’inertie inter

Regroupe les objets de faible poids et évite l’effet de chaîne

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

−2 0 2 4 6 8 10

−20246810

1 6105 3152 4 7139 811 12 14 16 18 25 26 19 20 30 23 22 27 24 28 29 17 21

Saut minimum Saut minimum

1 6 510713811 122 9 315414 16 18 25 26 24 28 29 17 19 20 30 23 21 22 27

Ward Ward

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

***************************

−2 0 2 4 6 8 10

−20246810 131 32610 33735 34 13 36537 38 39 40 41 42 43 44 45 46 47 48 49 26 57 56 50 51 52 53 54 55 18 25315 22 27 19 20 30 232 424 28 29 219 811 12 14 16 17

Saut minimum

131 326 510 33811 12735 34 13 362 9 315414 16 18 25 24 28 29 17 19 20 30 23 21 53 54 55 22 27 26 57 56 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Ward

Regroupe des classes ayant des centres de gravité proches

Intérêt immédiat pour la classification

(24)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Méthode de Ward

• Initialisation : 1 classe = 1 individu =⇒ In. inter = In. totale

• A chaque étape : agréger les classesa et b qui minimisent la diminution de l’inertie inter

Inertie(a) + Inertie(b) = Inertie(a∪b)mamb

ma+mb d2(a,b)

Regroupe les objets de faible poids et évite l’effet de chaîne

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

−2 0 2 4 6 8 10

−20246810

1 6105 3152 4 7139 811 12 14 16 18 25 26 19 20 30 23 22 27 24 28 29 17 21

Saut minimum Saut minimum

1 6 510713811 122 9 315414 16 18 25 26 24 28 29 17 19 20 30 23 21 22 27

Ward Ward

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

***************************

−2 0 2 4 6 8 10

−20246810 131 32610 33735 34 13 36537 38 39 40 41 42 43 44 45 46 47 48 49 26 57 56 50 51 52 53 54 55 18 25315 22 27 19 20 30 232 424 28 29 219 811 12 14 16 17

Saut minimum

131 326 510 33811 12735 34 13 362 9 315414 16 18 25 24 28 29 17 19 20 30 23 21 53 54 55 22 27 26 57 56 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Ward

Regroupe des classes ayant des centres de gravité proches

Intérêt immédiat pour la classification

(25)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Méthode de Ward

• Initialisation : 1 classe = 1 individu =⇒ In. inter = In. totale

• A chaque étape : agréger les classesa et b qui minimisent la diminution de l’inertie inter

Inertie(a) + Inertie(b) = Inertie(a∪b)mamb

ma+mb d2(a,b)

| {z } à minimiser

Regroupe les objets de faible poids et évite l’effet de chaîne

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

−2 0 2 4 6 8 10

−20246810

1 6105 3152 4 7139 811 12 14 16 18 25 26 19 20 30 23 22 27 24 28 29 17 21

Saut minimum Saut minimum

1 6 510713811 122 9 315414 16 18 25 26 24 28 29 17 19 20 30 23 21 22 27

Ward Ward

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

***************************

−2 0 2 4 6 8 10

−20246810 131 32610 33735 34 13 36537 38 39 40 41 42 43 44 45 46 47 48 49 26 57 56 50 51 52 53 54 55 18 25315 22 27 19 20 30 232 424 28 29 219 811 12 14 16 17

Saut minimum

131 326 510 33811 12735 34 13 362 9 315414 16 18 25 24 28 29 17 19 20 30 23 21 53 54 55 22 27 26 57 56 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Ward

Regroupe des classes ayant des centres de gravité proches

Intérêt immédiat pour la classification

(26)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Méthode de Ward

• Initialisation : 1 classe = 1 individu =⇒ In. inter = In. totale

• A chaque étape : agréger les classesa et b qui minimisent la diminution de l’inertie inter

Inertie(a) + Inertie(b) = Inertie(a∪b)mamb

ma+mb d2(a,b)

| {z } à minimiser Regroupe les objets de faible poids et

évite l’effet de chaîne

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

−2 0 2 4 6 8 10

−20246810

1 6105 3152 4 7139 811 12 14 16 18 25 26 19 20 30 23 22 27 24 28 29 17 21

Saut minimum Saut minimum

1 6 510713811 122 9 315414 16 18 25 26 24 28 29 17 19 20 30 23 21 22 27

Ward Ward

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

***************************

−20246810 131 32610 33735 34 13 36537 38 39 40 41 42 43 44 45 46 47 48 49 26 57 56 50 51 52 53 54 55 18 25315 22 27 19 20 30 232 424 28 29 219 811 12 14 16 17

Saut minimum

131 326 510 33811 12735 34 13 362 9 315414 16 18 25 24 28 29 17 19 20 30 23 21 53 54 55 22 27 26 57 56 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 Ward

Regroupe des classes ayant des centres de gravité proches

Intérêt immédiat pour la classification

(27)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Méthode de Ward

• Initialisation : 1 classe = 1 individu =⇒ In. inter = In. totale

• A chaque étape : agréger les classesa et b qui minimisent la diminution de l’inertie inter

Inertie(a) + Inertie(b) = Inertie(a∪b)mamb

ma+mb d2(a,b)

| {z } à minimiser Regroupe les objets de faible poids et

évite l’effet de chaîne

x xx xxxxx x

xx

x x

xx

+ + +++

+ ++ ++ ++++

+

0246810

1 6105 3152 4 7139 811 12 14 16 18 25 26 19 20 30 23 22 27 24 28 29 17 21

Saut minimum

1 6 510713811 122 9 315414 16 18 25 26 24 28 29 17 19 20 30 23 21 22 27

Ward Regroupe des classes ayant des centres de gravité proches

(28)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique

3 Exemple

4 Algorithme de partitionnement : les K-means

5 Compléments

6 Caractérisation des classes d’individus

(29)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Les données température

• 15 individus : villes de France

• 12 variables : températures mensuelles moyennes (sur 30 ans)

Janv Févr Mars Avri Mai Juin juil Août Sept Octo Nove Déce Lati Long Bordeaux 5.6 6.6 10.3 12.8 15.8 19.3 20.9 21 18.6 13.8 9.1 6.2 44.5 -0.34

Brest 6.1 5.8 7.8 9.2 11.6 14.4 15.6 16 14.7 12 9 7 48.24 -4.29

Clermont 2.6 3.7 7.5 10.3 13.8 17.3 19.4 19.1 16.2 11.2 6.6 3.6 45.47 3.05 Grenoble 1.5 3.2 7.7 10.6 14.5 17.8 20.1 19.5 16.7 11.4 6.5 2.3 45.1 5.43

Lille 2.4 2.9 6 8.9 12.4 15.3 17.1 17.1 14.7 10.4 6.1 3.5 50.38 3.04

Lyon 2.1 3.3 7.7 10.9 14.9 18.5 20.7 20.1 16.9 11.4 6.7 3.1 45.45 4.51 Marseille 5.5 6.6 10 13 16.8 20.8 23.3 22.8 19.9 15 10.2 6.9 43.18 5.24 Montpellier 5.6 6.7 9.9 12.8 16.2 20.1 22.7 22.3 19.3 14.6 10 6.5 43.36 3.53 Nantes 5 5.3 8.4 10.8 13.9 17.2 18.8 18.6 16.4 12.2 8.2 5.5 47.13 -1.33 Nice 7.5 8.5 10.8 13.3 16.7 20.1 22.7 22.5 20.3 16 11.5 8.2 43.42 7.15 Paris 3.4 4.1 7.6 10.7 14.3 17.5 19.1 18.7 16 11.4 7.1 4.3 48.52 2.2 Rennes 4.8 5.3 7.9 10.1 13.1 16.2 17.9 17.8 15.7 11.6 7.8 5.4 48.05 -1.41

(30)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Les données température : l’arbre hiérarchique

0246

Hierarchical clustering

inertia gain

68

Cluster Dendrogram

ulouse eaux Nice tpellier rseille Brest ennes antes noble Lyon Paris Vichy rmont Lille bourg

024

(31)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Les données température

15 classes en 14 classes : 0.01 14 classes en 13 classes : 0.02 13 classes en 12 classes : 0.03 12 classes en 11 classes : 0.05 11 classes en 10 classes : 0.06 10 classes en 9 classes : 0.09

Pertes d’inertie inter lors du passage de

46

10 classes en 9 classes : 0.09 9 classes en 8 classes : 0.17 8 classes en 7 classes : 0.19 7 classes en 6 classes : 0.26 6 classes en 5 classes : 0.42 5 classes en 4 classes : 0.56 4 classes en 3 classes : 0.69 3 classes en 2 classes : 1.56

02

inertia gain

Somme des pertes d’inertie = 12

(32)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Les données température

15 classes en 14 classes : 0.01 14 classes en 13 classes : 0.02 13 classes en 12 classes : 0.03 12 classes en 11 classes : 0.05 11 classes en 10 classes : 0.06 10 classes en 9 classes : 0.09

Pertes d’inertie inter lors du passage de

46

10 classes en 9 classes : 0.09 9 classes en 8 classes : 0.17 8 classes en 7 classes : 0.19 7 classes en 6 classes : 0.26 6 classes en 5 classes : 0.42 5 classes en 4 classes : 0.56 4 classes en 3 classes : 0.69 3 classes en 2 classes : 1.56 2 classes en 1 classe : 7.88

02

inertia gain

Grosse perte si on passe de 2 classes à 1 seule donc on préfère garder 2 classes

Somme des pertes d’inertie = 12

(33)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

Doit-on faire 2 groupes ? 3 groupes ? 4 ?

Découpage en 2 groupes : Inertie inter

Inertie totale = 7.88

12 = 66% A quoi comparer ce pourcen- tage ?

6824

(34)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

Doit-on faire 2 groupes ? 3 groupes ? 4 ?

Découpage en 2 groupes : Inertie inter

Inertie totale = 7.88

12 = 66% A quoi comparer ce pourcen- tage ?

68 Toulouse Bordeaux Nice Montpellier Marseille Brest Rennes Nantes Grenoble Lyon Paris Vichy Clermont Lille Strasbourg

024

(35)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

Doit-on faire 2 groupes ? 3 groupes ? 4 ?

Découpage en 2 groupes : Inertie inter

Inertie totale = 7.88

12 = 66%

A quoi comparer ce pourcen- tage ?

6824

(36)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

Doit-on faire 2 groupes ? 3 groupes ? 4 ?

Découpage en 2 groupes : Inertie inter

Inertie totale = 7.88

12 = 66%

A quoi comparer ce pourcen- tage ?

68 Toulouse Bordeaux Nice Montpellier Marseille Brest Rennes Nantes Grenoble Lyon Paris Vichy Clermont Lille Strasbourg

024

(37)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

66 % de l’information résumée avec ce découpage en 2 classes A quoi comparer ce pourcentage ?

24

Dim 2 (18.97%)

Lille Brest

Rennes

Nantes Nice

-20

Dim 2 (18.97%)

Lille

Vichy Clermont Grenoble

Paris

Lyon

Toulouse Bordeaux

Montpellier Marseille

Nice

(38)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

68 Toulouse Bordeaux Nice Montpellier Marseille Brest Rennes Nantes Grenoble Lyon Paris Vichy Clermont Lille Strasbourg

024

Séparer villes froides en 2 groupes :

Inertie inter

Inertie totale = 1.56

12 = 13%

(39)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

68 use eaux Nice ellier eille rest nnes ntes oble yon aris ichy ont Lille ourg

024

Séparer villes froides en 2 groupes :

Inertie inter

Inertie totale = 1.56

12 = 13%

(40)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Utilisation de l’arbre pour construire une partition

Passage de 15 villes à 3 classes :66 %+ 13 % = 79 % de la variabilité des données

24

Dim 2 (18.97%)

Lille Brest

Rennes Nantes

Nice

-4 -2 0 2 4 6

-20

Dim 1 (79.85%)

Dim 2 (18.97%)

Lille

Strasbourg Vichy Clermont Grenoble

Paris

Lyon

Toulouse Bordeaux

Montpellier Marseille

Nice

(41)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Détermination d’un nombre de classes

• A partir de l’arbre

• Dépend de l’usage (enquête, . . . )

• A partir du diagramme des indices de niveau

• Critère ultime :

interprétabilité des classes

6824 462

(42)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique

3 Exemple

4 Algorithme de partitionnement : les K-means

5 Compléments

6 Caractérisation des classes d’individus

(43)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Algorithme de partitionnement : les K-means

Algorithme d’agrégation autour des centres mobiles (K-means)

• ChoisirQ centres de classes au hasard

• Affecter les points au centre le plus proche

• Calculer lesQ

−4 −2 0 2 4 6

−2−101234

Dim 1 ( 79.85 %)

Dim 2 ( 18.97 %) Bordeaux

Brest

Clermont

Grenoble Lille

Lyon Marseille Montpellier Nantes

Nice Paris Rennes

Strasbourg Toulouse Vichy

−4 −2 0 2 4 6

−2−101234

Dim 1 ( 79.85 %)

Dim 2 ( 18.97 %)

Clermont

GrenobleLyon Marseille Montpellier Paris ToulouseBordeaux Brest

Nantes Nice Rennes

Lille

Strasbourg Vichy

−4 −2 0 2 4 6

−2−101234

Dim 1 ( 79.85 %)

Dim 2 ( 18.97 %) Bordeaux

Brest

Clermont

Grenoble Lille

Lyon Marseille Montpellier Nantes

Nice Paris Rennes

Strasbourg Toulouse Vichy

−4 −2 0 2 4 6

−2−101234

Dim 1 ( 79.85 %)

Dim 2 ( 18.97 %)

Lyon Marseille Montpellier Paris ToulouseBordeaux Brest

Nantes Nice Rennes

Clermont

Grenoble Lille

Strasbourg Vichy

−4 −2 0 2 4 6

−2−101234

Dim 1 ( 79.85 %)

Dim 2 ( 18.97 %) Bordeaux

Brest

Clermont

Grenoble Lille

Lyon Marseille Montpellier Nantes

Nice Paris Rennes

Strasbourg Toulouse Vichy

−4 −2 0 2 4 6

−2−101234

Dim 1 ( 79.85 %)

Dim 2 ( 18.97 %)

Bordeaux

Marseille Montpellier

Nice Toulouse Brest

Nantes Rennes

Clermont

Grenoble Lille

Lyon Paris

Strasbourg Vichy

(44)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Classification ascendante hiérarchique (CAH)

1 Introduction

2 Principes de la Classification Ascendante Hiérarchique

3 Exemple

4 Algorithme de partitionnement : les K-means

5 Compléments

6 Caractérisation des classes d’individus

(45)

Introduction Principes de la CAH Exemple K-means Compléments Description des classes

Consolidation d’une partition obtenue par CAH

La partition obtenue par CAH n’est pas optimale et peut être améliorée, consolidée, par les K-means

Algorithme de consolidation :

• la partition obtenue par CAH est utilisée comme initialisation de l’algorithme de partitionnement

• quelques étapes de K-means sont itérées

=⇒amélioration de la partition (souvent non décisive)

Références

Documents relatifs

Résumer le tableau à l’aide d’un petit nombre de facteurs - Résumer le tableau à l aide d un petit nombre de facteurs - Visualiser le positionnement des individus les uns

Pour réaliser une CAH, nous devons faire le choix d'une distance entre les individus, et d'un indice d'agrégation mesurant la distance entre les classes.. Cet indice est croissant

A chaque classe H est associé un nombre v(H) : la valeur de l'indice d'agrégation entre les deux objets qui ont été réunis pour former cette classe.. Cet indice est croissant pour

La question qui nous est ici posée est beaucoup plus embarrassante que la première. En effet, il apparaît que ces deux nombres, 14 ou 19, sont très faibles et que si nous

Partant d'un sommet s on cherche le sommet v(s) qui en est le plus proche en calculant les n distances de s à tous les sommets non rangés dans la chaîne; en cherche ensuite v(v(s))

5 VoX.ntb dz vue local zt global zn claA&X.£X.catX.on a&czndantz nllKaKcnicjiiz : De la complémentarité des inerties il résulte que pour autant qu'on les évalue

Commentaire : le tableau Ncl contient les numéros des classes qu'on désire retenir pour elles-mêmes ; le tableau Ret sera l'indicatrice de la sous-hiérarchie retenue avec

FLUX] offre un nouveau critère d'agrégation : ce cri- tère peut servir 3ans l'algorithme de base de la C.A.H., mais aussi dans les algorithmes accélérés d'agrégation des