• m ´ethode de base: ACP

(1)

• Typologie de la r ´eduction de dimension

• m ´ethode de base: ACP

• “groupement (clustering) des dimensions”

• extensions:

• ACP non-lin ´eaire (NLPCA)

• ´echelonnement multidimensionnel (multidimensional scaling – MDS)

• cartes auto-organisatrices (self-organizing maps – SOM)

• local linear embedding (LLE)

• ISOMAP

• courbes principales (principal curves)

(2)

• Typologie de groupement (clustering)

• m ´ethode de base: k-moyennes

• groupement (clustering) des points

• extensions:

• k-moyennes flou (fuzzy k-means) ≡ SOM

• densit ´es du m ´elange ⊆ k-moyennes flou

• groupement hi´erarchique (hierarchical clustering)

(3)

• Densit ´es du m ´elange

• mod `ele semi-param ´etrique:

p(x | ! ) = "

^k

!=1

p(x | C

_!

, !

!

)P( C

_!

)

• k classes

• vecteur des param `etres: ! = ( !

1

, . . ., !

k

)

• densit ´es de composante: p(x | C

_!

, !

!

)

• probabilit és a-priori (param ètres du m élange): P(C

_!

)

• Objectif

• estimer ! , (P(C

_!

)) ´etant donn ´e X

_n

= { X

1

, X

2

, . . . , X

n

}

(4)

• Approche de maximum de vraisemblance

• p( X

_n

_| _! ) = #

ⁿ

i=1

p(x

_i

| ! )

• l = "

ⁿ

i=1

log p(x

_i

| ! )

!

!_!

l = "

ⁿ

i=1

1 p(x

_i

| ! ) !

!_!

!

k

"

j=1

p(x

_i

| C

_j

, !

j

)P(C

_j

)

"

= "

ⁿ

i=1

P( C

_!

| x

_i

, ! ) !

!_!

log p(x

_i

| C

_!

, !

!

) = 0

• o `u P(C

_!

| x

_i

, ! ) = p(x

_i

| C

_!

, !

!

)P(C

_!

)

p(x

_i

| ! )

(5)

• Algorithme it ´eratif

D ENSIT ES ´ D U M ´ ELANGE ( X

_n

) 1 !

⁽⁰⁾

← #

!

⁽⁰⁾₁

, . . ., !

⁽⁰⁾_k

$

, j ← 0 2 faire

3 pour ! ← 1 `a k faire 4 pour i ← 1 `a n faire

5 P

_!,i⁽^j)

= P(C

_!

| x

i

, !

⁽^j)

) ← p(x

_i

| C

_!

, !

⁽_!^j)

)P(C

_!

) p(x

_i

| !

⁽^j)

) 6 pour ! ← 1 `a k faire

7 !

⁽_!^j+1)

← solution

%

n

"

i=1

P

_!,i⁽^j)

!

!_!

log p(x

_i

| C

_!

, !

!

) = 0

&

8 j ← j + 1 9 jusqu’`a '

1 −

_l(^lj+1)^(j)

( < seuil

(6)

• k-moyennes flou (fuzzy k-means)

• x

i

appartient `a V

!

avec un poids W

i,!

( ∼ P(C

_!

| x

i

))

• W

i,!

est normalis ´e pour tous les points x

i

:

k

"

!=1

W

_i,!

= 1

• objectif: minimiser

J

_fuz

= "

^k

!=1 n

"

i=1

W

^b_i,!

& x

_i

− µ

_!

&

²

(7)

• Solution (b > 1)

• µ

_!

= "

ⁿi=1

W

^b_i,!

x

_i

"

ⁿi=1

W

^b_i,!

• W

_i,!

= (1/d

_i!

)

^1/(b⁻¹⁾

"

^k_!'=1

(1/d

_i!'

)

^1/(b⁻¹⁾

, (d

_i!

= & x

_i

− µ

_!

&

²

)

• algorithme it ´eratif

(8)

• Normalisation

.2 .4 .6 .8 1

0 .2 .4 .6 .8 1

.25 .5 .75 1 1.25 1.5 1.75 2

0 .1 .2 .3 .4 .5

.1 .2 .3 .4 .5 0

.2 .4 .6 .8 1 1.2 1.4 1.6

2 00 .5

( )

x2

x1

x₁

.5 0

( )

0 2

(9)

• Normalisation

x

₁

x

₁

x

₂

x

₂

(10)

• Crit `eres diff ´erents

• m ´etrique de Minkowski:

d(x, x

^'

) = )

d

"

i=1

| x

_i

− x

^'_i

|

^p

*

1/p

• mesures de similarit ´e:

s(x, x

^'

) = x

^t

x

^'

& x & & x

^'

&

• x

^t

x

^'

est le nombre des attributs partag´es (variables binaires)

• & x & & x

^'

& est la moyenne géom étrique des attributs posséd és par x et x

^'

• s(x, x

^'

): possession relative des attributs

(11)

• Crit `eres diff ´erents

• versions diff ´erentes:

• fraction des attributs partag´es: s(x, x

^'

) = x

^t

x

^'

d

• distance de Tanimoto: s(x, x

^'

) = x

^t

x

^'

x

^t

x + x

^'^t

x

^'

− x

^t

x

^'

(12)

• Crit `eres diff ´erents

• m ´etrique quadratique:

J

_e

= "

^c

i=1

"

x∈

V

_i

& x

_i

− v

_i

&

²

= 1 2

c

"

i=1

n

_i

s

_i

• o `u s

i

= 1 n

²_i

"

x∈

V

_i

"

x^'∈

V

_i

& x − x

^'

&

²

• g ´en ´eralisations:

s

_i

= 1 n

²_i

"

x∈

V

_i

"

x^'∈

V

_i

s(x, x

^'

) s

_i

= max

x,x^'∈

V

_i

s(x, x

^'

)

(13)

• Groupement hi ´erarchique

• dendogramme:

0 10 20 30 40 50 60 70 80 90

x

₁

100 k = 1

k = 2 k = 3 k = 4 k = 5 k = 6 k = 7

x

₂

x

₃

x

₄

x

₅

x

₆

x

₇

x

₈

k = 8

´ec helle de similarit ´e

(14)

• Groupement hi ´erarchique agglom ´eratif

G ROUPEMENT H IERARCHIQUE A GGLOMERATIF ( X

_n

, c) 1 + c ← n

2 pour i ← 1 `a n faire 3 V

_i

← { x

_i

}

4 faire

5 trouver les groupes les plus proches V

i

et V

j

6 fusionner V

_i

et V

_j

7 c + ← + c − 1

8 jusqu’`a c = + c

(15)

• Distances des groupes

• d

min

(V

_i

, V

j

) = min

x∈V_i x^'∈V_j

& x − x

^'

&

• d

_max

(V

_i

, V

_j

) = max

x∈V_i x^'∈V_j

& x − x

^'

&

• d

_avg

(V

_i

, V

_j

) = 1 n

_i

n

_j

"

x∈V_i

"

x^'∈V_j

& x − x

^'

&

• d

mean

(V

_i

, V

j

) = &

ⁱ

−

^j

&

(16)

• Groupement hi ´erarchique – plus proche voisin

• d

min

(V

_i

, V

j

) = min

x∈V_i x^'∈V_j

& x − x

^'

&

• algorithme du lien simple (single-linkage)

• arbre couvrant minimal (Kruskal)

(17)

• Groupement hi ´erarchique – plus proche voisin

(18)

• Groupement hi ´erarchique – plus loin voisin

• d

max

(V

_i

, V

j

) = max

x∈V_i x^'∈V_j

& x − x

^'

&

• algorithme du lien complet (complete linkage)

• augmenter le diam `etre le moins possible

(19)

• Groupement hi ´erarchique – plus loin voisin

d

max

= large d

max

= small

(20)

• Groupement hi ´erarchique incr ´ementiel

G ROUPEMENT H IERARCHIQUE I NCREMENTIEL ( X

_n

_, c) 1 + c ← n

2 pour i ← 1 `a n faire 3 V

_i

← { x

_i

}

4 faire

5 trouver V

_i

et V

_j

dont la fusion change une crit`ere le moins 6 fusionner V

_i

et V

_j

7 c + ← + c − 1 8 jusqu’`a c = + c

• crit `ere: J

_e

= "

^c

i=1

"

x∈V_i

& x −

i

&

²

• distance: d

_e

( V

_i

,V

_j

) = , n

_i

n

_j

n

_i

+ n

_j

&

i

−

j

&

(21)

• Groupement hi ´erarchique – approche de th ´eorie de graphe

• Matrice (graphe) de similarit ´e S _{i j} =

% 1 si d (x _i , x _j ) < d ₀ 0 sinon.

• d

_min

−→ composantes connexes

• d

max

−→ sous-graphes complets

• Approche de division

• Statistique de longueurs des arr ˆetes

• Chemin de diam `etre

(22)

• Groupement hi ´erarchique – approche de division

• construire un arbre couvrant minimal

• couper les arr ˆetes “longues”

(23)

• Groupement hi ´erarch. – statistique de longueurs des arr ˆetes

1 2 3 4 5 6 7 8 9

longueur longueur

nombr e

(24)

• Groupement hi érarchique – m étrique g én ér ée

• $ (x, x

^'

) “dissimilarit ´e” non-m ´etrique

• non-n´egativit ´e: $(x, x

^'

) ≥ 0

• r ´eflexivit ´e: $(x, x

^'

) = 0 sii x = x

^'

• “dissimilarit ´e” des groupes

• $

min

(V

_i

,V

j

) = min

x∈V_i x^'∈V_j

$ (x, x

^'

)

• $

max

(V

_i

,V

_j

) = max

x∈V_i x^'∈Vj

$ (x, x

^'

)

• d(x, x

^'

) m étrique g én ér ée:

• le niveau de groupement plus bas o `u x et x

^'

se trouvent dans le mˆeme groupe

• aussi sym étrique et satisfait l’inégalit é de triangle

(25)

• Groupement hi ´erarchique – dans l’espace des attributs

• trouver les attributs les plus corr ´el ´es

• matrice de covariance: R = [ %

i j

]

• coefficients de corr ´elation: &

i j

= %

i j

%

ii

%

j j

• 0 ≤ &

i j

≤ 1: mesure de similarit ´e entre deux attributs

• m ´ethode de base: ACP

• Typologie de la r ´eduction de dimension