• Aucun résultat trouvé

Traitement Numérique des Données

N/A
N/A
Protected

Academic year: 2022

Partager "Traitement Numérique des Données"

Copied!
28
0
0

Texte intégral

(1)

Digital Data Processing – Traitement Numérique des Données 1 © Y. Bennani

Digital Data Processing

Traitement Numérique des Données

Younès BENNANI Full Professor

Master of Science in Informatics

Specialities

Data Mining, Analytics, and Knowledge Discovery (EID

2

) Programming Tools and Safety (PLS)

Digital Data Processing – Traitement Numérique des Données 2 © Y. Bennani

1 •  Théorie statistique de la décision Bayesienne

•  Classificateurs génératifs

•  Approches paramétriques

•  Quadratic normal density based classifiers

•  Linear normal density based classifiers

•  Naïve-Bayes (aussi non paramétrique)

•  Approches non paramétriques

•  Parzen classifier

•  Naïve-Bayes (aussi paramétrique)

(2)

Digital Data Processing – Traitement Numérique des Données 3 © Y. Bennani

Bibliographie

•  Bennani, Y., Apprentissage connexionniste, Editions Hermès Science (370 p.). ISBN: 2-7462-1337-0.

•  Bishop, C.M., Neural networks for pattern recognition, Clarendon Press, 1995.

•  Devroye,L.,Gyorfi,L.,and Lugosi,G., A probabilistic theory of pattern recognition,Springer,1996.

•  Duda, R.O., Hart, P.E., and Stork, D.G. Pattern Classification, 2d Edition Wiley, New York, 2001.

• Fukunaga, K., Introduction to statistical pattern recognition, second edition, Academic Press, 1990.

•  Gose,E.,Johnson baugh,R.,and Jost,S.,Pattern Recognition and Image Analysis,Prentice-Hall,1996.

•  Hastie, T., Tibishirani, R., Friedman, J., The Elements of Statistical Learning, Springer, Berlin, 2001.

•  Kohonen,T.,Self-organizing maps,Springer Series in Information Sciences,Volume30,Berlin,1995.

•  McLachlan, G.J., Discriminant Analysis and Statistical Pattern Recognition, Wiley , 1992.

•  Ripley, B.D., Pattern Recognition and Neural Networks, Cambridge University Press, 1996.

•  Schalkoff, R., Pattern recognition: Statistical, structural and neural approaches, Wiley, 1992.

•  Schurmann, J. Pattern classification, a unified view of statistical and neural approaches, Wiley, 1996.

•  Theodoridis, S. and Koutroumbas, K. Pattern Recognition, Academic Press, New York, 1999.

•  Van der Heijden F., Duin R.P.W., De Ridder D. and Tax D.M.J., Classification, parameter estimation and state estimation - an engineering approach using Matlab, John Wiley & Sons, 424 pages, ISBN 0470090138, 2004.

•  Vapnik, V.N., Statistical Learning Theory, Wiley, New York, 1998.

Travaux Pratiques (salles machines)

Scikit-learn

Machine Learning in Python

http://scikit-learn.org/stable/index.html

(3)

Digital Data Processing – Traitement Numérique des Données 5 © Y. Bennani

Support de cours

Espace Pédagogique Interactif

lipn.univ-paris13.fr/~bennani/enseignements

Traitement Numérique des Données (TND) Mot de passe : epi-m2-info-tnd

Digital Data Processing – Traitement Numérique des Données 6 © Y. Bennani

Introduction

(4)

Digital Data Processing – Traitement Numérique des Données 7 © Y. Bennani

Big Data : des données tous azimuts …

Une explosion exponentielle de la quantité de

données

(5)

Digital Data Processing – Traitement Numérique des Données 9 © Y. Bennani

Digital Data Processing – Traitement Numérique des Données 10 © Y. Bennani

Plus de données non structurées

(6)

Digital Data Processing – Traitement Numérique des Données 11 © Y. Bennani

Evolution des données massives …

Une croissance estimée à 44% par an jusqu’en 2020, aidée par le

prochain boum des objets connectés.

Les quantités d’informations générées par les outils numériques donnent le vertige.

« l'humanité a créé plus d'informations au cours des deux

dernières années que pendant toute son histoire »

(7)

Digital Data Processing – Traitement Numérique des Données 13 © Y. Bennani

Un ordre de grandeur …

Byte

B Kilobyte

KB 1000 Bytes

Megabyte MB 1000 KB

Gigabyte GB 1000 MB

Terabyte TB 1000 GB

Petabyte PB 1000 TB

Exabyte EB 1000 PB

Zettabyte ZB 1000 EB

Yottabyte YB 1000 ZB Unité

de mesure de base

1 B

1 page de texte 30 KB

1 pièce de musique

5 MB 1 vidéo

de 2h 1 GB

1 pile de DVD comme un immeuble de 55 étages 1 PB

Informations générées en 2003

5 EB

Informations générées en 2011

1,8 ZB

Capacité de stockage du Datacenter

de la NSA (92 000 m2, 2013)

1 YB 6 million

de livres 1 TB

Digital Data Processing – Traitement Numérique des Données 14 © Y. Bennani

Le « Big Data » d’aujourd’hui

= le « Small Data » de demain …

V olume V élocité V ariété V éracité V aleur V ie

Comment définir le phénomène Big Data :

3 V ou plus ?

(8)

Digital Data Processing – Traitement Numérique des Données 15 © Y. Bennani

Donnée - Information - Connaissance

Des mesures de température relevées chaque jour dans une station météo, ce sont des données.

Une courbe donnant l’évolution dans le temps de la température moyenne dans un lieu, c’est une information.

Le fait que la température sur Terre augmente en fonction de l’activité humaine, c’est une connaissance.

Ces trois notions sont très proches les unes des autres.

Une donnée est une description élémentaire, typiquement numérique pour nous, d’une réalité. C’est par exemple une observation ou une mesure.

• À partir de données collectées, de l’information est obtenue en organisant ces données, en les structurant pour en dégager du sens.

• En comprenant le sens de l’information, nous aboutissons à des connaissances, c’est-à-dire à des « faits » considérés comme vrais dans l’univers, et à des « lois » de cet univers.

Données - Data

(9)

Digital Data Processing – Traitement Numérique des Données 17 © Y. Bennani

A

Représentation des données

a b d c

e f

g h

=[x

1

, x

2

, …, x

n

]

= b b b h h h a a

=[x

1

, x

2

, …, x

n

]

= 0000000 …1100111000...

x

x

Représentation Structurelle Représentation Numérique

Méthodes syntaxiques - Grammaires et automates - Arbres et graphes

Méthodes statistiques

- Méthodes paramétriques+ non-paramétriques - Extraction et sélection de traits

- Classification automatique

Digital Data Processing – Traitement Numérique des Données 18 © Y. Bennani

A

Codage numérique des formes

t x(t)

t

1

t

2

t

3

t

n-1

t

n

x = x 1 x 2

M x n

"

#

$

$

$

$

%

&

' ' ' '

= x t ( ) 1

x t ( ) 2

M x t ( ) n

"

#

$

$

$

$ $

%

&

' ' ' ' '

x = x 1 x 2 M

x n

"

#

$

$

$

$

%

&

' ' ' '

= x ( ) 1 x ( ) 2 M

x n ( )

"

#

$

$

$

$ $

%

&

' ' ' ' '

Pixel #1

Pixel #n

(10)

Digital Data Processing – Traitement Numérique des Données 19 © Y. Bennani Représentation

numérique

Un exemple : Chernoff faces of the speaker data

Classification (automatique) :

« Clustering »

Espace des formes

regroupement

ω 3

ω 4

ω 2

ω 1

Espace des « clusters »

(11)

Digital Data Processing – Traitement Numérique des Données 21 © Y. Bennani

Classement Discrimination

Espace des formes

identification

Es p ac e d e d éc is ion

ω 1

ω 2

ω 3

ω 4

?

Digital Data Processing – Traitement Numérique des Données 22 © Y. Bennani

Classement/Discrimination

*

(12)

Digital Data Processing – Traitement Numérique des Données 23 © Y. Bennani

Chaîne de traitement

Codage Prétraitement Analyse Décision

Apprentissage Monde Physique

Espace des Formes

Analogique --> Numérique Espace de Représentation Microphone

Caméra

Sélection de l'info. nécessaire Elimination du bruit Suppression de la redondance

Calcul de paramètres Espace des Paramètres

Modélisation Espace des Noms Reconnaissance Calcul de distance ou

de probabilité

Classement/Discrimination

Approches génératives

(13)

Digital Data Processing – Traitement Numérique des Données 25 © Y. Bennani

Classement / Discrimination

Classement : apprendre une fonction (règle) de décision à partir d’un ensemble dexemples étiquetés.

M classes : ω

j

, j=1, …, M, (+ classe de rejet : ω

rej

)

Base d’apprentissage : {x

i

, y

i

} / x

i

∈ R

n

et y

i

=classe(x

i

), i=1, …, N Fonction de décision : S(x)

Comment apprendre S(x) à partir des exemples {x

i

, y

i

} ?

•  Approches génératives

•  Approches discriminantes

Digital Data Processing – Traitement Numérique des Données 26 © Y. Bennani

Apprentissage et décision

S(x, W) :.

+1

-1

+1 -1

Professeur

x = x

1

x

2

M x

n

"

#

$

$ $

$

%

&

' ' ' '

W =

w

1

w

2

M w

n

!

"

#

# #

$

%

&

&

&

(14)

Digital Data Processing – Traitement Numérique des Données 27 © Y. Bennani

Décision

Classificateur :.

x = x

1

x

2

M x

n

"

#

$ $

$ $

%

&

' ' ' '

Argmax

ω

i

P ( ω i / x )

ou Argmin

ω

i

d x, ( ω i )

Espace des observations Espace des décisions

Théorie de la Décision statistique : fondement

Le théorème de Bayes est un résultat de base en théorie des probabilités, issu des travaux de Thomas Bayes (1763) et retrouvé ensuite indépendamment par le mathématicien français Laplace (1774) .

En théorie des probabilités, le théorème de Bayes énonce des probabilités conditionnelles : étant donné deux événements A et B, le théorème de Bayes permet de déterminer la probabilité de A sachant B, si l’on connaît les probabilités : P(A) ; P(B) ; P(B/A).

Pour aboutir au théorème de Bayes, on part d’une des définitions de la probabilité conditionnelle :

P ( A | B ) P ( B ) = P ( A ∩ B ) = P ( B | A ) P ( A )

en notant P ( A ∩ B ) la probabilité que A et B aient tous les deux lieu. En divisant de part et d’autre par P(B), on obtient :

P ( A | B ) = P ( B | A ) P ( A ) soit le théorème de Bayes.

(15)

Digital Data Processing – Traitement Numérique des Données 29 © Y. Bennani

Théorie de la Décision statistique : fondement

Digital Data Processing – Traitement Numérique des Données 30 © Y. Bennani

Théorie de la Décision statistique : fondement

Théorème de Bayes :

posteriori = vraisemblance x priori / évidence

P( ω i / x) = P (x /ω i )P(ω i ) P (x)

P(x) = P(x / ω j )P ( ω j )

j=1 M

Probabilité a priori d’appartenance à la classe ωi

Densité de probabilité conditionnelle dans la classe ωi

Probabilité a posteriori d’appartenance de x à la classe ωi

(16)

Digital Data Processing – Traitement Numérique des Données 31 © Y. Bennani

Bayes Classifier

Hypothèse de Multi-normalité

Cas de 2 classes

P(A / x)P(B / x)xA, sinon xB

Bayes :

P(x / A)P(A)

P( x)P(x /B)P(B)

P(x)xA, sinon xB P(x / A)P(A)P( x / B)P(B)xA, sinon xB S(x) = P(x / A)P(A)P(x /B)P(B)

S(x) = P(x / A)P( A)P(x / B)P(B) ≥ 0 → xA, sinon xB

Classe(x) = Argmax P(x /ω )P(ω ) M classes :

MAP : Maximum A Posterior

(17)

Digital Data Processing – Traitement Numérique des Données 33 © Y. Bennani

Erreur de classement

Si S(x) ≥ 0 alors xA, Si S(x) < 0 alors xB

ε = P(S(x) < 0, xA) + P(S( x) ≥ 0,x ∈ B)

ε = P(S(x) < 0 / xA)P(A) + P(S(x) ≥ 0 / xB)P(B)

ε = P( A) f

A

(x)dx

S(x)<0

ε

A

1 4 4 2 4 4 3

+ P(B) f

B

(x)dx

S(x)≥0

ε

B

1 4 4 2 4 4 3

f

A

(x)

f

B

(x)

L’erreur de classement est :

: Fonctions de densité de probabilité de A et B

Digital Data Processing – Traitement Numérique des Données 34 © Y. Bennani

Règle de décision de Bayes : Règle optimale

Si S(x) ≥ 0 alors xA, Si S(x) < 0 alors xB

ε = P(A) f

A

(x)dx

S(x)<0

ε

A

1 4 4 2 4 4 3

+ P(B) f

B

(x)dx

S(x)≥0

ε

B

1 4 4 2 4 4 3

Déterminer la fonction de décision optimale minimisant :

ε = P(A) f

A

( x)dx

S(x)<0

+ P(B) f

B

( x)dx

S(x)≥0

+ P(B) f

B

(x)dx

S(x)<0

P(B) f

B

(x)dx

S(x)<0

P(B)

(18)

Digital Data Processing – Traitement Numérique des Données 35 © Y. Bennani

La règle optimale est la règle de décision de Bayes :

ε = P(B) + [ P( A) f

A

(x) − P(B) f

B

(x) ] dx

S(x)<0

est minimum si

P(A) f

A

(x) − P(B) f

B

(x)

[ ] < 0, sur R

B

,S(x) < 0

S

*

(x) = P(A) f

A

( x)P(B) f

B

(x)

Règle de décision de Bayes : Règle optimale

Règle de Bayes :

S( x) = P(x / A)P(A)P( x / B)P(B) = 0

P(x / A)P(A) = P(x / B)P(B)

log [ P(x / A)P(A) ] = log [ P(x / B)P(B) ]

R( x) = log ( P( x / A) ) log ( P(x / B) ) + log # P(A) P(B)

$ % &

' (

P( x / ω

i

) = 1

n

det ( ) Σ ω

i

exp 1

2 ( x − µ ω

i

)

T

Σ ω

−1i

( x µ ω

i

)

&

' ( )

* +

Distribution normale :

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

(19)

Digital Data Processing – Traitement Numérique des Données 37 © Y. Bennani

ℵ (µ i , Σ i ) pour la classe ω

i

µ

i

est le vecteur moyenne

Σ

i

est la matrice de covariance

µ

i

= µ

i

[1] = 1

N x

k

[1]

k=1 N

µ

i

[2] = 1 N x

k

[2]

k=1 N

M µ

i

[n] = 1

N x

k

[n]

k=1 N

#

$

%

%

%

%

%

%

%

% %

&

' ( ( ( ( ( ( ( ( (

Σ

i

=

var(x[1]) cov( x[1], x[2]) L L cov(x[1],x[n]) var(x[2])

M M M M M

M M M

cov(x[n],x[1]) L L var(x[n])

#

$

% %

%

% %

%

&

' ( ( ( ( ( (

var(x[i]) =σ

2

(x[i]) = 1 N (x

k

[i]

k=1 N

µ [i])

2

cov(x[i],x[ j]) = 1 N (x

k

[i]

k=1 N

−µ[i])(x

k

[ j]− µ[ j])

x

i

= x

i

[1]

x

i

[2]

M x

i

[n]

"

#

$

$

$

$

%

&

' ' ' '

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

Digital Data Processing – Traitement Numérique des Données 38 © Y. Bennani

Σ

Σ

Σ

Σ

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

(20)

Digital Data Processing – Traitement Numérique des Données 39 © Y. Bennani

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

x x x

x x

x x x x

x

o o o

o o o o

o o

o o

l l l l

l

l l

l l l

l l l

l

µ

1

Σ

1

µ

2

Σ

2

µ

3

Σ

3

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

(21)

Digital Data Processing – Traitement Numérique des Données 41 © Y. Bennani

La fonction de densité multi-normale a pour expression :

P(x / ω

i

) = 1

2 π

n

det ( ) Σ ω

i

exp 1

2 ( x − µ ω

i

)

T

Σ ω

−1i

( x µ ω

i

)

&

' ( )

* +

log ( P(x / ω

i

) ) = 1 2 ( x µ ω

i

)

T

Σ ω

−1i

( x µ ω

i

) log & ' ( 2 π

n

det ( ) Σ ω

i

) * +

Cas 2 classes A et B, lexpression quadratique :

R(x) = − 1

2 ( x − µ

A

)

T

Σ

A

−1

( x − µ

A

) + 1 2 ( x µ

B

)

T

Σ

B

−1

( x − µ

B

) + const

cont = log ( P(A) / P(B) ) + 1 2 log det ( ( ) Σ

B

/det ( ) Σ

A

)

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

Digital Data Processing – Traitement Numérique des Données 42 © Y. Bennani

QDC suppose que les distributions des classes sont normales.

Dans le cas contraire, les frontières de décision ne pas optimales.

Classe(x) = Argmax

ω

i

P(x

i

)P(ω

i

)

Classe(x) = Argmax

ω

i

− 1

2 ( x − µ ω

i

)

T

Σ ω

−1i

( x µ ω

i

) log 2π & ' (

n

det ( ) Σ ω

i

) * + + log(P(ω

i

))

, - .

/ 0 1

Discrimination quadratique

Quadratic Discriminant Classifier (QDC)

=Bayes+Distribution normale

(22)

Digital Data Processing – Traitement Numérique des Données 43 © Y. Bennani

Σ = Σ

A

= Σ

B

R(x) = ( µ

A

− µ

B

)

T

Σ

−1

x + const

const = − 1

2 µ

TA

Σ

−1

µ

A

+ 1

2 µ

TB

Σ

−1

µ

B

+ log ( P(A) / P(B) )

L’expression linéaire :

Discrimination linéaire

Linear Discriminant Classifier (LDC)

=Bayes+Distribution normale équi-covariance

Hypothèse :

Classe(x) = Argmax

ω

i

− 1

2 ( x − µ ω

i

)

T

Σ

−1

( x µ ω

i

) log 2 ( π

n

det ( ) Σ ) + log(P( ω

i

))

&

' (

) * +

Σ = Σ ω

i

i = 1, K ,M P(ω

i

) = P

j

) i, j = 1, K ,M

Mahalanobis Classifier

Hypothèse de Multi-normalité, déqui-covariance et déqui-probabilité

On retrouve la distance de Mahalanobis :

d mahalanobis

2 ( x, µ ω

i

) = (x − µ ω

i

) T Σ −1 ( x − µ ω

i

)

Classe(x) = Argmax

ω

i

− 1

2 ( x − µ ω

i

)

T

Σ

−1

( x µ ω

i

)

% &

'

( )

*

(23)

Digital Data Processing – Traitement Numérique des Données 45 © Y. Bennani

Σ = Σ

A

= Σ

B

= I

R(x) = ( µ

A

− µ

B

)

T

Σ

−1

x + const

Nearest Mean Classifier :

Nearest Mean Classifier (NMC)

Hypothèse :

R(x) = ( µ

A

− µ

B

)

T

x ( µ

A

− µ

B

)

T

( µ

A

+ µ

B

) /2

Digital Data Processing – Traitement Numérique des Données 46 © Y. Bennani

Naïve Bayes Classifier (NBC)

Le modèle probabiliste pour ce classifieur est le modèle conditionnel :

P(ω

k

/ x

1

, K , x

n

) = P(ω

k

)P( x

1

, K , x

n

k

) P(x

1

, K , x

n

)

P( ω

k

, x

1

, K , x

n

) = P( ω

k

)P( x

1

, K , x

n

/ ω

k

)

= P( ω

k

)P( x

1

/ ω

k

)P(x

2

,K, x

n

/ ω

k

, x

1

)

= P( ω

k

)P( x

1

/ ω

k

)P(x

2

/ ω

k

, x

1

)P(x

3

,K, x

n

/ ω

k

, x

1

, x

2

)

= P( ω

k

)P( x

1

/ ω

k

)P(x

2

/ ω

k

, x

1

)P(x

3

/ ω

k

, x

1

, x

2

)P( x

4

, K , x

n

/ ω

k

, x

1

, x

2

, x

3

)

= P( ω

k

)P( x

1

/ ω

k

)P(x

2

/ ω

k

, x

1

)P(x

3

/ ω

k

, x

1

, x

2

) K P(x

n

/ ω

k

, x

1

, x

2

, x

3

,K, x

n−1

) L’hypothèse naïve : les sont indépendantes :

x

i

P(x

i

/ ω

k

, x

j

) = P( x

i

/ ω

k

)

X = (x

1

, K , x

n

) ∈ ℜ

n

P( ω

k

/ X ) = P(X / ω

k

)P( ω

k

)

P(X)

(24)

Digital Data Processing – Traitement Numérique des Données 47 © Y. Bennani

P(ω

k

, x

1

, K , x

n

) = P(ω

k

)P( x

1

k

)P(x

2

k

) K P(x

n

k

)

= P( ω

k

) P(x

i

/ ω

k

)

i=1 n

Naïve Bayes Classifier (NBC)

Par conséquent :

P( ω

k

/ x

1

, K , x

n

) =

P(ω

k

) P(x

i

k

)

i=1 n

P(x

1

, K , x

n

)

Classe X ( ) = Argmax

ωk

P ( ) ω

k

P x (

i

k

)

i=1 n

" ∏

# $

% &

'

P(x / A) = P(x

i

/ A)

i=1 nA

P(x / B) = P( x

i

/B)

i=1 nB

Naïve Bayes Classifier :

Naïve Bayes Classifier (NBC)

Hypothèse :

classe(x) = Argmax

ω

k

P( ω

k

) P(x

i

/ ω

k

)

i=1 n

$ ∏

% &

' ( )

S( x) = P(A) f A ( x)P(B) f B ( x)

(25)

Digital Data Processing – Traitement Numérique des Données 49 © Y. Bennani

Naïve Bayes Classifier (NBC)

Exemples

d’apprentissage

x

1

=

N (nez qui coule)

x

2

=

T (tousser)

x

3

=

R (la peau rougie)

x

4

=

F (a de la fièvre)

ω

k Classe

X1 + + + _ malade

X2 + + _ _ malade

X3 _ _ + + malade

X4 + _ _ _ sain

X5 _ _ _ _ Sain

X6 + _ + _ ?

P(malade) = 3

5 et P(sain)= 2 5 P(N = +/malade)= 2

3 et P(N = −/ malade) = 1 3 P(N = +/sain) = 1

2 et P(N = −/sain)= 1 2

P(T = +/ malade) = 2

3 et P(T = −/ malade) = 1 3 P(T = +/ sain)= 0 et P(T =− /sain) =1

P(R = +/malade)= 2

3 et P(R= −/malade) = 1 3 P(R = +/sain) = 0 et P(R= −/ sain)=1

P(F = +/malade) = 1

3 et P(F = −/malade)= 2 3 P(F = +/sain)= 0 et P(F = −/sain) =1

Classe X

( )

6 =Argmax{malade,sain}

P malade

( )

P x

(

i/malade

)

=P malade

( ) (

P(N= +/malade)×P(T=−/malade)×P(R= +/malade)×P(F=−/malade)

)

i=1 4

P sain

( )

P x

(

i/sain

)

=P sain

( ) (

P(N= +/sain)×P(T=−/sain)×P(R= +/sain)×P(F=/sain)

)

i=1 4

$

%

&

&

&

'

&

&

&

(

)

&

&

&

*

&

&

&

3 5

2 3

1 3

2 5

1

2 1 1

2 3

2 3

0

X

6

malade

Digital Data Processing – Traitement Numérique des Données 50 © Y. Bennani

P(x

k

) = 1

n

k

K

h

xx

i

h

$

% & ' ( )

xi

ω

k

Parzen Classifier

Estimation de la densité : Parzen Classifier :

S(x) = P(A) f

A

(x) − P(B) f

B

(x) classe(x) = Argmax

ω

k

P(x

k

)P(ω

k

)

où K est un noyau (kernel en anglais) et h un paramètre nommé fenêtre, qui régit le degré de lissage de l'estimation.

Bien souvent, K est choisi comme étant la densité d'une fonction gaussienne standard (espérance nulle et variance unitaire) :

Six courbes en cloche gaussiennes (rouge) et leur somme (bleu). L'estimateur à noyau de la

densité f(x) est en fait la moyenne (on divise par le nombre de courbes en cloche, 6). La

variance des normales est posée à 0,5. Notons enfin que plus il y a d'observations dans le

voisinage d'un point, plus sa densité est élevée.

(26)

Digital Data Processing – Traitement Numérique des Données 51 © Y. Bennani

Parzen Classifier

Execrcice

µ 1 = 1 0

!

"

# $

% , µ 2 = 0

1

!

"

# $

% , µ 3 = 2

2

!

"

# $

%

On considère dans l’espace 2-D un problème à 3 classes :

- Donner les expressions des fonctions de décision - Donner les expressions des frontières entre les 3 classes - Donner une représentation graphique

P ( ) ω 1 = P ( ) ω 2 = 1

4 , P ( ) ω 3 = 1

2

Σ 1 = Σ 2 = 1 0 0 2

#

$ % &

' ( , Σ 3 = 1 0 0 1

#

$ % &

' (

(27)

Digital Data Processing – Traitement Numérique des Données 53 © Y. Bennani

La fonction de décision pour ω

1

:

Σ 1 = Σ 2 = 2, 1

2 ln Σ 1 = 1

2 ln Σ 2 = 1 2 ln2 Σ 3 =1, 1

2 ln Σ 3 = 0 Σ 1

−1 = Σ 2

−1 = 1 0 0 1

2

$

% & ' ( ) , Σ 3

−1 = 1 0 0 1

$

% & ' ( )

R

1

(x) = − 1 2

x[1]

x[2]

#

$ % &

' ( − 1 0

#

$ % &

' ( )

* + ,

- .

t

1 0

0 1/2

#

$ % &

' ( x[1]

x[2]

#

$ % &

' ( − 1 0

#

$ % &

' ( )

* + ,

- . − 1

2 log(2) + log 1 4

#

$ % &

' (

= − 1

2 ( x[1] − 1 x[2] ) # 1 0 1/2 0

$ % &

' ( x[1]− 1 x[2]

#

$ % &

' ( − 1

2 log(2) + log 1 4

#

$ % &

' (

= − 1

2 ) * + ( x[1] −1 )

2

+ 1 2 ( x[2] )

2

, - . 5 2 log(2)

Digital Data Processing – Traitement Numérique des Données 54 © Y. Bennani

Les fonctions de décision :

R

2

( x) = − 1 2 x

12

+ 1

2 ( x

2

−1 )

2

#

$ % &

' ( − 5 2 log(2)

R

3

(x) = − 1

2 [ ( x

1

− 2 )

2

+ ( x

2

− 2 )

2

] log(2)

R

1

(x) = − 1

2 ( x

1

− 1 )

2

+ 1 2 x

2

#

2

$ %

&

' ( − 5 2 log(2)

Les frontières entre les 3 classes :

entre ω

1

et ω

2

R

12

( x) = R

1

( x)R

2

(x)

= x

1

x

2

2 − 1

4 = 0

entre ω

1

et ω

3

entre ω

2

et ω

3

R

13

(x) = R

1

(x) − R

3

( x)

= x

22

4 − 2x

2

x

1

+ 7 − 3log(2)

2 = 0

R

23

(x) = R

2

( x)R

3

(x)

= x

12

4 − 2x

1

x

2

+ 7 − 3log(2)

2 = 0

x[1]= x

1

x[2]= x

2 On pose :

(28)

Digital Data Processing – Traitement Numérique des Données 55 © Y. Bennani

Représentation graphique

-2 -1 0 1 2 3 4 5 6 7 8

-6 -4 -2 0 2 4 6 8

µ

1

µ

2

µ

3

R

12

( x)

R

13

( x)

R

23

(x)

Références

Documents relatifs

Hence, in order to take into account the different path opening results obtained by the differ- ent features, a data fusion based on fuzzy sets is performed.. The goal here is

Here, we propose to analyze Morphological Profile constructed by Path Openings and Closings to extract the linear geometrical pixel information which allow to classify each pixel as

Percentage of correctly classified pixels, for the four images in Fig.. in the initial coordinates, these components become non-null and thus, the approach is full-vectorial. As

The computational model used to test this method through simulations is developed to fit the behaviour of bi- ological neural networks, showing the potential for training neural

•  Méthodes Stochastiques comparent un échantillon avec un modèle, prenant en compte plus de variabilité. •  La distance est remplacée par des probabilités calculées

Le nombre de paires de données correctement classées dans le même cluster.

After our numerical analysis, we suppose, that the Voynich Manuscript was written in two languages having the same alphabet without vowel letters: one of the Germanic languages

Constatant que chaque étude avec pmeasyr commence par un import de données, nous proposons une nouvelle approche : intégrer une fois pour toutes les données M12 dans une base de