• Aucun résultat trouvé

Analyse en composantes principales du spectrogramme du signal de parole: application à la détection de la dysarthrie.

N/A
N/A
Protected

Academic year: 2021

Partager "Analyse en composantes principales du spectrogramme du signal de parole: application à la détection de la dysarthrie."

Copied!
87
0
0

Texte intégral

(1)
(2)

erciements

Nos premiers remercielrents

la patence et le courage

duant

aas

qui

nous a aidé et nous a doDDé iâ sânté, annéas d'études.

Noùs tenons

à

saisfu c8ttc profondes reconnaissances à :

et

adæsser nos Drofonds rcmerciem€nts

et

nos

lu.Kachr AbdEllah, qote

de mémoire de

fil

d'études, pour ses conseils, s€s orientalions et ses ûout au long de notre rccherche.

À

tous nos enseignants : <

bakir.

C >. <

M

TekkoulG O >,

(

M.

Brahimi T

>,

qui

nous

ont

donné

lflIs

ioDs

et

leurs aides, sans

oubliet

d'expdmer nos

remerciements

au Chef

de

et

lout

le

penonnel

du

dépaæncnt

d'élecûoniquç

poul

leur gentillesse leur disponibilite.

Nos

remerciemerûs

vont

d'accept€r de

lire

et de juger ce

A

nos

frnilles

et nos

rmis q

surmontgr tous les obstacles.

aux membr€s

du

jury

qui

nous

ont fait

l'honneur

par lerns prières

et

lcurs etrcouragements,

on

a pu

Nous

teûoDs

à

remercier personrte

qui

a

participé

de

prÈs

ou

de

loin

à I'élaboration dc c€ modesûe

travail.

I

(3)

l:l t

a'

Lrearcace

Tous les mots ne

sqraienl

expriner

14 grqtitude,

I'amou4

le rcspect, la recotmaissance,

c'est

siûelenehtb

e :

je

dédie ce modeste

tdvsil-A

,endrc Mùrc Naeeru

:

Tu rcplésentes

poù

moi la source ds tendresse et I'exernple détouemerrt qui n'a

pss

cessé de

m'er{ourager.

Tu as

fait

plus qu'une mère puisse

faire

potl

que ses erfants suieent 14 bon chemin dons

letn

vie et leurs études.

A

Mon

rrès cher père

Mahfonil

: Au$me dédicace ne saurqi, expriùrer

I'amow,

I'estime,

le

dévouement eî le respect que

j'ai

t4ujours

pour

vous. Rien qu monde ne

raut

les

effofi|

f.tunis jour

et tulit

pur

,roû

éûtcatiol

et mon bien

ête.

Ce

truvail

et

b

fruit

de tes

socrifces

que îu ûs consentis

pots

mon

qucation

et

maforrnotion

le long de ces années-< Que

Diet

14 tor,t puisssnt me les gardes

,

A

ntes chet\

îrères

:

Karim

et yaakoub.

A

mcs s@tlrs : Ibtissam, Amal, Nasrin.

<

A

qui

je

nuhoite

leuua,ry

de réus$ite e, de

bonhew

t

A

wt

chùe binôrlu

< Zeyneb > et ù toulc

salamille

A

mes

chètq

amies

:

Chslw+ Salih4

Assia, Fadia" Sahco,

Chahrdzdd

Yot

tiaa lies'

Aù41' Meriem, Soumia, Sara, ...,

pour

leu+syntpdhie,

letr

hamew et leur

solidarité

envers moi.

A tous mes collègues

d'électrlnique

de I'université de Jiiel, promotion 2017. A totr.s ceÆ qui

nc

lqû

chers et que

i'oi

ornis de les

cïer'

(4)

Qédicace

Tous les mots ne sauraient

exprinet

Iy'gd'tlud4

l'amou1

le respect, la recofrnaissaûce,

c'est

tout sintplement bue :

je

dêdie ce ùtodeste

fiovail.

A Mo

tendre Mère

Ahilt

:

Tu reprqsentes

pour

ûtoi lq

soûce

de tendresse et I'exemple dévoueûren! qui n'a pos cessë de

m'enfoanger.

Tu 4s

fsit

plw

qa'une mèrc Wisse

faile poxr

que ses enfoûs suivent

ll

bon chemin dorc leur vie et leurs ëfirdes.

A

Mon

tràs cher pàre

AMElIah

:

Aulune

dédicace ne

sdûait

eryrimet I'amoxL

I'estirrre, le détouement et le respect qæ

j'.ri

t4uiours

pour

lous. Rien qu monde ne v.tul les

eîorts

fonn

is

joù

et

wil

pour

mon éducstioit et ,rurû bien être. Ce

travail

et Ie

fruit

de tes

sqcrifces

que

tt

as

co

senti$

pottt

nton éPucation

a nalormaion

le long de ces anmées. 4 Que

Dicu

14loul

paitsant rræ les

gades

,,

À

ma

yès chère

seur :

W$a.

À

ma

chQrc

lràres

: Sami et Arn ûar.

<

A quije

souhaile

.lc réussite et dc bonheuf

t

A

na

chèrc binôlpæ <

Inune

),

d

ù toute ta

lamille

A

rn{s

chù6 amb

: Nosaybo, Souhfia, Wafa, Diahtula, Fozia,

H6!a'

Ho{d4

Somi4 Ines' AmaL Yamina ...,

pour

lew

synipathx,

lew

humeù

et leur solidorité envers moL

A

to

s ,nes collègues

d'électrlnique

de l'unfuersité de Jiiel, promotion

2017-A

totrs

ceu

qui me

lpnl

chers et

qE

i'ati

ornis de les citet.

Zeyneb

(5)

Introduction généol"

...1'....

(6)

Sommaire

(7)

Sommaire

Chapitre

III

:

Séparateur

à

vaste

marge

(8)

Sommsir€

Chapitne

IV

:

Analyso

el

IV-l

Irtoôrction....

IV.4

Mom€ûts

sp€ctralx

IV.5

lrterpétdion

des deu(

ptmièr€s

principoles du sp€cûogratDmG

...

50 5'l 67

pfincipales

du

spcctmgramme

de

la

IV.2

Basê de doDlé€s

IV.3

Anatyse eD composades

princi

du

spectlpgræme...-...-...-...

--. --.. 43

IV.6 Application

à la parole IV-7 Conclusion

.-...

Conclusion

générale-Bibliographic...

(9)

Figurc

I.8 : Féqùence fondamentale

Figure

I.9

:

Illustratiot

des

formatts

Orgnigramme

Representation

Figure

II5

: Plan de projection

...-Figure

fI.6

: Rçéseûtatioo graphique

<<

iris

> ...,.,,..-....,.

de

CPI

...----...

...-

22

trois or€mières v4dables de l'ensemble

des

donnees

Figure

lI.7

:

Rçprés€ûtation dçs premiè:res composantes principales de I'ensemblc des

Listq

des

figures

Figûrc

L4

: La forme d'onde et la dentité spectrale de puissance d'rm son

voiÉ

""""""""9

Figrre I.5

: l,a forme rt'onde

*

la de$itré spectrale de puissance

d'un

son non voise

"

"""'

10

Figure

I.6

: Modélisation <lu conduit ]rocal dans le cas de la prononciation devoyelle

laletla'

Figure I.7

: Modèle sourc€

filtre du

de productionde

laparole

...-...'..--.

-.'...-

12

conduit

vocal)...-'.,...''.

15

Figure

I.10 : FoÎmc d'onde

et

d'un

signal de parole

...'... -...

-. - -.... - 17

figur€

ILI

tr.ig[re

n.2

figure

II3

Figure

II.4

Anallse

en

gincipales

: Nuage de données à deux dimensions .. 20

2l

les composantes principales

... -...

-.. --..-. 22

28

donnees <

iris

>...

(10)

List€

des

figur€s

Figure lII.1

Figure

lILl

Figure

lII3

Figtrre

1I.,1

Figure ltIL5

Hyperplanoplimal,margeetvçcteursdesupport...,..,.'...-...--..-...32

Classification d'un nouvel exernple dans les

detx

cas d'un hyperplan

...,..33

Séparabilite linéaire et qon linéaire . . - . . . . .

.

-...-.33

Caslinéairenonseparabte...

...-....36

Tmnsformation de I'espace de reFés€ntation et hyperylan separ"ateur dans

le

Figure

lV.1

: Analyse en c-omposattes pdncipales du spectrogramme...

" ' "'-" " '

''14

Figure

M:

Signaux acoustiques

du

texte

lu

produit

par un

locut€ur

coffôle

et de

la

séquenc,: des voyelles synthétiques, leurs spectogrammes et les

tois

premièrcs composant€s

principalespourdeslongueusdctramesde5mset30ms...,..."""'-

"""""

'45

Figure

JtV3 : Exemples de spect€s moyens à [ong terme de d€ux eDregisfemenls de textes lus produits pa. ùn locuteur

cotrdle

et rm locuteur Parkinsonien

... "

"

"""'---

--""'

50

Figure

JtV.4 : Première composante principale du spectogramme de la séqrænce des voyelles s],nthétiques et du texte lu pour les longueurs de trame de 5 ms et 30 ms superyosee au spectle

moyenàlongtemrc.

...,..."'-"""'---"

'51

Figure tV.5

:

Itlustation

de

la

relation

entre

le

spectre

d'une aame et

les deÙx premières composmtes principales

du

spectrogramne de

la

séquence des voyelles synthétiques

et du

texte pour ùne longueur de trame de 5 ms - . ..

.

..""""""""""""'54

Figurc IV.6 :

Spectrcs des trames co[espondants aux coefficients

positifs

OleÙ

et négatifs (rouge) tle CP2

a

leurs sommes pond,ûées pour la sequence des voyelles synthétiques

"

"'

55

Figure

Iv.?

:

spectres des trames correspotdants aÙx

coeffcients posilifs

OleÛ) et négatifs (rouge) de CP2 et leurs sommes pondérées pour le texte

lu..'...."

" "" "

""-

"" ""

55

Figùre W.8

:

Evolution

trame

par

trame

du premier formant de

la

sequenc-e des voyelles synthetiques,

coellcients

de CP2 et

low

version filù'ee

...,..."

"""""" """""""""'57

(11)

Lbte

d€3

figur€s

Figure

IV.9

: Première el deuxième principales du spectrograrDme pour tous les sur les loculeurs

...,...

59 locu&urs ainsi que lgs moyennes

Figure

IV.10

: Somme

pondetê

arx

coefficients positifdnéga'rfs du texte lu

Foduit

oal les locuteufs contrôles et et La moyernes sur les locut€urs

..-....-,.,...

6l

Figure

IV.ll

: Somme ponderée des des ftames av€c coefficients positiG/negatifs de CP2 du texte

lu

goduil

par les

codrôles et Pa*iosoniens et la

moyennes sur les

a

tr'igure

fv.12

: Repésentation en à moustaches des quatre premier

mome[ts

(moyeDno sp€ctrale, ecart

t'?e,

skewness, ) de la première composante piincipale et de la somme pondérce avec les coefficients

positi

ifs

de CP2 du texûe

lu

produit

par les locutcùrs contrôles et parkinsoniens

..-..-..,...

Figure

IV.13

: Classiûcation des locuteurs

...,..-..

...-.-

67

(12)

Liste

tableaux

2

classes,....-...'...

40

quadrarique

moyenne normalisée

(EQMN)

et

du

ent

e

le

spectre

moyen

à long

tenne

et la

pr€mière Tebleau

III.I

: Matrice de

conision

Trblctû

IV.l

:

Pourc€nlages de

la

expliquee por les deux premières c-omposantes

Table{u

fvl :

Valcus de

l'

coofficient

dc

conélation

de composanæ

prmqpûe

Tablesu

W3

:

Mesur€s

des

de

la

classification

contôleÆakinsonien

6'l

(13)

DSP

ACP

CP

SVM

w

FP

vfl

FN

TCC

SE SP

SMLT

EQMN

Liste

Densite Soechale de Analyse en

Co|nposdes

Composartê

Pritcipale

Séoorateur à Vaste

vlais Positif

Faux

Positif

Vlais

Néeatif

Fau<

Négatif

Tarx

de

Classificaion

Sensibilié

Spicitrcité

SpecEe Moyen à

Long

Erreu(

qndtatique

(14)

générale

L'analyse

en

composantes plincipales

et

le

spectre moYen

à

long

telme

(SMLT)

sont deux

formalismes

bien

connus

domaines.

SMLT

est

laryemçnt utilis€

trouvcnt

des appli.catioru dans divers I'analyse

de

la

pade

en

tant

que

représe

ation spectale

du

sigûal

qui

la

Épartitior

de

l'éoergie

moyenne en fonction de la 6équence.

I es

calculé en le signal en tmmes de coude

duée

et en

diftrentes

trames. (:ette EoyenDe vise à preDzmt lia moyennc des spccûes

d'amplitude

redùire

I'effet dc

la

variabilité

dtl

sêgnent

ue

ct

à

Droduire

ull

SMLT

aùssi similaire que possible à tous les spectres d' tude des trames.

IÆ specte

moyen

à

long terme

a

été utilisé

datrs

de

nombÎertx

dornaines de

taitemert

la

pa$le et

de

la voix,

comrqe

I'identificdion

et lo

reconoâissânce de loculeurs

Ul,

[2let [3]

l'aide

auditive [4]et

[5]i

et

l'évaluation

cliniqu€

de la qualité de

la

voix

[6

-

l3], tæ

SMLT

donne u4e

indicatioq

sur

la confguration

articulaloire moyenne

ainsi que

sur fecart du

conduit vocal par rapport au conduit

neut€

associé

à

la

voix

modale É41.

Daru le

cadre de l'éYaluatioû

del toubles

de [a

voix'

le

SMLT foumit

Ùne mesrue de [a

qualié

de la

voix

si fa duree d'eryegistrement est

suffisammett

longue

pour

empêcher les effets individuels des sons.

Iæs sons de parole peuvent êhe

modéli*s

comm€ étant le rcsultât de

I'action

d'un

filtr€

ropÉsentânt

le conduit vocal

sur urle source sonore (excitationL

glottique)'

Pour les sons vois€s,

lia

source

est ps€udo-Ériodiquç

et elle

modélise

la vibtatiot

des cordes vocales alors que pour les sons noq voises, la qowc€ est un

bruit

qui tnodélise le flÙx

d'air

nrrbulent. Iæ

SMLT

reflète à la foils I'effet de tp source glottique et du conduit vocal ce

qui

le rerd

très

utile

pour quantilier

les

différençs

acoustiques entre los

locuteÛs-

Pour se

conc€nter sw

lia caractéristique du conduit v(x-al et

élimircr

l'effet

de la périodicité de

la

sowce vocale, une analyse spectrale à large qâûde

doil

êtle

Éâlisee

à

I'aide

dlme ÎrÀne

d'analyse courte

qui

permet également

an+lys€ avec une grande tésolution temporelle alorc

qu'une

analyse spectralc à

tnnde

étroite au moygr! d'une tram€ d'analyse de longue durée, donc avec une

âible

résolution tempolelle,

p€met

de se focalis€r sur

I'effet

de

la

(15)

L'anatyse

en

composiltrtçs

principales

esl lme

technique

slatistique

utilise€

dans

diverses

ap,plications <Lingénierie

pou

réduie

dimensionnalité

de

lensenble

des donn:es comme dans la reconnaissance faciale et la compression d'irrrage- Avec I'analyse

en

composaûtes principales,

un

ens€mble d'observations

de

variabl'es

qui

peuvent être corrélees est

txansfomé en

un

ensemble

de

valeurs de variables orthogonales appelées composantes principales de sorte quç la grande quantité de la variatioû lotale des doimées

dbri!ùe

est rctenue daûs un petit nombre de composantes principal€s' Chaque composante principale est ùrle combinaison linéaire de tout€s les variables originales'

Le

spectre moyen à long terme p€ut êtue considéré comme une siomme pondéree des speclres d'amplitude des tmmes avec des coefficients d€ pondération identiques' Dans une

formulation

plus générale, on peut athibuer des poids

difiérents

aÙx spectres d'amplitude des trames

afin

de renforcer la contribution de cartaires trames 9t

affaiblir

la

contribution

d'autres trames selon ùn critère- Cependatt, le problème qui sous-ænd cette formulation est

I'estirmalion

des coefficietls

de

ponderation

impliques dans

la

somsation-

Cetûe formulation du

SMLT

peut êae obtenue en

utilisant

I'analyse en comprsantes principale du spedrognùtrme.

L'objectif

de ce

travail

est double

:

d'rme

part'

ét4blir

la relatiot

entre

le

spectle moyen à long tetme et l'analyse en composant€s principales du spectlogramme, et d'autre

par!

appliquer I'analys€ eû composantes principale du spectrogramme à la

déte'tion

de la dysartbrie. La

dyvrthrie

çst un trouble de la parole

d'odgine

neurologique qui se manifeste par rme atteration du contrôte musculaire du mécanisme de productircn de la parole

[15]'

De nombreuses maladies telles qræ la maladie de Parkinson, peuvent causer la dysarthrie'

Plusieus

méthodes d'analyse acoustique

pour

la

détection

ot

l'évaluâtion

de

la

dysarthrie ont été proposees dans la littérature [161. La plupart de aes indices sont utilises dans le cadre plus genéral d'évaluation des troubles de la

voix

[17]' Ilans

la plupart de ces études, I'analyse est basee sur des voyelles soutenues, des mols isolés ou des phrases' læs études réalis€es

sur des

lectures

de textes

ou

sur les

paroles

!{rontanées

sont

peu

nombreuses.Parûftesméthodesutiliseesdansl'analysedesphÉsr's,beâucoupd'eDtre

elles font recours à

ut€

segmentation manuelle lors du calcul des indices acoustiques' Les méthodes basees sur

la

parole continù€

utilisgnt un

grand nombre

d'indices

acoustiques' Cela a pour consequence, d'uDe part, de rendr€

difficile

I'interpretalion

de ræs indices en tertrLes de dysartbde, et d'autre part' de masquer la pertinence des incLices individuels

dals

(16)

Introducaion

gétrérale la relrcsentation de

I'infonnaton

permettant de distinguer entre les locuÛeurs dysartbdques et les locuteurs nomophoDiques.

Dans ta partie

applicaion

do c€ travail, on se propose d'analyser des [ecturcs de texte en se basant sur I'analyse en composantes principales du spectrogramme pour la détection de la

dysathrie. La

pertineuce des moments des deux premières composantes principales

en

termes

de

pouvoir

de

disqimination

entrc

les

locuteurs nomophoniques

et

dysarlriques lotsqu'ils

sont utllisés

dans

un

algorithrne

de classificaton est

quantitree mrmériquement.

Le

méûoire

est orgadsé ell quatre chapitres. Iæ premier cbapitre préselte les notions fondamentales nécessaires

pour

la bonne compéhension du mecanisme de production de

la

parole

ainsi

que ses caractéristiques.

Le

deuxième chapitre est dédié

à la

méthode de I'analyse

en

cornposattes principales

utilisée

dans c-e

tavail'

Le

troisième

chapite

est

conseclé

au séparateur

à

vasÛe

rnarge

(SVM) utilisrt pour

la

classification

dysarthrique,/nomrophoniqug

des

locuûeurs.

Le

quatième

chapite

se

focalise

sur

fintrprétation

de I'analyse en coBposantes principates

du

spectrogramme

du

sienal de parolle ainsi

qu'à l'apptication

à

la

détection de

la

dysarthrie. Iæ mémoire s€

temine

par une oonclusion générale.

(17)

Notions

Ll

hdrction

Ava

d€

frir€

des éttd€8 corceDts €6senti€ls liés à

la

C€ cùapitre pés€nle des

parole-On

do

re

urc

brèvç

orgaes qui

participdt à

Ia

caacbfoistiqu€s du

sigal

de

sort

,F$si

fn

senléë.

'hwpi*e

I

bndqmentales

sur

la

pprple

le

signal

p

parole,

il

farrt

toû

d'abo,rd

mtîtiser

les et pux

fractéristiques

du signal de perole.

dg baselnécessaires è la

conprehensiol

du signel de

du

$ecoisme

du produaion de

la

pade,

les

et

lts

ditrér€nts typcs

de som, l€s

différ€des

(18)

Ll!

Ia

pamle

Ia

paole

est

le

mod€

de

comunicalion trivilégié €nfe

les systÈme

$tnetué.

ftce

à elle

pensées. Nous pouvons

l'utiliser

désirs ou

pour

écbang€r,

communications orales diverses'

I;t

Production

de

la

Panole

proôction

d€ Pûole

comDort€tn€nt

à un moFent

dépeadnt

d'rme

variable

diculaloft€

É81.

Gednlem€nt,

LB

Notioos

fondmeûtrbs

rur

h

ion

le

plus nânn€I, c'est

aussi

I'art

de

i

sont l€s seuk eEe

vilads

à

utiliser

url

tel

poïons

dom€r

lre

voix

à

toûE volodé st

à

rcs

opinions, des fulées, d€s s€dim€nts' dos

derbodër

<ks

infornations, €t

€st

à

distiDgu€r des

lûs cÎi$, les al€rt€s ou les gémiss€m€nts.

dc

lF

êùb asdnilée

à

rm

sysême dynamiquc'

dont

le s€s étd.s antérieurs.

systême cst donc

du ΀rys

qui

dâns

ce

cas est

|m

gesÛc

€st

Dré6ctréc

€n ûois

étap€s daDs

litGrere

pbonétique

(FiguE

I.l]) €t

sF

à faide

d€ c€ qu'on

appellç I'appaæil

ohonaroire conrr,ôlé

Por le

nelverx] central.

Une

r€Fés€trtâtion simplitree du

sysnÈme de

poduction

de

etob

+

donDts

4

la

figwc (I'2)'

(19)

Notions

fondamentales

sur

la

I3.1 L'appareil phonrtoirc

I-e tangage parlé necessite

tout un

ensemble d'organes permettant la production de sons. Cet ensemble est appelé I'appareil phonatoirc.

I

C.Ytti

r.s.|c

rl

Cordritl.ocâl

pbrrtrr

ord.r

rcal6

+/

\

parti€ glonique

Figûre

IJ

: L'appareil phonatofue.

I3.2

Jllecanisne

de

production

de la

parole

La production de la parole est

ùr

systgme complexe et tE)os€ sùr :

>

Le système

neuologiquc

: sysême en éseau formé des organes, des sêDs, des nerfs, du cærveau et de la moelte épinière.

)

Iæ systeme physiologique : activité des organes.

Durant la production du son, une grande quantite d'orgares et de muscles eDtreDt en

activile, le fonctomement

de l'appÊreil phonaioire humain repose sur

l,interactiott

entre trois grandes classes dbrgaûes

[19]

:

C.alté or.alc Canté nasale Cauté buccale Glolte

(20)

Châpitre

I

Notions

fondamentales

sur

la

parole

I-es poumons.

tx

larynx.

Les cavites supra-glottiques. Les

poumom

Sa foDction première est d'oxygéner le colps

humair!

toutefois

ils

sonl txès

utiles

à

I'ho|nme

car ils

sont une

source d'air

pemettant

de

produire des

sois.

Lors

de

I'inspimtio4

l'action

du

diapbragme

(qui

se cortua.te

et

s'abaisse)

et

les

muscles inlercostaùx permettent de

vider

les poumons et de les

remplir

d'air.

Lors de

l'expiraton,

le

diaphragme

se

détend

et

laisse echapper

fair

penétre,

qui

est

ensuite

utilisé

pour produi.e des sons [19],

Le

lr!ryDx

L'air

expulsé des poumons est gnvoyé daDs tm tubo

formé

de plusieurs cartilages appelé le

Laryrx

(figure

1.3).

Celui-ci

est formé de muscles et de cartilages. Les cartilages

les plus

connus sont

les

cordes vocales.

Celles-ci peuvent s'ou!îir

et

se

femer

très npklement

jusqu'à

400

fois

par seconde. Elles produisent des vadations de pression dans

I'air

qui sont perçues

coîune

du son par

I'oreille

humaine [19].

Ease de langue Ép'gktlte

Cordes vocales Trachée

Eandes ventnculares

Figuie I.3

: L€

tarlrx.

Les,cavités

supra{Iottiques

lorsque

le

son sort

de la

glotte,

il

passe

à tmvers

les organes

vocaur

sqÉrieurs

appelés

cavites

supra-glottiques

(cavité

buccale,

cavité

nasale,

cavité labiale,

cavité

lar''r8ale)

oal

il

csr modifié, Ces cavilés serveDt à faire Ésonner le son et â

lui

donner une

(

f\

i{*r'-"li

(21)

Châlpitre

I _---=--=-

Notions fondament.les sur

la

parole

coulcur > particulière qui

pemettra

de

difér€ncier

les voyelles entre elles par exemplg

ou

les consonnes. Cette

coulerr

particùlière donnce à chaque son

Foyient

ess€ntjellement de la

modificatior

de

la

forme des résondeurs à

l'aide

des mouvements de

la

lânsu€ et des lèvrers

ertre

autres chos€s [201.

L4 Caractéristiques

de

la

yoix

La

parole est

rm

ensemble

de

sons

produits par

le

larynx

lorsque

l,air

expiré

fait

vibÊf

lcs cotdes vocales. Tous les sons simples peuvent êtrc décrits de manière exhaustive par

ûois

paramètes ; la hauteur,

l'intensit!

(appelée aussi

volume)

et

le

timbre. Ces

trois

crità:s

correq)ondert

respectivement,

à

trois

caracéristiques

de

l'onde

qui

sont

sa @ur:ncæ fondamentale, soo amplitude, et sa

c.nstitutioq

ha.moniqÛe 1211.

L4.l

Hrutcur

l,a haut€u

de la

voix

au cours d'rme conve.sation, varie selon les personnes. Elle est essentiellement déterminée par la longueur, la forme et [a position des cordes vocales.

Elle

peut

êfe

volontaircment

modifiee,

dans certaines limites, par

l'int€rmédiaire

des muscles r€spiratoire et de ceùx du

laryrx,

en faisant varier la pression de

l'ait,

ainsi que la tension

et la

position des

cordes vocales

qui

s'éloigne

ou

se

mpproche

l,lme

de

l,autle.

L'association

de

ces

élénents

détenûrine

la

tiequence

de

vibration

des cordes vocales (flequence fondamentale), plus celle-ci est élevee, plus la

voix

est aigræe [221.

I.4,

l.ntensit6

L'iniensité

conespond à I'amtr itude des vibrations sonorcs.

Ellç

est cônhôlée pax

la

force des vibrations qui dépend du débit avec lequel

l'air

est expirc. Elle est fonction de

la

ptession de

l'aire expiratoi€

et s€

mesue

génémlernent en

taille

[211.

I.43

lfimbre

Le

timbre

est l'ensemble des caractéristiques permettânt de

différenciet

une

voix,

provenant des

poumons,la

gorge,

la

cavité buccale et

le

nez.

Il

peut €,tre

déteminé

pal

(22)

NotioN

fond&metrtales

sur

lN

I.5

Catégories

d€s

sons de

pârole

La

parole est

une suite de

sons

produits soit

lar

la

vibration

des cordes vocales (source de voisement quasi periodique), soit par une turbulence creée par

I'air

s'ecoulant datrs

le corduit

vocal ou lors du

relâchement

d'une

occlusion de ce

conduit

(sources de

bruit

nor

voisees). Donc les sons de la parole sont classés en deux catégories selon

l'état

des <udes vocales (les cordes vocales vibrent ou pas) : 1.5.1 Sons voise'!

fæs sors voisés contennent l'ensemble des voyelles, sont

prcduib

par le passage de

I'air

de porunons à trav€rs la trachee qui met en vibration les cordes vocales. Ce mode,

qui

rcprc:sent€ 80% du temps de phonatioD. est caractédse en géné.al par une

quasiÉriodicité,

me

rnergie élevée et une fréquence fondamentale

(pitch).

La

figure (I.4)

montre la forme

d'orle

et la deûsité spe.ctrale de puissance @SP) d'rm son vois€ :

oqi

003

005

Temps

(s)

Forme d'onde

Demié

spectrale de puissarc€

Fig||re

I.4

: Forme d'onde et la densité spectrale de puissance d'un son voise.

g

o_ Ë 0Ûl

,//1U',,,h'i,\,'

t,

r/['l

'l'',.,'tû,y'n"r*.,,\*,,,.,r,,rû,,ùû,r"

",.qn

rss 2æ0

?!û Frequence

(llz)

(23)

Notio$

fondtmentale! rtrr

h

prrole

I52

Sotrr tron

voi!ê

Iæs sons non voises (comme certaines

mnsonnes!

dans ce cas les cordes vocâres ne

vibrent

poi

I'aù psse

à

rra.te

ente

lcs

cordes vocales,

signal

poduit

est équivalent à Ùn bruit

blatc.

La

fi+

(I.5) moûlre la

fome

d'onde et la

dosité

sp€ctale de puissanc€ d'rm son non voisé :

Tenps G)

Fomle d'onde

!

a

E d

cl

r&

s

Figur€

L5

: La forme d'onde

ft

la

de*ité

spectmle de puissance

d'un

son non voise.

L6

Modèles

de

production

de

la

parole

r6t) ffi

Fréqueace

(IIz)

sp€ctralg de puissânce

Dans la

plupart

du

tenps,

qu{

que

soit

le traiæment qu€

I'on desie rçalisq

sur

le

sisal

de

pamle, on

est amcné à comme

plemier

û'aitement une modélisation. Parmi les modèles

qu'ils

existeût on a le modèle physiqne

dit

aùssi modèle

a.ticulaloire

et le modèle acoustique base

sw

la

û{rie

source

filte.

(24)

Notions foldamental€s sur

I.6.1

Modélis{tion

physiquc

Les analyses expérimentales de

lappareil

phonatroire humain

monfent

que celui_ci

est

rm

sysGme

complexe

de

production

de

signaux

acoustiques.

Une descdpton

du processus de

phoration

avec des quanlités physiques et physiologiques p€rmet

de

mieux

comprendre les mécanismes de la production de sons voisés et de tenter de les

repodulre

artifir:ielft:men1.

La

modélisation physique

de

la

phonation

repos€

donc

sur

une repÉsentrLtion

physique des

différentes

parties

de

l,appar€il

phonatoire

el

propose

d'intqpréfer

la

production

de sons voisés comrne

le ésultat de

l,instâbilité du

système

dynarnique,

formé

par

les

plis

vocaux

et

fécoulement glottique, couplé avec

des

résonaærùs acÆùstiques. Cetûe inûerpÉtation est donc base€ srrl

l,intemction

entle

les

plis

voçarx et

l'écoulement glottique

qui,

sous certaines cotrditions, engendre les oscillatioos

glottiques. Cette

modélisation

nécessiûe

ùne

description mecanique

de

la

structue

repÉlientant

les

plis

vocaux,

'ne

description

de

l,ecoulement dans

les

voies

aénennes

supé.ieures, une description de la propagaton des ondes acoustiques et une descripton des mecaûismes

d'inkractions

[23] .

[æs caractéristiques acoustiques des phonèmes

sont liées d,une part

aLLx souces,

mais

surtout

à la

configuration

geométliqùe

du

conduit vocal,

cctte coDformation étant d)'namiquo au cours

du

temps.

La

connaissance des

lois qui

régissent

la

relation

ent e géométrie et çonsequences acoustiques p€Imet

ainsi

de proposer un modèle

gômétrique

du conduit vocal

capable

de

générer,

à partir de

paramètres géoméaiques,

un

signal acouslique en so.tie.

ile

conduit

vocal peut être considéré comme une suc{ession de tub€s ou de cavités acoùstiques de section

difiërefies.

La figure (I.6) moûtre la

fome

du conduit vocal dans le cas de la prononciation de rvoyelle

lal

et Ia voyelle /i/ .

lal

til

Figurt,l.6

; Modélisation du conduit vocal dans le cas de la prononciation de voyelle

/a/et

lavoye:lle

lU.

(25)

Chapitre

I

Notions

fondarnentales

sur

la

parole

I.6l

Modélisation acoustque

L'analyse, la synthèsg la reconnaissance et le codage de la parole

so

Îles

souvent basés

srr

une représ€ntation paramétrique

du

sigal

:

le

mécanisme de production

de

la paroile

qui

a été decrit dâns ce

chapitE

condùit très Daturellement à un modèle oarticulier-appelé modèle sourc€-fi ltre.

Iæ modèle

soulce-filtÎe

est

la

bas€ de beaucoup d'applications de tlaitemenr

dc la

parole

[241.

La

Figure (I.7)

montre

le

modèle source-filtæ

utilisé pour

modélisel

le système de production de la parole.

Figure

L7

: Modele source

filtre

du systeme de production de la parole.

Le filae

1l(z)

est assoçié au conduit

vocal

et

aux

articulateurs alors que

le

modèle R(z) simule le rayonnement aux lèwes. DÙrant les s€grents de parole voisée, le générateur de

train d'impulsions utilise

me

estimation de la

!ériode

fondamentale

pou,

générer une suiûe d'impulsions qui excitent le

filae

d'impulsion

glottique G(z). Durant les

seper{s

de parole

nor

voisée

I'excitation

est modélisée par un

b.uit

cancterise par un spectre plat.

.Lors de lzr production de

la

parole,

la

forme du conduit vocal

change au cours du

temps

Le

filÎIe

H(z)

associé au conduit vocal

doit

changer aussi pour simuler les effets du changemeût

de

la

forme

du

conduit vocal. Dans les

applications

de

la

parole,

les

pardrètres

du

filùe peuvent être

considérés,

avec

une

botrne

approximation,

comme incbangés pendart une durée de 20 ms à 30 ms.

Gaù poû.la sorrt€ yoi!Êc

Grir porr'la soûrcê dr

bnir

(26)

Châpitre

l

Notions

fondamentales

sûr

la

prrole

I.7

Signal

de

signal dp parole est

un

signal

Éel,

continrg d'énergie

finie,

non

stationnaire, sa shuchrrg

€st complexç

et

variablc

dans

le

t€mps-

Le

signal

de

parole est

ùr

vecteur acoustique porteùr

d'infomations

d'une

grande camplexité,

variabilité

et redondance.

Il

€xiste

diférentes

méthodes de représentaiion

du

signal. Certaines

ont

été spécifiquement développées pour l'anslyse ou le codage des signaux de parole.

I.7.1

CârrctéristiqtrB

du

signal de

parole

Les

caractérisiques

de ce signal

sont

app€lé€s

traits

acoustiques. Chaque

trait

acoustique a une signification sur le plaû perceptuel.

L7.l.l

Fr'equetrce

fondam€ntde

(pitch)

C'esl

la

fréquence avec laquelle les cordes vocales

vibrent

pour

la

réalisation

d'un

son voisé. En acoustique, la fiéquence fondamentale ou son fondarnental est

lhannonique

de premier rang

d\m

son (Figure I.8).

La

fréquence fondamentale F0 ou

pitch

(p€dode des sons voisés)

joue

un

rôle

très

important dens la

parole.

C'est

elle

qui

véhicule

une

graûde

partie de l'infomation

prosodique.

L'inteDsité

de

la voix et

les dule€s successives des syllabes

coÉplètent

c€s informations.

D'une

manière

génâalq

la prosodie, qui peut êùe considâée comme

I'effet

des (ûffércntes variations de

la

fiéquence fondamedale F0, de

fittensité

et de

la duée,

peut

faire

ressortir

bien

des caractéristiques

du locutqÙ,

comme son

gflÉ,

s€s origines géographiques et

cultuell€s,

s€s émotions, etc., mais participe aussi à la caracærisation de

la

langue

elle-mêmq par

la

manière

dont

elle

est

utilisee

pour diffâencier

les

divers

élémeûts

syntaxiques

çomme

les

énonces

(interrogatifs, exclamatifs

ou

declaratifs),

I'importance de

certains mots,

ou bien

même

pour caractâisel

les différences lexicales ente tçs mots[251.

(27)

Chapitre

I

Notions fondamentales

sur

parol€

Intensté

nce fondamentàle

i fz fa

Fréquence (Hz)

Figurr L8

: FÉquence fondamentale.

La

ftéquence fondamentale €st

proprc à

chaque

individu

et varie

selol

l'âge

et

le sexe. Pour avoir une idée de

I'ordre

de grandeur de cette frequgnce, nous pouvons rappeler les

chiftes

zuivants ;

)

70 à 250 Hz pour les hommes.

>

150 à 400 Hz pour les f€mmes.

>

200 à 600 Hz poùr les eDfmts. L7.1.:2

Forl|lanh

l,€

voisement que nous percevons est

diférent

de

celui

produir

à la

source

par

les cordes vocal€s. Ce que nous entendons est le

ésultat

d'un phénomèoe de

filtage

sur

ule

onde cornplexe. La capacité d'amplifier ori, au

contaire,

d'atûenuer certaines ftéquences est la propriété de tout résonaleul. Dans le cas précis de la parole,

le

stimulus est

foumi

par I'onde périodique complexe provenant des cordes yocales

et

ce sont les

cavites

supra-glottiques

qui

assurent

la

fonction de

rcsonatçur,

Ia

fonne,

la

dimension

ainsi que la

matiere

qui

compose çes cavités

sont

autant

de

particularités

qui

détemineront

les ftéquolces

qui

s€ront mises en évidences et celles

qui

ssont

atténuées. Les cavités supra-glottiques

ort

la

capaciie de neutraliser certains harmoniques

et

d'en

methe

d'autre en éviderrce par rm simple changemetrt d€ configuration,

Dolc

le

conduit vocal possède rme

fonction

de transfert

(filte)

qui

appli$rê

à une source

goduit

un phonème- Les maxima locaurr (pics) de cette

foûcton

de transfeÎt sont appelés

fomants

(Figure I.9) et sont notés

Fl,

F2, Ir3,

etc. [æs

formants corespondent

âux

zones

de

reDforc€ment maximal. Néanrnoins, du

point

de vue perceptif, seuls quelques

foroauts jouent

un

rôle

c€ntral au niveau de

la

parole.

En

théorie,

ou décrit

souvent les voyelles

glâcc à

leurs

2

premiers

fomants

Fl,

F2 [251.

(28)

Chapiûe

I

Notions

fotrdametraales

sur

Ir parole

Figure

I.9: lllust

ation des

fomants

(résonateur conduit vocal).

I.8

Oulils

d'analyse du signâl

de

pârole

I.8.1

Fenêlrage

Il

s'Érgit

de

découper

le

signal

en

trames

successives

suivaût des

fenêtres,

qui

permetterrt de localiser

le

traitement. IÆs fenêtres les plus utilisées dans

le

domaiûe

sott

celle$ Hamminig et de Hatrning.

Ces jienêtres d'aDÂlyse

sort

jûxtaposées

d'une farpn

permettant

I'apparitiot d'un

chevauchemenl.

Ainsi

dans

la

phase de

restitution

du

signal

or

doit tenir

en compte le besoin de lisser les

sigaux

synthétises. On

doit

noter également que les fenêtres utilisées ont une tlurée allant de 20

ns

à 30

ns

[26].

I.8.2

Sptntre

Le

spectre

d'un

signal est le

Ésultat

de la transfonnation de Fourier de ce signal.

À

partir

d'un

spectre otr peut savoir

la

ftéquence et I'amplLitude des composantes péseûtes

dans

le

signal

analyse.

La

forme

générale

des

spectrcs, appelée enveloppe spectnle, présente elle-même des pics et des

crcux qui

correspondlent aùx resotrnances et aux

atti-ésonlances

du

conduit

vocal

et

soot

appelés

fomaDts

et

aûti-formads. L'évolution

temp,rrelle d€ leuls ûéqusnces centrales et de leurs

largeus

de bandes

détemine

le timbre du

mn.

Il

apparait en pratique

$re

l'enveloppe spectrale des soos voises est de q.pe passe bas, :rvec environ un formant par

kHz

de bande passanæ, et dont seÙls les

tois

ou

quate

prernières

conaibuenl

de

façon importante au

timbre.

Par conùe,

les

sons

rlon

vois€s piéseDtent tiouvent uûe acc€ntuatioû vers les hautes fiéquences 1271.

(29)

llfpitrCl

Notions

foDdamenteles

sur

h

Darolo

I.83

SF)ttrogr&m|ltc

Le

sp€ctrogramme

est

un outil

de

visualisation utilisant

tecbnique

de

la

traûslornrce

de

Fourier

et de calcul de

specûes.

ll

est obteûu

par

I'application

de la

lmns:lornrée de Fourier sur des s€gments (txames) successifs de parole de 20 rns à 30 ms, pondéésr

par une

fenêtre

de

pondération Généralement une

fenête

de Hamming).

Il

a cotrunenÉ à être largernent

utilis€

en 1947, et est devenu

I'outil

incontoumable des études en phooëtique

penda

de nombrcus€s années [251.

Llpparition

de

l'informatique puis

d'ecrans graphiques de bonne qualite a permis d'abaûdormer tout materiel comme le sonagraphe mais la technique du spectrogiamme est eucore aqjourd'hui largement utitisée du

fait

de sa simplicité de mis€ en @u!Te et du grand nombre cl'études qui ont déjà éte réalisees [251.

Le

spectuogrdmmc

pemet de

mettre

en

évidenc€

les

différenæs

composantes

ftquenlielles

du

signat à

un

instant donné, une

transfonnée

de

Fourier mpide

étant

regulièremenl calculée

à

des

intervalles

de

temps

.approchés.

Avant

des

ca.lculs de tmrrsfomrées successives,

le

signal

doit d'abotd

être préaccentue

pat

un

filhe

du prenrier

orùe

pour

égalis€r les hauies liéquences dont

l'énergie

est toujours plus

faible

que c.elle des basxrs fréquences. Cette phase de

pdac€entuaton

du signal est suivie par une phase de fenêtrage, néc€ssaire de

fait

de

la

théorie

qui

soùs-tend

la

tralsfomée

de

Fourier. Dans cette mélhode d'analyse,

le

signal

colsidéré

comme

infiniment

stable est constitué

d'urc

somme invariable de fonction sinusoïdale de fréquenc€s différcntes. Pour contoumer cetùg

contraintr

théorique

d'invariabilité du

signal,

il

faut convoluer

le

sigDal avec une fenêtÎe temporelLe qùalifie€ de

glissa

€ puisque chaque calcul de spectre nécessite de convoluer l€

signal av,:c la fenêtre tempolelle à

ù

instant paTticulier [25].

I-e choix de la

taille

de lâ fenetre, en nombre de points de convolution, est également importaû,t

vis-à-vis

de

la

qualité de l'analyse

ftéquentielle

obtenue.

Ainsi

une fenêtre de

pette

taillle

(ave{

un nombre

de

128 points,

pa

exemple) p€rmetha

d'obtenir

ue

bonne analys€ dans

le

domaine temporel,

du

fait

dp

son

éAoitesse,

mais ne

permettra pas

d'obtenir

uoe bonne

ioformation fiéquertielle,

la

taille

de la fenêtre

érad

ators

ÎIop

petite

pour

ne loas

tonquer

les

phénomàes

de basses

téquences.

À

I'interse,

une fenêtre de grande

taille

(plus de 512 points)

pemettra d'obtenir

rme bonnc

informalion

ffiuentelle

mais

ne

pennettra pas

d'obtenir

une bonne

information

temporelle

car

tout

événement, meme de courte

duée, estjugé Fésent sul

I'ensemble du pas de temps analyse puisque

la

(30)

co[sld&e

et

son

Hanning.

E

théorie de la

tusformee

de

Fouri

(.10)

n,onue

un

signal

de parole d'analyu; de 20 ms et une feuêtrç

Notiom

fondrm€trasl€s

sur

la

parole

signax

indéfiniment

sables.

La

figure

sramme calculé

sn

utilisant

tme trame

d'onde

d'un

signal de parole.

la

résolution

spectrale

de

fanalyse,

il

€t la

Ésolution

fréquentielle-

Il

s'agit

qui nous interessent

-

32 ms)

oftc

une bonne résolution au

de

la

stnrcturg

hamodqug

du

Temps

Fomr

?

I

't0

l7

(31)

sig!Â],

nais

I'analyse t€Nrporçllç cou.t$s durées) [251.

lûv€rsem€ût,

u!

résofuûion

t€rnporclle

et

permet fréquonlielle est moins fine avec La

comléhension

du

mecaoise

de

Notions

fond.Dentd€!

sur

h

morps

(ûftcile

d'éhdier

des pbénomènes de

à larges dégFgGr

(3

ms

-

6

ûs)

oftie

ùne meilleure

les

formdts

vocaliques.

Eais

I'snalyse la

stuctu,e

harmonique

ûr

signnl

[25]-L9 Conclusion

Iæ signal

pdole

est ùn

sigMl

par sa très grande variabilite et donc par cbang€monts dans le temps du

sigal

de m

gzode

dchesse en

infonndioo,

i

est

dt

sourqe. de la foime et des

du

vocal.

Dans

ce

cbE)itç,

nous péçcnæ

les

différcNrtes

rcFésentations

du

sigDal acoustique

airci

que

le

modèle

phonatoir€,

c€ qui p€met

une boîne

pad€.

r

(32)

Chup

An'alyse en

compo

II.1 Introduction

Ce chaDitre est consacÉ aux méthodes multidirnensionnelle : l'analys€ elr composante ùaiter simultanément un nombre quelconque

L'ide€

centrale

de

I'analyse

etr dimensionnalité

d\rn

ensemble de domees intedependantes, tout eo coNervant le plu.s po des rlonnées [28].

Cr;tte

réductiot

est obtenue Pai

la

ensemble de variables,

(

les composantes clasÉes de façon à ce qu€ les premiètos

oartiLe d,e la variation pés€nte dans toutes les odginales.

19

CII

antes principales

plus cour:antes de la statistique descriptive (ACP). Cetle méthode Permet de variablçs. toutes quantitatives.

principales

est

de

réduire

la

lequel

il

y a rm grand

tombre

de variables de la varialion Drésente daru l'ensemble

des variables originales en un

touvel

D, qui ne sont pas corrélees, 9t qui sont pritrcipales coDservent la plus grande

(33)

Chapitre

II

Analyse

en

conposantes

principales

II2

Priocipe

de

I'atralyse

en

com

tes

principale,s

Etant

dormé

un

nuage

de

n

points

p

dimensions,

l'analyse

en

composanies de I'espacæ qui porte la plus grando palt de principales (ACP) consisle à trouver la

di

la dir;persion totale ; puis la direction à la pl'ecederfe

portalt

la deuxième plus grande part, et ainsi de suite. Du point de !'tre ique, c'est un simple changemett de base.

qui

a pour

effa

une nouvelle dæs des dircctions corresDondant à des variaibles deconéllees (au sens empirique)

d'expliquer I'information

conlenue dans

le

ouage sans

la

redondance

qui

pouvail iser la reprcsentation de départ.

La

trgure

(JLl)

montrc

l'aDalyse en principales

à

deux

dimeosions.

ta

ligne represeûte

la

direction de

la

Femiàe

pdncipale,

qui

donne rme réduction

lin&ûe

,oDtimale de deux à uae dimeosion

Figûre

lI.1

: Analyse en composantes : nuage de données à deux dimensions.

L'analyse eo composantes

prbcipale

est méthode d'ordination ctassique. A

panir

d'uû eff€mble

de n d'objets dans

ur

espace

p desqipteus,

son but est de trouver tme rep*,seDtâtioo dans un espac€ reduit de

k

ions

(k

<<

p)

[291.

II3

Re,cherche et

calcul

des

composa

principales

Ixs

doonées sont généraleûent soùs

la

d'un

tableau rectangulaire

n

x

p'

à rr ligne$ repÉsentant les individus ou

(fgure ll.2).

et à p colontres correspoodant aux variables

(34)

Chapitre

U

Aaalyre

en

composlntes principalcs

I

Figrre fI.2

: T4bleau de données.

Dans le tableau de données (figure

Il.2).

xiest la valeur de

I'individu i

pour la variable

j,

on peut representer chaque

individu

par te vecteur de s€s mesures sur les p variablesXi

=

(*1,....*l)t,

de façon analogue,

on

peut regésenter chaque variable

par le

vecteurxJ

=

cl...,4).

Supposons

que

X

=

(xf,xi-.,xf1r.

La

première étap€

corrsisûe

à

trouver la

combinaison linéaire

afx

des éléments du vecteur

X

aya

la plus grande varianc€, de sorte oue :

crrx

=

crr*1

*

orr*3

*

...

*

aloxf

=

X;P=, c1;xl

(II.])

Oir c1= (c11,ct12 ...c10)r est le vecteur des p coeffici€nts à

détermircr.

Emuite, trouver la deuxième combinaisoa linéaire

cfx

uon corrélée aveç la première combinaison ayant

la plus

grande variance et

ainsi

de zuite

jusqu'à

la

k'*

conbinaison

linéaire

qlx.

La première combinaison

linéùe

représepte la première composante principale

CPI'

et la deuxième combinaison linéaire repésenæ la deuxième composante principale CP2,

et

ainsi de

suiæ

jusqu'à

la

ktu

conposante

gincipale

CPr

telle

que

les

k

composantes pdncipales non conélécs

2

à2,

de variance maximale

et

d'importance dearoissant€,

la

piemière composade principale

CFl

doit être de variance maximale

(figue

tr.3).

''''..1'.il-'4

(35)

Chrpitre

II

Géométiouemenl CPI

suit I'a.Ye d'allongement

(eti

CP1

=

droire passant par

le

nuage

c-àd qui

conserve au

Analysc cn compoarntes

prirciprl€i

4x=

)crrl

c*- )

c,,xl

: RepÉsenlation geométrique de

CPl.

Cl

=

Xf=,

cr;xl

, du

point i fur I'axe CPl,

projection de xl sur

CPl,

CP1 de variance maximale donc les ions Cir $ont les plus dispenées qæ possible.

Pour fixer la droite, on

i

qù'e[e

paise par g (c-entre de graviæ), sinon l'ensemble

des droites Darallèles

convi@nent

de gravité féalisant le

meilleur

ajustcment possible

du

la distanc€tenùe les Doints (aorès oroiection). droitc de proj@tion a$$rant rme distorsion

lenùe les points (après

goje{tion),

droite de

CP2:2*

composante, à CP1 et

{e

variancæ maximale.

G'eométriqu€ment CP2 d€tenniûe droite

fixpendiculairc

à

CPI

(au point g), suivant

un

axe (perpendiculaire

au

l)

d'

m4ximun,

et

CPI

a

CP2 détermine.nt le plan

principal

: le meilleur

plal

dc

proj

(de

diftorsion minimum)

[30] Qa figure

(36)

Chapitre

II

Alalyre

en

eonlpoernte!

principlle,

Figure

ILs

I plan de prcjection.

CPI

est telle que la moyenne des distançes euçlidiemes d2

(À4)

est maximale, Cp2

est perpendiculaire à

CPI

et

lelle

que la moyenne des distanc€s euclidieDnes d2 (Êi,Fi) est

maximale.

CPI

et CP2 detemrinent le plan tel que <D

(t,

fi) soit maximurn, Cp3 est lâ droite perpendiculaire à

CPI

et CP2 (par g)

t€Ie

que la variance des coordonnés

soil

maxrmum

1301.

Après

avoir défini

les composantes principales (Cps), ûous

avors

besoin de savoir cômment les trouver. Envisager, le cas où le vecteur de variables aléatoires

X

a une matrice

de covariance C.

II.4

Decomposition

de

la

variance

I,a variance est une mesure servant à c€ractériser la dispersion d'une variable aléatoire autolu de sa moyerme. La variance d'une variable aléatoire

X

est définie oar :

v(x)=EtG_Elxl),1

La variance correspond au carÎé de l'écart-type noté

o

:

(rr.2)

v(D

=

o'z

(rr.3)

La variance des donnees multivadées est estimee de la manierc suivanûg :

o::;#XÈ'

XÊt Gi

-

x;)r (x;

-

x1)

=

#ôtil'XÈ.(*,

-

s)

+

(s

-

xt)r

((xt

-

s)

+

(s-"';)

(37)

Anslyse

€4

compolrntca

principdctr

=;àri'ri

=frIÊ"<"'-

)'(xi

-

ùi

IL4.1 Projection sur

une

1

(Gr

-

s)ÎÇr

-

e)

+

(s

-

'1)'(s

-

*;)

'

Gr

-

dr$-

x;))

Chrpitre

II

Sroit donc : 1

(r-1)

L (tr_1) (D-1) 1, (n-1) L'opérâf eur de projec'tion

V s'écrit

:

Avec

\lV

=

I

La

vûianc€

des obsêrvdioos

proj

s'éptit

a[on

:

('t

-1)

(

n(&

-

g)rxr(& -

s))

IL4.2 Recherche

de

la

Nous avons donc :

4e

vqriance

narimale

(n-1)

!rgl("i

-rs)')Gl(xr

-

g))

0r.4)

4

sur lme

&ûite

de vac-teur

direcieltl

uftaire

(rL

s)

(rr.6)

1W1(x,

-+

g)1(Wr(x1

-

g))

(t"r

- s1"t@w)f''

* sl)

(xi-drwl(xi-c)

(r.a

(xr

-

C)lr

\tXVrGi

-

d)

(rr.8)

=

vrcv

6r-9(xi-dÏv

24

(38)

Chapitre

II

Aralyse

en

composrntes

prfucipales

Observons que la matrice C est la matrice de covariance. Cette matdce €st s].métrique

définie

positive. Noùs devoDs donc

maxinisêr

cette variance des observations

ûoietês

:

Maxv(Vrcv)

Avec

Vrv

=

1

(rr.e)

Il

s'agit

d'u

problème

d'optimisation

sous

containte.

Noùs forrnons donc

la

fonction de

I,agange

;

f

=

vrcv

+

À(1

_

vrv)

Gr.l0)

Nous obtenons ainsi

l1lquaton

aux valeurs propres

CV:lV

(tr.1l)

Conme

la matrice variaDçe-covarianc€ çst symétrique définie posilive, les lalcr.us propres sonl reelles positives. l,es vecteurs prcpres peuvent êÎIe choisis otthonormés et la variance

des observatiors projetees

s'éûit

alo.s :

oi

=

vrcv

:

Vl.lv

=r

G.t2)

Donc la

soluton

est la projection des donnees sur le vecteur propre ayant la yaleur propre

tr

la plus

élevê.

II.4,3

Recherche

des

projecûions de

variance mâximale orthogonales

au

-

premier

âxe

Afrn

de trouver lç serond axe de variance maximale, nous recherchons :

Maxv(Vrc

V)

Avec

(VrV

=

t)

et

(VrV1

=

0)

(tr.13)

(39)

Chapitre

lI

Analys€

en composantes

priDcipales

Avec

Vr étant

le prcmier

vecleùr propre

à

wleur

propre maximal€. Comme les vecûeûs propres de

C

sort nâturellement orthonormés, la solution est de choisir le deuxième vecteur propre de C à deuxième valeur

popte

maximale.

IL5

Matrice

de

covariance

la

matric€ de covadanc€ étant une

matice

définie positive, elle peut êûe diagonalisee et

l'étude

des

valeù$

proprcs

el vecteus

proprçs

pemet

de camclédson ta

dlshibution

à

l'aidc

d'une

base

orthogonalg

cetûe approche

esl

l

objet de

I'analyse

en

çomposanæs

prircipales

qui peut être considerée comme une sorte de compressior de

I'informafion.

La matrice de covariarce qui pour un ensemble de p vafiables algatoires réelles est

la

matrice carreæ dont l'élément de la ligne i et de la

colonnej

est la covariarce des vanables

xi

€t

xj.

Pour rme matrice de donnees

X

de dimeasion

n

x p,

la

matice

de covariance

C

de

dimensiotr p x p est estinee par :

c=xxrl(n_1)

C'est une matrice symétrique et peut doûc être diagonalis€e :

(rr.l4)

C

=

VDVT

([

l5)

Où:

V : matrice dont les colonnes sont les vecteurs proprcs.

D

:

matrice diagonale dont

la

diagonale

contient les valeurs

proges

4

dâns

I'odre

déûoissant.

Les yecteuls proprçs sont

appelés axes

principaru

ou

ditections

pincipales

des données. Les projections des données sur les axes

principaux

sont appelees composanæs

principales, également connues sous le nom de

Cp,

elles peuvent êlÎe considérces

comnç

des nouvelles variables

t

ansformées.

Ia

representation des dornées daDs

les

c.ordonûées des composantes principales

est doûré€ par :

(n. r 6)

Z=XY

(40)

Chapitre

II

Analyse

en

comporatrtes principâles

La

jib

composante principale obtenue comrne étant la

jitu

coloane de la matric€

xv

est Ùne combiDaison linéaire des

p

variables où les

coeffcients

de la combiDaison lrnéaiæ

sont les éléments

dujitu

vecteur propre v;:

4 =

Xvi,i:7,.--,V

(Ir. r 7)

II.6

Décomposition

en

valeurs singulières

La decomposition en valeurs singulières de la matdcg des donnees

X

s,ecrit comme :

X

=

USVT (JU :

S : matrice diagonale des valeurs singulières si. U, V : matrices orthogonales d'ordres tgspectifs n et p.

De 14 on peut facilement

voir qæ

:

À=

sil("-

r)

Iæs composanûgs principales sont dorurées par :

c

=

vsurusvr/

(n

-

1)

= V(s2ln

-

1)vr

(rr.1e)

Ce qui signifie que les vecteurs

singulie$ corects V

sont les directions principales et

que les valeurs

singuliùes

sont lié€s aùx valeurs propres de la maûice de covariance

na

:

(rr.18)

(rr.20)

(tr.21)

XV=USVTV=US

(rr.2l)

II.7

Choix

de

la

dimensionnalité

Souvent, nous

re

conraissoos pas le nombte

r

de composartes principales à

utiliser

pour une bonne

appoximatioL Un

Cdtùc

de

choix

de

r

est de calculer la

fraction

de

la

variance totale expliquee par les r prernières composantes principales [31] :

r(r)

=:*++'

=Ftr

^71^2r--r^p L;=1^,

Etaût donné un s€uil c! déshé, on

coûûence

par la première composante principale et

Figure

Figure  IV.9  :  Première  el deuxième principales  du spectrograrDme  pour  tous les sur  les  loculeurs  ..................,.........
Figure  L7  :  Modele  source  filtre  du  systeme  de  production  de  la parole.
Figure  I.9: lllust  ation  des  fomants  (résonateur  conduit vocal).
Figure  ILs  I  plan  de  prcjection.
+7

Références

Documents relatifs

cation de ces ressemblances par le calcul de distances euclidiennes entre les indi- vidus rendu possible par le choix d’une métrique Q sur RP.. L’ANALYSE EN

Pour cela nous disposons de l’estimation de la ligne de fond de spectre f( ν ) obtenue par une des méthodes présentées paragraphe 5.2.. s’intéresse qu’aux pics qui se détachent

 La somme des carrés expliquée par la typologie en K classes est égale à la somme des carrés inter-classes de la typologie en K classes.  La qualité de la typologie

PUISS CYLI CoupleMax i LONG LARG HAUT COFFRE RESE POIDS VITE CONS PRIX. Correlation is signific ant at t he 0.01 lev

Dans ce sens, l'ACP peut être considérée comme une technique de minimisation de l'erreur quadratique d'estimation ou une technique de maximisation de la variance

Dans une perspective globale, et sans faire preuve d'un pessimisme exagéré, on peut craindre un creusement des déficits régionaux, ce qui suppose un accroissement de la production

Les variables supplémen- taires apportent une information utile pour caractériser les individus mais ne servent pas directement à l’analyse : on ne s’intéresse pas aux

Note : Dans le cas de l'acp de la matrice des corrélations, les coordonnées des variables sont égales aux corrélations entre les variables et les différents vecteurs propres