erciements
Nos premiers remercielrentsla patence et le courage
duant
aasqui
nous a aidé et nous a doDDé iâ sânté, annéas d'études.Noùs tenons
à
saisfu c8ttc profondes reconnaissances à :et
adæsser nos Drofonds rcmerciem€ntset
noslu.Kachr AbdEllah, qote
de mémoire defil
d'études, pour ses conseils, s€s orientalions et ses ûout au long de notre rccherche.À
tous nos enseignants : <bakir.
C >. <M
TekkoulG O >,(
M.
Brahimi T
>,
qui
nousont
donnélflIs
ioDset
leurs aides, sansoubliet
d'expdmer nosremerciements
au Chef
deet
lout
le
penonnel
du
dépaæncnt
d'élecûoniquçpoul
leur gentillesse leur disponibilite.Nos
remerciemerûsvont
d'accept€r delire
et de juger ceA
nosfrnilles
et nosrmis q
surmontgr tous les obstacles.aux membr€s
du
jury
qui
nousont fait
l'honneur
par lerns prières
et
lcurs etrcouragements,on
a puNous
teûoDsà
remercier personrtequi
a
participé
de
prÈs
ou
de
loin
à I'élaboration dc c€ modesûetravail.
I
l:l t
a'
Lrearcace
Tous les mots ne
sqraienl
expriner
14 grqtitude,I'amou4
le rcspect, la recotmaissance,c'est
bû
siûelenehtb
e :je
dédie ce modestetdvsil-A
Mû
,endrc Mùrc Naeeru:
Tu rcplésentespoù
moi la source ds tendresse et I'exernple détouemerrt qui n'apss
cessé dem'er{ourager.
Tu asfait
plus qu'une mère puissefaire
potl
que ses erfants suieent 14 bon chemin dons
letn
vie et leurs études.A
Mon
rrès cher pèreMahfonil
: Au$me dédicace ne saurqi, expriùrerI'amow,
I'estime,le
dévouement eî le respect quej'ai
t4ujourspour
vous. Rien qu monde neraut
leseffofi|
f.tunis jour
et tulitpur
,roû
éûtcatiol
et mon bienête.
Cetruvail
etb
fruit
de tessocrifces
que îu ûs consentis
pots
monqucation
etmaforrnotion
le long de ces années-< QueDiet
14 tor,t puisssnt me les gardes,
A
ntes chet\îrères
:Karim
et yaakoub.A
mcs s@tlrs : Ibtissam, Amal, Nasrin.<
A
quije
nuhoite
leuua,ry
de réus$ite e, debonhew
t
A
wt
chùe binôrlu
< Zeyneb > et ù toulcsalamille
A
meschètq
amies:
Chslw+ Salih4
Assia, Fadia" Sahco,Chahrdzdd
Yottiaa lies'
Aù41' Meriem, Soumia, Sara, ...,pour
leu+syntpdhie,letr
hamew et leursolidarité
envers moi.A tous mes collègues
d'électrlnique
de I'université de Jiiel, promotion 2017. A totr.s ceÆ quinc
lqû
chers et quei'oi
ornis de lescïer'
Qédicace
Tous les mots ne sauraient
exprinet
Iy'gd'tlud4
l'amou1
le respect, la recofrnaissaûce,c'est
tout sintplement bue :je
dêdie ce ùtodestefiovail.
A Mo
tendre MèreAhilt
:
Tu reprqsentespour
ûtoi lqsoûce
de tendresse et I'exemple dévoueûren! qui n'a pos cessë dem'enfoanger.
Tu 4sfsit
plw
qa'une mèrc Wissefaile poxr
que ses enfoûs suivent
ll
bon chemin dorc leur vie et leurs ëfirdes.A
Mon
tràs cher pàreAMElIah
:Aulune
dédicace nesdûait
eryrimet I'amoxL
I'estirrre, le détouement et le respect qæj'.ri
t4uiourspour
lous. Rien qu monde ne v.tul leseîorts
fonn
isjoù
etwil
pour
mon éducstioit et ,rurû bien être. Cetravail
et Iefruit
de tessqcrifces
que
tt
asco
senti$pottt
nton éPucationa nalormaion
le long de ces anmées. 4 QueDicu
14loul
paitsant rræ lesgades
,,À
ma
yès chèreseur :
W$a.À
ma
chQrclràres
: Sami et Arn ûar.<
A quije
souhaile
.lc réussite et dc bonheuft
A
na
chèrc binôlpæ <Inune
),d
ù toute talamille
A
rn{schù6 amb
: Nosaybo, Souhfia, Wafa, Diahtula, Fozia,H6!a'
Ho{d4
Somi4 Ines' AmaL Yamina ...,pour
lew
synipathx,lew
humeù
et leur solidorité envers moLA
to
s ,nes collèguesd'électrlnique
de l'unfuersité de Jiiel, promotion2017-A
totrsceu
qui melpnl
chers etqE
i'ati
ornis de les citet.Zeyneb
Introduction généol"
...1'....
Sommaire
Sommaire
Chapitre
III
:
Séparateur
à
vaste
marge
Sommsir€
Chapitne
IV
:
Analyso
el
IV-l
Irtoôrction....
IV.4
Mom€ûtssp€ctralx
IV.5
lrterpétdion
des deu(ptmièr€s
principoles du sp€cûogratDmG...
50 5'l 67pfincipales
du
spcctmgramme
de
la
IV.2
Basê de doDlé€sIV.3
Anatyse eD composadesprinci
duspectlpgræme...-...-...-...
--. --.. 43IV.6 Application
à la parole IV-7 Conclusion.-...
Conclusion
générale-Bibliographic...
Figurc
I.8 : Féqùence fondamentaleFigure
I.9
:Illustratiot
desformatts
Orgnigramme
RepresentationFigure
II5
: Plan de projection...-Figure
fI.6
: Rçéseûtatioo graphique<<
iris
> ...,.,,..-....,.de
CPI
...----...
...-
22trois or€mières v4dables de l'ensemble
des
donneesFigure
lI.7
:
Rçprés€ûtation dçs premiè:res composantes principales de I'ensemblc desListq
des
figures
Figûrc
L4
: La forme d'onde et la dentité spectrale de puissance d'rm sonvoiÉ
""""""""9
Figrre I.5
: l,a forme rt'onde*
la de$itré spectrale de puissanced'un
son non voise"
"""'
10Figure
I.6
: Modélisation <lu conduit ]rocal dans le cas de la prononciation devoyellelaletla'
Figure I.7
: Modèle sourc€filtre du
de productiondelaparole
...-...'..--.
-.'...-
12conduit
vocal)...-'.,...''.
15Figure
I.10 : FoÎmc d'ondeet
d'un
signal de parole...'... -...
-. - -.... - 17figur€
ILI
tr.ig[re
n.2
figure
II3
Figure
II.4
Anallse
engincipales
: Nuage de données à deux dimensions .. 202l
les composantes principales
... -...
-.. --..-. 2228
donnees <
iris
>...
List€
desfigur€s
Figure lII.1
Figure
lILl
Figure
lII3
Figtrre
1I.,1
Figure ltIL5
Hyperplanoplimal,margeetvçcteursdesupport...,..,.'...-...--..-...32
Classification d'un nouvel exernple dans les
detx
cas d'un hyperplan...,..33
Séparabilite linéaire et qon linéaire . . - . . . . .
.
-...-.33
Caslinéairenonseparabte...
...-....36
Tmnsformation de I'espace de reFés€ntation et hyperylan separ"ateur dans
le
Figure
lV.1
: Analyse en c-omposattes pdncipales du spectrogramme..." ' "'-" " '
''14
Figure
M:
Signaux acoustiquesdu
texte
lu
produit
par un
locut€ur
coffôle
et de
la
séquenc,: des voyelles synthétiques, leurs spectogrammes et lestois
premièrcs composant€sprincipalespourdeslongueusdctramesde5mset30ms...,..."""'-
"""""
'45
Figure
JtV3 : Exemples de spect€s moyens à [ong terme de d€ux eDregisfemenls de textes lus produits pa. ùn locuteurcotrdle
et rm locuteur Parkinsonien... "
"
"""'---
--""'
50Figure
JtV.4 : Première composante principale du spectogramme de la séqrænce des voyelles s],nthétiques et du texte lu pour les longueurs de trame de 5 ms et 30 ms superyosee au spectlemoyenàlongtemrc.
...,..."'-"""'---"
'51
Figure tV.5
:
Itlustation
dela
relation
entrele
spectred'une aame et
les deÙx premières composmtes principalesdu
spectrogramne dela
séquence des voyelles synthétiqueset du
texte pour ùne longueur de trame de 5 ms - . ...
..""""""""""""'54
Figurc IV.6 :
Spectrcs des trames co[espondants aux coefficientspositifs
OleÙ
et négatifs (rouge) tle CP2a
leurs sommes pond,ûées pour la sequence des voyelles synthétiques"
"'
55Figure
Iv.?
:
spectres des trames correspotdants aÙxcoeffcients posilifs
OleÛ) et négatifs (rouge) de CP2 et leurs sommes pondérées pour le textelu..'...."
" "" "
""-
"" ""
55Figùre W.8
:
Evolution
tramepar
tramedu premier formant de
la
sequenc-e des voyelles synthetiques,coellcients
de CP2 etlow
version filù'ee...,..."
"""""" """""""""'57
Lbte
d€3figur€s
Figure
IV.9
: Première el deuxième principales du spectrograrDme pour tous les sur les loculeurs...,...
59 locu&urs ainsi que lgs moyennesFigure
IV.10
: Sommepondetê
arx
coefficients positifdnéga'rfs du texte luFoduit
oal les locuteufs contrôles et et La moyernes sur les locut€urs..-....-,.,...
6l
Figure
IV.ll
: Somme ponderée des des ftames av€c coefficients positiG/negatifs de CP2 du textelu
goduil
par lescodrôles et Pa*iosoniens et la
moyennes sur lesa
tr'igure
fv.12
: Repésentation en à moustaches des quatre premiermome[ts
(moyeDno sp€ctrale, ecartt'?e,
skewness, ) de la première composante piincipale et de la somme pondérce avec les coefficientspositi
ifs
de CP2 du texûelu
produit
par les locutcùrs contrôles et parkinsoniens..-..-..,...
Figure
IV.13
: Classiûcation des locuteurs...,..-..
...-.-
67Liste
tableaux
2
classes,....-...'...
40quadrarique
moyenne normalisée
(EQMN)
et
du
ente
le
spectremoyen
à long
tenne
et la
pr€mière TebleauIII.I
: Matrice deconision
Trblctû
IV.l
:
Pourc€nlages dela
expliquee por les deux premières c-omposantesTable{u
fvl :
Valcus de
l'
coofficient
dc
conélation
de composanæprmqpûe
Tablesu
W3
:
Mesur€s
desde
la
classification
contôleÆakinsonien
6'l
DSP
ACP
CPSVM
w
FPvfl
FN
TCC
SE SPSMLT
EQMN
Liste
Densite Soechale de Analyse enCo|nposdes
ComposartêPritcipale
Séoorateur à Vastevlais Positif
FauxPositif
Vlais
Néeatif
Fau<Négatif
Tarx
deClassificaion
Sensibilié
Spicitrcité
SpecEe Moyen à
Long
Erreu(qndtatique
générale
L'analyse
en
composantes plincipaleset
le
spectre moYenà
long
telme(SMLT)
sont deux
formalismesbien
connusdomaines.
IÆ
SMLT
est
laryemçnt utilis€
trouvcnt
des appli.catioru dans divers I'analysede
la
pade
en
tant
quereprése
ation spectale
du
sigûal
quila
Épartitior
de
l'éoergie
moyenne en fonction de la 6équence.I es
calculé en le signal en tmmes de coudeduée
et endiftrentes
trames. (:ette EoyenDe vise à preDzmt lia moyennc des spccûesd'amplitude
redùire
I'effet dc
la
variabilité
dtl
sêgnentue
ct
à
Droduireull
SMLT
aùssi similaire que possible à tous les spectres d' tude des trames.IÆ specte
moyen
à
long terme
a
été utilisé
datrsde
nombÎertx
dornaines detaitemert
dç
la
pa$le et
de
la voix,
comrqeI'identificdion
et lo
reconoâissânce de loculeursUl,
[2let [3]
l'aideauditive [4]et
[5]i
et
l'évaluationcliniqu€
de la qualité dela
voix
[6
-
l3], tæ
SMLT
donne u4eindicatioq
surla confguration
articulaloire moyenneainsi que
sur fecart du
conduit vocal par rapport au conduit
neut€
associéà
la
voix
modale É41.Daru le
cadre de l'éYaluatioûdel toubles
de [avoix'
le
SMLT foumit
Ùne mesrue de [aqualié
de lavoix
si fa duree d'eryegistrement estsuffisammett
longuepour
empêcher les effets individuels des sons.
Iæs sons de parole peuvent êhe
modéli*s
comm€ étant le rcsultât deI'action
d'un
filtr€
ropÉsentântle conduit vocal
sur urle source sonore (excitationLglottique)'
Pour les sons vois€s,lia
sourceest ps€udo-Ériodiquç
et elle
modélise
la vibtatiot
des cordes vocales alors que pour les sons noq voises, la qowc€ est unbruit
qui tnodélise le flÙxd'air
nrrbulent. IæSMLT
reflète à la foils I'effet de tp source glottique et du conduit vocal cequi
le rerd
trèsutile
pour quantilier
lesdifférençs
acoustiques entre loslocuteÛs-
Pour seconc€nter sw
lia caractéristique du conduit v(x-al etélimircr
l'effet
de la périodicité dela
sowce vocale, une analyse spectrale à large qâûdedoil
êtle
Éâliseeà
I'aidedlme ÎrÀne
d'analyse courtequi
permet égalementuæ
an+lys€ avec une grande tésolution temporelle alorcqu'une
analyse spectralc àtnnde
étroite au moygr! d'une tram€ d'analyse de longue durée, donc avec uneâible
résolution tempolelle,p€met
de se focalis€r surI'effet
dela
L'anatyse
en
composiltrtçsprincipales
esl lme
technique
slatistiqueutilise€
dansdiverses
ap,plications <Lingénieriepou
réduie
lâ
dimensionnalité
de
lensenble
des donn:es comme dans la reconnaissance faciale et la compression d'irrrage- Avec I'analyseen
composaûtes principales,un
ens€mble d'observationsde
variabl'esqui
peuvent être corrélees esttxansfomé en
un
ensemblede
valeurs de variables orthogonales appelées composantes principales de sorte quç la grande quantité de la variatioû lotale des doiméesdbri!ùe
est rctenue daûs un petit nombre de composantes principal€s' Chaque composante principale est ùrle combinaison linéaire de tout€s les variables originales'Le
spectre moyen à long terme p€ut êtue considéré comme une siomme pondéree des speclres d'amplitude des tmmes avec des coefficients d€ pondération identiques' Dans uneformulation
plus générale, on peut athibuer des poidsdifiérents
aÙx spectres d'amplitude des tramesafin
de renforcer la contribution de cartaires trames 9taffaiblir
lacontribution
d'autres trames selon ùn critère- Cependatt, le problème qui sous-ænd cette formulation estI'estirmalion
des coefficietls
de
ponderation
impliques dans
la
somsation-
Cetûe formulation duSMLT
peut êae obtenue enutilisant
I'analyse en comprsantes principale du spedrognùtrme.L'objectif
de cetravail
est double:
d'rme
part'
ét4blir
la relatiot
entrele
spectle moyen à long tetme et l'analyse en composant€s principales du spectlogramme, et d'autrepar!
appliquer I'analys€ eû composantes principale du spectrogramme à ladéte'tion
de la dysartbrie. Ladyvrthrie
çst un trouble de la paroled'odgine
neurologique qui se manifeste par rme atteration du contrôte musculaire du mécanisme de productircn de la parole[15]'
De nombreuses maladies telles qræ la maladie de Parkinson, peuvent causer la dysarthrie'Plusieus
méthodes d'analyse acoustiquepour
la
détection
ot
l'évaluâtion
de
la
dysarthrie ont été proposees dans la littérature [161. La plupart de aes indices sont utilises dans le cadre plus genéral d'évaluation des troubles de lavoix
[17]' Ilans
la plupart de ces études, I'analyse est basee sur des voyelles soutenues, des mols isolés ou des phrases' læs études réalis€essur des
lectures
de textes
ou
sur les
paroles
!{rontanéessont
peunombreuses.Parûftesméthodesutiliseesdansl'analysedesphÉsr's,beâucoupd'eDtre
elles font recours àut€
segmentation manuelle lors du calcul des indices acoustiques' Les méthodes basees surla
parole continù€utilisgnt un
grand nombred'indices
acoustiques' Cela a pour consequence, d'uDe part, de rendr€difficile
I'interpretalion
de ræs indices en tertrLes de dysartbde, et d'autre part' de masquer la pertinence des incLices individuelsdals
Introducaion
gétrérale la relrcsentation deI'infonnaton
permettant de distinguer entre les locuÛeurs dysartbdques et les locuteurs nomophoDiques.Dans ta partie
applicaion
do c€ travail, on se propose d'analyser des [ecturcs de texte en se basant sur I'analyse en composantes principales du spectrogramme pour la détection de ladysathrie. La
pertineuce des moments des deux premières composantes principalesen
termes
de
pouvoir
de
disqimination
entrc
les
locuteurs nomophoniques
et
dysarlriques lotsqu'ils
sont utllisés
dansun
algorithrnede classificaton est
quantitree mrmériquement.Le
méûoire
est orgadsé ell quatre chapitres. Iæ premier cbapitre préselte les notions fondamentales nécessairespour
la bonne compéhension du mecanisme de production dela
paroleainsi
que ses caractéristiques.Le
deuxième chapitre est dédiéà la
méthode de I'analyseen
cornposattes principalesutilisée
dans c-etavail'
Le
troisième
chapite
estconseclé
au séparateur
à
vasÛe
rnarge
(SVM) utilisrt pour
la
classificationdysarthrique,/nomrophoniqug
des
locuûeurs.Le
quatième
chapite
se
focalise
surfintrprétation
de I'analyse en coBposantes principatesdu
spectrogrammedu
sienal de parolle ainsiqu'à l'apptication
àla
détection dela
dysarthrie. Iæ mémoire s€temine
par une oonclusion générale.Notions
Ll
hdrction
Ava
d€frir€
des éttd€8 corceDts €6senti€ls liés àla
C€ cùapitre pés€nle des
parole-On
do
re
urc
brèvçorgaes qui
participdt à
Iacaacbfoistiqu€s du
sigal
desort
,F$sifn
senléë.
'hwpi*e
I
bndqmentales
sur
la
pprple
le
signalp
parole,il
farrttoû
d'abo,rdmtîtiser
les et puxfractéristiques
du signal de perole.dg baselnécessaires è la
conprehensiol
du signel dedu
$ecoisme
du produaion de
la
pade,
leset
lts
ditrér€nts typcs
de som, l€s
différ€des
Ll!
Ia
pamle
Ia
paole
est
le
mod€
decomunicalion trivilégié €nfe
les systÈme$tnetué.
ftce
à elle
pensées. Nous pouvonsl'utiliser
désirs oupour
écbang€r,communications orales diverses'
I;t
Production
de
la
Panole
Iâ
proôction
d€ Pûole
comDort€tn€nt
à un moFent
dépeadnt
d'rme
variablediculaloft€
É81.Gednlem€nt,
LBNotioos
fondmeûtrbs
rur
h
ion
le
plus nânn€I, c'est
aussi
I'art
dei
sont l€s seuk eEevilads
àutiliser
urltel
poïons
dom€r
lre
voix
àtoûE volodé st
à
rcs
opinions, des fulées, d€s s€dim€nts' dos
derbodër
<ksinfornations, €t
€stà
distiDgu€r deslûs cÎi$, les al€rt€s ou les gémiss€m€nts.
dc
lFêùb asdnilée
à
rm
sysême dynamiquc'
dont
le s€s étd.s antérieurs.Iæ
systême cst doncdu ΀rys
qui
dânsce
cas est|m
gesÛc€st
Dré6ctréc€n ûois
étap€s daDslô
litGrere
pbonétique(FiguE
I.l]) €t
sFà faide
d€ c€ qu'on
appellç I'appaæil
ohonaroire conrr,ôléPor le
nelverx] central.
Une
r€Fés€trtâtion simplitree du
sysnÈme depoduction
deetob
+
donDts4
lafigwc (I'2)'
Notions
fondamentalessur
la
I3.1 L'appareil phonrtoirc
I-e tangage parlé necessite
tout un
ensemble d'organes permettant la production de sons. Cet ensemble est appelé I'appareil phonatoirc.I
C.Ytti
r.s.|c
rl
Cordritl.ocâl
pbrrtrr
ord.r
rcal6
+/
\
parti€ gloniqueFigûre
IJ
: L'appareil phonatofue.I3.2
Jllecanisne
deproduction
de laparole
La production de la parole est
ùr
systgme complexe et tE)os€ sùr :>
Le systèmeneuologiquc
: sysême en éseau formé des organes, des sêDs, des nerfs, du cærveau et de la moelte épinière.)
Iæ systeme physiologique : activité des organes.Durant la production du son, une grande quantite d'orgares et de muscles eDtreDt en
activile, le fonctomement
de l'appÊreil phonaioire humain repose surl,interactiott
entre trois grandes classes dbrgaûes[19]
:C.alté or.alc Canté nasale Cauté buccale Glolte
Châpitre
I
Notions
fondamentalessur
laparole
I-es poumons.
tx
larynx.Les cavites supra-glottiques. Les
poumom
Sa foDction première est d'oxygéner le colps
humair!
toutefoisils
sonl txèsutiles
àI'ho|nme
car ils
sont une
source d'air
pemettant
de
produire des
sois.
Lors
deI'inspimtio4
l'action
du
diapbragme(qui
se cortua.te
et
s'abaisse)et
les
muscles inlercostaùx permettent devider
les poumons et de lesremplir
d'air.
Lors del'expiraton,
le
diaphragmese
détendet
laisse echapperfair
penétre,qui
est
ensuiteutilisé
pour produi.e des sons [19],Le
lr!ryDx
L'air
expulsé des poumons est gnvoyé daDs tm tuboformé
de plusieurs cartilages appelé leLaryrx
(figure
1.3).Celui-ci
est formé de muscles et de cartilages. Les cartilagesles plus
connus sont
les
cordes vocales.Celles-ci peuvent s'ou!îir
et
se
femer
très npklementjusqu'à
400fois
par seconde. Elles produisent des vadations de pression dansI'air
qui sont perçuescoîune
du son parI'oreille
humaine [19].Ease de langue Ép'gktlte
Cordes vocales Trachée
Eandes ventnculares
Figuie I.3
: L€tarlrx.
Les,cavités
supra{Iottiques
lorsque
le
son sortde la
glotte,
il
passeà tmvers
les organesvocaur
sqÉrieurs
appeléscavites
supra-glottiques(cavité
buccale,
cavité
nasale,
cavité labiale,
cavitélar''r8ale)
oalil
csr modifié, Ces cavilés serveDt à faire Ésonner le son et âlui
donner une(
f\
i{*r'-"li
Châlpitre
I _---=--=-
Notions fondament.les sur
laparole
coulcur > particulière quipemettra
dedifér€ncier
les voyelles entre elles par exemplgou
les consonnes. Cettecoulerr
particùlière donnce à chaque sonFoyient
ess€ntjellement de lamodificatior
dela
forme des résondeurs àl'aide
des mouvements dela
lânsu€ et des lèvrersertre
autres chos€s [201.L4 Caractéristiques
de
la
yoix
La
parole estrm
ensemblede
sonsproduits par
le
larynx
lorsquel,air
expiré
fait
vibÊf
lcs cotdes vocales. Tous les sons simples peuvent êtrc décrits de manière exhaustive parûois
paramètes ; la hauteur,l'intensit!
(appelée aussivolume)
etle
timbre. Cestrois
crità:s
correq)ondert
respectivement,à
trois
caracéristiques
de
l'onde
qui
sont
sa @ur:ncæ fondamentale, soo amplitude, et sac.nstitutioq
ha.moniqÛe 1211.L4.l
Hrutcur
l,a haut€u
de lavoix
au cours d'rme conve.sation, varie selon les personnes. Elle est essentiellement déterminée par la longueur, la forme et [a position des cordes vocales.Elle
peutêfe
volontaircmentmodifiee,
dans certaines limites, parl'int€rmédiaire
des muscles r€spiratoire et de ceùx dularyrx,
en faisant varier la pression del'ait,
ainsi que la tensionet la
position des
cordes vocales
qui
s'éloigne
ou
se
mpproche
l,lme
de
l,autle.
L'association
de
cesélénents
détenûrinela
tiequencede
vibration
des cordes vocales (flequence fondamentale), plus celle-ci est élevee, plus lavoix
est aigræe [221.I.4,
l.ntensit6L'iniensité
conespond à I'amtr itude des vibrations sonorcs.Ellç
est cônhôlée paxla
force des vibrations qui dépend du débit avec lequell'air
est expirc. Elle est fonction dela
ptession del'aire expiratoi€
et s€mesue
génémlernent entaille
[211.I.43
lfimbre
Le
timbre
est l'ensemble des caractéristiques permettânt dedifférenciet
unevoix,
provenant despoumons,la
gorge,la
cavité buccale etle
nez.Il
peut €,tredéteminé
pal
NotioN
fond&metrtalessur
lNI.5
Catégories
d€s
sons de
pârole
La
parole estune suite de
sonsproduits soit
lar
la
vibration
des cordes vocales (source de voisement quasi periodique), soit par une turbulence creée parI'air
s'ecoulant datrsle corduit
vocal ou lors du
relâchementd'une
occlusion de ceconduit
(sources debruit
nor
voisees). Donc les sons de la parole sont classés en deux catégories selonl'état
des <udes vocales (les cordes vocales vibrent ou pas) : 1.5.1 Sons voise'!
fæs sors voisés contennent l'ensemble des voyelles, sont
prcduib
par le passage deI'air
de porunons à trav€rs la trachee qui met en vibration les cordes vocales. Ce mode,qui
rcprc:sent€ 80% du temps de phonatioD. est caractédse en géné.al par unequasiÉriodicité,
me
rnergie élevée et une fréquence fondamentale(pitch).
Lafigure (I.4)
montre la formed'orle
et la deûsité spe.ctrale de puissance @SP) d'rm son vois€ :oqi
003
005Temps
(s)
Forme d'ondeDemié
spectrale de puissarc€Fig||re
I.4
: Forme d'onde et la densité spectrale de puissance d'un son voise.g
o_ Ë 0Ûl,//1U',,,h'i,\,'
t,
r/['l
'l'',.,'tû,y'n"r*.,,\*,,,.,r,,rû,,ùû,r"
",.qnrss 2æ0
?!û Frequence(llz)
Notio$
fondtmentale! rtrr
h
prrole
I52
Sotrr tronvoi!ê
Iæs sons non voises (comme certaines
mnsonnes!
dans ce cas les cordes vocâres nevibrent
poi
I'aù psse
à
rra.te
ente
lcs
cordes vocales,Iæ
signal
poduit
est équivalent à Ùn bruitblatc.
Lafi+
(I.5) moûlre lafome
d'onde et ladosité
sp€ctale de puissanc€ d'rm son non voisé :Tenps G)
Fomle d'onde!
a
E dcl
r&s
Figur€
L5
: La forme d'ondeft
lade*ité
spectmle de puissanced'un
son non voise.L6
Modèles
de
production
de
la
parole
r6t) ffi
Fréqueace
(IIz)
sp€ctralg de puissânce
Dans la
plupart
dutenps,
qu{
quesoit
le traiæment qu€I'on desie rçalisq
surle
sisal
depamle, on
est amcné à commeplemier
û'aitement une modélisation. Parmi les modèlesqu'ils
existeût on a le modèle physiqnedit
aùssi modèlea.ticulaloire
et le modèle acoustique basesw
laû{rie
sourcefilte.
Notions foldamental€s sur
lâ
I.6.1
Modélis{tion
physiquc
Les analyses expérimentales de
lappareil
phonatroire humainmonfent
que celui_ciest
rm
sysGmecomplexe
de
production
de
signaux
acoustiques.Une descdpton
du processus dephoration
avec des quanlités physiques et physiologiques p€rmetde
mieux
comprendre les mécanismes de la production de sons voisés et de tenter de lesrepodulre
artifir:ielft:men1.La
modélisation physique
de
la
phonation
repos€
donc
sur
une repÉsentrLtion
physique des
différentes
parties
de
l,appar€il
phonatoire
el
propose
d'intqpréfer
laproduction
de sons voisés comrnele ésultat de
l,instâbilité du
systèmedynarnique,
formé
par
les
plis
vocaux
et
fécoulement glottique, couplé avec
desrésonaærùs acÆùstiques. Cetûe inûerpÉtation est donc base€ srrl
l,intemction
entleles
plis
voçarx et
l'écoulement glottiquequi,
sous certaines cotrditions, engendre les oscillatioosglottiques. Cette
modélisation
nécessiûeùne
description mecanique
de
la
structue
repÉlientantles
plis
vocaux,
'ne
descriptionde
l,ecoulement dansles
voies
aénennessupé.ieures, une description de la propagaton des ondes acoustiques et une descripton des mecaûismes
d'inkractions
[23] .[æs caractéristiques acoustiques des phonèmes
sont liées d,une part
aLLx souces,mais
surtoutà la
configuration
geométliqùedu
conduit vocal,
cctte coDformation étant d)'namiquo au coursdu
temps.La
connaissance deslois qui
régissentla
relation
ent e géométrie et çonsequences acoustiques p€Imetainsi
de proposer un modèlegômétrique
du conduit vocal
capablede
générer,à partir de
paramètres géoméaiques,un
signal acouslique en so.tie.ile
conduit
vocal peut être considéré comme une suc{ession de tub€s ou de cavités acoùstiques de sectiondifiërefies.
La figure (I.6) moûtre lafome
du conduit vocal dans le cas de la prononciation de rvoyellelal
et Ia voyelle /i/ .lal
til
Figurt,l.6
; Modélisation du conduit vocal dans le cas de la prononciation de voyelle/a/et
lavoye:lle
lU.
Chapitre
I
Notions
fondarnentalessur
laparole
I.6l
Modélisation acoustque
L'analyse, la synthèsg la reconnaissance et le codage de la parole
so
Îles
souvent baséssrr
une représ€ntation paramétriquedu
sigal
:
le
mécanisme de productionde
la paroilequi
a été decrit dâns cechapitE
condùit très Daturellement à un modèle oarticulier-appelé modèle sourc€-fi ltre.Iæ modèle
soulce-filtÎe
estla
bas€ de beaucoup d'applications de tlaitemenrdc la
parole
[241.La
Figure (I.7)
montre
le
modèle source-filtæ
utilisé pour
modélisel
le système de production de la parole.Figure
L7
: Modele sourcefiltre
du systeme de production de la parole.Le filae
1l(z)
est assoçié au conduitvocal
etaux
articulateurs alors quele
modèle R(z) simule le rayonnement aux lèwes. DÙrant les s€grents de parole voisée, le générateur detrain d'impulsions utilise
me
estimation de la!ériode
fondamentalepou,
générer une suiûe d'impulsions qui excitent lefilae
d'impulsion
glottique G(z). Durant lesseper{s
de parolenor
voiséeI'excitation
est modélisée par unb.uit
cancterise par un spectre plat..Lors de lzr production de
la
parole,la
forme du conduit vocal
change au cours dutemps
LefilÎIe
H(z)
associé au conduit vocaldoit
changer aussi pour simuler les effets du changemeûtde
la
forme
du
conduit vocal. Dans les
applications
de
la
parole,
lespardrètres
du
filùe peuvent être
considérés,avec
une
botrneapproximation,
comme incbangés pendart une durée de 20 ms à 30 ms.Gaù poû.la sorrt€ yoi!Êc
Grir porr'la soûrcê dr
bnir
Châpitre
l
Notions
fondamentalessûr
laprrole
I.7
Signal
de
Iæ
signal dp parole estun
signalÉel,
continrg d'énergiefinie,
non
stationnaire, sa shuchrrg€st complexç
et
variablc
dansle
t€mps-Le
signal
de
parole est
ùr
vecteur acoustique porteùrd'infomations
d'une
grande camplexité,variabilité
et redondance.Il
€xistediférentes
méthodes de représentaiiondu
signal. Certainesont
été spécifiquement développées pour l'anslyse ou le codage des signaux de parole.I.7.1
CârrctéristiqtrB
du
signal deparole
Les
caractérisiques
de ce signal
sont
app€lé€straits
acoustiques. Chaquetrait
acoustique a une signification sur le plaû perceptuel.L7.l.l
Fr'equetrcefondam€ntde
(pitch)
C'esl
la
fréquence avec laquelle les cordes vocalesvibrent
pourla
réalisationd'un
son voisé. En acoustique, la fiéquence fondamentale ou son fondarnental estlhannonique
de premier rang
d\m
son (Figure I.8).La
fréquence fondamentale F0 oupitch
(p€dode des sons voisés)joue
unrôle
trèsimportant dens la
parole.
C'est
elle
qui
véhicule
une
graûdepartie de l'infomation
prosodique.
L'inteDsité
dela voix et
les dule€s successives des syllabescoÉplètent
c€s informations.D'une
manièregénâalq
la prosodie, qui peut êùe considâée commeI'effet
des (ûffércntes variations dela
fiéquence fondamedale F0, defittensité
et dela duée,
peutfaire
ressortirbien
des caractéristiquesdu locutqÙ,
comme songflÉ,
s€s origines géographiques etcultuell€s,
s€s émotions, etc., mais participe aussi à la caracærisation dela
langueelle-mêmq par
la
manièredont
elle
estutilisee
pour diffâencier
les
diversélémeûts
syntaxiquesçomme
les
énonces(interrogatifs, exclamatifs
ou
declaratifs),I'importance de
certains mots,ou bien
mêmepour caractâisel
les différences lexicales ente tçs mots[251.Chapitre
I
Notions fondamentalessur
lâparol€
Intensté
nce fondamentàle
i fz fa
Fréquence (Hz)Figurr L8
: FÉquence fondamentale.La
ftéquence fondamentale €stproprc à
chaqueindividu
et varie
selol
l'âgeet
le sexe. Pour avoir une idée deI'ordre
de grandeur de cette frequgnce, nous pouvons rappeler leschiftes
zuivants ;)
70 à 250 Hz pour les hommes.>
150 à 400 Hz pour les f€mmes.>
200 à 600 Hz poùr les eDfmts. L7.1.:2Forl|lanh
l,€
voisement que nous percevons estdiférent
decelui
produirà la
sourcepar
les cordes vocal€s. Ce que nous entendons est leésultat
d'un phénomèoe defiltage
surule
onde cornplexe. La capacité d'amplifier ori, au
contaire,
d'atûenuer certaines ftéquences est la propriété de tout résonaleul. Dans le cas précis de la parole,le
stimulus estfoumi
par I'onde périodique complexe provenant des cordes yocaleset
ce sont les
cavitessupra-glottiques
qui
assurentla
fonction de
rcsonatçur,Ia
fonne,
la
dimensionainsi que la
matiere
qui
compose çes cavités
sont
autant
de
particularités
qui
détemineront
les ftéquolcesqui
s€ront mises en évidences et cellesqui
ssont
atténuées. Les cavités supra-glottiquesort
la
capaciie de neutraliser certains harmoniqueset
d'enmethe
d'autre en éviderrce par rm simple changemetrt d€ configuration,Dolc
le
conduit vocal possède rmefonction
de transfert(filte)
qui
appli$rê
à une sourcegoduit
un phonème- Les maxima locaurr (pics) de cettefoûcton
de transfeÎt sont appelésfomants
(Figure I.9) et sont notésFl,
F2, Ir3,
etc. [æs
formants corespondent
âux
zones
de
reDforc€ment maximal. Néanrnoins, dupoint
de vue perceptif, seuls quelquesforoauts jouent
unrôle
c€ntral au niveau dela
parole.En
théorie,ou décrit
souvent les voyellesglâcc à
leurs2
premiersfomants
Fl,
F2 [251.Chapiûe
I
Notions
fotrdametraalessur
Ir parole
Figure
I.9: lllust
ation desfomants
(résonateur conduit vocal).I.8
Oulils
d'analyse du signâl
de
pârole
I.8.1
Fenêlrage
Il
s'Érgitde
découperle
signal
en
trames
successivessuivaût des
fenêtres,qui
permetterrt de localiserle
traitement. IÆs fenêtres les plus utilisées dansle
domaiûesott
celle$ Hamminig et de Hatrning.Ces jienêtres d'aDÂlyse
sort
jûxtaposéesd'une farpn
permettantI'apparitiot d'un
chevauchemenl.Ainsi
dansla
phase derestitution
du
signalor
doit tenir
en compte le besoin de lisser lessigaux
synthétises. Ondoit
noter également que les fenêtres utilisées ont une tlurée allant de 20ns
à 30ns
[26].I.8.2
Sptntre
Le
spectred'un
signal est leÉsultat
de la transfonnation de Fourier de ce signal.À
partir
d'un
spectre otr peut savoirla
ftéquence et I'amplLitude des composantes péseûtesdans
le
signal
analyse.La
forme
généraledes
spectrcs, appelée enveloppe spectnle, présente elle-même des pics et descrcux qui
correspondlent aùx resotrnances et auxatti-ésonlances
du
conduit
vocal
et
soot
appelésfomaDts
et
aûti-formads. L'évolution
temp,rrelle d€ leuls ûéqusnces centrales et de leurslargeus
de bandesdétemine
le timbre dumn.
Il
apparait en pratique$re
l'enveloppe spectrale des soos voises est de q.pe passe bas, :rvec environ un formant parkHz
de bande passanæ, et dont seÙls lestois
ouquate
prernières
conaibuenl
de
façon importante au
timbre.
Par conùe,
les
sonsrlon
vois€s piéseDtent tiouvent uûe acc€ntuatioû vers les hautes fiéquences 1271.llfpitrCl
Notions
foDdamentelessur
h
DaroloI.83
SF)ttrogr&m|ltc
Le
sp€ctrogrammeest
un outil
de
visualisation utilisant
lâ
tecbnique
de
la
traûslornrce
de
Fourier
et de calcul de
specûes.ll
est obteûu
par
I'application
de la
lmns:lornrée de Fourier sur des s€gments (txames) successifs de parole de 20 rns à 30 ms, pondéésrpar une
fenêtrede
pondération Généralement unefenête
de Hamming).
Il
a cotrunenÉ à être largernentutilis€
en 1947, et est devenuI'outil
incontoumable des études en phooëtiquependa
de nombrcus€s années [251.Llpparition
del'informatique puis
d'ecrans graphiques de bonne qualite a permis d'abaûdormer tout materiel comme le sonagraphe mais la technique du spectrogiamme est eucore aqjourd'hui largement utitisée dufait
de sa simplicité de mis€ en @u!Te et du grand nombre cl'études qui ont déjà éte réalisees [251.Le
spectuogrdmmcpemet de
mettre
en
évidenc€
les
différenæs
composantesftquenlielles
du
signat à
un
instant donné, une
transfonnéede
Fourier mpide
étantregulièremenl calculée
à
des
intervalles
de
temps
.approchés.Avant
des
ca.lculs de tmrrsfomrées successives,le
signaldoit d'abotd
être préaccentuepat
unfilhe
du prenrierorùe
pour
égalis€r les hauies liéquences dontl'énergie
est toujours plusfaible
que c.elle des basxrs fréquences. Cette phase depdac€entuaton
du signal est suivie par une phase de fenêtrage, néc€ssaire defait
dela
théoriequi
soùs-tendla
tralsfomée
de
Fourier. Dans cette mélhode d'analyse,le
signalcolsidéré
commeinfiniment
stable est constituéd'urc
somme invariable de fonction sinusoïdale de fréquenc€s différcntes. Pour contoumer cetùgcontraintr
théoriqued'invariabilité du
signal,il
faut convoluerle
sigDal avec une fenêtÎe temporelLe qùalifie€ deglissa
€ puisque chaque calcul de spectre nécessite de convoluer l€signal av,:c la fenêtre tempolelle à
ù
instant paTticulier [25].I-e choix de la
taille
de lâ fenetre, en nombre de points de convolution, est également importaû,tvis-à-vis
dela
qualité de l'analyseftéquentielle
obtenue.Ainsi
une fenêtre depette
taillle(ave{
un nombrede
128 points,pa
exemple) p€rmethad'obtenir
ue
bonne analys€ dansle
domaine temporel,
du
fait
dp
son
éAoitesse,mais ne
permettra pasd'obtenir
uoe bonneioformation fiéquertielle,
lataille
de la fenêtreérad
atorsÎIop
petitepour
ne loastonquer
lesphénomàes
de bassestéquences.
À
I'interse,
une fenêtre de grandetaille
(plus de 512 points)pemettra d'obtenir
rme bonncinformalion
ffiuentelle
maisne
pennettra pasd'obtenir
une bonneinformation
temporellecar
tout
événement, meme de courteduée, estjugé Fésent sul
I'ensemble du pas de temps analyse puisquela
co[sld&e
et
sonHanning.
E
théorie de la
tusformee
deFouri
(.10)
n,onue
un
signal
de parole d'analyu; de 20 ms et une feuêtrçNotiom
fondrm€trasl€ssur
laparole
signax
indéfinimentsables.
Lafigure
sramme calculésn
utilisant
tme tramed'onde
d'un
signal de parole.la
résolution
spectralede
fanalyse,
il
€t laÉsolution
fréquentielle-Il
s'agit
qui nous interessent
-
32 ms)oftc
une bonne résolution aude
la
stnrcturghamodqug
du
jï
TempsFomr
?
I
't0l7
sig!Â],
nais
I'analyse t€Nrporçllç cou.t$s durées) [251.lûv€rsem€ût,
u!
résofuûion
t€rnporclle
et
permet fréquonlielle est moins fine avec Lacomléhension
dumecaoise
deNotions
fond.Dentd€!
sur
h
morps
(ûftcile
d'éhdier
des pbénomènes deà larges dégFgGr
(3
ms-
6
ûs)
oftie
ùne meilleureles
formdts
vocaliques.
Eais
I'snalyse lastuctu,e
harmoniqueûr
signnl[25]-L9 Conclusion
Iæ signal
pdole
est ùnsigMl
par sa très grande variabilite et donc par cbang€monts dans le temps dusigal
de mgzode
dchesse eninfonndioo,
i
estdt
sourqe. de la foime et des
du
vocal.Dans
ce
cbE)itç,
nous péçcnæles
différcNrtesrcFésentations
du
sigDal acoustiqueairci
que
le
modèlephonatoir€,
c€ qui p€met
une boîne
pad€.
r
Chup
An'alyse en
compo
II.1 Introduction
Ce chaDitre est consacÉ aux méthodes multidirnensionnelle : l'analys€ elr composante ùaiter simultanément un nombre quelconque
L'ide€
centrale
de
I'analyse
etr dimensionnalitéd\rn
ensemble de domees intedependantes, tout eo coNervant le plu.s po des rlonnées [28].Cr;tte
réductiot
est obtenue Paila
ensemble de variables,(
les composantes clasÉes de façon à ce qu€ les premiètosoartiLe d,e la variation pés€nte dans toutes les odginales.
19
CII
antes principales
plus cour:antes de la statistique descriptive (ACP). Cetle méthode Permet de variablçs. toutes quantitatives.
principales
est
de
réduire
la
lequelil
y a rm grandtombre
de variables de la varialion Drésente daru l'ensembledes variables originales en un
touvel
D, qui ne sont pas corrélees, 9t qui sont pritrcipales coDservent la plus grandeChapitre
II
Analyse
enconposantes
principales
II2
Priocipe
de
I'atralyse
en
com
tes
principale,s
Etant
dorméun
nuagede
n
pointsp
dimensions,l'analyse
en
composanies de I'espacæ qui porte la plus grando palt de principales (ACP) consisle à trouver ladi
la dir;persion totale ; puis la direction à la pl'ecederfe
portalt
la deuxième plus grande part, et ainsi de suite. Du point de !'tre ique, c'est un simple changemett de base.qui
a poureffa
une nouvelle dæs des dircctions corresDondant à des variaibles deconéllees (au sens empirique)d'expliquer I'information
conlenue dansle
ouage sansla
redondancequi
pouvail iser la reprcsentation de départ.La
trgure
(JLl)
montrc
l'aDalyse en principalesà
deux
dimeosions.ta
ligne represeûtela
direction de
la
Femiàe
pdncipale,
qui
donne rme réductionlin&ûe
,oDtimale de deux à uae dimeosionFigûre
lI.1
: Analyse en composantes : nuage de données à deux dimensions.L'analyse eo composantes
prbcipale
est méthode d'ordination ctassique. Apanir
d'uû eff€mble
de n d'objets dansur
espacep desqipteus,
son but est de trouver tme rep*,seDtâtioo dans un espac€ reduit dek
ions(k
<<p)
[291.II3
Re,cherche et
calcul
des
composa
principales
Ixs
doonées sont généraleûent soùsla
d'un
tableau rectangulairen
x
p'
à rr ligne$ repÉsentant les individus ou(fgure ll.2).
et à p colontres correspoodant aux variables
Chapitre
U
Aaalyre
encomposlntes principalcs
_ï
I
Figrre fI.2
: T4bleau de données.Dans le tableau de données (figure
Il.2).
xiest la valeur deI'individu i
pour la variablej,
on peut representer chaqueindividu
par te vecteur de s€s mesures sur les p variablesXi=
(*1,....*l)t,
de façon analogue,on
peut regésenter chaque variablepar le
vecteurxJ=
cl...,4).
Supposons
que
X
=
(xf,xi-.,xf1r.
La
première étap€
corrsisûeà
trouver la
combinaison linéaireafx
des éléments du vecteurX
aya
la plus grande varianc€, de sorte oue :crrx
=
crr*1
*
orr*3
*
...*
aloxf
=
X;P=, c1;xl(II.])
Oir c1= (c11,ct12 ...c10)r est le vecteur des p coeffici€nts à
détermircr.
Emuite, trouver la deuxième combinaisoa linéaire
cfx
uon corrélée aveç la première combinaison ayantla plus
grande variance etainsi
de zuitejusqu'à
la
k'*
conbinaison
linéaireqlx.
La première combinaison
linéùe
représepte la première composante principaleCPI'
et la deuxième combinaison linéaire repésenæ la deuxième composante principale CP2,et
ainsi de
suiæjusqu'à
la
ktu
conposante
gincipale
CPr
telle
que
les
k
composantes pdncipales non conélécs2
à2,
de variance maximaleet
d'importance dearoissant€,la
piemière composade principaleCFl
doit être de variance maximale(figue
tr.3).''''..1'.il-'4
Chrpitre
II
Géométiouemenl CPI
suit I'a.Ye d'allongement
(eti
CP1
=
droire passant parle
nuage
c-àd qui
conserve auAnalysc cn compoarntes
prirciprl€i
4x=
)crrl
c*- )
c,,xl: RepÉsenlation geométrique de
CPl.
Cl
=Xf=,
cr;xl
, dupoint i fur I'axe CPl,
projection de xl surCPl,
CP1 de variance maximale donc les ions Cir $ont les plus dispenées qæ possible.Pour fixer la droite, on
i
qù'e[e
paise par g (c-entre de graviæ), sinon l'ensembledes droites Darallèles
convi@nent
de gravité féalisant le
meilleur
ajustcment possibledu
la distanc€tenùe les Doints (aorès oroiection). droitc de proj@tion a$$rant rme distorsionlenùe les points (après
goje{tion),
droite deCP2:2*
composante, à CP1 et{e
variancæ maximale.G'eométriqu€ment CP2 d€tenniûe droite
fixpendiculairc
àCPI
(au point g), suivantun
axe (perpendiculaire
au
l)
d'
m4ximun,
etCPI
a
CP2 détermine.nt le planprincipal
: le meilleurplal
dcproj
(dediftorsion minimum)
[30] Qa figureChapitre
II
Alalyre
en
eonlpoernte!
principlle,
Figure
ILs
I plan de prcjection.CPI
est telle que la moyenne des distançes euçlidiemes d2(À4)
est maximale, Cp2est perpendiculaire à
CPI
etlelle
que la moyenne des distanc€s euclidieDnes d2 (Êi,Fi) estmaximale.
CPI
et CP2 detemrinent le plan tel que <D(t,
fi) soit maximurn, Cp3 est lâ droite perpendiculaire àCPI
et CP2 (par g)t€Ie
que la variance des coordonnéssoil
maxrmum1301.
Après
avoir défini
les composantes principales (Cps), ûousavors
besoin de savoir cômment les trouver. Envisager, le cas où le vecteur de variables aléatoiresX
a une matricede covariance C.
II.4
Decomposition
de
la
variance
I,a variance est une mesure servant à c€ractériser la dispersion d'une variable aléatoire autolu de sa moyerme. La variance d'une variable aléatoire
X
est définie oar :v(x)=EtG_Elxl),1
La variance correspond au carÎé de l'écart-type noté
o
:(rr.2)
v(D
=
o'z(rr.3)
La variance des donnees multivadées est estimee de la manierc suivanûg :
o::;#XÈ'
XÊt Gi
-
x;)r (x;
-
x1)=
#ôtil'XÈ.(*,
-
s)
+
(s
-
xt)r
((xt
-
s)
+
(s-"';)
Anslyse
€4compolrntca
principdctr
=;àri'ri
=frIÊ"<"'-
)'(xi
-
ùi
IL4.1 Projection sur
une
1
(Gr
-
s)ÎÇr
-
e)
+
(s
-
'1)'(s
-
*;)
'
Gr
-
dr$-
x;))
Chrpitre
II
Sroit donc : 1(r-1)
L (tr_1) (D-1) 1, (n-1) L'opérâf eur de projec'tionV s'écrit
:Avec
\lV
=
I
La
vûianc€
des obsêrvdioosproj
s'éptita[on
:('t
-1)
(n(&
-
g)rxr(& -
s))
IL4.2 Recherche
de
la
Nous avons donc :
4e
vqriance
narimale
(n-1)
!rgl("i
-rs)')Gl(xr
-
g))
0r.4)
4
sur lme&ûite
de vac-teurdirecieltl
uftaire
(rL
s)
(rr.6)
1W1(x,
-+g)1(Wr(x1
-
g))
(t"r
- s1"t@w)f''
* sl)
(xi-drwl(xi-c)
(r.a
(xr
-
C)lr\tXVrGi
-
d)
(rr.8)
=
vrcv
6r-9(xi-dÏv
24Chapitre
II
Aralyse
encomposrntes
prfucipales
Observons que la matrice C est la matrice de covariance. Cette matdce €st s].métrique
définie
positive. Noùs devoDs donc
maxinisêr
cette variance des observationsûoietês
:Maxv(Vrcv)
AvecVrv
=
1(rr.e)
Il
s'agit
d'u
problèmed'optimisation
souscontainte.
Noùs forrnons doncla
fonction deI,agange
;f
=
vrcv
+
À(1_
vrv)
Gr.l0)
Nous obtenons ainsi
l1lquaton
aux valeurs propresCV:lV
(tr.1l)
Conme
la matrice variaDçe-covarianc€ çst symétrique définie posilive, les lalcr.us propres sonl reelles positives. l,es vecteurs prcpres peuvent êÎIe choisis otthonormés et la variancedes observatiors projetees
s'éûit
alo.s :oi
=
vrcv
:
Vl.lv
=r
G.t2)
Donc la
soluton
est la projection des donnees sur le vecteur propre ayant la yaleur propretr
la plus
élevê.
II.4,3
Recherche
des
projecûions de
variance mâximale orthogonales
au
-
premier
âxe
Afrn
de trouver lç serond axe de variance maximale, nous recherchons :Maxv(Vrc
V)
Avec
(VrV
=
t)
et(VrV1
=
0)
(tr.13)
Chapitre
lI
Analys€
en composantespriDcipales
Avec
Vr étantle prcmier
vecleùr propreà
wleur
propre maximal€. Comme les vecûeûs propres deC
sort nâturellement orthonormés, la solution est de choisir le deuxième vecteur propre de C à deuxième valeurpopte
maximale.IL5
Matrice
de
covariance
la
matric€ de covadanc€ étant unematice
définie positive, elle peut êûe diagonalisee etl'étude
desvaleù$
proprcsel vecteus
proprçspemet
de camclédson tadlshibution
àl'aidc
d'une
baseorthogonalg
cetûe approcheesl
lobjet de
I'analyseen
çomposanæsprircipales
qui peut être considerée comme une sorte de compressior deI'informafion.
La matrice de covariarce qui pour un ensemble de p vafiables algatoires réelles est
la
matrice carreæ dont l'élément de la ligne i et de la
colonnej
est la covariarce des vanablesxi
€t
xj.
Pour rme matrice de donnees
X
de dimeasionn
x p,
lamatice
de covarianceC
dedimensiotr p x p est estinee par :
c=xxrl(n_1)
C'est une matrice symétrique et peut doûc être diagonalis€e :
(rr.l4)
C
=
VDVT([
l5)
Où:
V : matrice dont les colonnes sont les vecteurs proprcs.
D
:
matrice diagonale dont
la
diagonalecontient les valeurs
proges
4
dâns
I'odre
déûoissant.
Les yecteuls proprçs sont
appelés axesprinciparu
ou
ditections
pincipales
des données. Les projections des données sur les axesprincipaux
sont appelees composanæsprincipales, également connues sous le nom de
Cp,
elles peuvent êlÎe considércescomnç
des nouvelles variables
t
ansformées.Ia
representation des dornées daDsles
c.ordonûées des composantes principalesest doûré€ par :
(n. r 6)
Z=XY
Chapitre
II
Analyse
encomporatrtes principâles
La
jib
composante principale obtenue comrne étant lajitu
coloane de la matric€xv
est Ùne combiDaison linéaire des
p
variables où lescoeffcients
de la combiDaison lrnéaiæsont les éléments
dujitu
vecteur propre v;:4 =
Xvi,i:7,.--,V
(Ir. r 7)II.6
Décomposition
en
valeurs singulières
La decomposition en valeurs singulières de la matdcg des donnees
X
s,ecrit comme :X
=
USVT (JU :S : matrice diagonale des valeurs singulières si. U, V : matrices orthogonales d'ordres tgspectifs n et p.
De 14 on peut facilement
voir qæ
:À=
sil("-
r)
Iæs composanûgs principales sont dorurées par :
c
=
vsurusvr/
(n
-
1)
= V(s2ln
-
1)vr
(rr.1e)Ce qui signifie que les vecteurs
singulie$ corects V
sont les directions principales etque les valeurs
singuliùes
sont lié€s aùx valeurs propres de la maûice de covariancena
:(rr.18)
(rr.20)
(tr.21)
XV=USVTV=US
(rr.2l)
II.7
Choix
de
la
dimensionnalité
Souvent, nous
re
conraissoos pas le nombter
de composartes principales àutiliser
pour une bonne
appoximatioL Un
Cdtùc
dechoix
der
est de calculer lafraction
dela
variance totale expliquee par les r prernières composantes principales [31] :
r(r)
=:*++'
=Ftr
^71^2r--r^p L;=1^,
Etaût donné un s€uil c! déshé, on