Décompositions conjointes de matrices complexes : application à la séparation de sources

(1)

HAL Id: tel-00798019

https://tel.archives-ouvertes.fr/tel-00798019

Submitted on 7 Mar 2013

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Décompositions conjointes de matrices complexes :

application à la séparation de sources

Tual Trainini

To cite this version:

Tual Trainini. Décompositions conjointes de matrices complexes : application à la séparation de

sources. Autre. Université de Toulon, 2012. Français. �NNT : 2012TOUL0010�. �tel-00798019�

(2)

Laboratoire desS ien esde l'Informationetdes Systèmes(LSIS)

EquipeSignal &Images (SIIM)

THESEprésentée par :

Tual Trainini

pour obtenir le gradedeDo teuren S ien espour l'Ingénieur

DECOMPOSITION CONJOINTE DE MATRICES COMPLEXES

APPLICATION A LA SEPARATION DE SOURCES

Thèsedirigée par :

M. MOREAU Eri Dire teur de thèse

M. LUCE Hubert Co-dire teur de thèse

Jury :

M. BOURENNANE Salah

M. FAVIER Gérard

(3)

(4)

Dieua réél'homme,etensuitepourleremer ier l'hommea rééDieu.

Letourdu haten365jours,P.Gelu k

Entoutpremierlieu,jetiensàremer ierM.Eri Moreauqui,entantquedire teurdethèse,

s'esttoujoursmontrédisponibleetdebon onseil,toutensupportantave almeetmaîtrisemes

mé ontentements réguliers!

Mer i àH. Lu e d'avoir o-en adré ette thèse,etqui m'aura faittou her du doigtles

di- ultésinhérentes auxdonnées réelles.

MM. J. Mars et G. Favier ont a epté d'être les rapporteurs de ette thèse, et je les en

remer ie. Leurs remarquespertinantes ont permisd'é lair ir ertains pointsde e manus rit.

Mer iégalement àM. S.Bourennane d'avoir a epté de fairepartie du jury.

Je souhaite également remer ier R. Weber, ave qui j'ai pu travailler sur une appli ation

on rète et très intéressante pour les méthodes développées. Je garde un ex ellent souvenir de

mes semaines passées à Nançay, et je pense arriver à appré ier désormais la Sologne, même

en automne! J'espère que ette ollaboration perdurera, et que ela permettra à d'autres de

dé ouvrir un domaine fort intéressant. Mer i également à Gregory pour tout e qu'il a pufaire

sur les simulations, et aux responsables de l'institut néerlandais de radioastronomie ASTRON

pour m'avoir autorisé l'utilisation desdonnées.

Mer i aux membres de l'aile Télé om d'avoir toujours eu une attitude sympathique à mon

égard, et de m'avoir réservé un a ueil haleureux. Certaines dis ussions m'ont permis d'avoir

plus dere ul sur lesalgorithmes développés, des onseils judi ieux surl'enseignement et .

Mer i à William Webb Ellis d'avoir inventéun sportan de m'oxygéner leweek-end. Mer i

aux opains dusiet Fred,Hervé,Fran k, Ri eettouslesautres, Papa Coa h pour sonsoutien

sansfailleetquim'auraamenédejeunePadawan àJedi,sansoublierChadontlesélu ubrations

trouveront toujours grâ e à mes yeux. Un mer i parti ulier à tous les supporters aux quatre

oins delaFran e,quiauront su,par leursmots euris,medonnerune surmotivationpour aller

travailler lelundi matin!

Mer iaux opainseten parti ulier,pêlemêle,FloFlo,Captain,lafamille "M",Seb"le hef"

et Fanny, PtiFlo, Vin ent, Geooooorgeslaloutre, Moman, PJ,Polgas, Gnognotte,Touillette et

Bidule.

Jene saurai trouverles motspour exprimer eque jeressensvis-à-visde mafamille,demes

parents, de mon frère, de ma soeur et de ma ompagne, eux qui auront réussi pendant toutes

ses annéesàme supporterau quotidien(et ilsyarrivent en ore, e n'est pasune min e aaire),

(5)

A ronymes x

1 Introdu tion 3

1.1 Cadre de lathèse . . . 3

1.2 Obje tifset ontenudu do ument. . . 5

1.3 Notations,dénitions etoutils . . . 6

1.3.1 Notations lassiques . . . 6

1.3.2 Opération surlesmatri es . . . 7

2 Présentation du problème 10 2.1 Diagonalisation onjointe . . . 10

2.1.1 Dé ompositions matri ielles . . . 10

2.1.2 Diagonalisation onjointe appro hée . . . 12

2.1.3 Au sujetde l'identiabilité. . . 13

2.2 Lienave laséparation de sour es. . . 13

2.3 Des ription dequelques algorithmes . . . 17

3 Algorithmes de Gradient 20 3.1 Des ription générale . . . 20 3.2 Cal ul dugradient . . . 22 3.2.1 Cas hermitien . . . 22 3.2.2 Cas symétrique . . . 23 3.2.3 Pasoptimal . . . 23

3.3 Gradient etapproximations du ritère . . . 23

3.3.1 Approximations surle ritère . . . 24

3.3.2 Cas hermitien . . . 25

3.3.3 Cas symétrique . . . 26

(6)

3.5 Simulations . . . 28

3.5.3 Combinaison desdeuxensembles . . . 31

3.5.4 Complexité de al ul . . . 36

3.6 Con lusions surles méthodesde type gradient . . . 36

4 Algorithmes de mise à jour analytique de la matri e 38 4.1 Algorithme demiseà jour par ouplede termes . . . 38

4.1.1 Des ription générale . . . 38

4.1.2 Cal ul de lamatri ede miseà jour

Z

. . . 39

4.1.2.1 Cas hermitien . . . 39

4.1.2.2 Cas symétrique . . . 41

4.1.2.3 Combinaisondesdeux ensembles . . . 43

4.1.3 Des ription desalgorithmes . . . 44

4.2 Algorithmes de moindres arrés alternés . . . 44

4.2.1 Des ription générale . . . 44

4.2.2 Mise àjour desmatri esdiagonales

D

i

. . . 45

4.2.3 Mise àjour de lamatri e demélange

A

. . . 45

4.2.4 Mise àjour de

C

. . . 45

4.2.5 Re her he linéaire optimisée . . . 46

4.2.6 Des ription desalgorithmes . . . 47

4.2.7 Remarque . . . 48

4.3 Simulations . . . 48

4.3.3 Combinaison desdeuxensembles . . . 53

4.3.4 Remarque surlestemps de al uls . . . 53

4.4 Con lusions surles méthodesde re her he analytiques . . . 55

5 Appli ation à la séparation de sour es de télé ommuni ations 57 5.1 Séparationde sour es. . . 57

5.2 Hypothèsesdesimulation . . . 58

5.3 Cas hermitien . . . 59

5.4 Cas symétrique . . . 62

(7)

6 Appli ation à la radioastronomie 68

6.1 Présentation . . . 68

6.2 Données synthétiques. . . 70

6.2.1 Modèle . . . 70

6.2.2 Simulationsinformatiques . . . 71

6.2.2.1 Comparaison desvitessesde onvergen e . . . 73

6.2.2.2 Inuen ede lapuissan edesinterféren es . . . 75

6.2.2.3 Inuen edu nombred'é hantillons . . . 75

6.2.2.4 Inuen edu nombrede pollueurs . . . 77

6.2.2.5 Autresrésultats . . . 77

6.3 Données expérimentales . . . 79

6.3.1 Justi ationempiriquedel'utilisationd'unematri ealéatoire ommepoint initial . . . 80

6.3.2 Justi ation empiriquede l'utilisation des umulants . . . 82

6.3.3 Traitements pour les énario "landmobile" . . . 82

6.3.4 Traitements pour les énario "pager" . . . 85

7 Con lusions et Perspe tives 88 7.1 Con lusions . . . 88

7.2 Perspe tives . . . 88

A Développement des al uls des algorithmes de gradient 90 A.1 Cal ul dugradient . . . 90

A.1.1 Cas hermitien . . . 90

A.1.2 Cas symétrique . . . 92

A.2 Cal ul dugradient pourun ritère simplié . . . 93

A.2.1 Cas hermitien . . . 93

A.2.2 Cas symétrique . . . 93

B Développement des al uls pour les oe ients des pas optimaux 95 B.1 Cal ul dupasoptimal pourle ritère initial . . . 95

B.2 Cal ul dupasoptimal dansle as d'un ritèresimplié . . . 96

(8)

1 UWEDGE . . . 17

2 ACDC. . . 18

3 FAJD . . . 19

4 S hémaGlobal pour les algorithmes degradient . . . 22

5 Pas Optimal . . . 23

6 H"Diagonalization of omplEx SEtsusing aRelative gradienT"(DESERT) . . . . 27

7 SDESERT . . . 27

8 "NOnOrthogonal De omposition of ompLEx Sets"(NOODLES) . . . 44

9 "Enhan edLine Sear h" (ELS) . . . 47

10 "AlternatingLeast Square" (ALS) . . . 47

11 ALS ELS . . . 47

(9)

2.1 S hémade laséparation de sour es . . . 14

2.2 S hémadansle asbruité . . . 14

2.3 S hémadansle asd'unblan himent . . . 15

3.1 Vitesse de onvergen e desalgorithmesHDESERT. . . 30

3.2 Vitesse de onvergen e desalgorithmesHDESERT. . . 30

3.3 Vitesse de onvergen e des algorithmes HDESERT. Comparaison en fon tion du ritère. . . 31

3.4 Vitesse de onvergen e des algorithmes HDESERT. Comparaison en fon tion du ritère. . . 32

3.5 Vitesse de onvergen e desalgorithmesSDESERT. . . 32

3.6 Vitesse de onvergen e desalgorithmesSDESERT. . . 33

3.7 Vitesse de onvergen e desalgorithmesDESERT. . . 33

3.8 Performan edes algorithmesDESERT.. . . 34

3.9 Vitesse de onvergen e desalgorithmesDESERT. . . 34

3.10 Performan edes algorithmesDESERT.. . . 35

3.11 Vitesse de onvergen e des algorithmes DESERT. Comparaison en fon tion du ritère. . . 35

3.12 Vitesse de onvergen e des algorithmes DESERT. Comparaison en fon tion du ritère. . . 36

4.1 Performan edes algorithmesALS etNOODLES . . . 49

4.2 Vitesse de onvergen e desalgorithmesALS etNOODLES . . . 50

4.5 Performan edes algorithmesALS . . . 51

(10)

5.1 Vitesse de onvergen e desalgorithmes . . . 60

5.2 Performan edes algorithmesen fon tion duRapportSignal surBruit(RSB). . . 60

5.4 Performan edes algorithmesen fon tion duRSB . . . 61

6.1 Superterp, le oeur du oeur de "LOw Frequen y ARray" (LOFAR) (6 stations "High Band Antennas" (HBA) et "Low Band Antennas" (LBA) dans 300m de diamètre), prèsde Exlooaux Pays-Bas . . . 69

6.2 Vue du iel sans perturbateurs . . . 72

6.3 Vue du iel ave les interféren es . . . 72

6.6 Performan edes algorithmesen fon tion duRapportInterféren esurBruit (RIB) 75 6.7 Performan edes algorithmesen fon tion dunombre d'é hantillons . . . 76

6.8 Performan edes algorithmesen fon tion dunombre d'é hantillons . . . 76

6.9 Performan edes algorithmesen fon tion dunombre depollueurs . . . 77

6.10 Performan edes algorithmesen fon tion dunombre depollueurs . . . 78

6.11 Vue du iel après proje tion . . . 78

6.12 Vue du iel après soustra tion . . . 79

6.13 Vue du iel surles antennes impaires. S énario "landmobile" . . . 80

6.14 (a):Dé ompositionenValeursPropres(DVP)ave Ve teurPropre(Ve P)asso ié à plus grande Valeur Propre (ValP), (b) : ALS ave Ve P asso ié à plus grande ValP, ( ):DVP ave Ve P asso ié à2nd plus grandeValP, (d):ALS ave Ve P asso iéà 2ndplus grandeValP . . . 81

(11)

utilisées.(a): Ordre 2,(b):Ordre 4 . . . 82

6.16 dim(Sous-Espa e Interféren es (SEI))

= 1

pour (a): DVP et(b):ALS . . . 83

6.17 dim(SEI)

= 2

pour (a):DVPet(b): ALS . . . 83

6.18 Vue du iel surles antennes paires. S énario "landmobile" . . . 84

6.19 dim(SEI)

= 1

6.20 dim(SEI)

= 2

6.21 Vue du iel surles antennes paires. S énario "pager" . . . 85

6.22 dim(SEI)

= 1

6.23 dim(SEI)

= 3

6.24 dim(SEI)

= 4

6.25 dim(SEI)

= 4

(12)

1.1 Méthodesde diagonalisation onjointe . . . 5

3.1 Paramètres de simulationsdesalgorithmes DESERT . . . 29

3.2 Temps d'exé ution desalgorithmesDESERT . . . 37

4.1 Paramètres de simulationsdesalgorithmes ALS etNOODLES. . . 48

4.2 Temps d'exé ution desalgorithmesALS etNOODLES . . . 55

5.1 Paramètres de simulationsde signauxde télé ommuni ations . . . 59

(13)

ACDC "Alternating Columns -Diagonal Centers"

ACI Analyse en ComposantesIndépendantes

ALS "Alternating LeastSquare"

BPSK "BinaryPhaseShift Keying"

DESERT "Diagonalization of omplEx SEtsusing aRelative gradienT"

DIEM "DIagonalization usingEquivalent Matri es"

DOMUNG "Diagonalization OfMatri esUsing NaturalGradient"

DVP Dé omposition enValeursPropres

ELS "Enhan ed LineSear h"

FAJD "Fast Approximate Joint Diagonalization"

FFDIAG "FastFrobenius DIAGonalization"

HBA "High BandAntennas"

JADE "Joint Approximate Diagonalization ofEigenmatri es"

LBA "LowBandAntennas"

LOFAR "LOw Frequen y ARray"

MC MonteCarlo

QPSK "Quaternary PhaseShiftKeying"

RFI "Radiofrequen y interferen e"

RIB RapportInterféren e surBruit

RSB RapportSignal surBruit

NOODLES "NOn Orthogonal De ompositionof ompLEx Sets"

SEI Sous-Espa e Interféren es

(14)

TBB "Transient BuerBoard"

U-WEDGE "UniformalyWeightedExhaustive Diagonalization withGaussitErations"

ValP Valeur Propre

(15)

Introdu tion

1.1 Cadre de la thèse

Dansde nombreux algorithmes de traitement du signal,on al uleà partir des donnéesune

ou des matri es dont leur dé omposition permet d'estimer les paramètres utiles au problème

envisagé.C'est le aspar exemple en traitement d'antennes où,à partirde ladé ompositionen

éléments propresde lamatri e de ovarian e desdonnées, on peutestimer lenombrede sour es

a tives,l'espa esignalasso iéetlesdiérentsanglesd'arrivée.C'estaussile asenséparationde

sour esoù,parexemple,onpeutestimer unematri edeséparationàpartir deladé omposition

en éléments propres généralisée de deux matri es de orrélation des données, al ulées à deux

instants diérents.

De nombreux types de matri es peuvent être envisagés, et ont été utilisées es dernières

années. Ona, parexemple, desmatri esliées:

à desstatistiquesà l'ordre deux[1,6,20 , 37℄,

à desstatistiquesd'ordre supérieur[3, 10,11 , 12,13,36 ,47,55, 60 ℄,

à unedé omposition spe traledesdonnées [27℄,

à desdé ompositions temps-fréquen es desdonnées [7 ,32℄.

Une autre type de solution pour la séparation de sour esa onsisté à utiliserun s héma de

type déation,où lessour es sont extraitesune àune du mélange[28 , 30,31℄.

Les matri es pré édentes peuvent être réelles ou omplexes. Dans quasiment tous les as,

es matri es possèdent naturellement une propriétés de symétrie. Dans le as réel, elles sont

très souvent symétriques et dans le as omplexe, elles sont très souvent hermitiennes. Plus

ré emment,un intérêt roissantest apparu on ernant desmatri es omplexessymétriques.Par

exemple en télé ommuni ations numériques, de telles matri es peuvent être envisagées lorsque

les signaux onsidérés sont non ir ulaires [48, 50, 56, 64℄. Mais il existe d'autres domaines

(16)

En equi on ernelesdé ompositionsenvisagées,ellesdépendentbienévidemmentdutypede

matri esetduproblème onsidérés.Lesplus lassiquessontladé ompositionenélémentspropres

etladé ompositionenvaleurssingulières.Cependant,lapriseen omptesimultanéedeplusieurs

matri espeutavoirun intérêtimportant (voireprimordial) ommeen séparationde sour es.La

première dé omposition de e type est la dé omposition en éléments propres généralisée. Cette

dernièredé ompositionne prenden omptequedeuxmatri es. Unegénéralisation ena étéfaite

relativement ré emment pourun nombre quel onque dematri es(enl'o urren ehermitiennes)

sousladénominationdiagonalisation onjointed'unensembledematri es dans[18 ℄.Lamatri e

detransformationre her hée étaitalorsunitaire.Celaadonnélieuauxdeuxalgorithmesde

sépa-rationdesour es"JointApproximateDiagonalizationofEigenmatri es"(JADE)[18 ℄(généralisé

à n'importe quel ordre supérieur à 3 dans [54℄) et"Se ond Order Blind Identi ation" (SOBI)

[6℄. Cependant,lare her he d'unematri e unitaire né essiteau préalable uneétapede

blan hi-ment des données [46℄. Cette étape n'étant pas sans onséquen es au niveau des performan es

d'estimation [14℄. L'idée a alors étéde développer des algorithmes de diagonalisation onjointe

sans ontrainte unitaire.

Un ertain nombred'algorithmes de e type ont étépubliésdepuis, par exemple [19 ,21 , 29,

63, 73℄. En général, il s'agitd'optimiser un ertain ritère lié à ladé omposition. Il existe deux

grands typesde ritère.Le premier type orrespondà un ritère liédire tement à une erreurde

dé omposition (ou erreur demodèle) qui sera appelé ritèredire t etlese ondtype orrespond

à un ritère lié àl'inverse de latransformation quisera appelé ritère inverse.

Des nouveaux problèmes sont apparus ré emment, et ont né essité une généralisation de la

diagonalisation onjointe au asoù lesmatri essont blo -diagonales [39, 40℄.

Onpeutaussi onsidérerlesensemblesdematri es ommedestenseurs,etfairelestraitements

dire tement sur eux- i.Laméthodeoriginelles'appellePARAFAC[41℄et d'autressolutions ont

étéapportéespar lasuite [34, 35 ,52 ,53, 66 ℄.

La séparation de sour es trouve des appli ations dans de nombreux problèmes tels que le

biomédi al[42 ,44,49 ℄,laspe tros opie[59℄,l'astronomie[27 ℄,lasismique[62 ,72℄etles

ommu-ni ations numériques[20 , 23 ,37℄.

Letableau1.1rappellebrièvementunensembled'algorithmesdelalittératurequitraitentde

ladiagonalisation onjointe d'ensemble dematri es. Certainesde esméthodesserontdétaillées

plus longuement dans la suite, et nous servirons de omparaison par rapport à elles que nous

avonsdéveloppé.On iteprin ipalement"AlternatingColumns-DiagonalCenters"(ACDC)[75℄,

"Uniformaly Weighted Exhaustive Diagonalization with Gauss itErations" (U-WEDGE)[70℄,

"Fast Approximate Joint Diagonalization" (FAJD)[51 ℄ , JADE[18℄, SOBI[6 ℄, "DIagonalization

(17)

Nomde l'algo. Critère Corps Matri e transfo. Ensemble

ACDC dire t omplexe re tangulaire hermitien/symétrique

U-WEDGE inverse omplexe arrée hermitien(/symétrique?)

FAJD inverse omplexe arrée hermitien

JADE inverse omplexe arrée hermitien

SOBI inverse omplexe arrée hermitien

DIEM dire t omplexe arrée hermitien

J-Di dire t réel arrée symétrique

NOJD[2 ℄ inverse réel arré symétrique

DOMUNG inverse réel arrée symétrique

Table 1.1Méthodesde diagonalisation onjointe

1.2 Obje tifs et ontenu du do ument

L'obje tif prin ipal de thèse onsiste à développer des algorithmes de diagonalisation

on-jointe de deux ensembles de matri es omplexes. Le premier ensemble est onstitué de

matri- es hermitiennes etle se ond ensemble de matri e omplexe symétrique. L'obje tif est ainside

prendre en ompte onjointement toute l'information disponible au niveau desstatistiques des

données. Ces algorithmes seront appliqués dansun premiertemps au problème delaséparation

de sour es de type télé ommuni ations numériques etdansun se ond temps au problème de la

réje tiond'interféren es liéesàdessignauxdetélé ommuni ations numériquesdansun adrede

radioastronomie.

Dansle hapitre 3,lesalgorithmesdetype gradient quenousavonsdéveloppé seront

présen-tés. Nousproposerons desméthodesnovatri es,ou des extensions de méthodesdéjà existantes.

Par exemple, nous verrons l'extension de DOMUNG développé dans [76 ℄ au as omplexe. De

plus, nousproposerons dessolutions qui nouspermettront de nousaran hirdu pré-traitement

des données onsistant à blan hir elles- i an, entre autre, d'estimer des matri es de mélange

re tangulaires.Deplus,nousproposeronsdessolutionsquiné essitentmoinsderessour es(temps

de al ul ou mémoire). Dessimulations permettront de valider lesalgorithmes développés.

Le hapitre 4 développera deux méthodes de type algébrique. Il s'agit de al uler

analy-tiquement, en fon tion des données en notre possession, la matri e de mélange ou la matri e

de séparation. Ces solutions s'appuieront surdesrésultats présentés dans[9 ℄, [25 ℄ ou[65 ℄. Nous

étendrons toujours es algorithmes au as omplexe, en onsidérant des ensembles hermitiens,

symétriques, et en ombinant es deux types d'ensemble. Enn, nous présenterons des

simula-tions numériques qui permettront de mettre en éviden e les performan es de nos algorithmes,

omparés àdesalgorithmes lassiques.

(18)

algorithmes développés dans le as de la séparation de sour es, où les signaux sour essont des

signaux typiques de télé ommuni ations numériques.

Enn, le hapitre 6 présentera l'appli ation des méthodes développées au domaine

radioas-tronomique. Le ontexte est le suivant : les observations que font les astronomes peuvent être

perturbées par des interféren es issues du milieu terrestre, omme par exemple les signaux de

radio ommuni ations.Notre obje tif sera alors d'estimer aumieux esperturbationsan deles

éliminer des signaux reçus, et don de permettre aux utilisateurs d'avoir l'observation la plus

"propre" possible de e qui se passe en dehors de la Terre. Dans un premier temps, nous

véri-erons lebon omportement denosalgorithmes ave desdonnées synthétiquessimulant letype

d'observations quel'on a lassiquement. Puis, nousles appliqueronssurdesdonnées réelles.

1.3 Notations, dénitions et outils

1.3.1 Notations lassiques

Onnotera

R

l'ensemble desnombres réelset

C

l'ensemble desnombres omplexes.

Dans e qui suivra,les s alairesseront notésen minus ule

m

,lesve teursen minus ule gras

m

,les matri esenmajus ule grasse

i

,

j

) dansunematri e

M

seranoté

M

i,j

.

On notera

M

T

sa transposée,

M

∗

sa onjuguée et

M

H

sa transposée onjugué.

M

−1

est

l'inverse d'unematri e,

M

†

lapseudo-inverse.

Lemoduled'unnombre omplexe

m

est noté

|m|

.

ℜ(m)

estla partie réellede

m

et

ℑ(m)

sapartie imaginaire.

Produitsmatri iels Soient

M

⊗ P

et dedimension

M P × NQ

, orrespondà :

M

_{⊗ P =}







m

1,1

P

· · ·

m

1,n

P

. . . . . . . . .

m

m,1

P

· · · m

m,n

P







(1.1)

,noté

M

⊙ P

etde dimension

M P × N

estunproduitdeKrone kerpar olonnes

(19)

déni par:

M

_{⊙ P = (M}

1 ⊗ P

1 , . . . , M

n

⊗ P

n

)

(1.2)

1.3.2 Opération sur les matri es

Diag

_{M}

annuleles termeshors-diagonaux de

M

:

Diag

_{{M} =}







m

1,1

0 . . .

0

0 m

2,2

. . . . . . . . . . . . . . .

0

0 . . .

0 m

m,m







ZDiag

_{M}

est l'opérateur annulant les termesdiagonauxde

M

:

ZDiag

_{{M} = M − Diag {M}}

diag

_{M}

est un ve teur ontenant les termes diagonaux de

M

et

Diag

{m}

onstruit une matri e diagonaleà partir deséléments de

m

.

tr

_{M}

représente latra e de lamatri e

M

. Soient

M

et

P

deuxmatri es arrées. Ona:

tr

_{{MZdiag {P}} = tr {Zdiag {M} P}}

(1.3)

Soient

M

,

N

et

P

troismatri es arrées.Ona :

tr

_{{MNP} = tr {PMN} = tr {NPM}}

(1.4)

vec

_{M}

orrespond à l'empilement de toutes les olonnes de

M

dans un ve teur. Une des propriétés de etopérateur est:

vec

_{{MNP} = P}

T

_{⊗ M}

vec

_{N}

(1.5)

Deplus, silamatri e

N

estdiagonale, on a

(20)

Norme deFrobenius LanormedeFrobenius

kMk

d'unematri e

M

estdénie ommesuit:

kMk = tr

M

H

M

1

2 ₌





X

i,j

|M

i,j

|

2 



1

2

(1.7)

Pseudo-inverse Dans le as où

M

est une matri e omplexe re tangulaire, on utilisera la pseudo-inverse deMoore-Penrose, notée

M

†

etvériant :

MM

†

M

= M

M

†

MM

†

= M

†

MM

†

H

= MM

†

M

†

M

H

= M

†

M

Silerangde

M

estégal àsonnombre delignes, on a:

M

†

= M

H

MM

H

−1

Demême,si lerangde

M

estégal àsonnombre de olonnes, on a:

M

†

= M

H

M

−1

M

H

Dérivation

∇

sera utilisé pour legradient omplexe et nousintroduisons deuxdénitions de gradient :

∇J (M) =

∂J (M)

∂M

∗

=

∂J (M)

∂ℜ(M)

− j

∂J (M)

∂ℑ(M)

(1.8)

qui représente legradient naturel, et:

∇

r

J (M) = ∇J (M) M

H

=

∂J (M)

∂M

∗

M

H

(1.9)

qui est legradient relatif, introduit dans[15 , 17℄(qui peut être vu ommeun as parti ulierde

[4℄).

Lapropriétésuivante,liantladérivationdematri esetl'opérateurtra e,nousserautilepour

le al ul desdiérentsgradients:

∂tr

Z

H

M

(21)

Contributions de l'auteur

Colloques internationaux ave a tes et omité de le ture

[ i4℄ T. Trainini and E. Moreau, "Variations Around Gradient Like Algorithms for Joint

Diagonalization of Hermitian Matri es," inPro . European Signal Pro essingConferen e

(EU-SIPCO'2012), Bu harest, Romania,August 2012.

[ i3℄G.Hellbourg,T.Trainini, R.Weber,E.Moreau,C.CapdessusandA.J.Boonstra,"RFI

Subspa eEstimationTe hniquesforNewGeneration RadioTeles opes,"inPro .European

Sig-nalPro essing Conferen e(EUSIPCO'2012), Bu harest, Romania,August 2012.

[ i2℄T.TraininiandE.Moreau,"ALeastSquaresAlgorithmforGlobalJointDe omposition

of Complex Matri es Sets", in Pro . IEEE Fourth International Workshop on Computational

Advan es in Multi-Sensor Adaptive Pro essing (CAMSAP'2011), San Juan, Puerto Ri o,

De- ember2011.

[ i1℄ T. Trainini, X.-L. Li, E. Moreau, and T. Adali, "A Relative Gradient Algorithm for

Joint De ompositions of Complex Matri es", in Pro . European Signal Pro essing Conferen e

(EUSIPCO'2010), Aalborg, Denmark,August2010.

Colloques nationaux ave a tes et omité de le ture

[ n1℄ T. Trainini et E. Moreau, "Un algorithme ALS pour la dé omposition onjointe de

matri es omplexes", dans Pro . 23ième olloque GRETSI sur le traitement du signal et des

(22)

Présentation du problème

2.1 Diagonalisation onjointe

Dans e paragraphe nousdé rivonsle problème de la diagonalisation onjointe d'ensembles

de matri es omplexes ainsi que les ritères asso iés. Nous allons onsidérer deux ensembles

de matri es omplexes. Le premier on ernera des matri es hermitiennes tandis que le se ond

on ernera desmatri es omplexessymétriques.

2.1.1 Dé ompositions matri ielles

Plus pré isément, on onsidère un premier ensemble

M

h

de

N

h

∈ N

matri es arrées de dimension

N

o

× N

o

é ritdela manièresuivante

M

h

= {M

(h)

i

∈ C

N

o

×N

o

, i = 1, . . . , N

h

}

Pour ha une desmatri esde etensembleon supposequ'il existeune matri e

A

de dimension

N

o

× N

s

,de tellemanièrequ'idéalement onait

M

(h)

_i

= AD

(h)

_i

A

H

(2.1)

oùlesmatri es

D

(h)

i

dedimension

N

s

×N

s

,sonttoutesdiagonales.Dans(2.1),

(·)

H

estl'opérateur

detransposition onjuguéedelamatri eenargument.Ainsi,lorsquelesmatri esdiagonales

D

(h)

i

sont réelles, les matri es

M

(h)

i

sont alors hermitiennes. Siles matri es

D

(h)

i

sont omplexes, on feral'opération

M

(h)

_i

_←

1

2 M

(h)

_i

+ M

(h)

_i

H

an de lesrendre hermitiennes.

(23)

tellematri e sera noté

A =

A

_{∈ C}

N

o

×N

s

| A

rang plein en olonne

(2.2)

Ainsi, ilexiste une pseudoinverse de

A

notée

B

,i.e.

B

= A

†

(2.3)

de tellemanière quel'on ait

BA

= I

(2.4)

où

I

est lamatri e identité.L'ensemblede tellematri e

B

seranoté

B =

n

B

_{∈ C}

N

s

×N

o

| ∃

une matri e derang plein

A

telleque

B

= A

†

o

(2.5)

Ainsien utilisant (2.1),on a dire tement

BM

(h)

_i

B

H

= D

(h)

_i

(2.6)

On onsidèreaussiundeuxièmeensemble

M

t

de

N

t

∈ N

matri es arréesdedimension

N

o

× N

o

é ritde lamanière suivante

M

t

= {M

(t)

_i

∈ C

N

o

×N

o

, i = 1, . . . , N

t

}

Onsupposera que ha unede esmatri es peutsedé omposerde lamanière suivante

M

(t)

_i

= AD

(t)

_i

A

T

(2.7)

oùlamatri e

A

estidentiqueà elleayant étéutiliséedansladé omposition(2.1)etoùes matri- es

D

(t)

i

dedimension

N

s

× N

s

,sont toutesdiagonales.Dans (2.7),

(·)

T

estl'opérateur de

trans-position de lamatri e en argument. Ainsi toutes les matri es

D

(t)

i

sont omplexes symétriques. A partirde (2.7) etenutilisant (2.4), ona dire tement

BM

(t)

_i

B

H

= D

(t)

_i

(2.8)

A haque foisque ela ne portera pasà onfusion etan de simplier les notations, dans toute

lasuite on utiliserala formulation ommune suivante pour lesdeux typespré édents

(24)

où l'opérateur

(·)

‡

orrespond don soit à une simple transposition soit à une transposition

onjuguée. Onaura don aussi

BM

i

B

‡

= D

i

(2.10)

2.1.2 Diagonalisation onjointe appro hée

Leproblèmede diagonalisation onjointe onsidéré onsiste,àpartir d'un(resp. des)

ensem-ble(s)

M

h

ou (resp. et)

M

t

, en l'estimation de la matri e

A

pour le problème dire t ou de la matri e

B

pourleproblèmeinverse.Enpratique,lesmatri esdanslesdeuxensembles

M

h

et

M

t

sontestiméesparexempleàpartird'estimateursempiriquesdestatistiquesd'ordredeuxou

d'or-dre supérieuràdeuxenutilisant unnombrenidedonnée.Ainsilesdé ompositions pré édentes

ne sont pasexa tes maisseulement appro hées. C'est laraison pour laquelleon parlealors de

diagonalisation onjointe appro hée. Dans e adre, on aborde le problème par l'intermédiaire

d'un ritère mesurant ette diagonalisation appro hée dont l'optimisation permettra de trouver

la matri e re her hée. Il existe de nombreux ritères possibles asso iés au problème dire t ou

au problème inverse. Con ernant le problème dire t, le ritère peut être le plus lassique est le

i

}) =

N

X

i=1

kM

i

− AD

i

A

‡

}k

2

(2.11)

qui orrespond à un ritère quadratique d'ajustement demodèle de dé omposition. Con ernant

leproblème inverse,le ritèreleplus lassiqueest

J (B) =

N

X

i=1

kZDiag{BM

i

B

‡

}k

2

(2.12)

oùl'opérateur

ZDiag

{·}

metsàzérol'ensembledesélémentsdiagonauxdelamatri eenargument, i.e.

ZDiag

{A}

i,j

= (1 − δ

i,j

)A

i,j

où

δ

i,j

= 1

si

i = j

et

0

sinon.Ce ritère étant nul pour une matri e diagonale, il s'agit d'une mesure quadratique de la diagonalité d'une matri e. Dans

le seul as hermitien, les deux ritères pré édents seront notés

D

h

et

J

h

et dans le seul as symétrique, ils seront notés

D

s

et

J

s

. Lorsque que l'on voudra prendre en ompte de manière simultanélesdeux asdematri es,onleferaparl'intermédiaired'unesimple ombinaisonlinéaire

desdeux ritères de lamanièresuivante. Pour le ritèredire t on posera

D

λ

= (1 − λ)D

h

+ λD

s

(2.13)

où

λ ∈ [0, 1]

etpour le ritère inverse onposera

(25)

Les ritèresétant dénis,lebutestmaintenant d'estimerlesparamètres optimauxliésàleur

op-timisation.Pourle ritèredire t,l'obje tifestd'estimerunematri e

A

b

etdesmatri esdiagonales

b

D

i

telles que

( b

A, b

D

i

) = arg min

A

∈A

D

i

∈D

ia

D(A, {D

i

})

(2.15)

où

A

est l'ensembledénien (2.2) et

D

ia

estl'ensembledesmatri es diagonales.Pour le ritère inverse, l'obje tif estd'estimer unematri e

B

b

telleque

b

B

= arg min

B

_∈B

J (B)

(2.16)

où

B

estl'ensembledéni en(2.5).

2.1.3 Au sujet de l'identiabilité

Il est d'abord important de remarquer qu'il ne sera pas possible, à partir des seuls ritères

pré édents, d'identier exa tement

A

ou

B

. Celaest lié à l'aspe t aveugle de l'identi ation. Dans e adre, on se ontente, mais 'est très lassique etlargement susant en pratique,

d'es-timer

A

ou

B

auproduitd'unematri ediagonaleinversibleprèsetd'unematri edepermutation près.

2.2 Lien ave la séparation de sour es

Dans eparagraphe nousfaisonsunbrefrappelduproblèmedelaséparationdesour esdans

un adredemélangelinéaire etinstantané. Puisnousprésentonssonlienave ladiagonalisation

onjointede matri es.En séparation desour es, on supposedisposer d'un ertainnombre

d'ob-servations résultant du mélanged'un ertainnombre de signauxd'intérêt appelés sour es. Dans

le as leplussimple lemodèle de mélangeestlesuivant [42℄

x(t) = As(t)

(2.17)

y(t) = x(t) + b(t)

(2.18)

où

A

estlamatri edemélangededimension

N

N

o

≥ N

s

,lamatri e

A

serasupposéderangpleinen olonneetdans le as sous-déterminé, i.e.lorsque

N

o

< N

s

,la matri e de mélange sera supposée de rangplein

(26)

ave des ve teurs olonnes deux à deux distin ts. Dans le as sur-déterminé, le but est alors

d'estimer une matri ede séparation

B

detelle manièrequele ve teur

z(t) = Bx(t)

(2.19)

orrespond aux signaux sour es que l'on re her he. Dans e adre la matri e de séparation

B

est re her hée en imposant des omposantes indépendantes aux ve teurs

z(t)

. On parle alors d'analyseen omposantesindépendantes. Ils'agitdon de restaurerlapropriétéd'indépendan e

statistique perdue par lemélange. Cela sera le as [24℄ lorsque l'on aura trouvé une matri e de

séparation

B

de tellefaçon que

BA

= DP

(2.20)

où

D

estune matri e diagonaleinversible etoù

P

estune matri e depermutation. Leproblème peutalors ses hématiserde lafaçon suivante:

A

B

s(t)

x(t)

z(t)

Figure2.1 S hémade laséparation de sour es

Cependant,ilestrarededisposerde donnéestotalement nonbruitées.Ainsi, notreproblème

serad'estimer ettematri ede séparation

B

àpartirdesobservations bruitées(2.18),etdon la s hématisationest lasuivante:

A

+

B

s(t)

x(t)

b(t)

y(t)

z(t)

Figure 2.2 S hémadans le asbruité

Dans le but de restaurer ette propriété d'indépendan e statistique, une première étape de

dé orrélationpeutêtreenvisagée.Cettepremièreétapeasso iéeàunenormalisationenpuissan e

dessignauxestsouventappeléeblan himentdesobservations.Dansle asd'observationsbruitées,

elle peutavoirunintérêt supplémentaire derédu tionde bruitpar proje tion surl'espa e signal

lorsquequelenombred'observations

N

o

eststri tementplusgrandquelenombredesour es

N

s

. Celapeutaussiavoir l'intérêt,dansle assur-déterminé, deramenerleproblèmeàun problème

(27)

Dans e as,lamatri edemélange

B

sedé omposeenunproduitmatri ielentreunematri e de blan himent

W

etune matri e unitaire

U

:

A

+

W

U

s(t)

x(t)

b(t)

y(t)

u(t)

z(t)

Figure 2.3 S héma dansle asd'unblan himent

Detrès nombreuses méthodesont été proposées an de résoudre e problème de séparation

de sour es. Nous allons uniquement dans le adre de la thèse nous intéresser aux méthodes

dites de diagonalisations onjointes de matri es qui, quasiment toutes, tirent leur origine dans

les travaux initiaux de Cardoso et Souloumia [18 ℄. Dans e adre, en général, des statistiques

sont estimés et rangés dans des matri es etdes dé ompositions algébriques onjointes de es

matri espermettent l'estimationd'unematri edeséparation.Onpeut onsidérerlesstatistiques

d'ordre deux par l'intermédiaire delamatri e de orrélation lassique desobservations

R

_x

(t, τ ) = AR

′

_s

(t, τ )A

T

(2.24)

oùlesdeuxmatri esde orrélationdessour es

R

s

(t, τ )

et

R

′

s

(t, τ )

sontdiagonales arlessour es sont supposées statistiquement indépendantes.

(2.27)

ave

1 ≤ a, b, c, d ≤ N

.

Il doit être pré isé que les deux derniers types de statistique ne peuvent on erner que des

signaux non ir ulaires. A partirde es statistiques d'ordre quatre, il estpossible de onstruire

desmatri es dediérentes façons. La manière ertainement la plussimple onsisteà onsidérer

(M

x,c,d

)

_a,b

= C

x,a,b,c,d

(2.28)

M

′

_x,c,d

_a,b

= C

_x,a,b,c,d

′

(2.29)

M

′′

_x,c,d

_a,b

= C

x,a,b,c,d

′′

(2.30)

(2.36)

sont diagonales arles sour essont supposées statistiquement indépendantes.

Ainsi, à partir des statistiques d'ordre deux et/ou des statistiques d'ordre quatre, il est

possiblede onstruire desensemblesde matri essediagonalisant sousdeuxfa torisations

parti- ulières. Dans ette thèse, nous ne nous préo uperons que du as où les deux derniers indi es

i = 1, . . . , K

h

(2.40)

ave

D

i

des matri es diagonales. Ce modèle dé rit de manière générique les dé ompositions onsidérées en(2.23) et(2.37).

On onsidèrera aussidesmatri es omplexessymétriques de laforme

M

i

= AD

i

A

T

i = 1, . . . , K

s

(2.41)

Ce modèledé it demanièregénérique lesdé ompositions onsidéréesen (2.24),(2.38) et(2.39).

2.3 Des ription de quelques algorithmes

Dans eparagraphenousdé rivonstroisalgorithmesdediagonalisation onjointedematri es

qui nousservironsde omparaison lors dessimulations informatiques.

Le s héma global pour l'algorithme U-WEDGEdé rit dans[70 ℄ est développé dansle

pseu-do odeAlgorithme 1 i-dessous. Pour ette méthode, lesensembles sont réels.

Algorithme 1:UWEDGE Critère:

J (B, A) =

P

N

i=1

kBΛ

i

B

T

− ADiag BM

i

T

for

l = 1, . . . , N

s

,(où

N

s

estlenombre de olonnes) do Cal uler

C(l) =

P

N

i=1

R

si

(l) ⊘ R(i)

, ave

⊘

le produittermeà terme. end for Cal uler

A

= I +

C

_{⊘G−Diag(G)C}

T

(G⊘G

T

−diag(G)diag(G)

T

_)+I

B

_{← A}

−1

B

(30)

Les hémaglobalpourl'algorithmeACDCdé ritdans[75 ℄estdéveloppédanslepseudo ode

Algorithme2 i-dessous.Ilprenden omptel'utilisationdematri eshermitiennesousymétriques.

Algorithme 2:ACDC

Critère:

C

LS

(B, Λ

i

) =

P

N

i=1

kM

i

− BΛ

i

B

‡

k

2

for

k = 1, 2, . . .

jusqu'à onvergen e do if ACPhasethen Cal uler

P

=

P

N

i=1

w

i

λ

l

i





M

i

−

N

P

n=1

n

_6=l

λ

n,i

b

n

b

‡

n







(H‡)

Séle tionnerlaplusgrande valeur propre

µ

,ainsi queleve teur

β

asso ié, de

P

(si

‡ = H

)ou

Q

=

"

Real(P)

_−Imag(P)

−Imag(P) −Real(P)

#

(si

‡ = T

) if

µ = 0

then

b

l

= 0

else if

‡ = H

then

b

l

=

β√µ

q

P

N

i=1

w

i

(

λ

l

i

)

2

else

b

l

=

(β(1)+jβ(2))√µ

q

P

N

i=1

w

i

|λ

l

i

|

2

endif endif

elseif DC Phasethen

Cal uler

G

=

h

B

H

B

(T ‡)

_{⊙ B}

H

B

i

−1

for

i = 1, . . . , N

do

Λ

i

= diag Gdiag B

H

M

i

B

(H‡)

endfor end if

(31)

Les hémaglobal pour l'algorithme FAJD dé ritdans[51 ℄est développé danslepseudo ode

Algorithme 3 i-dessous. Pour etalgorithme, lesensembles sont hermitiens.

Algorithme 3:FAJD Critère:

J (W) =

P

N

i=1

α

i

P

N

m=1

s

N

s

P

n=1

n

6=m

|

W

H

M

i

W

ij

|

2 − βlog|det(W)|

α

i

,

β

sont des oe ientsde pondérationpositifs. for

k = 1, 2, . . .

jusqu'à onvergen e do

for

m = 1, . . . , N

s

do Cal uler

Q

i

=

P

N

i=1

N

s

P

n=1

n

_6=m

α

i

M

i

w

n

w

H

n

M

i

H

+ M

H

i

w

n

w

H

n

M

i

Trouver

1 ≤ s ≤ N

s

et onstruire

E

s,N

s

WE

n,N

s

=

"

G

u

g

H

v

#

,ave

[E

s,t

]

_m,n

=











1

si

m = s, n = t

ou

m = t, n = s

1

si

m = n

et

m 6= s, t

0

sinon

detellesorte que

G

soit inversible Cal uler

d

s

=

−g

H

_G

₋₁

_{, 1}

_E

s,N

s

H

Rempla erla

m

ième olonnede

W

ave

w

opt

m

=

√

_βQ

−1

i

d

s

√

2d

H

s

Q

−1

i

d

s

end for end for

Ces algorithmesfon tionnent dansdes adresdiérents ( fTable 1.1), enfon tion de :

ladimension de lamatri e ( arrée,re tangulaire),

desvariables (réelles, omplexes),

(32)

Algorithmes de Gradient

Dans equivasuivre,nousprésenterons unensembledeméthodesitérativesquiutilisentles

fon tionsde oûtprésentéesauparagraphe 2.1.2 etdesmisesàjour basées surlegradient.Cela

a déjà été onsidéré, en parti ulier dans [43 , 76, 26, 45 , 69℄. Nous allons généraliser ertaines

appro hesdansles deux as omplexes, mais aussiproposer dessimpli ations.

3.1 Des ription générale

Dans e hapitrenousallonsdévelopperunensembled'algorithmesdetypegradientan

d'es-timerlamatri ede séparation

B

parminimisationdu ritère

J (B)

dont onrappelle l'expression

J (B) =

N

X

i=1

kZDiag{BM

i

B

‡

}k

2

(3.1)

Leprin ipe desalgorithmesde type gradientestrelativement simple,ils'agit, àpartir d'une

matri einitiale,de onstruiredemanièreitérativeuneestiméede

B

minimisantà haqueitération le ritère hoisi. En e qui on erne l'estimation d'une matri e, il existe deux grands types de

miseà jour.Le premier typeest à unemiseà jour additive orrespondant à

B

_{← B + Z}

où lamatri e

Z

estletermede miseà jour dépendant également dugradient du ritère.

Ce deuxième type est moins lassique ar il ne peut orrespondre qu'au as matri iel. La

notiondegradient relatifdénie en(1.9),etappliquéeà

J (B)

,permetde onsidérerletermede miseà jour suivant

Z

_{= −µ∇}

r

J (B) = µF

(3.3)

Deplus, ila étémontré dans[16 ℄,qu'il existaitun lienentrele gradient en

B

et elui en

Z

∇

r

J (B) =

∂J (I + Z)B

∂Z

∗

Ilsetrouveque, dansnotre as,ladépendan edu ritèreparrapportàlamatri ere her hée

B

peutêtrerendue impli ite, e qui auraun grand avantage danslasuite.Il sut pour elade onsidérer une miseà jour enparallèle de l'ensemble onsidéré de matri es.

Apartirde l'ensembleinitial eten posant

T

i

= BM

i

B

‡

(3.4)

en utilisant lamiseà jour(3.2), le ritère

J (B)

peutseréé rire

J (Z) =

N

X

i=1

kZDiag{(I + Z) T

i

(I + Z)

‡

}k

2

(3.5)

tout en onsidérant don une mise à jour en parallèle des matri es

T

i

en (3.4) de la manière suivante

T

i

← I + Z

T

i

I

+ Z

_‡

(3.6)

Une miseàjour multipli ative possèdedenombreux avantages dansle adrede notreproblème.

Tout d'abord elle permet(dansune ertainemesure, i.e.ave un passusamment petit)de

garderle ara tèreinversibledelamatri e

B

au oursdesitérations.Ils'agitd'unalgorithmede type gradient relatif,et ommemontrédans[76 ℄, elapermetd'avoirdesperforman es

indépen-dantes de

B

. Eneet l'algorithmeglobal ne dépend quede

Z

.

Ainsidanstoutela suite, ette seule miseàjour multipli ative sera onsidérée.

Le s héma global pour l'algorithme de gradient dé rit dans ette partie est développé dans

(34)

Algorithme 4:S héma Globalpour lesalgorithmes de gradient

Initialisation:Ensemble dematri es

M

i

,matri esinitales

B

(0)

for

k = 1, 2, . . .

jusqu'à onvergen e do Mise àjour desmatri es

T

i

suivant (3.6)

Cal ul dugradient ( lassique ou relatif) de(3.1)

Mise àjour de lamatri es

Z

ave (3.3) puisde

B

ave (3.2) end for

µ

, f. (3.3).Dans le asle plussimple, e pasest xéà une ertaine valeur déniepar l'utilisa-teur. Cettestratégie très simple estlargement sous optimale.Une idée ourante onsiste alors à

onsidérer e pas ommeun paramètresupplémentaire dansleproblème d'optimisationetdon

à le al uler à haqueitération par minimisation du ritère onsidéré.

Dansnotre asen reportant l'expressionde

Z

en(3.3) dans(3.5),ilestalors lairque

J

est unefon tionquartiquede

µ

etquesaminimisationneposerapasdeproblème. C'est e quenous ferons danslasuite.

3.2 Cal ul du gradient

Dans eparagraphenousallons al ulerlegradientdu ritèredansle ashermitienpuisdans

le assymétrique.Nousallonsaussidéterminerles oe ientsdupolynmededegréquatrepour

le al ul dupasoptimal.

3.2.1 Cas hermitien

On onsidère le ritèresuivant orrespondant au seul as hermitien

J

h

(Z) =

N

X

i=1

kZDiag{(I + Z) T

i

(I + Z)

H

}k

2

(3.7)

Dans e qui suivra, seuls les résultats seront rappelés. Tous les développements des al uls

sont ee tués dansl'Annexe A.1.1.

Legradient de e ritère estdonné par laformule suivante:

∂J

h

(Z)

∂Z

∗

=

N

X

i=1

ZDiag

_{{(I + Z) T}

i

(I + Z)

H

} (I + Z) T

H

i

+ ZDiag{(I + Z) T

i

(I + Z)

H

}

H

(I + Z) T

i

(3.8)

(35)

3.2.2 Cas symétrique

On onsidère le ritèresuivant orrespondant au seul as symétrique

J

s

(Z) =

N

X

i=1

kZDiag{(I + Z) T

i

(I + Z)

T

}k

2

(3.9)

Le al ul dugradient de (3.9),ee tuédansl'Annexe A.1.2, donne:

∂J

s

(Z)

∂Z

∗

= 2

N

X

i=1

ZDiag

_{{(I + Z) T}

i

(I + Z)

T

} (I + Z)

∗

T

∗

i

}

(3.10) 3.2.3 Pas optimal

La re her he du pas optimal peut se faire de manière globale. En remplaçant

Z

, exprimé ommeen (3.3),dans (3.5),on obtient lepolynme suivant :

J (Z) =

N

X

i=1

tr

a

i,0

+ µa

i,1

+ µ

2 a

i,2

+ µ

3 a

i,3

+ µ

4 a

i,4

(3.11)

dont les al uls sont développés dansl'Annexe B.1 ,et dont les oe ients

a

i,j

∀j = 0, . . . , 4

y sont donnés.

Les hémaglobal pourla déterminationdu pasoptimal estdétaillé dansl'Algorithme 5:

Algorithme 5:PasOptimal

Init: oe ients

a

i,j

Dans un but de rédu tion de la omplexité des al uls, nous allons maintenant développer

plusieurs approximations du ritère initial permettant un al ul de gradient simplié. Ces

(36)

3.3.1 Approximations sur le ritère

Prin ipalement deux hypothèses simpli atri es peuvent être onsidérées. La première

on- erne le terme de mise à jour

Z

dans (3.2). En fait l'algorithme itératif est onstruit de telle façon que e terme de mise à jour tend à s'annuler an d'obtenir un point stationnaire. Ainsi

on peut supposer raisonnablement que, relativement rapidement, on ait

kZk ≪ 1

. Cela a deux onséquen es.

La première onséquen e on erne larelation de mise à jour en (3.2) où

Z

n'intervient que par l'intermédiaire de la somme

I

+ Z

. Ainsi si l'on suppose que la norme de

Z

est très petite alorslesélémentsdiagonauxde

Z

peuventêtre onsidéréstrèspetitsdevant

1

orrespondantaux éléments diagonauxde lamatri e identité

I

.

Ainsi,à lapla e de(3.2), onpeut onsidérer lanouvelle misesuivante

B

_{← (I + ZDiag{Z})B}

(3.12)

où lestermes diagonauxde

Z

sont négligésdevant

1

.

La deuxième onséquen e on erne dire tement le ritère

J (Z)

en (3.5). En eet, en sup-posant

kZk ≪ 1

,alors au premier ordreon a

(I + Z) T

i

(I + Z)

‡

≈ T

i

+ ZT

i

+ T

i

Z

‡

(3.13)

onduisant à une approximation

J

a

1 (Z)

du ritère

J (Z)

donnéepar

J

a

₁

(Z) =

N

X

i=1

kZDiag{T

i

+ ZT

i

+ T

i

Z

‡

}k

2

(3.14)

Unese onde hypothèse simpli atri e peutêtre onsidérée on ernant ettefoisles matri es

T

i

misesà jourau oursdesitérations en(3.6).En eetl'algorithme estaussi onstruitde telle façon que es matri estendent à devenir desmatri esdiagonales au ours desitérations.

Ainsionpeuten ore raisonnablement supposer que, relativement rapidement, on ait

kZDiag{T

i

}k ≪ 1

Cela a la onséquen e suivante. Ennotant

T

D

_i

_{= Diag {T}

i

}

et

T

Z

i

= ZDiag {T

i

}

(3.15)

(37)

Ainsilemembre de droite de(3.13) peuten oreêtre appro hé par

T

i

+ ZT

i

+ T

i

Z

‡

≈ T

D

i

+ T

Z

i

+ ZT

D

i

+ T

D

i

Z

‡

(3.16)

onduisant à une deuxième approximation

J

a

2 (Z)

du ritère

J (Z)

déduite de (3.14) et donnée par

J

a

2 (Z) =

N

X

i=1

kZDiag{T

Z

i

+ ZT

D

i

+ T

D

i

Z

‡

}k

2

(3.17)

Comme les deux approximations pré édentes ont la même expression, on peut les réé rire

sous laforme génériquesuivante

J

a

(Z) =

N

X

i=1

kZDiag{T

(1)

i

+ ZT

(2)

i

+ T

(2)

i

Z

‡

}k

2

(3.18) où

T

(1)

i

= T

(2)

i

J

a

2 (Z)

est onsidéré.

Unedernièreapproximationpeutêtreenvisagée.Eneetenutilisantlefaitque

kZDiag {·} k

2 ₌

tr

_(·)

H

ZDiag

_{·}

,où

tr

{·}

est latra ede lamatri e en argument, on a

J

a

(Z) =

N

X

i=1

tr

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

‡

H

ZDiag

n

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

‡

oo

(3.19) et en onsidérant de nouveau que

kZk ≪ 1

, uneapproximation supplémentaire

J

b

(Z)

de

J

a

(Z)

est donnéepar

J

b

(Z) =

N

X

i=1

tr

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

‡

H

T

Z

i

+ T

(1)

H

i

ZDiag

n

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

‡

o

(3.20) aron a toujours

ZDiag

{T

(1)

i

} = T

Z

i

.

Demanièreexpli ite,lorsquequel'on posera

T

(1)

i

= T

(2)

i

J

b

2 (Z)

. 3.3.2 Cas hermitien

(1)

i

+ ZT

(2)

i

+ T

(2)

i

Z

H

}k

2

(3.21)

(38)

et

J

b,h

(Z) =

N

X

i=1

tr

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

H

T

Z

i

+ T

(1)

H

i

ZDiag

n

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

H

o

(3.22)

Ledéveloppement du al uldu gradient de(3.21) est ee tuéen AnnexeA.2.1 etdonne :

∂J

a,h

(Z)

∂Z

∗

=

N

X

i=1

ZDiag

n

T

(1)

_i

o

H

T

(2)

_i

+ ZDiag

n

T

(1)

_i

o

T

(2)

_i

H

+ ZDiag

n

ZT

(2)

_i

+ T

(2)

_i

Z

H

o

T

(2)

_i

H

+ ZDiag

n

ZT

(2)

_i

+ T

(2)

_i

Z

H

o

H

T

(2)

_i

(3.23)

tandis que l'onobtient legradient suivant pour (3.22) ( fexpli ation en AnnexeA.2.1) :

∂J

b,h

(Z)

∂Z

∗

=

N

X

i=1

ZDiag

n

T

(1)

_i

o

H

T

(2)

_i

+ ZDiag

n

T

(1)

_i

o

T

(2)

_i

H

(3.24) 3.3.3 Cas symétrique

(1)

i

+ ZT

(2)

i

+ T

(2)

i

Z

T

}k

2

(3.25) et

J

b,s

(Z) =

N

X

i=1

tr

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

T

H

T

Z

_i

+ T

(1)

_i

H

ZDiag

n

T

(1)

_i

+ ZT

(2)

_i

+ T

(2)

_i

Z

T

o

(3.26)

Le al uldesdérivées des ritères

J

a,s

(Z)

et

J

b,s

(Z)

par rapportà

Z

∗

estee tuéenAnnexe

A.2.2, etdonne :

∂J

a,s

(Z)

∂Z

∗

=

N

X

i=1

ZDiag

n

T

(1)

_i

o

T

(2)

_i

H

+ ZDiag

n

T

(1)

_i

o

T

(2)

_i

∗

+ ZDiag

n

ZT

(2)

_i

+ T

(2)

_i

Z

T

o

T

(2)

_i

H

+ ZDiag

n

ZT

(2)

_i

+ T

(2)

_i

Z

T

o

T

(2)

_i

∗

(3.27)