HAL Id: tel-00798019
https://tel.archives-ouvertes.fr/tel-00798019
Submitted on 7 Mar 2013
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Décompositions conjointes de matrices complexes :
application à la séparation de sources
Tual Trainini
To cite this version:
Tual Trainini. Décompositions conjointes de matrices complexes : application à la séparation de
sources. Autre. Université de Toulon, 2012. Français. �NNT : 2012TOUL0010�. �tel-00798019�
Laboratoire desS ien esde l'Informationetdes Systèmes(LSIS)
EquipeSignal &Images (SIIM)
THESEprésentée par :
Tual Trainini
pour obtenir le gradedeDo teuren S ien espour l'Ingénieur
DECOMPOSITION CONJOINTE DE MATRICES COMPLEXES
APPLICATION A LA SEPARATION DE SOURCES
Thèsedirigée par :
M. MOREAU Eri Dire teur de thèse
M. LUCE Hubert Co-dire teur de thèse
Jury :
M. BOURENNANE Salah
M. FAVIER Gérard
Dieua réél'homme,etensuitepourleremer ier l'hommea rééDieu.
Letourdu haten365jours,P.Gelu k
Entoutpremierlieu,jetiensàremer ierM.Eri Moreauqui,entantquedire teurdethèse,
s'esttoujoursmontrédisponibleetdebon onseil,toutensupportantave almeetmaîtrisemes
mé ontentements réguliers!
Mer i àH. Lu e d'avoir o-en adré ette thèse,etqui m'aura faittou her du doigtles
di- ultésinhérentes auxdonnées réelles.
MM. J. Mars et G. Favier ont a epté d'être les rapporteurs de ette thèse, et je les en
remer ie. Leurs remarquespertinantes ont permisd'é lair ir ertains pointsde e manus rit.
Mer iégalement àM. S.Bourennane d'avoir a epté de fairepartie du jury.
Je souhaite également remer ier R. Weber, ave qui j'ai pu travailler sur une appli ation
on rète et très intéressante pour les méthodes développées. Je garde un ex ellent souvenir de
mes semaines passées à Nançay, et je pense arriver à appré ier désormais la Sologne, même
en automne! J'espère que ette ollaboration perdurera, et que ela permettra à d'autres de
dé ouvrir un domaine fort intéressant. Mer i également à Gregory pour tout e qu'il a pufaire
sur les simulations, et aux responsables de l'institut néerlandais de radioastronomie ASTRON
pour m'avoir autorisé l'utilisation desdonnées.
Mer i aux membres de l'aile Télé om d'avoir toujours eu une attitude sympathique à mon
égard, et de m'avoir réservé un a ueil haleureux. Certaines dis ussions m'ont permis d'avoir
plus dere ul sur lesalgorithmes développés, des onseils judi ieux surl'enseignement et .
Mer i à William Webb Ellis d'avoir inventéun sportan de m'oxygéner leweek-end. Mer i
aux opains dusiet Fred,Hervé,Fran k, Ri eettouslesautres, Papa Coa h pour sonsoutien
sansfailleetquim'auraamenédejeunePadawan àJedi,sansoublierChadontlesélu ubrations
trouveront toujours grâ e à mes yeux. Un mer i parti ulier à tous les supporters aux quatre
oins delaFran e,quiauront su,par leursmots euris,medonnerune surmotivationpour aller
travailler lelundi matin!
Mer iaux opainseten parti ulier,pêlemêle,FloFlo,Captain,lafamille "M",Seb"le hef"
et Fanny, PtiFlo, Vin ent, Geooooorgeslaloutre, Moman, PJ,Polgas, Gnognotte,Touillette et
Bidule.
Jene saurai trouverles motspour exprimer eque jeressensvis-à-visde mafamille,demes
parents, de mon frère, de ma soeur et de ma ompagne, eux qui auront réussi pendant toutes
ses annéesàme supporterau quotidien(et ilsyarrivent en ore, e n'est pasune min e aaire),
A ronymes x
1 Introdu tion 3
1.1 Cadre de lathèse . . . 3
1.2 Obje tifset ontenudu do ument. . . 5
1.3 Notations,dénitions etoutils . . . 6
1.3.1 Notations lassiques . . . 6
1.3.2 Opération surlesmatri es . . . 7
2 Présentation du problème 10 2.1 Diagonalisation onjointe . . . 10
2.1.1 Dé ompositions matri ielles . . . 10
2.1.2 Diagonalisation onjointe appro hée . . . 12
2.1.3 Au sujetde l'identiabilité. . . 13
2.2 Lienave laséparation de sour es. . . 13
2.3 Des ription dequelques algorithmes . . . 17
3 Algorithmes de Gradient 20 3.1 Des ription générale . . . 20 3.2 Cal ul dugradient . . . 22 3.2.1 Cas hermitien . . . 22 3.2.2 Cas symétrique . . . 23 3.2.3 Pasoptimal . . . 23
3.3 Gradient etapproximations du ritère . . . 23
3.3.1 Approximations surle ritère . . . 24
3.3.2 Cas hermitien . . . 25
3.3.3 Cas symétrique . . . 26
3.5 Simulations . . . 28
3.5.1 Cas hermitien . . . 29
3.5.2 Cas symétrique . . . 29
3.5.3 Combinaison desdeuxensembles . . . 31
3.5.4 Complexité de al ul . . . 36
3.6 Con lusions surles méthodesde type gradient . . . 36
4 Algorithmes de mise à jour analytique de la matri e 38 4.1 Algorithme demiseà jour par ouplede termes . . . 38
4.1.1 Des ription générale . . . 38
4.1.2 Cal ul de lamatri ede miseà jour
Z
. . . 394.1.2.1 Cas hermitien . . . 39
4.1.2.2 Cas symétrique . . . 41
4.1.2.3 Combinaisondesdeux ensembles . . . 43
4.1.3 Des ription desalgorithmes . . . 44
4.2 Algorithmes de moindres arrés alternés . . . 44
4.2.1 Des ription générale . . . 44
4.2.2 Mise àjour desmatri esdiagonales
D
i
. . . 454.2.3 Mise àjour de lamatri e demélange
A
. . . 454.2.4 Mise àjour de
C
. . . 454.2.5 Re her he linéaire optimisée . . . 46
4.2.6 Des ription desalgorithmes . . . 47
4.2.7 Remarque . . . 48
4.3 Simulations . . . 48
4.3.1 Cas hermitien . . . 49
4.3.2 Cas symétrique . . . 49
4.3.3 Combinaison desdeuxensembles . . . 53
4.3.4 Remarque surlestemps de al uls . . . 53
4.4 Con lusions surles méthodesde re her he analytiques . . . 55
5 Appli ation à la séparation de sour es de télé ommuni ations 57 5.1 Séparationde sour es. . . 57
5.2 Hypothèsesdesimulation . . . 58
5.3 Cas hermitien . . . 59
5.4 Cas symétrique . . . 62
6 Appli ation à la radioastronomie 68
6.1 Présentation . . . 68
6.2 Données synthétiques. . . 70
6.2.1 Modèle . . . 70
6.2.2 Simulationsinformatiques . . . 71
6.2.2.1 Comparaison desvitessesde onvergen e . . . 73
6.2.2.2 Inuen ede lapuissan edesinterféren es . . . 75
6.2.2.3 Inuen edu nombred'é hantillons . . . 75
6.2.2.4 Inuen edu nombrede pollueurs . . . 77
6.2.2.5 Autresrésultats . . . 77
6.3 Données expérimentales . . . 79
6.3.1 Justi ationempiriquedel'utilisationd'unematri ealéatoire ommepoint initial . . . 80
6.3.2 Justi ation empiriquede l'utilisation des umulants . . . 82
6.3.3 Traitements pour les énario "landmobile" . . . 82
6.3.4 Traitements pour les énario "pager" . . . 85
7 Con lusions et Perspe tives 88 7.1 Con lusions . . . 88
7.2 Perspe tives . . . 88
A Développement des al uls des algorithmes de gradient 90 A.1 Cal ul dugradient . . . 90
A.1.1 Cas hermitien . . . 90
A.1.2 Cas symétrique . . . 92
A.2 Cal ul dugradient pourun ritère simplié . . . 93
A.2.1 Cas hermitien . . . 93
A.2.2 Cas symétrique . . . 93
B Développement des al uls pour les oe ients des pas optimaux 95 B.1 Cal ul dupasoptimal pourle ritère initial . . . 95
B.2 Cal ul dupasoptimal dansle as d'un ritèresimplié . . . 96
1 UWEDGE . . . 17
2 ACDC. . . 18
3 FAJD . . . 19
4 S hémaGlobal pour les algorithmes degradient . . . 22
5 Pas Optimal . . . 23
6 H"Diagonalization of omplEx SEtsusing aRelative gradienT"(DESERT) . . . . 27
7 SDESERT . . . 27
8 "NOnOrthogonal De omposition of ompLEx Sets"(NOODLES) . . . 44
9 "Enhan edLine Sear h" (ELS) . . . 47
10 "AlternatingLeast Square" (ALS) . . . 47
11 ALS ELS . . . 47
2.1 S hémade laséparation de sour es . . . 14
2.2 S hémadansle asbruité . . . 14
2.3 S hémadansle asd'unblan himent . . . 15
3.1 Vitesse de onvergen e desalgorithmesHDESERT. . . 30
3.2 Vitesse de onvergen e desalgorithmesHDESERT. . . 30
3.3 Vitesse de onvergen e des algorithmes HDESERT. Comparaison en fon tion du ritère. . . 31
3.4 Vitesse de onvergen e des algorithmes HDESERT. Comparaison en fon tion du ritère. . . 32
3.5 Vitesse de onvergen e desalgorithmesSDESERT. . . 32
3.6 Vitesse de onvergen e desalgorithmesSDESERT. . . 33
3.7 Vitesse de onvergen e desalgorithmesDESERT. . . 33
3.8 Performan edes algorithmesDESERT.. . . 34
3.9 Vitesse de onvergen e desalgorithmesDESERT. . . 34
3.10 Performan edes algorithmesDESERT.. . . 35
3.11 Vitesse de onvergen e des algorithmes DESERT. Comparaison en fon tion du ritère. . . 35
3.12 Vitesse de onvergen e des algorithmes DESERT. Comparaison en fon tion du ritère. . . 36
4.1 Performan edes algorithmesALS etNOODLES . . . 49
4.2 Vitesse de onvergen e desalgorithmesALS etNOODLES . . . 50
4.3 Performan edes algorithmesALS etNOODLES . . . 50
4.4 Vitesse de onvergen e desalgorithmesALS etNOODLES . . . 51
4.5 Performan edes algorithmesALS . . . 51
4.6 Performan edes algorithmesALS etNOODLES . . . 52
4.7 Vitesse de onvergen e desalgorithmesALS etNOODLES . . . 52
4.10 Performan edes algorithmesALS etNOODLES . . . 54
4.11 Vitesse de onvergen e desalgorithmesALS etNOODLES . . . 55
5.1 Vitesse de onvergen e desalgorithmes . . . 60
5.2 Performan edes algorithmesen fon tion duRapportSignal surBruit(RSB). . . 60
5.3 Vitesse de onvergen e desalgorithmes . . . 61
5.4 Performan edes algorithmesen fon tion duRSB . . . 61
5.5 Vitesse de onvergen e desalgorithmes . . . 62
5.6 Performan edes algorithmesen fon tion duRSB . . . 63
5.7 Vitesse de onvergen e desalgorithmes . . . 63
5.8 Performan edes algorithmesen fon tion duRSB . . . 64
5.9 Vitesse de onvergen e desalgorithmes . . . 65
5.10 Performan edes algorithmesen fon tion duRSB . . . 65
5.11 Vitesse de onvergen e desalgorithmes . . . 66
5.12 Performan edes algorithmesen fon tion duRSB . . . 66
6.1 Superterp, le oeur du oeur de "LOw Frequen y ARray" (LOFAR) (6 stations "High Band Antennas" (HBA) et "Low Band Antennas" (LBA) dans 300m de diamètre), prèsde Exlooaux Pays-Bas . . . 69
6.2 Vue du iel sans perturbateurs . . . 72
6.3 Vue du iel ave les interféren es . . . 72
6.4 Vitesse de onvergen e desalgorithmes . . . 74
6.5 Vitesse de onvergen e desalgorithmes . . . 74
6.6 Performan edes algorithmesen fon tion duRapportInterféren esurBruit (RIB) 75 6.7 Performan edes algorithmesen fon tion dunombre d'é hantillons . . . 76
6.8 Performan edes algorithmesen fon tion dunombre d'é hantillons . . . 76
6.9 Performan edes algorithmesen fon tion dunombre depollueurs . . . 77
6.10 Performan edes algorithmesen fon tion dunombre depollueurs . . . 78
6.11 Vue du iel après proje tion . . . 78
6.12 Vue du iel après soustra tion . . . 79
6.13 Vue du iel surles antennes impaires. S énario "landmobile" . . . 80
6.14 (a):Dé ompositionenValeursPropres(DVP)ave Ve teurPropre(Ve P)asso ié à plus grande Valeur Propre (ValP), (b) : ALS ave Ve P asso ié à plus grande ValP, ( ):DVP ave Ve P asso ié à2nd plus grandeValP, (d):ALS ave Ve P asso iéà 2ndplus grandeValP . . . 81
utilisées.(a): Ordre 2,(b):Ordre 4 . . . 82
6.16 dim(Sous-Espa e Interféren es (SEI))
= 1
pour (a): DVP et(b):ALS . . . 836.17 dim(SEI)
= 2
pour (a):DVPet(b): ALS . . . 836.18 Vue du iel surles antennes paires. S énario "landmobile" . . . 84
6.19 dim(SEI)
= 1
pour (a):DVPet(b): ALS . . . 846.20 dim(SEI)
= 2
pour (a):DVPet(b): ALS . . . 856.21 Vue du iel surles antennes paires. S énario "pager" . . . 85
6.22 dim(SEI)
= 1
pour (a):DVPet(b): ALS . . . 866.23 dim(SEI)
= 3
pour (a):DVPet(b): ALS . . . 866.24 dim(SEI)
= 4
pour (a):DVPet(b): ALS . . . 876.25 dim(SEI)
= 4
pour (a):DVPet(b): ALS . . . 871.1 Méthodesde diagonalisation onjointe . . . 5
3.1 Paramètres de simulationsdesalgorithmes DESERT . . . 29
3.2 Temps d'exé ution desalgorithmesDESERT . . . 37
4.1 Paramètres de simulationsdesalgorithmes ALS etNOODLES. . . 48
4.2 Temps d'exé ution desalgorithmesALS etNOODLES . . . 55
5.1 Paramètres de simulationsde signauxde télé ommuni ations . . . 59
ACDC "Alternating Columns -Diagonal Centers"
ACI Analyse en ComposantesIndépendantes
ALS "Alternating LeastSquare"
BPSK "BinaryPhaseShift Keying"
DESERT "Diagonalization of omplEx SEtsusing aRelative gradienT"
DIEM "DIagonalization usingEquivalent Matri es"
DOMUNG "Diagonalization OfMatri esUsing NaturalGradient"
DVP Dé omposition enValeursPropres
ELS "Enhan ed LineSear h"
FAJD "Fast Approximate Joint Diagonalization"
FFDIAG "FastFrobenius DIAGonalization"
HBA "High BandAntennas"
JADE "Joint Approximate Diagonalization ofEigenmatri es"
LBA "LowBandAntennas"
LOFAR "LOw Frequen y ARray"
MC MonteCarlo
QPSK "Quaternary PhaseShiftKeying"
RFI "Radiofrequen y interferen e"
RIB RapportInterféren e surBruit
RSB RapportSignal surBruit
NOODLES "NOn Orthogonal De ompositionof ompLEx Sets"
SEI Sous-Espa e Interféren es
TBB "Transient BuerBoard"
U-WEDGE "UniformalyWeightedExhaustive Diagonalization withGaussitErations"
ValP Valeur Propre
Introdu tion
1.1 Cadre de la thèse
Dansde nombreux algorithmes de traitement du signal,on al uleà partir des donnéesune
ou des matri es dont leur dé omposition permet d'estimer les paramètres utiles au problème
envisagé.C'est le aspar exemple en traitement d'antennes où,à partirde ladé ompositionen
éléments propresde lamatri e de ovarian e desdonnées, on peutestimer lenombrede sour es
a tives,l'espa esignalasso iéetlesdiérentsanglesd'arrivée.C'estaussile asenséparationde
sour esoù,parexemple,onpeutestimer unematri edeséparationàpartir deladé omposition
en éléments propres généralisée de deux matri es de orrélation des données, al ulées à deux
instants diérents.
De nombreux types de matri es peuvent être envisagés, et ont été utilisées es dernières
années. Ona, parexemple, desmatri esliées:
à desstatistiquesà l'ordre deux[1,6,20 , 37℄,
à desstatistiquesd'ordre supérieur[3, 10,11 , 12,13,36 ,47,55, 60 ℄,
à unedé omposition spe traledesdonnées [27℄,
à desdé ompositions temps-fréquen es desdonnées [7 ,32℄.
Une autre type de solution pour la séparation de sour esa onsisté à utiliserun s héma de
type déation,où lessour es sont extraitesune àune du mélange[28 , 30,31℄.
Les matri es pré édentes peuvent être réelles ou omplexes. Dans quasiment tous les as,
es matri es possèdent naturellement une propriétés de symétrie. Dans le as réel, elles sont
très souvent symétriques et dans le as omplexe, elles sont très souvent hermitiennes. Plus
ré emment,un intérêt roissantest apparu on ernant desmatri es omplexessymétriques.Par
exemple en télé ommuni ations numériques, de telles matri es peuvent être envisagées lorsque
les signaux onsidérés sont non ir ulaires [48, 50, 56, 64℄. Mais il existe d'autres domaines
En equi on ernelesdé ompositionsenvisagées,ellesdépendentbienévidemmentdutypede
matri esetduproblème onsidérés.Lesplus lassiquessontladé ompositionenélémentspropres
etladé ompositionenvaleurssingulières.Cependant,lapriseen omptesimultanéedeplusieurs
matri espeutavoirun intérêtimportant (voireprimordial) ommeen séparationde sour es.La
première dé omposition de e type est la dé omposition en éléments propres généralisée. Cette
dernièredé ompositionne prenden omptequedeuxmatri es. Unegénéralisation ena étéfaite
relativement ré emment pourun nombre quel onque dematri es(enl'o urren ehermitiennes)
sousladénominationdiagonalisation onjointed'unensembledematri es dans[18 ℄.Lamatri e
detransformationre her hée étaitalorsunitaire.Celaadonnélieuauxdeuxalgorithmesde
sépa-rationdesour es"JointApproximateDiagonalizationofEigenmatri es"(JADE)[18 ℄(généralisé
à n'importe quel ordre supérieur à 3 dans [54℄) et"Se ond Order Blind Identi ation" (SOBI)
[6℄. Cependant,lare her he d'unematri e unitaire né essiteau préalable uneétapede
blan hi-ment des données [46℄. Cette étape n'étant pas sans onséquen es au niveau des performan es
d'estimation [14℄. L'idée a alors étéde développer des algorithmes de diagonalisation onjointe
sans ontrainte unitaire.
Un ertain nombred'algorithmes de e type ont étépubliésdepuis, par exemple [19 ,21 , 29,
63, 73℄. En général, il s'agitd'optimiser un ertain ritère lié à ladé omposition. Il existe deux
grands typesde ritère.Le premier type orrespondà un ritère liédire tement à une erreurde
dé omposition (ou erreur demodèle) qui sera appelé ritèredire t etlese ondtype orrespond
à un ritère lié àl'inverse de latransformation quisera appelé ritère inverse.
Des nouveaux problèmes sont apparus ré emment, et ont né essité une généralisation de la
diagonalisation onjointe au asoù lesmatri essont blo -diagonales [39, 40℄.
Onpeutaussi onsidérerlesensemblesdematri es ommedestenseurs,etfairelestraitements
dire tement sur eux- i.Laméthodeoriginelles'appellePARAFAC[41℄et d'autressolutions ont
étéapportéespar lasuite [34, 35 ,52 ,53, 66 ℄.
La séparation de sour es trouve des appli ations dans de nombreux problèmes tels que le
biomédi al[42 ,44,49 ℄,laspe tros opie[59℄,l'astronomie[27 ℄,lasismique[62 ,72℄etles
ommu-ni ations numériques[20 , 23 ,37℄.
Letableau1.1rappellebrièvementunensembled'algorithmesdelalittératurequitraitentde
ladiagonalisation onjointe d'ensemble dematri es. Certainesde esméthodesserontdétaillées
plus longuement dans la suite, et nous servirons de omparaison par rapport à elles que nous
avonsdéveloppé.On iteprin ipalement"AlternatingColumns-DiagonalCenters"(ACDC)[75℄,
"Uniformaly Weighted Exhaustive Diagonalization with Gauss itErations" (U-WEDGE)[70℄,
"Fast Approximate Joint Diagonalization" (FAJD)[51 ℄ , JADE[18℄, SOBI[6 ℄, "DIagonalization
Nomde l'algo. Critère Corps Matri e transfo. Ensemble
ACDC dire t omplexe re tangulaire hermitien/symétrique
U-WEDGE inverse omplexe arrée hermitien(/symétrique?)
FAJD inverse omplexe arrée hermitien
JADE inverse omplexe arrée hermitien
SOBI inverse omplexe arrée hermitien
DIEM dire t omplexe arrée hermitien
J-Di dire t réel arrée symétrique
NOJD[2 ℄ inverse réel arré symétrique
DOMUNG inverse réel arrée symétrique
Table 1.1Méthodesde diagonalisation onjointe
1.2 Obje tifs et ontenu du do ument
L'obje tif prin ipal de thèse onsiste à développer des algorithmes de diagonalisation
on-jointe de deux ensembles de matri es omplexes. Le premier ensemble est onstitué de
matri- es hermitiennes etle se ond ensemble de matri e omplexe symétrique. L'obje tif est ainside
prendre en ompte onjointement toute l'information disponible au niveau desstatistiques des
données. Ces algorithmes seront appliqués dansun premiertemps au problème delaséparation
de sour es de type télé ommuni ations numériques etdansun se ond temps au problème de la
réje tiond'interféren es liéesàdessignauxdetélé ommuni ations numériquesdansun adrede
radioastronomie.
Dansle hapitre 3,lesalgorithmesdetype gradient quenousavonsdéveloppé seront
présen-tés. Nousproposerons desméthodesnovatri es,ou des extensions de méthodesdéjà existantes.
Par exemple, nous verrons l'extension de DOMUNG développé dans [76 ℄ au as omplexe. De
plus, nousproposerons dessolutions qui nouspermettront de nousaran hirdu pré-traitement
des données onsistant à blan hir elles- i an, entre autre, d'estimer des matri es de mélange
re tangulaires.Deplus,nousproposeronsdessolutionsquiné essitentmoinsderessour es(temps
de al ul ou mémoire). Dessimulations permettront de valider lesalgorithmes développés.
Le hapitre 4 développera deux méthodes de type algébrique. Il s'agit de al uler
analy-tiquement, en fon tion des données en notre possession, la matri e de mélange ou la matri e
de séparation. Ces solutions s'appuieront surdesrésultats présentés dans[9 ℄, [25 ℄ ou[65 ℄. Nous
étendrons toujours es algorithmes au as omplexe, en onsidérant des ensembles hermitiens,
symétriques, et en ombinant es deux types d'ensemble. Enn, nous présenterons des
simula-tions numériques qui permettront de mettre en éviden e les performan es de nos algorithmes,
omparés àdesalgorithmes lassiques.
algorithmes développés dans le as de la séparation de sour es, où les signaux sour essont des
signaux typiques de télé ommuni ations numériques.
Enn, le hapitre 6 présentera l'appli ation des méthodes développées au domaine
radioas-tronomique. Le ontexte est le suivant : les observations que font les astronomes peuvent être
perturbées par des interféren es issues du milieu terrestre, omme par exemple les signaux de
radio ommuni ations.Notre obje tif sera alors d'estimer aumieux esperturbationsan deles
éliminer des signaux reçus, et don de permettre aux utilisateurs d'avoir l'observation la plus
"propre" possible de e qui se passe en dehors de la Terre. Dans un premier temps, nous
véri-erons lebon omportement denosalgorithmes ave desdonnées synthétiquessimulant letype
d'observations quel'on a lassiquement. Puis, nousles appliqueronssurdesdonnées réelles.
1.3 Notations, dénitions et outils
1.3.1 Notations lassiques
Onnotera
R
l'ensemble desnombres réelsetC
l'ensemble desnombres omplexes.Dans e qui suivra,les s alairesseront notésen minus ule
m
,lesve teursen minus ule grasm
,les matri esenmajus ule grasseM
etM
ˆ
estune estimée deM
. SoitM
∈ C
M
×N
une matri e omplexe. Les majus ulessimples seront utilisées pour
déter-miner desquantités (nombre dematri es dansun ensemble, taille desmatri eset .) :
M, N, K
. Lei
èmeélémentd'unve teurseranotém
i
,etl'élément ayantpourindi e (i
,j
) dansunematri eM
seranotéM
i,j
.On notera
M
T
sa transposée,M
∗
sa onjuguée etM
H
sa transposée onjugué.M
−1
estl'inverse d'unematri e,
M
†
lapseudo-inverse.
Lemoduled'unnombre omplexe
m
est noté|m|
.ℜ(m)
estla partie réelledem
etℑ(m)
sapartie imaginaire.Produitsmatri iels Soient
M
etP
desmatri esde dimensionrespe tivesM × N
etP × Q
. Le produitde Krone kerdeM
etP
,notéM
⊗ P
et dedimensionM P × NQ
, orrespondà :M
⊗ P =
m
1,1
P
· · ·
m
1,n
P
. . . . . . . . .m
m,1
P
· · · m
m,n
P
(1.1)Soient
M
etP
desmatri esdedimensionrespe tivesM × N
etP × N
.Leproduitde Khatri-RaodeM
etP
,notéM
⊙ P
etde dimensionM P × N
estunproduitdeKrone kerpar olonnesdéni par:
M
⊙ P = (M
1
⊗ P
1
, . . . , M
n
⊗ P
n
)
(1.2)1.3.2 Opération sur les matri es
Diag
{M}
annuleles termeshors-diagonaux deM
:Diag
{M} =
m
1,1
0
. . .
0
0
m
2,2
. . . . . . . . . . . . . . .0
0
. . .
0
m
m,m
ZDiag
{M}
est l'opérateur annulant les termesdiagonauxdeM
:ZDiag
{M} = M − Diag {M}
diag
{M}
est un ve teur ontenant les termes diagonaux deM
etDiag
{m}
onstruit une matri e diagonaleà partir deséléments dem
.tr
{M}
représente latra e de lamatri eM
. SoientM
etP
deuxmatri es arrées. Ona:tr
{MZdiag {P}} = tr {Zdiag {M} P}
(1.3)Soient
M
,N
etP
troismatri es arrées.Ona :tr
{MNP} = tr {PMN} = tr {NPM}
(1.4)vec
{M}
orrespond à l'empilement de toutes les olonnes deM
dans un ve teur. Une des propriétés de etopérateur est:vec
{MNP} = P
T
⊗ M
vec
{N}
(1.5)Deplus, silamatri e
N
estdiagonale, on aNorme deFrobenius LanormedeFrobenius
kMk
d'unematri eM
estdénie ommesuit:kMk = tr
M
H
M
1
2
=
X
i,j
|M
i,j
|
2
1
2
(1.7)Pseudo-inverse Dans le as où
M
est une matri e omplexe re tangulaire, on utilisera la pseudo-inverse deMoore-Penrose, notéeM
†
etvériant :MM
†
M
= M
M
†
MM
†
= M
†
MM
†
H
= MM
†
M
†
M
H
= M
†
M
Silerangde
M
estégal àsonnombre delignes, on a:M
†
= M
H
MM
H
−1
Demême,si lerangde
M
estégal àsonnombre de olonnes, on a:M
†
= M
H
M
−1
M
H
Dérivation
∇
sera utilisé pour legradient omplexe et nousintroduisons deuxdénitions de gradient :∇J (M) =
∂J (M)
∂M
∗
=
∂J (M)
∂ℜ(M)
− j
∂J (M)
∂ℑ(M)
(1.8)qui représente legradient naturel, et:
∇
r
J (M) = ∇J (M) M
H
=
∂J (M)
∂M
∗
M
H
(1.9)
qui est legradient relatif, introduit dans[15 , 17℄(qui peut être vu ommeun as parti ulierde
[4℄).
Lapropriétésuivante,liantladérivationdematri esetl'opérateurtra e,nousserautilepour
le al ul desdiérentsgradients:
∂tr
Z
H
M
Contributions de l'auteur
Colloques internationaux ave a tes et omité de le ture
[ i4℄ T. Trainini and E. Moreau, "Variations Around Gradient Like Algorithms for Joint
Diagonalization of Hermitian Matri es," inPro . European Signal Pro essingConferen e
(EU-SIPCO'2012), Bu harest, Romania,August 2012.
[ i3℄G.Hellbourg,T.Trainini, R.Weber,E.Moreau,C.CapdessusandA.J.Boonstra,"RFI
Subspa eEstimationTe hniquesforNewGeneration RadioTeles opes,"inPro .European
Sig-nalPro essing Conferen e(EUSIPCO'2012), Bu harest, Romania,August 2012.
[ i2℄T.TraininiandE.Moreau,"ALeastSquaresAlgorithmforGlobalJointDe omposition
of Complex Matri es Sets", in Pro . IEEE Fourth International Workshop on Computational
Advan es in Multi-Sensor Adaptive Pro essing (CAMSAP'2011), San Juan, Puerto Ri o,
De- ember2011.
[ i1℄ T. Trainini, X.-L. Li, E. Moreau, and T. Adali, "A Relative Gradient Algorithm for
Joint De ompositions of Complex Matri es", in Pro . European Signal Pro essing Conferen e
(EUSIPCO'2010), Aalborg, Denmark,August2010.
Colloques nationaux ave a tes et omité de le ture
[ n1℄ T. Trainini et E. Moreau, "Un algorithme ALS pour la dé omposition onjointe de
matri es omplexes", dans Pro . 23ième olloque GRETSI sur le traitement du signal et des
Présentation du problème
2.1 Diagonalisation onjointe
Dans e paragraphe nousdé rivonsle problème de la diagonalisation onjointe d'ensembles
de matri es omplexes ainsi que les ritères asso iés. Nous allons onsidérer deux ensembles
de matri es omplexes. Le premier on ernera des matri es hermitiennes tandis que le se ond
on ernera desmatri es omplexessymétriques.
2.1.1 Dé ompositions matri ielles
Plus pré isément, on onsidère un premier ensemble
M
h
deN
h
∈ N
matri es arrées de dimensionN
o
× N
o
é ritdela manièresuivanteM
h
= {M
(h)
i
∈ C
N
o
×N
o
, i = 1, . . . , N
h
}
Pour ha une desmatri esde etensembleon supposequ'il existeune matri e
A
de dimensionN
o
× N
s
,de tellemanièrequ'idéalement onaitM
(h)
i
= AD
(h)
i
A
H
(2.1)oùlesmatri es
D
(h)
i
dedimensionN
s
×N
s
,sonttoutesdiagonales.Dans(2.1),(·)
H
estl'opérateur
detransposition onjuguéedelamatri eenargument.Ainsi,lorsquelesmatri esdiagonales
D
(h)
i
sont réelles, les matri es
M
(h)
i
sont alors hermitiennes. Siles matri esD
(h)
i
sont omplexes, on feral'opérationM
(h)
i
←
1
2
M
(h)
i
+ M
(h)
i
H
an de lesrendre hermitiennes.
tellematri e sera noté
A =
A
∈ C
N
o
×N
s
| A
rang plein en olonne(2.2)
Ainsi, ilexiste une pseudoinverse de
A
notéeB
,i.e.B
= A
†
(2.3)de tellemanière quel'on ait
BA
= I
(2.4)où
I
est lamatri e identité.L'ensemblede tellematri eB
seranotéB =
n
B
∈ C
N
s
×N
o
| ∃
une matri e derang pleinA
tellequeB
= A
†
o
(2.5)
Ainsien utilisant (2.1),on a dire tement
BM
(h)
i
B
H
= D
(h)
i
(2.6)On onsidèreaussiundeuxièmeensemble
M
t
deN
t
∈ N
matri es arréesdedimensionN
o
× N
o
é ritde lamanière suivanteM
t
= {M
(t)
i
∈ C
N
o
×N
o
, i = 1, . . . , N
t
}
Onsupposera que ha unede esmatri es peutsedé omposerde lamanière suivante
M
(t)
i
= AD
(t)
i
A
T
(2.7)oùlamatri e
A
estidentiqueà elleayant étéutiliséedansladé omposition(2.1)etoùes matri- esD
(t)
i
dedimensionN
s
× N
s
,sont toutesdiagonales.Dans (2.7),(·)
T
estl'opérateur de
trans-position de lamatri e en argument. Ainsi toutes les matri es
D
(t)
i
sont omplexes symétriques. A partirde (2.7) etenutilisant (2.4), ona dire tementBM
(t)
i
B
H
= D
(t)
i
(2.8)A haque foisque ela ne portera pasà onfusion etan de simplier les notations, dans toute
lasuite on utiliserala formulation ommune suivante pour lesdeux typespré édents
où l'opérateur
(·)
‡
orrespond don soit à une simple transposition soit à une transposition
onjuguée. Onaura don aussi
BM
i
B
‡
= D
i
(2.10)2.1.2 Diagonalisation onjointe appro hée
Leproblèmede diagonalisation onjointe onsidéré onsiste,àpartir d'un(resp. des)
ensem-ble(s)
M
h
ou (resp. et)M
t
, en l'estimation de la matri eA
pour le problème dire t ou de la matri eB
pourleproblèmeinverse.Enpratique,lesmatri esdanslesdeuxensemblesM
h
etM
t
sontestiméesparexempleàpartird'estimateursempiriquesdestatistiquesd'ordredeuxoud'or-dre supérieuràdeuxenutilisant unnombrenidedonnée.Ainsilesdé ompositions pré édentes
ne sont pasexa tes maisseulement appro hées. C'est laraison pour laquelleon parlealors de
diagonalisation onjointe appro hée. Dans e adre, on aborde le problème par l'intermédiaire
d'un ritère mesurant ette diagonalisation appro hée dont l'optimisation permettra de trouver
la matri e re her hée. Il existe de nombreux ritères possibles asso iés au problème dire t ou
au problème inverse. Con ernant le problème dire t, le ritère peut être le plus lassique est le
suivant
D(A, {D
i
}) =
N
X
i=1
kM
i
− AD
i
A
‡
}k
2
(2.11)qui orrespond à un ritère quadratique d'ajustement demodèle de dé omposition. Con ernant
leproblème inverse,le ritèreleplus lassiqueest
J (B) =
N
X
i=1
kZDiag{BM
i
B
‡
}k
2
(2.12)oùl'opérateur
ZDiag
{·}
metsàzérol'ensembledesélémentsdiagonauxdelamatri eenargument, i.e.ZDiag
{A}
i,j
= (1 − δ
i,j
)A
i,j
oùδ
i,j
= 1
sii = j
et0
sinon.Ce ritère étant nul pour une matri e diagonale, il s'agit d'une mesure quadratique de la diagonalité d'une matri e. Dansle seul as hermitien, les deux ritères pré édents seront notés
D
h
etJ
h
et dans le seul as symétrique, ils seront notésD
s
etJ
s
. Lorsque que l'on voudra prendre en ompte de manière simultanélesdeux asdematri es,onleferaparl'intermédiaired'unesimple ombinaisonlinéairedesdeux ritères de lamanièresuivante. Pour le ritèredire t on posera
D
λ
= (1 − λ)D
h
+ λD
s
(2.13)où
λ ∈ [0, 1]
etpour le ritère inverse onposeraLes ritèresétant dénis,lebutestmaintenant d'estimerlesparamètres optimauxliésàleur
op-timisation.Pourle ritèredire t,l'obje tifestd'estimerunematri e
A
b
etdesmatri esdiagonalesb
D
i
telles que( b
A, b
D
i
) = arg min
A
∈A
D
i
∈D
ia
D(A, {D
i
})
(2.15)où
A
est l'ensembledénien (2.2) etD
ia
estl'ensembledesmatri es diagonales.Pour le ritère inverse, l'obje tif estd'estimer unematri eB
b
tellequeb
B
= arg min
B
∈B
J (B)
(2.16)
où
B
estl'ensembledéni en(2.5).2.1.3 Au sujet de l'identiabilité
Il est d'abord important de remarquer qu'il ne sera pas possible, à partir des seuls ritères
pré édents, d'identier exa tement
A
ouB
. Celaest lié à l'aspe t aveugle de l'identi ation. Dans e adre, on se ontente, mais 'est très lassique etlargement susant en pratique,d'es-timer
A
ouB
auproduitd'unematri ediagonaleinversibleprèsetd'unematri edepermutation près.2.2 Lien ave la séparation de sour es
Dans eparagraphe nousfaisonsunbrefrappelduproblèmedelaséparationdesour esdans
un adredemélangelinéaire etinstantané. Puisnousprésentonssonlienave ladiagonalisation
onjointede matri es.En séparation desour es, on supposedisposer d'un ertainnombre
d'ob-servations résultant du mélanged'un ertainnombre de signauxd'intérêt appelés sour es. Dans
le as leplussimple lemodèle de mélangeestlesuivant [42℄
x(t) = As(t)
(2.17)y(t) = x(t) + b(t)
(2.18)où
A
estlamatri edemélangededimensionN
o
× N
s
,s(t)
leve teurN
s
× 1
dessignauxsour es,b(t)
leve teurN
o
×1
desbruitsadditifs,x(t)
leve teurN
o
×1
desobservationssansbruitety(t)
leve teurN
o
×1
desobservationsbruitées.Parrapportà emodèle,ilest lassiqued'imposerun ertainnombred'hypothèses. Enl'o urren e,onsupposeratoujourslessignauxsour es entrés,de puissan e unité etstatistiquement indépendants. En e qui on erne le mélange, dansle as
sur-déterminé, i.e.lorsque
N
o
≥ N
s
,lamatri eA
serasupposéderangpleinen olonneetdans le as sous-déterminé, i.e.lorsqueN
o
< N
s
,la matri e de mélange sera supposée de rangpleinave des ve teurs olonnes deux à deux distin ts. Dans le as sur-déterminé, le but est alors
d'estimer une matri ede séparation
B
detelle manièrequele ve teurz(t) = Bx(t)
(2.19)orrespond aux signaux sour es que l'on re her he. Dans e adre la matri e de séparation
B
est re her hée en imposant des omposantes indépendantes aux ve teursz(t)
. On parle alors d'analyseen omposantesindépendantes. Ils'agitdon de restaurerlapropriétéd'indépendan estatistique perdue par lemélange. Cela sera le as [24℄ lorsque l'on aura trouvé une matri e de
séparation
B
de tellefaçon queBA
= DP
(2.20)où
D
estune matri e diagonaleinversible etoùP
estune matri e depermutation. Leproblème peutalors ses hématiserde lafaçon suivante:A
B
s(t)
x(t)
z(t)
Figure2.1 S hémade laséparation de sour es
Cependant,ilestrarededisposerde donnéestotalement nonbruitées.Ainsi, notreproblème
serad'estimer ettematri ede séparation
B
àpartirdesobservations bruitées(2.18),etdon la s hématisationest lasuivante:A
+B
s(t)
x(t)
b(t)
y(t)
z(t)
Figure 2.2 S hémadans le asbruité
Dans le but de restaurer ette propriété d'indépendan e statistique, une première étape de
dé orrélationpeutêtreenvisagée.Cettepremièreétapeasso iéeàunenormalisationenpuissan e
dessignauxestsouventappeléeblan himentdesobservations.Dansle asd'observationsbruitées,
elle peutavoirunintérêt supplémentaire derédu tionde bruitpar proje tion surl'espa e signal
lorsquequelenombred'observations
N
o
eststri tementplusgrandquelenombredesour esN
s
. Celapeutaussiavoir l'intérêt,dansle assur-déterminé, deramenerleproblèmeàun problèmeDans e as,lamatri edemélange
B
sedé omposeenunproduitmatri ielentreunematri e de blan himentW
etune matri e unitaireU
:A
+W
U
s(t)
x(t)
b(t)
y(t)
u(t)
z(t)
Figure 2.3 S héma dansle asd'unblan himent
Detrès nombreuses méthodesont été proposées an de résoudre e problème de séparation
de sour es. Nous allons uniquement dans le adre de la thèse nous intéresser aux méthodes
dites de diagonalisations onjointes de matri es qui, quasiment toutes, tirent leur origine dans
les travaux initiaux de Cardoso et Souloumia [18 ℄. Dans e adre, en général, des statistiques
sont estimés et rangés dans des matri es etdes dé ompositions algébriques onjointes de es
matri espermettent l'estimationd'unematri edeséparation.Onpeut onsidérerlesstatistiques
d'ordre deux par l'intermédiaire delamatri e de orrélation lassique desobservations
R
x
(t, τ ) = E
x
(t)x(t − τ)
H
(2.21)
et/ou dele se ondematri e de orrélationdesobservations
R
′
x
(t, τ ) = E
x
(t)x(t − τ)
T
(2.22)
dansle asoùlessignauxsour essontnon ir ulaires.Dansle assansbruit,enremplaçant
x(t)
par sonexpression (2.17),on obtient dire tementR
x
(t, τ ) = AR
s
(t, τ )A
H
(2.23)R
′
x
(t, τ ) = AR
′
s
(t, τ )A
T
(2.24)oùlesdeuxmatri esde orrélationdessour es
R
s
(t, τ )
etR
′
s
(t, τ )
sontdiagonales arlessour es sont supposées statistiquement indépendantes.d'ordre quatresuivantes
C
x,a,b,c,d
= Cum {x
a
, x
∗
b
, x
c
, x
∗
d
}
(2.25)C
x,a,b,c,d
′
= Cum {x
a
, x
b
, x
c
, x
∗
d
}
(2.26)C
x,a,b,c,d
′′
= Cum {x
a
, x
b
, x
c
, x
d
}
(2.27)ave
1 ≤ a, b, c, d ≤ N
.Il doit être pré isé que les deux derniers types de statistique ne peuvent on erner que des
signaux non ir ulaires. A partirde es statistiques d'ordre quatre, il estpossible de onstruire
desmatri es dediérentes façons. La manière ertainement la plussimple onsisteà onsidérer
(M
x,c,d
)
a,b
= C
x,a,b,c,d
(2.28)M
′
x,c,d
a,b
= C
x,a,b,c,d
′
(2.29)M
′′
x,c,d
a,b
= C
x,a,b,c,d
′′
(2.30)Dansle assans bruit,enremplaçant
x(t)
parsonexpression (2.17),onobtient dire tementM
x,c,d
= AM
s,x,c,d
A
H
(2.31)M
′
x,c,d
= AM
′
s,x,c,d
A
T
(2.32)M
′′
x,c,d
= AM
′′
s,x,c,d
A
T
(2.33)où lesmatri es
M
s,x,c,d
= Cum {s
a
, s
∗
b
, x
c
, x
∗
d
}
(2.34)M
′
s,x,c,d
= Cum {s
a
, s
b
, x
c
, x
∗
d
}
(2.35)M
′′
s,x,c,d
= Cum {s
a
, s
b
, x
c
, x
d
}
(2.36)sont diagonales arles sour essont supposées statistiquement indépendantes.
Ainsi, à partir des statistiques d'ordre deux et/ou des statistiques d'ordre quatre, il est
possiblede onstruire desensemblesde matri essediagonalisant sousdeuxfa torisations
parti- ulières. Dans ette thèse, nous ne nous préo uperons que du as où les deux derniers indi es
sont identiques, i.e.
c = d
.Lesmodèles quenousutiliserons alors sont :M
x
= AM
s,x,c,c
A
H
(2.37)M
′
x
= AM
′
s,x,c,c
A
T
(2.38)On onsidèrera don desmatri eshermitiennes de laforme
M
i
= AD
i
A
H
i = 1, . . . , K
h
(2.40)ave
D
i
des matri es diagonales. Ce modèle dé rit de manière générique les dé ompositions onsidérées en(2.23) et(2.37).On onsidèrera aussidesmatri es omplexessymétriques de laforme
M
i
= AD
i
A
T
i = 1, . . . , K
s
(2.41)Ce modèledé it demanièregénérique lesdé ompositions onsidéréesen (2.24),(2.38) et(2.39).
2.3 Des ription de quelques algorithmes
Dans eparagraphenousdé rivonstroisalgorithmesdediagonalisation onjointedematri es
qui nousservironsde omparaison lors dessimulations informatiques.
Le s héma global pour l'algorithme U-WEDGEdé rit dans[70 ℄ est développé dansle
pseu-do odeAlgorithme 1 i-dessous. Pour ette méthode, lesensembles sont réels.
Algorithme 1:UWEDGE Critère:
J (B, A) =
P
N
i=1
kBΛ
i
B
T
− ADiag BM
i
B
T
A
T
k
2
for
k = 1, 2, . . .
jusqu'à onvergen e do Cal ulerR
si
= BM
i
B
T
pour
i = 1, . . . , N
Construire
R
= [diag(R
s1
), . . . , diag(R
sN
)]
etG
= RR
T
for
l = 1, . . . , N
s
,(oùN
s
estlenombre de olonnes) do Cal ulerC(l) =
P
N
i=1
R
si
(l) ⊘ R(i)
, ave⊘
le produittermeà terme. end for Cal ulerA
= I +
C
⊘G−Diag(G)C
T
(G⊘G
T
−diag(G)diag(G)
T
)+I
B
← A
−1
B
Les hémaglobalpourl'algorithmeACDCdé ritdans[75 ℄estdéveloppédanslepseudo ode
Algorithme2 i-dessous.Ilprenden omptel'utilisationdematri eshermitiennesousymétriques.
Algorithme 2:ACDC
Critère:
C
LS
(B, Λ
i
) =
P
N
i=1
kM
i
− BΛ
i
B
‡
k
2
for
k = 1, 2, . . .
jusqu'à onvergen e do if ACPhasethen Cal ulerP
=
P
N
i=1
w
i
λ
l
i
M
i
−
N
P
n=1
n
6=l
λ
n,i
b
n
b
‡
n
(H‡)
Séle tionnerlaplusgrande valeur propre
µ
,ainsi queleve teurβ
asso ié, deP
(si‡ = H
)ouQ
=
"
Real(P)
−Imag(P)
−Imag(P) −Real(P)
#
(si‡ = T
) ifµ = 0
thenb
l
= 0
else if‡ = H
thenb
l
=
β√µ
q
P
N
i=1
w
i
(
λ
l
i
)
2
elseb
l
=
(β(1)+jβ(2))√µ
q
P
N
i=1
w
i
|λ
l
i
|
2
endif endifelseif DC Phasethen
Cal uler
G
=
h
B
H
B
(T ‡)
⊙ B
H
B
i
−1
fori = 1, . . . , N
doΛ
i
= diag Gdiag B
H
M
i
B
(H‡)
endfor end ifLes hémaglobal pour l'algorithme FAJD dé ritdans[51 ℄est développé danslepseudo ode
Algorithme 3 i-dessous. Pour etalgorithme, lesensembles sont hermitiens.
Algorithme 3:FAJD Critère:
J (W) =
P
N
i=1
α
i
P
N
m=1
s
N
s
P
n=1
n
6=m
|
W
H
M
i
W
ij
|
2
− βlog|det(W)|
α
i
,β
sont des oe ientsde pondérationpositifs. fork = 1, 2, . . .
jusqu'à onvergen e dofor
m = 1, . . . , N
s
do Cal ulerQ
i
=
P
N
i=1
N
s
P
n=1
n
6=m
α
i
M
i
w
n
w
H
n
M
i
H
+ M
H
i
w
n
w
H
n
M
i
Trouver1 ≤ s ≤ N
s
et onstruireE
s,N
s
WE
n,N
s
=
"
G
u
g
H
v
#
,ave[E
s,t
]
m,n
=
1
sim = s, n = t
oum = t, n = s
1
sim = n
etm 6= s, t
0
sinondetellesorte que
G
soit inversible Cal ulerd
s
=
−g
H
G
−1
, 1
E
s,N
s
H
Rempla erla
m
ième olonnedeW
avew
optm
=
√
βQ
−1
i
d
s
√
2d
H
s
Q
−1
i
d
s
end for end forCes algorithmesfon tionnent dansdes adresdiérents ( fTable 1.1), enfon tion de :
ladimension de lamatri e ( arrée,re tangulaire),
desvariables (réelles, omplexes),
Algorithmes de Gradient
Dans equivasuivre,nousprésenterons unensembledeméthodesitérativesquiutilisentles
fon tionsde oûtprésentéesauparagraphe 2.1.2 etdesmisesàjour basées surlegradient.Cela
a déjà été onsidéré, en parti ulier dans [43 , 76, 26, 45 , 69℄. Nous allons généraliser ertaines
appro hesdansles deux as omplexes, mais aussiproposer dessimpli ations.
3.1 Des ription générale
Dans e hapitrenousallonsdévelopperunensembled'algorithmesdetypegradientan
d'es-timerlamatri ede séparation
B
parminimisationdu ritèreJ (B)
dont onrappelle l'expressionJ (B) =
N
X
i=1
kZDiag{BM
i
B
‡
}k
2
(3.1)Leprin ipe desalgorithmesde type gradientestrelativement simple,ils'agit, àpartir d'une
matri einitiale,de onstruiredemanièreitérativeuneestiméede
B
minimisantà haqueitération le ritère hoisi. En e qui on erne l'estimation d'une matri e, il existe deux grands types demiseà jour.Le premier typeest à unemiseà jour additive orrespondant à
B
← B + Z
a
où lamatri e
Z
a
est leterme de miseà jour dépendant du gradient du ritère.Ce premiertype est très lassique.En eet,en utilisant la dénitiondu gradient (1.8) àJ (B)
,on posepour un algorithme degradient lassiqueZ
a
= −µ∇J (B)
miseà jour multipli ative orrespondant à
B
← (I + Z)B
(3.2)où lamatri e
Z
estletermede miseà jour dépendant également dugradient du ritère.Ce deuxième type est moins lassique ar il ne peut orrespondre qu'au as matri iel. La
notiondegradient relatifdénie en(1.9),etappliquéeà
J (B)
,permetde onsidérerletermede miseà jour suivantZ
= −µ∇
r
J (B) = µF
(3.3)Deplus, ila étémontré dans[16 ℄,qu'il existaitun lienentrele gradient en
B
et elui enZ
∇
r
J (B) =
∂J (I + Z)B
∂Z
∗
Ilsetrouveque, dansnotre as,ladépendan edu ritèreparrapportàlamatri ere her hée
B
peutêtrerendue impli ite, e qui auraun grand avantage danslasuite.Il sut pour elade onsidérer une miseà jour enparallèle de l'ensemble onsidéré de matri es.Apartirde l'ensembleinitial eten posant
T
i
= BM
i
B
‡
(3.4)en utilisant lamiseà jour(3.2), le ritère
J (B)
peutseréé rireJ (Z) =
N
X
i=1
kZDiag{(I + Z) T
i
(I + Z)
‡
}k
2
(3.5)tout en onsidérant don une mise à jour en parallèle des matri es
T
i
en (3.4) de la manière suivanteT
i
← I + Z
T
i
I
+ Z
‡
(3.6)Une miseàjour multipli ative possèdedenombreux avantages dansle adrede notreproblème.
Tout d'abord elle permet(dansune ertainemesure, i.e.ave un passusamment petit)de
garderle ara tèreinversibledelamatri e
B
au oursdesitérations.Ils'agitd'unalgorithmede type gradient relatif,et ommemontrédans[76 ℄, elapermetd'avoirdesperforman esindépen-dantes de
B
. Eneet l'algorithmeglobal ne dépend quedeZ
.Ainsidanstoutela suite, ette seule miseàjour multipli ative sera onsidérée.
Le s héma global pour l'algorithme de gradient dé rit dans ette partie est développé dans
Algorithme 4:S héma Globalpour lesalgorithmes de gradient
Initialisation:Ensemble dematri es
M
i
,matri esinitalesB
(0)
for
k = 1, 2, . . .
jusqu'à onvergen e do Mise àjour desmatri esT
i
suivant (3.6)Cal ul dugradient ( lassique ou relatif) de(3.1)
Mise àjour de lamatri es
Z
ave (3.3) puisdeB
ave (3.2) end forµ
, f. (3.3).Dans le asle plussimple, e pasest xéà une ertaine valeur déniepar l'utilisa-teur. Cettestratégie très simple estlargement sous optimale.Une idée ourante onsiste alors àonsidérer e pas ommeun paramètresupplémentaire dansleproblème d'optimisationetdon
à le al uler à haqueitération par minimisation du ritère onsidéré.
Dansnotre asen reportant l'expressionde
Z
en(3.3) dans(3.5),ilestalors lairqueJ
est unefon tionquartiquedeµ
etquesaminimisationneposerapasdeproblème. C'est e quenous ferons danslasuite.3.2 Cal ul du gradient
Dans eparagraphenousallons al ulerlegradientdu ritèredansle ashermitienpuisdans
le assymétrique.Nousallonsaussidéterminerles oe ientsdupolynmededegréquatrepour
le al ul dupasoptimal.
3.2.1 Cas hermitien
On onsidère le ritèresuivant orrespondant au seul as hermitien
J
h
(Z) =
N
X
i=1
kZDiag{(I + Z) T
i
(I + Z)
H
}k
2
(3.7)Dans e qui suivra, seuls les résultats seront rappelés. Tous les développements des al uls
sont ee tués dansl'Annexe A.1.1.
Legradient de e ritère estdonné par laformule suivante:
∂J
h
(Z)
∂Z
∗
=
N
X
i=1
ZDiag
{(I + Z) T
i
(I + Z)
H
} (I + Z) T
H
i
+ ZDiag{(I + Z) T
i
(I + Z)
H
}
H
(I + Z) T
i
(3.8)3.2.2 Cas symétrique
On onsidère le ritèresuivant orrespondant au seul as symétrique
J
s
(Z) =
N
X
i=1
kZDiag{(I + Z) T
i
(I + Z)
T
}k
2
(3.9)Le al ul dugradient de (3.9),ee tuédansl'Annexe A.1.2, donne:
∂J
s
(Z)
∂Z
∗
= 2
N
X
i=1
ZDiag
{(I + Z) T
i
(I + Z)
T
} (I + Z)
∗
T
∗
i
}
(3.10) 3.2.3 Pas optimalLa re her he du pas optimal peut se faire de manière globale. En remplaçant
Z
, exprimé ommeen (3.3),dans (3.5),on obtient lepolynme suivant :J (Z) =
N
X
i=1
tr
a
i,0
+ µa
i,1
+ µ
2
a
i,2
+ µ
3
a
i,3
+ µ
4
a
i,4
(3.11)
dont les al uls sont développés dansl'Annexe B.1 ,et dont les oe ients
a
i,j
∀j = 0, . . . , 4
y sont donnés.Les hémaglobal pourla déterminationdu pasoptimal estdétaillé dansl'Algorithme 5:
Algorithme 5:PasOptimal
Init: oe ients
a
i,j
, j = 0, . . . , deg
avedeg
le degrédupolynme Détermination desra inesµ
de ladérivée dupolynme(3.11)µ
opt
= argmin
µ
{J (Z)}
3.3 Gradient et approximations du ritère
Dans un but de rédu tion de la omplexité des al uls, nous allons maintenant développer
plusieurs approximations du ritère initial permettant un al ul de gradient simplié. Ces
3.3.1 Approximations sur le ritère
Prin ipalement deux hypothèses simpli atri es peuvent être onsidérées. La première
on- erne le terme de mise à jour
Z
dans (3.2). En fait l'algorithme itératif est onstruit de telle façon que e terme de mise à jour tend à s'annuler an d'obtenir un point stationnaire. Ainsion peut supposer raisonnablement que, relativement rapidement, on ait
kZk ≪ 1
. Cela a deux onséquen es.La première onséquen e on erne larelation de mise à jour en (3.2) où
Z
n'intervient que par l'intermédiaire de la sommeI
+ Z
. Ainsi si l'on suppose que la norme deZ
est très petite alorslesélémentsdiagonauxdeZ
peuventêtre onsidéréstrèspetitsdevant1
orrespondantaux éléments diagonauxde lamatri e identitéI
.Ainsi,à lapla e de(3.2), onpeut onsidérer lanouvelle misesuivante
B
← (I + ZDiag{Z})B
(3.12)où lestermes diagonauxde
Z
sont négligésdevant1
.La deuxième onséquen e on erne dire tement le ritère
J (Z)
en (3.5). En eet, en sup-posantkZk ≪ 1
,alors au premier ordreon a(I + Z) T
i
(I + Z)
‡
≈ T
i
+ ZT
i
+ T
i
Z
‡
(3.13)onduisant à une approximation
J
a
1
(Z)
du ritèreJ (Z)
donnéeparJ
a
1
(Z) =
N
X
i=1
kZDiag{T
i
+ ZT
i
+ T
i
Z
‡
}k
2
(3.14)Unese onde hypothèse simpli atri e peutêtre onsidérée on ernant ettefoisles matri es
T
i
misesà jourau oursdesitérations en(3.6).En eetl'algorithme estaussi onstruitde telle façon que es matri estendent à devenir desmatri esdiagonales au ours desitérations.Ainsionpeuten ore raisonnablement supposer que, relativement rapidement, on ait
kZDiag{T
i
}k ≪ 1
Cela a la onséquen e suivante. Ennotant
T
D
i
= Diag {T
i
}
etT
Z
i
= ZDiag {T
i
}
(3.15)Ainsilemembre de droite de(3.13) peuten oreêtre appro hé par
T
i
+ ZT
i
+ T
i
Z
‡
≈ T
D
i
+ T
Z
i
+ ZT
D
i
+ T
D
i
Z
‡
(3.16)onduisant à une deuxième approximation
J
a
2
(Z)
du ritèreJ (Z)
déduite de (3.14) et donnée parJ
a
2
(Z) =
N
X
i=1
kZDiag{T
Z
i
+ ZT
D
i
+ T
D
i
Z
‡
}k
2
(3.17)Comme les deux approximations pré édentes ont la même expression, on peut les réé rire
sous laforme génériquesuivante
J
a
(Z) =
N
X
i=1
kZDiag{T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
‡
}k
2
(3.18) oùT
(1)
i
= T
(2)
i
= T
i
quandJ
a
1
(Z)
est onsidéré etoùT
(1)
i
= T
Z
i
etT
(2)
i
= T
D
i
quandJ
a
2
(Z)
est onsidéré.Unedernièreapproximationpeutêtreenvisagée.Eneetenutilisantlefaitque
kZDiag {·} k
2
=
tr
(·)
H
ZDiag
{·}
,où
tr
{·}
est latra ede lamatri e en argument, on aJ
a
(Z) =
N
X
i=1
tr
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
‡
H
ZDiag
n
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
‡
oo
(3.19) et en onsidérant de nouveau quekZk ≪ 1
, uneapproximation supplémentaireJ
b
(Z)
deJ
a
(Z)
est donnéeparJ
b
(Z) =
N
X
i=1
tr
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
‡
H
T
Z
i
+ T
(1)
H
i
ZDiag
n
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
‡
o
(3.20) aron a toujoursZDiag
{T
(1)
i
} = T
Z
i
.Demanièreexpli ite,lorsquequel'on posera
T
(1)
i
= T
(2)
i
= T
i
le ritèrepré édent seranotéJ
b
1
(Z)
etlorsque l'on poseraT
(1)
i
= T
Z
i
etT
(2)
i
= T
D
i
il seranotéJ
b
2
(Z)
. 3.3.2 Cas hermitienOn onsidèrelesdeux ritères
J
a
(Z)
etJ
b
(Z)
duparagraphe pré édent dansseul as hermi-tien.Onles notera alorsJ
a,h
(Z)
etJ
b,h
(Z)
etont lesexpressionsJ
a,h
(Z) =
N
X
i=1
kZDiag{T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
H
}k
2
(3.21)et
J
b,h
(Z) =
N
X
i=1
tr
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
H
H
T
Z
i
+ T
(1)
H
i
ZDiag
n
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
H
o
(3.22)Ledéveloppement du al uldu gradient de(3.21) est ee tuéen AnnexeA.2.1 etdonne :
∂J
a,h
(Z)
∂Z
∗
=
N
X
i=1
ZDiag
n
T
(1)
i
o
H
T
(2)
i
+ ZDiag
n
T
(1)
i
o
T
(2)
i
H
+ ZDiag
n
ZT
(2)
i
+ T
(2)
i
Z
H
o
T
(2)
i
H
+ ZDiag
n
ZT
(2)
i
+ T
(2)
i
Z
H
o
H
T
(2)
i
(3.23)tandis que l'onobtient legradient suivant pour (3.22) ( fexpli ation en AnnexeA.2.1) :
∂J
b,h
(Z)
∂Z
∗
=
N
X
i=1
ZDiag
n
T
(1)
i
o
H
T
(2)
i
+ ZDiag
n
T
(1)
i
o
T
(2)
i
H
(3.24) 3.3.3 Cas symétriqueOn onsidèrelesdeux ritères
J
a
(Z)
etJ
b
(Z)
duparagraphepré édentdansseul assymétrique. Onles notera alorsJ
a,s
(Z)
etJ
b,s
(Z)
etont les expressionsJ
a,s
(Z) =
N
X
i=1
kZDiag{T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
T
}k
2
(3.25) etJ
b,s
(Z) =
N
X
i=1
tr
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
T
H
T
Z
i
+ T
(1)
i
H
ZDiag
n
T
(1)
i
+ ZT
(2)
i
+ T
(2)
i
Z
T
o
(3.26)Le al uldesdérivées des ritères
J
a,s
(Z)
etJ
b,s
(Z)
par rapportàZ
∗
estee tuéenAnnexe
A.2.2, etdonne :