L’algorithme du gradient stochastique - Identification aveugle “en boucle”

3.4 Identification aveugle “en boucle”

3.4.1 L’algorithme du gradient stochastique

La structure générale de ces systèmes est donnée sur la figure (3.3). Le signal observé o(n) est issu du filtrage d’un bruit blanc parfait (suite de variables aléatoires indépendantes) e(n) par le filtre direct de réponse impulsionnelle d(k).

o(n) =)

IDENTIFICATION AVEUGLE Non param´etrique

boucl´e, §3.4 Crit`eres non quadratiques, p. 112 kurtosis p. 114

Godard p. 116 Sato p. 116

en fréquence, §3.5 Méthode récursive linéaire p. 120 Moindres carrés, p. 121

M´ethode de projection, p. 122 Retard de groupe, p. 122 Param´etrique

filtre MA, §3.6.2 Formule C(q, k), p. 128 M´ethodes alg´ebriques, p. 129 Optimisation, p. 132

Multicepstre, p. 133

filtre AR, §3.6.3 Yule-Walker ordre sup´erieur, p. 134 filtre ARMA, §3.6.4 p. 135

Tab. _{3.1 – Synthèse des méthodes d’identification aveugles présentées dans ce} chapitre

On cherche un filtre inverse transversal d´ecrit par sa r´eponse impulsionnelle de longueur finie i(k) pour −p1 ≤ k ≤ p2, donnant en sortie s(n) via

s(n) =)

p i(k)o(n − k)) = i T_o(n),

avec iT _{= (i(−p}

1) . . . i(p2)) et oT(n) = (o(n + p1) . . . o(n − p2)). Dans le cas

général, le filtre cherché peut contenir une partie causale 0 ≤ k ≤ p2 et une

partie non-causale −p1 ≤ k < 0.

Le bruit blanc d’entrée e(n) et la sortie s(n) sont reliés par le filtre global (figure (3.3)) de réponse impulsionnelle t(k) par

s(n) = )

p t(p)e(n − p).

(3.5) Pour obtenir le filtre inverse on minimise un critère V (s) dépendant de la sor- tie3_{. Les signaux traités étant aléatoires, le critère est généralement un moment} 3_{En physique on rencontre le même problème de minimisation de l’énergie des systèmes}

Système total o(n) s(n) d(k) SLS FI i(k) e(n) i.i.d

Fig. _{3.3 – Le filtre inverse} du type

V (s) = E[v(s)].

La convergence vers le filtre inverse est obtenue par une méthode du gradient [101, 132, 135, 198]. En pratique on ne peut pas calculer l’espérance mathématique donnant V (s). On la remplace par sa valeur instantanée v(s). On obtient alors une méthode d’adaptation dite du gradient stochastique [132, 172].

Pendant la période d’adaptation du filtre sa réponse impulsionnelle est variable, nous la noterons i(n). En théorie, i(n) doit tendre vers une limite. A la convergence le filtre devient donc stationnaire en moyenne. En réalité, par suite des erreurs d’estimation, le filtre ne se stabilise jamais complètement. . .

L’adaptation du filtre est obtenue par

i(n + 1) = i(n) − µ∇v [s(n)] ,

o`_{u ∇V (s) est le gradient de V par rapport aux coefficients du filtre, et µ est} une constante dont la valeur fixe la vitesse de convergence et l’amplitude des fluctuations résiduelles de la réponse impulsionnelle estimée.

Quand on utilise un critère quadratique (ordre 2) µ doit être inférieur à une valeur déterminée pour assurer la convergence [198]. On peut faire diminuer la valeur de µ lorsque l’on approche de la convergence [135].

Cette technique est très étudiée dans les méthodes utilisant des critères quadratiques. Elle s’appelle alors la méthode des moindres carrés moyens et une très vaste littérature a été consacrée à ce sujet [101]. Les principales variantes portent sur la structure du filtre estimé : transversal comme ici, en treillis [97, 137]. . .On peut également définir le filtre en temps, en fréquence [163], on peut optimiser la vitesse de convergence : moindres carrés. . .

En résumé l’algorithme du gradient stochastique s’écrit

s(n) = iT_(n)o(n),

i(n + 1) = i(n) − µ∇v[s(n)].

Parfois i(n) = 0 est une solution des algorithmes de minimisation. Pour éviter de converger vers cette solution triviale on impose des contraintes à la réponse impulsionnelle. Les contraintes imposées sont généralement soit4

i0 = 1 soit ||i||2 = iTi = 1. On obtient alors un algorithme de minimisation

sous contrainte.

On peut voir l’algorithme du gradient stochastique de la fa¸con imagée suivante. Le filtre est un randonneur qui se déplace dans un terrain boisé (ce qui ne lui permet pas de voir à distance) dont la topographie est fixée par le critère. Le randonneur ne possède pas de carte mais dispose d’un niveau à bulles lui permettant de mesurer la pente du sol exactement sous ses pieds. Le randonneur veut atteindre le point le plus haut (ou le plus bas mais, pour les randonneurs nous opterions plutôt pour le point le plus haut. . .) du territoire. Il va donc chercher à monter constamment en mesurant, grâce à son niveau à bulles, la déclivité du sol. Le sol, comme les signaux, est aléatoire (mottes de terre, touffes d’herbe, fourmilières. . .) la déclivité locale mesurée est donc le gradient stochastique :

∇v[s(n)].

Le randonneur peut “optimiser” sa route : moindres carrés. Le randonneur doit également adapter l’amplitude de ses pas par µ. Lorsque le randonneur est près du but on imagine que si ses pas sont d’amplitude constante il va osciller autour du sommet, voire redescendre. Pour se rapprocher du sommet il doit donc faire des pas de plus en plus petits (diminution de µ). Le cas des algorithmes sous contraintes est ici celui du randonneur qui veut atteindre le sommet en suivant un chemin. On lui suggère alors deux solutions. Soit se contenter de mesurer la pente le long du chemin : c’est le plus simple pour un randonneur. Soit mesurer la pente sans tenir compte du chemin, faire un pas dans la direction trouvée et regagner le point du chemin le plus proche de sa nouvelle position : c’est le plus simple pour les systèmes adaptatifs. Quand le randonneur peut enfin se reposer sur le sommet tant désiré il a le temps de se poser la grave question suivante : ai-je atteint le véritable sommet ? Seule la métaphysique du critère, c’est-à-dire les propriétés générales du critère (concavité par exemple), lui permettra de s’assurer de ce résultat. Si il dispose d’un altimètre, on lui suggère une solution (fatigante) qui consiste à repartir d’un autre point et à recommencer de multiples fois son ascension. Il verra bien à la fin si il rencontre, ou non, un sommet plus élevé : c’est la méthode du recuit simulé dont le nom semble bien adapté à cette histoire de randonneur. . . Les méthodes du gradient stochastique ont été développées avec des critères quadratiques qui ont l’avantage d’être concaves. Dans le contexte considéré ici (identification aveugle) ces méthodes permettent de trouver un filtre blanchisseur mais elles ne donnent pas forcément le filtre inverse. Pour

4_i

0 est la r´eponse impulsionelle au temps 0, et donc la premi`ere composante du vecteur filtre dans le cas causal.

obtenir le filtre inverse il faut utiliser un critère plus complexe ce qui fait ap- paraˆıtre dans le traitement des moments ou des cumulants d’ordre supérieur à 2. Après avoir présenté une vue d’ensemble, nous donnerons une solution simple et élégante de ce problème due à [185], nous discuterons les propriétés des algorithmes que l’on appelle les algorithmes de Bussgang [39] et nous les illustrerons sur des exemples.

Dans le document Statistiques d'ordre supérieur pour le traitement du signal (Page 109-113)