• Aucun résultat trouvé

5.5 Suivi de tête et de mains

5.5.1 Méthodes de ltrage temporel

Le problème du ltrage en temps discret dans un cadre markovien se présente de la

manière suivante : on considère l'état xt d'un système observé. L'évolution temporelle de

xt est fonction de l'état précédent xt−1 et du bruit ut :

xt= ft(xt−1, ut)

Les caractéristiques statistiques de ce processus (i.e. de la fonction ft(xt, ut)) sont

supposées connues. A l'instant t on recueille une observation yt qui est constituée d'un

signal représenté par une fonction ht(xt, vt) de l'état xt et du bruit de mesure vt :

5.5. Suivi de tête et de mains Les caractéristiques statistiques du bruit de mesure sont également connues. A l'ins- tant t, on dispose de l'historique des observations Yk= {y0, . . . , yt}; le but est d'obtenir

le plus d'informations possibles sur l'état du système xt. La solution est de calculer la

loi conditionnelle de xt sachant Yt ou, en d'autres termes, la densité de probabilité a

posteriori.

Si l'on se place dans un cadre gaussien (gure 5.21a) et que l'évolution de cette loi condi- tionnelle est régie par un système dynamique linéaire, le ltre de Kalman [Kalman 60] constitue une solution optimale et analytique à la problématique du ltrage.

Les techniques développées pour le cas linéaire peuvent s'étendre aux cas non linéaires par des méthodes de linéarisation locale. C'est le cas des ltres de Kalman étendu (Extended Kalman Filter) [Sorenson 85] [Uhlmann 92] et sans saveur (Unscented Kalman Filter) [Julier 97].

Pour les cas non linéaires, non gaussiens (gure 5.21b), l'évolution de la densité de proba- bilité a posteriori ne peut être déterminée analytiquement. D'autres approches basées sur l'approximation de cette densité sont alors envisagées. La densité de probabilité a poste- riori est approchée par une distribution empirique d'un ensemble d'échantillons aléatoires. C'est le principe du ltrage particulaire et en particulier de l'algorithme de ConDensAtion [Isard 98]. p(x) x p(x) x p(x) x p(x) x z dérive diusion stochastique Eet de la mesure p(x) x p(x) x z dérive diusion stochastique Eet de la mesure p(x) x p(x) x (a) (b)

Fig. 5.21: Propagation de la densité de probabilité de l'état dans le cas (a) où la densité est gaussienne. La propagation est linéaire et la densité reste gaussienne à toutes les étapes. C'est la diusion qu'eectue un ltre de Kalman. Dans le cas (b) où la densité est multimodale. Les étape sont : dérive déterministe dûe à la dynamique du procédé, diusion dûe au processus aléatoire et réaction (correction) de la courbe à la mesure. Figures tirées de [Isard 98]

5.5.1.1 Filtre de Kalman

Le ltre de Kalman est un estimateur linéaire récursif. Son but est de déterminer la meilleure estimation de l'état d'un système au vu des données observées. En d'autres termes, le ltre de Kalman vise l'estimation analytique récursive de la densité de proba- bilité a posteriori de l'état connaissant les observations. Le ltre de Kalman opère, après une étape d'initalisation, en deux étapes d'une manière récursive : une étape de prédic- tion puis une étape de mise à jour (ou correction) de la prédiction à chaque fois qu'une observation est disponible.

La phase de prédiction utilise l'état estimé de l'instant précédent pour produire une estimation de l'instant courant ainsi qu'une estimation de l'erreur sur cette prédiction. Dans l'étape de mise à jour, les observations de l'instant courant sont utilisées pour cor- riger l'état prédit dans le but d'obtenir une estimation plus précise.

Dans un modèle dynamique linéaire avec des mesures linéaires, il n'existe toujours qu'un seul pic dans les données a posteriori ; de petites non-linéarités dans les modèles dyna- miques peuvent donner naissance à un certain nombre de pics. Il peut donc être dicile de représenter les données a posteriori : pour être capable de calculer la moyenne et la covariance il faudrait pouvoir représenter tous ces pics.

La principale diculté lors d'un suivi en présence de dynamique non linéaire est de main- tenir une représentation satisfaisante de p(xk|y0, · · · , yk). Cette représentation doit être

capable de représenter de multiples pics dans la distribution et donc des solutions locales possibles et doit être capable de maintenir un vecteur d'état de grande dimension sans diculté.

5.5.1.2 Filtre particulaire

Le ltrage particulaire est une méthode dérivée des méthodes de Monte Carlo. Ces mé- thodes procèdent par la simulation des distributions de probabilité a posteriori de l'état (connaissant l'ensemble des observations). Elles proposent d'approcher ces distributions par des distributions d'échantillons tirés aléatoirement. Ces méthodes numériques sont utilisées pour la résolution des problèmes de ltrage Bayésien non linéaire étant donné leur exibilité vis à vis des dimensions des données, leur capacité à maintenir des distribu- tions de probabilité multimodales ainsi que leur adaptation à la non linéarité des modèles pris en compte. Plusieurs algorithmes sont basés sur les méthodes de Monte Carlo, ils sont connus sous le nom de bootstrap ltering [Gordon 93], l'algorithme de ConDensAtion (Conditional Density Propagation) [Isard 98], les ltres de Monte-Carlo [Kitagawa 96b], les ltres particulaire [Doucet 01].

La problématique des méthodes de Monte Carlo est l'estimation récursive dans le temps de l'état caché xtselon des observation z1:t = {z1, . . . , zt}. La séquence d'états (non obser-

vés) {xt, t ∈ N}, xt ∈ Rnx a une distribution initiale p(x0)et une distribution de transition

5.5. Suivi de tête et de mains étant la dimension du vecteur d'observation, ont une distribution d'observation fonction de leur vraisemblance. Lorsqu'il s'agit d'un processus Bayésien, toutes les informations

concernant l'état caché xt connaissant les observations jusqu'à l'instant t sont obtenues à

partir de la distribution a posteriori. En d'autre termes il s'agit d'estimer récursivement la distribution a posteriori p(xt|z1:t)de l'état xtconnaissant l'ensemble des observations z1:t.

Dans le cas non-linéaire non gaussiens, il est souvent impossible d'évaluer analytiquement cette distribution ; on procède alors par échantillonnage pour l'approximer.

Les ltres particulaire sont une classe de méthodes séquentielles de Monte Carlo. Ils sont basés sur l'approximation récursive des densités de probabilité a posteriori de l'état (connaissant l'ensemble d'observation) par des distributions d'échantillons aléatoires aux- quels sont associés des poids discrets de probabilité. Ces échantillons sont connus sous le nom de particules : à l'instant t, une particule i correspond à un échantillon aléatoire représenté par la paire (s(i)t , π

(i)

t ), où s (i)

t est une hypothèse d'état (une réalisation de la

variable aléatoire xt∈ X, avec X l'espace d'état) et π(i)t ∈ [0, 1] un poids proportionnel à

sa probabilité (voir gure 5.22).

Densité a posteriori Poids échanitllonné Probabilités Etat x

Fig. 5.22: Représentation de la densité de probabilité a posteriori accompagnée des poids as- sociés. Un ensemble de points s(n), correspondant aux centres des blobs, est échan-

tillonné aléatoirement à partir d'une densité a priori p(x). À chaque échantillon est associé un poids πi (illustré par la taille des blobs) proportionnel à la densité ob-

servée p(z|x = s(n)). L'ensemble des points pondérés représente alors la densité a

posteriori utilisable pour l'échantillonnage. Schéma tiré de [Isard 98]