• Aucun résultat trouvé

Suivi visuel par filtrage particulaire. Application à l'interaction homme-robot

N/A
N/A
Protected

Academic year: 2021

Partager "Suivi visuel par filtrage particulaire. Application à l'interaction homme-robot"

Copied!
172
0
0

Texte intégral

(1)

HAL Id: tel-00139428

https://tel.archives-ouvertes.fr/tel-00139428

Submitted on 30 Mar 2007

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

l’interaction homme-robot

Ludovic Brèthes

To cite this version:

Ludovic Brèthes. Suivi visuel par filtrage particulaire. Application à l’interaction homme-robot.

Automatique / Robotique. Université Paul Sabatier - Toulouse III, 2005. Français. �tel-00139428�

(2)

THÈSE

Présentéedevant

l'Université Paul Sabatier de Toulouse

Envuede l'obtention du

Do torat de l'Université Paul Sabatier de Toulouse

Spé ialitéRobotique

par

Ludovi Brèthes

Équipe d'a ueil: LAAS-CNRS É ole Do torale: EDSYS

Titre de lathèse :

Suivi visuel par ltrage parti ulaire.

Appli ation à l'intera tion Homme-Robot

soutenue le13 dé embre 2005 devantla ommission d'examen

Rapporteurs M. Frédéri Jurie Chargé de Re her he CNRS, GRAVIR,Grenoble

M. Patri k Pérez Dire teur de Re her he IRISA/INRIA, Rennes

Examinateurs M. Raja Chatila Dire teur de Re her he CNRS, LAAS,Toulouse

M. Patri e Dalle Professeur,UPS,IRIT(Toulouse) Dire teursde thèse M. Frédéri Lerasle MCf,UPS, LAAS,Toulouse

(3)
(4)
(5)

Avant tout,il onvientde remer ier MalikGhallab, pour m'avoira ueilli dansson laboratoire.

Mesremer ieme nts vont également à RajaChatila,qui m'a a ueilliausein de son groupe dere her he et aprésidémon juryde soutenan e.

Je remer ie sin èrement MM. Frédéri Jurie et Patri k Pérez d'avoir a epté de rapporter ette thèse,ainsiqueM.Patri eDalled'avoireu lagentillesse defaire partie demon juryde soutenan e.

Cestroisannéesdethèsen'auraientpaspusedéroulersanslaprésen eetlesoutien deFrédéri et Patri kmes o-dire teurs de thèse, 'estpourquoije lesremer ie haleu-reusement de leur aide. Ils ont été très présents et ont su me onseiller et m'aiguiller lorsquej'enavaisbesoin.J'ai appré iéletravaildans etteéquipedynamiqueetsoudée quenousavonsformée.

Faire une thèse est une expérien e qui demeure enri hissante à tout point de vue. LestroisanspassésauseindugroupeRIAm'aurontbeau oupappriset elaaura aussi été un moyen de ren ontrer de nombreuses personnes qui d'une façon ou d'une autre ont ontribué à la réussite de e travail. Je voudrais tout d'abord remer ier Vin ent ave qui j'ai partagébeau oupde hosesà ommen er par lebureau, les afés,les fous rires, le stress,... un grand mer i aussi à ThierryP et Aurélie qui ont été làdepuis le débutetm'ontaidélorsquej'enavaisbesoin,sansoublierSylvainA(mer ipourle oup de pou e), Jérme et Jean-Mi hel qui ont aussi ététrès présents es dernières années. Naturellement, jeremer ie aussitouslesautres do torantset stagiairesave qui j'aieu des onta ts à la fois pour le travail et les loisirs, je pense parti ulière ment à Gabriel, SylvainJ,Mathias,Léonnard,Guillaume,Léo,Thomas,Olivier,Efrain,Aymeri ,etbien d'autresen ore...Jevoudraisaussiadressermesremer ieme nt sàPauloetJean-Bernard quim'ontbeau oupaidéàmonarrivée,ainsiqu'àViviannequim'agentillementa ueilli danssonbureauet quiatoujours suserendre disponible eta étédebon onseil,mer i aussiàThierry S.

Enn je remer ie de tout oeur toute ma famille pour son soutien inestimable et sonen ouragem ent permanent. Je remer ie tout parti ulière ment Hélène pour m'avoir supportémême danslesmoments les plusdi iles, 'est ertainement grâ e àelle que jesuis arrivéjusqu'i i.

(6)
(7)

Remer iements 1

Table des matières 2

1 Introdu tion 7

1.1 Contextegénéral . . . 7

1.2 Etatde l'artet positionnement de nostravaux. . . 8

1.3 Organisationdu manus rit . . . 15

2 Estimation par ltrage parti ulaire 17 2.1 Généralités . . . 18

2.1.1 Formalisation du problème . . . 19

A Modélisation . . . 19

B Leltrage Bayésienoptimaletsasolutionré ursiveexa te 19 2.1.2 Filtrageparti ulaire . . . 21

A Méthodes d'approximatio n deMonte Carlo . . . 21

A-1 Prin ipe . . . 21

A-2 É hantillo nnage idéal . . . 22

A-3 É hantillo nnage préférentiel . . . 22

B Appli ation àlaproblématique du ltrage . . . 23

B-1 É hantillo nnage préférentiel . . . 23

B-2 É hantillo nnagepondéréséquentieletméthode séquentielle deMonte Carlo . . . 24

2.1.3 Di ultéset leviers . . . 26

A Dégénéres en e de l'algorithme . . . 26

B Choix de lafon tion d'importan e  Stratégieré ursive optimale . . . 27

C Introdu tion duréé hantillo nnage  Vers unalgorithme générique de ltrage parti ulaire . . . 28

D Autresstratégiesderéé hantillo nnageetd'é hantillonnage 31 D-1 Réé hantillonna ge pondéré . . . 31

D-2 É hantillo nnage partitionné . . . 31

D-3 É hantillo nnage hiérar hisé . . . 34

(8)

F Complément s . . . 36

2.2 Stratégies d'é hantillo nnage simples . . . 36

2.2.1 Fon tion d'importan e baséesur ladynamique(

FID

) . . . 36

2.2.2 Fon tion d'importan e baséesur lesmesures (

FIM

) . . . 38

2.2.3 Extensions . . . 40

A Combinaison de fon tionsd'importan e . . . 40

B Améliorationspar leréé hantillo nnage . . . 41

2.3 Versle asoptimal . . . 46

2.3.1 Stratégie Auxiliary . . . 47

2.3.2 Stratégie Uns ented . . . 51

A Transformée uns ented . . . 52

B Filtre deKalman uns ented . . . 53

C Filtre parti ulaireuns ented . . . 54

2.3.3 Stratégie mixte . . . 54

2.4 Synthèse . . . 55

3 Attributs visuels pour le ltrage parti ulaire 59 3.1 Introdu tion . . . 59

3.2 Attributmouvement . . . 60

3.2.1 Généralités . . . 60

3.2.2 Fon tionsd'importan e asso iées . . . 62

3.2.3 Fon tionsde mesureasso iées . . . 63

3.3 Attribut ouleur . . . 63

3.3.1 Généralités . . . 63

3.3.2 Classi ation despixelspar leurs ouleurs . . . 64

3.3.3 Segmentatio n enrégions peau . . . 65

3.3.4 Fon tionsd'importan e asso iées . . . 69

3.3.5 Fon tionsde mesureasso iées . . . 69

3.4 Attributforme . . . 71

3.4.1 Généralités . . . 71

3.4.2 Cara térisation des ontours d'images ouleurs . . . 72

3.4.3 Déte tion derégions ir ulaires . . . 73

3.4.4 Déte tion devisages . . . 74

3.4.5 Fon tionsd'importan e asso iéés . . . 75

3.4.6 Fon tionsde mesureasso iées . . . 76

3.4.7 Combinaisonave lesautres attributs danslafon tion de mesure 79 3.4.8 Fusion ave les autres attributs danslafon tion de mesure. . . . 81

3.5 Évaluationglobale . . . 83

3.5.1 Cal ul desé art-typesrelatifs auxfon tions demesure . . . 84

3.5.2 Fon tionsde mesure . . . 84

3.5.3 Fon tionsd'importan e . . . 89

(9)

4 Suivi pour l'intera tion Homme-Robot 95

4.1 Modalités d'intera tion et dé linaisondesfon tions visuelles asso iées. . 95

4.1.1 Contextegénéral . . . 95

4.1.2 Ra kham: lerobot guidede laCitéde l'Espa e . . . 96

4.1.3 Des riptiond'un s énario type . . . 97

4.1.4 Modalités d'intera tio n-Fon tions desuivi asso iées . . . 97

4.1.5 Proto ole d'évaluation . . . 99

4.2 Suivipour l'intera tion proximale . . . 100

4.2.1 Considérationsgénerales . . . 100

4.2.2 Fon tionsde mesureenvisagées . . . 100

4.2.3 Fon tionsd'importan e et stratégies deltrage envisagées . . . . 101

4.2.4 Evaluation desstratégiesde ltrage envisagées . . . 103

4.2.5 Dis ussion . . . 106

4.3 Suivipour l'intera tion à mi-distan e . . . 106

4.3.1 Considérationsgénérales . . . 106

4.3.2 Fon tionsde mesureenvisagées . . . 107

4.3.3 Fon tionsd'importan e et stratégies deltrage envisagées . . . . 108

4.3.4 Évaluation desstratégiesde suivi envisagées . . . 108

4.3.5 Dis ussion . . . 114

4.4 Suivipour lasurveillan e . . . 115

4.4.1 Considérationsgénérales . . . 115

4.4.2 Fon tionsde mesureenvisagées . . . 116

4.4.3 Fon tionsd'importan e et stratégies deltrage envisagées . . . . 117

4.4.4 Évaluation desstratégiesde ltrage envisagées . . . 117

4.4.5 Dis ussion . . . 123

4.5 Con lusion. . . 123

5 Re onnaissan e de gestes 127 5.1 Généralités . . . 127

5.2 Filtrageparti ulaire et systèmesdynamiques àsauts Markoviens . . . . 132

5.2.1 Généralités . . . 132

5.2.2 L'algorithme mixed-state

CONDENSATION

 . . . 134

5.2.3 Unestratégie

AUXILIARY

_

UNSCENTED

pour l'estimation du ve teur d'état dessystèmesà sauts Markoviens . . . 135

5.3 S énario et modalitésd'intera tio n gestuelle asso iées. . . 136

5.4 Intera tion gestuelle pour le hangement de but . . . 138

5.4.1 Considérationsgénérales . . . 138

5.4.2 Fon tion demesure envisagée . . . 139

5.4.3 Évaluation. . . 139

5.5 Intera tion gestuelle pour l'apprentissage du prénom . . . 142

5.5.1 Considérationsgénérales . . . 142

5.5.2 Fon tion demesure envisagée . . . 143

(10)

Bibliographie 160

(11)

Introdu tion

1.1 Contexte général

Un dé dela Robotiqueaujourd'hui est sansdoute elui durobot personnel. Cette perspe tive pose leproblème essentiel de l'intera tion et de la relation de l'homme au robot.Un obje tif majeurest unrobot mobile autonome quinavigue dansun environ-nementdegrandesdimensionsenprésen edepubli .Lorsdesesdépla ement s, lerobot doitêtre apable de déte ter et de prendre en ompte de manièreexpli ite la présen e de personnes dans son voisinage pour les éviter ou leur éder le passage, le but étant defa iliteret desé uriserleurs dépla ements.Plusqu'un simpleusager de l'environne-ment qu'il partage ave les humains, le robot doit en outre pouvoir interagir ave es derniersparlare onnaissan edegestesélémentairespourl'exé utiondetâ hesdé idées pareux: asservissement surleursdépla ement s, apprentissagesupervisé,manipulatio n d'objets,...

Dans e ontexte, les travaux présentés i i portent plus spé iquement sur la dé-te tion, le suivi de personnes et la re onnaissan e de gestes élémentaire s à partir du ot vidéo d'une améra ouleur embarquée surun robot mobile. Le robot évolue dans desenvironnementsd'intérieur(espa es ouverts onne tés par unréseau de ouloirs) a priori en ombrés et sujets à des hangements d'illumination. Il est alors opportun de gérer à haque instant plusieurs hypothèsessurles paramètres àestimer et d'exploiter plusieurs sour esde mesures.

Les fon tionnalités visuelles proposées doivent don être tout à la fois robustes et simples.Lesfon tionsdesuivi devront êtrerobustes(i)auxmouvementsa priori quel- onquesdela ible(translation,rotation,zoom),pouvantdonnerlieuàdeso ultations, (ii)aux onditionsdeprisesdevue( hangement sd'illumination, s ènesen ombrées, a-mérastatiqueou non,présen edeplusieurs objetsmobiles).Lasimpli itéestrelativeà l'implément ation. Elle implique l'estimation d'un faible nombre de paramètres an de répondreà des ontraintes temporelles fortes.

Dans e travail,nous nous limiterons à une analyse spatio-tempore lle dans le plan image arelle est susamment pertinente du point de vuedesmodalités d'intera tion

(12)

et pour permettre l'exploitation desrésultatspar d'autresmodulesde l'ar hite turedu robot e.g.plani ation de traje toire, surperviseur, plani atio n detâ hes, et .

Enn, es appro hes 2D sont peu onsommatri e s de ressour es CPU et ne om-promettent don pasl'exé ution desautres fon tionnalités né essairesàl'évolution au-tonome du robot. Par exemple, tout dépla ement au long ours du robot impose une réa tualisation de saposition dans la arte qu'il onstruit de l'environnement , et don l'a tivation, entre autres, des modules d'a quisition et de traitement desdonnées pro-prio eptiveset extéro eptives.

1.2 Etat de l'art et positionnement de nos travaux

Le suivi visuel sedénit onventionnellement omme le pro essus d'estimation des attributsdela ibledansleotvidéo.Cesattributssontrelatifsàlaposition/dynamique, laforme(sielleest onnuea priori)et l'apparen edela iblesuivie.Sonapparen e est liée aux ara téristiques image quel'onpeut extrairede larégion d'intérêt asso iée.

Lesappro hestraitant dusuivivisuelde l'hommesont nombreusesdansla ommu-nauté et il serait présomptueux et illusoire de vouloir toutes les référen er. Disso ions d'emblée les appro hes 2Ddes appro hes 3Dqui sortent du adre de ette thèse pour lesraisonsévoquéespré édemment .Pour plusdedétailssurlesappro hes3D,lele teur pourra seréférerà [Moeslundet al.,2001, Smin hises u, 2002℄.

Revenons un à un sur les attributs listés pré édemment . Certains travaux onsi-dèrent naturellement l'attribut forme en exploitant la silhouette de tout ou partie des limbes orporels. Citons les travaux sur les ontours a tifs, notamment les snakes pour Isard et Blake [Isard et al.,1996b℄ ou les équations aux dérivées partielles pour Paragios et Deri he [Paragioset al.,2000℄. Ces te hniques permettent de prendre en ompte les déformations d'une forme prototype ( template). Des variantes onsistent à dénir un modèle statistique hiérar hique [Kervrannet al.,1996℄ voire à gérer plu-sieurs formes prototypes [Gavrila,2000℄ pour estimer les déformations. Les méthodes d'analyse estimant à la fois le mouvement et la stru ture des membres né essitent de résoudre un problème omplexe et onduisent parfoisà des solutions instablesen pré-sen e de bruit. Des perturbations sont ependant in ontournables lorsqu'au une res-tri tion ou hypothèse n'est faite quant au ontexte de la prise d'images. La prise en ompte de es onsidérations et la volonté de simplier au maximum la modélisation font que nos fon tions de suivi exploitant la forme privilégient une forme prototype grossièrenondéformable.Certains onsidérentdessilhouettesplusoumoins approxima-tives[Isard et al.,1998b℄oudesformesgéométriquestellesquedesellipsespourlesuivi devisage[Bir held, 1998,S hwerdtet al.,2000,Wageneret al.,2003,Ruiet al.,2001℄ ou desellipseset des er les pour lesuivi de lamain[Bretzner et al.,2002℄.

Certainstravauxexploitentl'apparen edela ibledanslesdiérentesimagesduot vidéo.Letemplateasso iéestreprésenté pardesimagespropres[Blakeet al., 1998a℄ou régions d'intérêt [Jurie et al.,2002℄ en niveaux de gris, un sous-ensemble de points de ontours[Huttenlo her et al., 1993℄,laphasedeltresenondelettes[Jepsonet al.,2001℄

(13)

S hwerdt et al.,2000, Wuet al., 2001℄. L'information de ouleur est i i modélisée par une ou plusieurs Gaussiennes [Wu et al.,2001, Thayananthan et al.,2003℄, une Look-Up-Table [Kawato et al.,2000℄ ou deshistogrammes normalisés [S hwerdtet al.,2000, Comani iuet al.,2000, Nummiaro et al.,2003, Pérez et al.,2004℄. Ces histogrammes, onnus pour leur robustesse aux o ultations, leur onfèrent un grand intérêt pour le suivi.

Cemodèled'apparen epeutrésulterde onnaissan esapriori issuesd'un apprentis-sagehors-ligne,parexempledela ouleurpeau[S hwerdt et al.,2000,Pérez et al.,2004℄, d'imagespropres[Blakeet al.,1998a℄oudesvariationsdeluminan easso iéesaux mou-vements image [Jurieet al.,2002℄. Sans onnaissan e a priori, l'apparen e de la ible doit être apturée dans leot vidéo, par exemple par une segmentation sur le mouve-ment.Cettedémar heestparti ulièrementadaptéeauxappli ationsdesurveillan epour lesquelles l'arrière-plan est supposé plus ou moins stationnaire [Kawato et al.,2000, Haritaoglyet al.,2000, Isardet al.,2001℄. Elle permet de s'aran hir des fausses me-sures liées à l'arrière-plan mais reste subordonnée à des hypothèses restri tives quant auxmouvementsobservésdansla s ène.Plus globalement , l'initialisation du suivi (ou sa réinitialisation) dépend de la déte tion souvent ad ho de la ible qui exploite le ontextegénéral desprisesdevue[Isard et al.,1998a,Nummiaro et al.,2003℄and'en fa iliterlepro essus.

En présen e de s ènes en ombrées, une démar he plus générique est de mixer plusieurs informations dans le template , par exemple ouleur et forme dans [Isard et al.,1998b, Bir held, 1998, Daviset al.,2000, Wuet al.,2001, Bretzneret al., 2002℄, ouleur et mouvement dans [Spengler et al.,2001, Pérez et al.,2004℄, ouleur et son dans [Pérez et al.,2004℄, images d'intensité et mouvement dans[Blake et al.,1998a℄.

Les hangements d'illumination, les o ultation s et mouvements de la ible im-pliquent la mise à jour de son apparen e durant le pro essus de suivi. Cette mise à jour peut trivialement onsidérer l'apparen e du template dans l'image pré é-dente[Papanikolopoulos et al.,1993℄maisunetellestratégieestsujetteàdérivesdansle tempsvoireé houeenprésen ed'o ultationsetde hangementsd'illuminationbrutaux. Un ltrage de l'apparen e , sous l'hypothèse de variations lentes, est souvent appliqué, par exemple dans[Nguyenet al.,2001, Nummiaro et al.,2003℄.

Pour en simplier la formulation, les appro hes disso ient souvent le ltrage de l'apparen e du ltrage de la position et dynamique de la ible [Wu et al.,2001, Jepsonet al.,2001, Nguyen et al.,2001, Vermaaket al.,2002a, Nummiaro et al.,2003℄.Lesappro hesreposent alors majoritairementsurleltrage de Kalman [Blake et al.,1993, Huttenlo her et al.,1993, Papanikolopo ulos et al.,1993, S hwerdt et al.,2000℄, le gradient du ritère - e.g. meanshift [Comani iu et al.,2003℄ ou ses variantes [Bradski,1998, Chenet al.,2001℄-, enn les te hniques de ltrage parti ulaireet ses variantes, itonspar exemple[Isard et al.,1996a, Isardet al.,1998 , Ma Cormi ket al.,2000, Nummiaro et al.,2003, Tormaet al.,2003℄.

(14)

sont très adaptées à e ontexte. Il s'agit de méthodes de simulation séquentielles de type Monte Carlo permettant l'estimation du ve teur d'état d'un système Markovien nonné essairement linéaire soumisàdesex itations aléatoirespossiblementnon Gaus-siennes [Blakeet al., 1998a℄. Ce formalisme générique permet ainsi de s'aran hir de toute hypothèse restri tive quantaux distributions de probabilitésentrant en jeu dans la ara térisation duproblème.

Isard etBlakedans[Isard et al.,1996a℄ sontles premiers àexploiterle ltrage par-ti ulairepour lesuivi visuel. Ilsintroduisent l'algorithme bien onnu de CONDENSA-TION -pourConditionalDensity Propagation -qui s'appuiesurunefon tion d'impor-tan e relative à la dynamique du système pour propager les parti ules dans l'espa e d'état. Ce i onfère à laCONDENSATION une stru ture prédi tion/miseà jour om-parable à elle du ltre de Kalman mais sans restri tion à des modèles probabilistes Gaussiens. Les auteurs montrent les limites du ltre de Kalman sur des séquen es de suivide visages en milieuxen ombréspour lesquelsles ditributionsde probabilité sont multi-modales.Dans esexemples,l'estimation deladensitéde probabilité aposteriori duve teurd'étatreposesurunefon tiondemesurerelativeàlaseuleformeduvisageet aux ontoursextraitsdansl'image ourante.Cetalgorithmein ontournableestsouvent mis en ÷uvre et utilisé omme référen e pour la omparaison ave d'autres stratégies de ltrage.

Ces mêmes auteurs introduisent dans [Isardet al.,1998 ℄ une extension de la CONDENSATION ( mixed-state CONDENSATION) an de gérer des variables onti-nues et dis rètes dans le ve teur d'état. Dans leur appli ation, une variable dis rète indexe le modèle de dynamique asso ié à la ible parmi une bibliothèque donnée de modèles de mouvements anoniques apparents. L'évolution du paramètre dis rêt entre les diérents modèles est gérée par une matri e de transition ontenant les probabili-tés de transition. Le suivi et la re onnaissan e du modèle le plus vraisemblable s'ef-fe tuent simultanément. Les auteurs illustrent leur appro he sur des séquen es d'une main ee tuant un dessin où les modèles de dynamique utilisés sont : ourbe, trem-blement et arrêt. Une appli ation au suivi simultané de deux personnes est proposée dans[Ma Cormi ket al.,1999℄.Lavariabledis rètepermeti idegérerleso ultation s mutuelles entreles deuxsujets.

L'algorithme de ICONDENSATION proposé par Isard et al. dans

[Isard et al.,1998a℄ est une autre extension de la CONDENSATION. Les auteurs dénissent une stratégie de ltrage qui ombine à la fois des informations visuelles bas-niveau et des mesures haut-niveau, où ertaines parti ules sont é hantillonn ées selonune fon tiond'importan e relativeà unemesurevisuelleseule (déte tionde blobs ouleurs) alors que d'autres suivent la dynamique du pro essus d'état sous-ja ent. Au nal, la densité de probabilité a posteriori du ve teur d'état est mise à jour par re alaged'unmodèlede ontouri.e.lasilhouetted'unemain.Cettestratégiedeltrage permet entre autre, la réinitialisation du ltre même si la déte tion de blobs peau est génératri e de faussesmesures pour dess ènesen ombrées.

(15)

d'im-lespartiesduve teur orrespondantàl'innovation 1

.Ilssoulignentlerisquede ontra-di tion pouvant survenir dès lors que le nouvel état est tiré indépendamment de son passé et proposent des extensions assurant de onserver dans ette situation la ohéren e entre les parties historique et innovation des parti ules. Le prin ipe est de séle tionner par des réé hantillo nnages des paires d'innovation et d'historique qui ont une probabilité élevée de o-o uren e. Dans l'arti le,trois algorithmes sont proposés. Lepremiernommé

HSSIR

pour HistorySamplingSamplingImportan eResampling ré-é hantillonne les partiesinnovations selon leurprobabilités d'o uren e, puis, pour ha une des sous-parti ules ainsi obtenues, é hantillonne un historique plausible. Une version Rao-Bla kwellisée (

RBHSSIR

) est également développée an de réduire la varian edel'estimateurenneréé hantillo nnantqu'unpasséplausiblepour haque par-ti ule. Une dernière extension nommée

RBSSHSSIR

pour Rao-Bla kwellised History Sampling SIR est une adaptation de

RBHSSIR

pour permettre la prise en ompte de fon tions d'importan e qui ne permettent d'é hantillo nner qu'une sous partie de l'in-novation. Une expérimentation de suivi d'un objet arti iel ombinant une déte tion de ouleur et la mesure de forme montre un gain en pré ision et taux de réussite des stratégies proposées par les auteurs omparé à la CONDENSATION et au ltre

SIR

basique.

Ma Cormi k et Isard dans [Ma Cormi ket al., 2000℄ exploitent l'é hantillo nnage partitionné introduit dans [Ma Cormi ket al.,1999℄ pour l'étendre au suivi d'objets arti uléstels que lamain. Le prin ipe est de diviserl'espa e d'état en plusieurs  par-titions, puis d'appliquer séquentiellement ladynamique sur haque partition préala-blement à un réé hantillo nnage pondéré adapté. Le but est de réduire le nombre de parti ulesné éssaires,notamment dans un ontextede grandedimension.

RuietChendans[Ruiet al.,2001℄ s'appuientsurledéveloppement dultrage par-ti ulaireuns ented dansla ommunautéde traitement du signal ([Merwe et al.,2000℄) pour l'appliquer dansun ontexte de lo alisation de lo uteur et de suivi visuel. Cette stratégie permet d'in orpore rl'observation ourante danslapropagationdesparti ules au moyen d'une fon tion d'importan e Gaussienne asso iée à haque parti ule et mise àjour par unltre deKalmanuns ented.La priseen ompte àlafoisde ladynamique dupro essusd'état et de l'observationà l'instant ourant positionne au mieuxles par-ti ules dans l'espa e d'état. La ible à suivre orrespond i i au ontour d'un visage, et est modélisée par une ellipse. Les vraisemblan es des parti ules sont basées sur la mesure des distan es entre les ellipses asso iées et les points de ontours de l'image. Lesauteurs omparentleurappro heàlaCONDENSATIONetmontrentl'avantagede ette stratégie surdesexemplesde suiviréels.

Li et Zhang dans [Liet al.,2002℄ réalisent le suivi d'une main modélisée par son ontour an de omparer la CONDENSATION au ltre parti ulaire uns ented et au ltre parti ulaire Kalman. Ces deux dernières stratégies apparaissent pluspré ises que la CONDENSATION en terme d'erreur quadratique moyenne, ependant, les temps de al ul prohibitifs asso iés au ltre parti ulaire uns ented onduisne les auteurs à

1

(16)

on lure queleltre parti ulaire Kalman estlameilleure stratégiedansun ontextede suivi visuelde mains.

Un autreavantage onnudultrage parti ulaire ,en dehorsdesagrandegénéri ité, est de pouvoir ombiner/fusionner aisément diérentes sour es de mesures. Malgré e onstat, la fusion de données par ltrage parti ulaire noussemble assez peu exploitée et souvent onnée à un nombre restreint de primitives visuelles. Néanmoins, ertains travaux proposent des fon tionsd'importan e permettant l'obtention de performan es intéressantes.

Pérez et al. dans [Pérezet al., 2002℄ introduisent une nouvelle te hnique de suivi par Monte Carlo basée sur l'apparen e de la ible. La ible à suivre est i i ara téri-séeparuntemplate d'histogramme s indépendant snormalisésdela ouleurrelative aux pixels in lus dans une région re tangulair e englobant elle- i. La fon tion de mesure est dénie par une mesure de similarité basée sur la distan e de Bhatta haryya entre histogrammes ouleur.Cettenouvelleappro heprobabilisteest omparéeàl'algorithme meanshift [Comani iu et al.,2003℄ quiutilise lemême attribut visuelet montre des ré-sultatssimilaires.Lesauteursproposentensuitetrois ontribution s.Lapremièredénit unenouvellefon tiondemesurequi ombinelesdistributionsde ouleur ontenuesdans deuxrégionsde la ible an d'ajouter une ontrainte spatiale entre lesdistributions de ouleur. Le gainde ette stratégie de mesure par rapport à la pré édente est montrée surune séquen eréellede suivi.La deuxième ontribution on erne lapriseen ompte du modèle de ouleur du fond dans le al ul des vraisemblan es. Dans un ontexteoù la améraest immobileetoù uneimage dufondestdisponible,lesvraisemblan es sont alors obtenuesà partir de ladiéren e entre la distan e olorimétrique ible/référen e etladistan e olorimétrique ible/fond.Enn,ladernière ontribution on ernelesuivi multi-objets. Les auteurs tirent i i parti de la apa ité des ltres parti ulaire s à ap-turer les multi-modalités. Le ve teur d'état est alors onstitué de la on aténation des ve teurs d'états des diérentes ibles et une méthode d'ex lusion est mise en ÷uvre dansle al ul desvraisemblan es dèslorsqu'ilyaunre ouvrement (o ultation) entre les ibles.La méthode estnalementexpérimentéesuruneséquen eoùdeuxpersonnes se roisent; letra ker réussit à les suivre en onservant le bon ordre de profondeur et sansles onfondre.

Nummiaroetal.dans[Nummiaroet al.,2003℄exploitentaussilaCONDENSATION ainsi qu'une mesure basée sur la distribution de ouleur, mais la ible à suivre est i i modéliséepar uneellipse.Durantlesuivi, esdistributions de ouleur sontmisesàjour an de gérer les hangements d'apparen e de la ible, typiquement la rotation d'une personne surelle-même.La fon tion demesureestdénie parune mesuredesimilarité baséesurladistan edeBhatta haryyaentrehistogrammes ouleur.L'appro he propo-séeestalors omparéeave unalgorithmedemeanshift [Comani iu et al.,2003℄àpartir de séquen es-test.Ce dernier estplus rapide et plus pré ismaispour desdistributions possiblementmulti-modales,laCONDENSATIONestplusrobusteauxfaussesmesures. Lesauteurs montrent quelenombre departi ulesinuen edire tement lapré isiondu

(17)

Isardet Ma Cormi kdans[Isard et al.,2001℄dénissentuntra kermulti-blobs basé surunltrage parCONDENSATION.Leurtravailsesitue plusparti ulière mentau ni-veau de la dénition de la fon tion de mesure exploitée dans le ltre. Le fond de la s ène estmodélisépar unmélange de Gaussiennes apturant à lafois les informations sur la ouleur et sur le gradient ontenus aux diérents points d'une grille de taille xesous-é hantillonnant l'image.UnautremélangedeGaussiennesdumêmetype ap-ture lesinformations asso iéesau premier plan de l'image typiquement despersonnes. Les poids desparti ules sont alors obtenus en al ulant le rapport entre les deux mé-langes de gaussiennes dans une région andidate, i i la proje tion dans le plan image d'un ylindre3Dmodélisantlapersonne.L'algorithmenomméBraMBLepourBayesian Multiple-Blob Tra ker , permet de suivre un nombre de personnes a priori in onnu et variable. Les expérimentations présentées dans l'arti le montrent les performan es de etteappro he,quisuitsansdi ultétroispersonnes.Unproblèmeapparait ependant lorsquedeuxpersonnesse roisent,dufaitdela ommutatio nerronéedeslabelsquileur sont asso iées.

Ma Cormi k et Blake dans [Ma Cormi ket al.,1999℄ proposent une solution pour suivreplusieursobjetsdontlemodèlene permet pasdelesdiérentier,e.g. ontoursde latête. Ilsintroduisent dans etarti ledeux ontribution s majeures.Toutd'abord,une méthode d'ex lusionmutuelleempê heune mêmemesurede ontribueraux al ulsdes vraisemblan es dediérentes ibles.Ensuite,l'é hantillo nnage partitionné pour les mé-thodesdeMonte Carloestimplémenté , e quipermet,par uneexplorationpluse a e de l'espa e d'état du système, de diminuer signi ativement le nombre de parti ules né essairesau suivi.

Outre les travaux tels que eux déja mentionnés de Isard et al. dans [Isard et al.,1998a℄, d'autres appro hespermettent de ondidérer desattributs visuels variéspour lesuivi.

Spengler et S hiele dans [Spengler et al.,2001℄ mixent deux artesde salien e an desegmenterrespe tivementles régionsde ouleur peau oumobiles (mouvement inter-images).Chaquefon tiondemesureestdénieparunmélangedeGaussiennes ara té-riséàl'aided'unalgorithmeEM( Expe tationMaximization).Ladensitédeprobabilitéa posteriori del'étatestestiméeparCONDENSATION,oùlafon tiondemesureglobale est une somme pondérée des fon tions de mesure pré édentes. Les auteurs omparent alorsave uneestimationparmaximumdevraisemblan eet on luentquela CONDEN-SATION estplusperformante lorsque lesdensités estiméessontmulti-modales.

Bretzner et al.dans[Bretzner et al.,2002℄ dénissent unmodèle hiérar hique gros-sier d'une main à partir d'ellipses et de er le, respe tivement pour les doigts et la paume. La fon tion de mesureest dénie par une diéren e quadratique entre les mé-langes de Gaussiennes relatives au modèle et à l'image. La nalité est i i de suivre et re onnaîtredansleot vidéo,par CONDENSATION,la onguratio nlaplus vraisem-blable dela main.Lesgestesanalysés sont grossièrement fronto-parallèles à la améra. Chaquepixelestae téd'uneprobabilité d'appartenan e à la lassepeau. Lesauteurs

(18)

au modèle et de ouleur réduit sensiblement les dé ro hages du ltre en présen e de s ènesen ombrées.

Pérez et al. ont largement abordé le problème de fusion de données dans[Pérezet al., 2004℄.Ilsproposentunalgorithmedeltragehiérar hisé( hierar hi al sampling) dans lequel deux mesures sont onsommées : (1) une mesure intermittent e pour éventuellement positionner e a ement les parti ules,(2)une mesurepersistente pourpondérer esdernièresetdon mettreàjourladensitéaposteriori.Lesmesures in-termittentestirentpartiedemodulesdedéte tionsoitvisuel(mouvementinter-images), soit a oustique. Enn, les mesures persistentes sont relatives au seul attribut ouleur. Dansnotre ontexte,la onnaissan e apriori des iblessuiviespermet de onsidéreren plusla formedansnosfon tions demesure.

Tous estravaux,bienqueliéspar lemême adreappli atif,dé riventdesfon tions desuivitrèsvariéesentermesdestratégiesdeltrageetdemesures.Hélas,ilsproposent assez peu d'élémentsde omparaison et illustrent,souvent surquelquesséquen es- lés, le omportement qualitatifde leurs ltres.

Li htenaue retal.dans[Li htenau er et al.,2004℄traitentdel'inuen edelafon tion devraisemblan esurlesperforman esd'unsuiviparltreparti ulaire .Dans etarti le, lesauteurs observentle omportementdusuivi parCONDENSATION dansuneimage synthétiqueenfon tion delaformede lafon tiondevraisemblan e. Trois s énariisont envisagés : (1) suivi d'un objet seul, (2) suivi d'objets multiples et (3) réinitialisation (objet perdu). Ils montrent que les paramètres dénissant la vraisemblan e, typique-ment la ovarian e dansle lien état-mesure, doivent être adaptés au ontexte de suivi onsidéré.

Peudetravauxproposentd'évaluerplusendétaillesdiérentesstratégiesdeltrage et demesure. Il noussemblepertinent deles ompareret deles évaluerpluslargement dansun ontexte robotique.

Plus généralement , ilnous semble intéressant de proposer desltres qui ombinent ou fusionnent plus largement les mesures visuelles dans leurs fon tions d'importan e et de mesure. A terme, nous prévoyons, par exemple, d'intégrer dans nos ltres des informations non visuelles. De plus, nous souhaitons également évaluer quelques-unes des nombreuses stratégies de ltrage proposées dansla littérature de façon à détermi-ner les asso iationsde primitivesvisuelles et d'algorithmes d'estimation qui répondent au mieux aux modalités d'intera tion envisagées pour notre robot. Le ltrage parti- ulaire ore i i un adresusamment générique pour l'implément ation desdiérentes fon tionnalités de suivi visuel asso iées.Nous tironspartie des plateformesmobiles du groupe Robotiqueet Intelligen e Arti ielle (RIA) pour dénir desmodalités réalistes d'intera tio nentre elles- iet l'humain dansunenvironnement a priori quel onque.

Ces modalités dé rivent une intera tion entre l'homme et son guide, i i le robot, dansunmusée, ar estravauxs'ins riventdansle adred'une ollaborationdugroupe RIAave laCitédel'Espa edeToulouse.L'obje tifestdevoirsursitelerobotnommé Ra kham utilisé pour e projet naviguer et interagirave les visiteursde laCité surla

(19)

aussidansleprojeteuropéenCOGNIRON(CognitiveRobotCompanion) oordonnépar leLAAS-CNRS. L'obje tif entral de e projetest de onférer des apa ités ognitives àdesrobotsà traversl'étudeet ledéveloppement de méthodeset de te hnologie spour la per eption, l'interprétation, le raisonnement et l'apprentissage en intera tion ave l'homme. Nos ontribution s pour e projet se situent don sur les aspe ts intera tion visuelleHomme-Robot.

Enn, l'ensemble des fon tionnalités visuelles que nous proposons doivent obéir à des ontraintestemps-réelles réalistes ave le ontexte appli atifdé rit pré édemment .

1.3 Organisation du manus rit

Après e hapitreintrodu tif,lesquatre hapitressuivantss'organisent ommesuit: Le hapitre

2

rappelle quelques généralités sur le ltrage parti ulaire et détaille l'algorithme générique. Les di ultés ainsi que les leviers sur lesquels il est possible d'agirlorsdeladénitiond'un ltresontensuiteabordés.Diérentesstratégiessimples d'é hantillo nnage sont alors présentées. Elles reposent sur des fon tions d'importan e relatives à la dynamique ou aux mesures. Enn, la stratégie ré ursive optimale, et les algorithmes permettant des'en appro her sont dis utés.

Le hapitre

3

spé ie, pour notre ontexte appli atif et le formalisme pré édent, desmesuresvisuelles reposantsurdesattributs de ouleur,forme oumouvement inter-imagesdela ible observée.Cesmesures visuellessont prisesen ompte danslemodèle de mesure et/ou la fon tion d'importan e des ltres. En présen e d'environnement s en ombrés, ilestalors judi ieuxde ombinerou fusionnerplusieurs mesuresde natures diérentes. Des stratégies ombinant ou fusionnant tout ou partie des attributs pré- itéssont don envisagées. Les diversesfon tionsde mesure ou d'importan e asso iées sontnalement évaluéeset omparéessurunebased'imagesa quisesdepuislerobot et représentatives dess ènesren ontrées lors de sanavigation.

Le hapitre

4

dé ritdesmodalités omplément airesd'intera tionpournotre robot-guide. Diérentes fon tionnalités de suivi, adaptées à ha un des s énarii, sont alors proposées et mises en ÷uvre. Elles se dénissent en termes de mesures visuelles et de stratégiesde ltrage dont les hoix sont argumentés. Chaque fon tionnalitévisuelleest ensuite onfrontée à des ontextes susamment variés et réalistes pour une modalité donnée d'intera tio n an d'enévaluer les performan es en termes de robustesse, pré i-sion et temps d'exé ution. Ces évaluations permettent de validerles fon tionnalités de suivipour ha une desmodalités d'intera tion.

Le hapitre

5

présente enn des modalités de suivi et re onnaissan e de gestes symboliques d'une main humaine. Le re alage du template et la séle tion de la on-guration delamain laplusvraisemblable s'ee tuent dansunseul et unique pro essus de ltrage parti ulaire , e qui permet d'obtenir des temps de al ul ompatibles ave les appli ations visées. Comme pré édemment , deux stratégies spé iques de ltrage

(20)

appliquéepour lesuivi visuel.Desrésultatsdesuiviet dere onnaissan e sontalors dé- ritsetdis utéspour esmodalités.Celles- idoivent permettre auxusagerspartageant l'environnement durobotde le ommandergestuellement àpartir d'unvo abulairequi sort du adre de ette thèse.

Lebilande estravauxainsiquelesperspe tivesenvisagéessontprésentésen on lu-sion.

(21)

Estimation par ltrage parti ulaire

L'estimation de l'état d'un système dynamique à partir d'observations bruitées et éventuellement in omplètes est un problème entral dans de nombreuses appli ations. On peut iter, par exemple, l'analyse de signaux radars, la lo alisation 3D d'objets en robotique, la modélisation de données nan ières, le traitement de la parole ou, notamment dansnotre ontexte, lesuivi visuel d'entités.

Généralement, le système est modélisé par une haîne de Markov a hée à temps dis ret,dontl'étatvitdansunespa e ontinuoubienadmetdesvaleursdis rètes. L'ob-je tif estalors d'estimer à haqueinstant la loide e pro essus àpartir de réalisations dupro essusd'observation. Untelsystèmeestentièrementdé rit parladistributiondu pro essusd'étatàl'instantinitial,unmodèled'évolutiondel'étatainsiqu'unmodèlede mesurereliant l'état àl'observation. Demanière générale, toutel'information quipeut êtreinférée surl'étatdisposantdesmesuresjusqu'àuninstant quel onque

k

est aptu-réedanssaloi onjointe a posteriori, i.e.danssadistribution onjointe depuisl'instant initial jusqu'àl'instant

k

onditionnellement à la onnaissan e desmesures jusqu'à

k

. Très souvent, seule la loi marginale est re her hée, au sens où il s'agit uniquement de ara tériser ladistributiona posteriori de l'étatà l'instant

k

.

Dans etravail,nousnousintéressonsauproblèmedultrage,qui onsisteàétablir ladistribution a posteriori  onjointe ou marginale de manièreré ursive.

Sous ertaines hypothèsese.g.espa e d'état dis retet ni,systèmedé rit par une représentation d'état soumise à desex itations aléatoiresGaussiennes, il est possible de propager temporellement la loi a posteriori exa te ou une approximation de ses premiersmoments. Cependant,dansun ontextedesuivivisueltelquelentre,ilpeut êtrené essairedere ouriràunealternativesous-optimale plusgénérique,permettant d'approximer laloia posteriori y omprissielle estmultimodale, si lelienétat-mesure est non linéaire,si les bruits sont non Gaussiens,et . Le ltrage parti ulaire onstitue une telle alternative, du fait qu'il permet l'estimation appro hée de l'état dis ret ou ontinude toutsystèmedynamiqueMarkovien,indépendamment de toutehypothèse surlanature desbruits.

Les ltres parti ulaire s sont des méthodes séquentielles de Monte Carlo onsistant à appro her la densité a posteriori au moyen d'un ensemble de mesures pon tuelles

(22)

ou parti ules pondérées. Les méthodes de Monte Carlo sont apparues dans les années 50 ave l'arti le de Metropolis et Ulam [Metropoliset al.,1949℄ suivi d'autres travaux omme [Metropoliset al.,1953℄ ou [Hammersley et al.,1954℄. Puis, dansles années60-70,lesfaiblespuissan esde al ulainsiqueladégénéres en edesalgorithmes due à leur implémenta t ion basée sur un é hantillonnage pondéré séquentiel brut ont onduitàuneperted'intérêtpour esméthodesinutilisablesenpratique.Seulsquelques développement s pon tuels tels que[Hands hin et al.,1970℄ ou [Akashi et al.,1977℄ ont ontinué à explorer es idées. Plus ré emment, dans les années 90, les méthodes de Monte Carlo ont été de nouveau explorées, ave l'introdu tion du réé hantillo nnage par Gordon et al. [Gordonet al.,1993℄ qui permet de limiter la dégénéres en e des algorithmes baséssurl'é hantillo nnage pondéréséquentiel.Cette ontribution majeure asso iéeàl'augmentat ionimportantedes apa itésde al ulaeuunimpa tdéterminant dansla ommunautéTraitementduSignalenrendant lesltresparti ulaire s utilisables en pratiquepour lapremière fois.

Depuis, les a tivités de re her he dans e domaine ont énormément augmenté [Dou etet al.,2001a℄ onduisant à de nombreuses ontribution s améliorant l'e a- ité des ltres parti ulaire s. Ces méthodes ont été largement exploitées dans di-vers domaines omme par exemple le traitement du signal [Gustafsson et al.,2002℄, [Hueet al., 2000℄, le traitement de la parole [Vermaak et al.,2002a℄, larobotique mo-bile [Kwoket al.,2004℄,lamodélisation dedonnées nan ières [Pittet al.,2001℄,ou le suivi visuel[Isard et al.,1998a℄,[Pérez et al.,2004℄.

Ce hapitre introduittout d'abord lesméthodesséquentiellesde Monte Carlo, puis abordeleursdi ultésainsiqueleslevierssurlesquelsilestpossibled'agirlorsdela dénitiond'unltre.Unalgorithmegénériquedeltrage parti ulaires'ensuit.Ensuite, plusieurs stratégiesd'é hantillo nnage sont évoquées, ainsiquedesmé anismes permet-tantd'améliorer leltrage.Ladernièrepartie dis utelastratégie ré ursiveoptimale,et les algorithmespermettant de s'en appro her.

2.1 Généralités

Dans ette se tion,nousprésentonslesoutilset méthodesmis en÷uvredans l'esti-mation del'étatd'un systèmedynamiquepar ltrageparti ulaire .Aprèsavoirprésenté leformalismeet leprin ipedesméthodesdeMonteCarlo, nousabordonsles di ultés liéesà etyped'estimateurainsiqueleste hniquespermettantdepallier esproblèmes. Ensuite, nousdé rivonsl'algorithme générique deltrage parti ulaire qui peut en être déduit et pour nirnousdétaillons le asoptimal de ltrage.

An de simplier les notations, nous noterons une variable aléatoire de la même façonquesaréalisation.Dansle as ontinu,touteprobabilité

P(X ∈

d

x)

serasupposée de laforme

p(x)

d

x

. Demême, dansle asdis ret, la distribution

P(X = x)

sera notée

(23)

2.1.1 Formalisation du problème

A Modélisation

On onsidère un système sto hastique dynamique qui est le siège d'un pro essus d'état, a hé,lequelestindire teme ntobservévia unpro essusd'observation.Les repré-sentationsàtempsdis retde esdeuxpro essusaléatoiressontrespe tivementdésignées par

{x

k

}

k

∈N

et

{z

k

}

k

∈N

, ave

x

k

∈ R

n

x

,

z

k

∈ R

n

z

.

Soient

x

0:k

, {x

0

, . . . , x

k

}

et

z

1:k

, {z

1

, . . . , z

k

}

. Le pro essus

{x

k

}

admet une dis-tribution initiale ara térisée par

p(x

0

)

, et est supposé Markovien de loi de transition

p(x

k

|x

0:k−1

) = p(x

k

|x

k

−1

)

. Les observations sont supposéees indépendant es ondition-nellement au pro essus d'état, et leur distribution ne dépend que de l'état au même instant, e qui setraduit par

p(z

1:k

|x

0:k

) = p(z

k

|x

0:k

)p(z

1:k−1

|x

0:k

),

p(z

k

|x

0:k

) = p(z

k

|x

0:k

, z

1:k−1

)

satisfait

p(z

k

|x

0:k

) = p(z

k

|x

k

).

(2.1) Ladensitéde probabilité

p(z

k

|x

k

)

de

z

k

onditionnellement à

x

k

permet naturellement de quantier la vraisemblan e de

x

k

par rapport à

z

k

. En outre, leve teur de mesure à un instant donné et le ve teur d'état à l'instant suivant obéissent à la propriété d'indépendan e onditionnelle

p(x

k

, z

1:k−1

|x

0:k−1

) = p(x

k

|x

0:k−1

)p(z

1:k−1

|x

0:k−1

),

p(x

k

|x

0:k−1

) = p(x

k

|x

0:k−1

, z

1:k−1

)

satisfait

p(x

k

|x

0:k−1

) = p(x

k

|x

k

−1

).

(2.2) À titred'exemple, lamodélisation(2.2)(2.1) re ouvrela représentation d'état



x

k+1

= f (x

k

) + w

k

z

k

= h(x

k

) + v

k

(2.3)

d'unsystèmenonlinéaireMarkoviensoumisàdesbruitsdedynamique

w

k

etdemesure

v

k

blan s,mutuelleme nt indépendant s, et indépendant s de la onditioninitiale.

B Le ltrage Bayésien optimal et sa solution ré ursive exa te

Basé sur le ara tère Markovien du système et la modélisation pré édente, le l-trageBayésienoptimal onsiste enle al ul ré ursif deladensité onjointe a posteriori

p(x

0:k

|z

1:k

)

ou de sa densité marginale également désignée i-après distribution de ltrage

p(x

k

|z

1:k

)

.

L'appli at iondelarègledeBayespermet l'é ritureré ursivede

p(x

0:k

|z

1:k

)

en fon -tionde

p(x

0:k−1

|z

1:k−1

)

sous laforme

p(x

0:k

|z

1:k

) =

p(z

k

|x

0:k

, z

1:k−1

)p(x

0:k

|z

1:k−1

)

p(z

k

|z

1:k−1

)

(2.4) ave

p(x

0:k

|z

1:k−1

) = p(x

k

|x

0:k−1

, z

1:k−1

)p(x

0:k−1

|z

1:k−1

).

(2.5)

(24)

Lespropriétés d'indépendan e (2.2)et (2.1) permettent de simplier (2.4)(2.5) en

p(x

0:k

|z

1:k

) =

p(z

k

|x

k

)p(x

k

|x

k

−1

)

p(z

k

|z

1:k−1

)

p(x

0:k−1

|z

1:k−1

)

∝ p(z

k

|x

k

)p(x

k

|x

k

−1

)p(x

0:k−1

|z

1:k−1

).

(2.6) La marginalisatio n de (2.5) selon

x

0:k−1

onduit à l'équation de Chapman-Kolgomorov, qui exprime la densité de prédi tion

p(x

k

|z

1:k−1

)

à l'instant

k

en fon -tiondeladensitéde ltrage

p(x

k

−1

|z

1:k−1

)

àl'instant pré édent

k

− 1

.Eninvoquantla propriété (2.2), ette équations'é rit

p(x

k

|z

1:k−1

) =

Z

p(x

k

|x

k

−1

)p(x

k

−1

|z

1:k−1

)dx

k

−1

.

(2.7) Similairement à(2.4),la distributionde ltrage à l'instant

k

estobtenueà partir de la distribution de prédi tion en e même instant par une miseà jour prenant en ompte l'observation

z

k

, soit

p(x

k

|z

1:k

) =

p(z

k

|x

k

)

p(z

k

|z

1:k−1

)

p(x

k

|z

1:k−1

)

∝ p(z

k

|x

k

)p(x

k

|z

1:k−1

).

(2.8)

La onstante de normalisation

p(z

k

|z

1:k−1

)

intervenant dans(2.6) et (2.8) s'exprimeen fon tion de ladensitéde prédi tionet du lien état-mesuresous laforme

p(z

k

|z

1:k−1

) =

Z

p(z

k

|x

k

)p(x

k

|z

1:k−1

)dx

k

.

(2.9)

Dès lorsqueladistributiona posteriori

p(x

k

|z

1:k

)

est onnue,unestimé duve teur d'étatpeutêtredéniàpartir deladonnéed'un ritèred'optimalité. Ainsi,l'estimédu maximumaposteriori etl'estiméduminimumd'erreurquadratiquemoyenne

1 s'é rivent respe tivement

x

k

|k

]

MAP

=

arg

max

x

k

p(x

k

|z

1:k

)

et

x

k

|k

]

MMSE

=

E

p

(.|z

1:k

)

(x

k

)

. Plus généralement ,toutequantitédelaforme

E

p

(.|z

1:k

)

(φ(x

k

))

peutêtreévaluée,ave

φ(.)

une fon tion intégrablede

R

n

x

àvaleursdans

R

, permettantainsile al ul dela ovarian e a posteriori, et .

La déterminati on ré ursive de la distribution a posteriori ne peut être ee tuée analytiquement quedansquelques situationstrès parti ulière s. Ainsi, dansle as d'un systèmelinéaire soumisà desbruits de dynamiqueet de mesureGaussiens, onmontre qu'il s'agit d'une Gaussienne, dont les deux premiers moments peuvent être propagés au moyen du ltre de Kalman. Cependant, pour des modèles plus omplexes, la so-lution exa te du problème ne peut pas être déterminée, e.g. du fait de l'impossibilité de al uler l'expression analytique de (2.9) dans (2.4)(2.5) ou (2.7)(2.8). Il est alors né essaire d'utiliser des méthodes appro hées parfois appelées algorithmes Bayésiens sous-optimaux[Arulampalam et al.,2002℄.

(25)

Ainsi,leltre deKalmanétendu(FKE)ouExtended Kalman Filterpermet la déterminati onappro héedelamoyenneetdela ovarian eaposterioriduve teurd'état parlalinéarisationau premierordredeséquations dedynamiqueet demesure, respe -tivement autour dudernier estimé et deladernière prédi tion disponibles. Cependant, lefaitde négligertousles termesd'orde supérieur ouégal à

2

danslesdéveloppement s de Taylor des non-linéarit és onduit souvent à une performan e médio re de e ltre, voire àsadivergen e.

Le ltre de Kalman Uns ented (FKU)  ou Uns ented Kalman Filter  ré em-ment proposé par Julier et Uhlmann [Julier et al.,1996℄ permet une pré ision plus a - rue. Reposant sur un é hantillonn age déterministe, au moyen de 

σ

-points judi ieu-sement séle tionnés, de la distribution a posteriori à l'instant pré édent ainsi que des bruitsde dynamique et de mesure, il onduit,via l'utilisation de latransformée Uns- ented,àuneapproximationdesdeuxpremiersmomentsdeladistributionaposteriori àl'instant ourant.Celle- iestvalable jusqu'audeuxième ordredesdéveloppements en série de Taylor des non-linéarit és, sans augmentatio n de omplexité omparativement au FKE. L'approximation tient jusqu'au troisième ordre si les distributions des bruits et dupro essusd'état sontassimilées àdesGaussiennes.

An de s'aran hir de l'hypothèse de Gaussianité de la loi a posteriori, des approximations par mélanges de Gaussiennes ont également été dévelop-pées [Alspa het al.,1972℄. Dans notre ontexte non-linéaire, multi-modal et non-Gaussien, nous préfèrerons des algorithmes de ltrage parti ulaire , ou méthodes séquentielles de Monte Carlo qui approximent des lois de probabilité ontinues au moyen de distributions pon tuelles. Ces dernières méthodes présentent quelques simi-litudes ave les méthodes de ltrage par maillage de l'espa e d'état grid-based me-thods, qui approximent la densité a posteriori par une somme de mesures de Dira admettant pour support une grille gée

2

. Cependant, elles se diéren ient par le fait que les distributions pon tuelles élémentaire s onstituant l'approximatio n parti ulaire sont entrées sur une grille qui évolue de manière sto hastique, an de permettre une explorationadaptative deszonespertinentesde l'espa e d'état.

2.1.2 Filtrage parti ulaire

A Méthodes d'approximation de Monte Carlo

A-1 Prin ipe Les méthodes de Monte Carlo permettent d'approximer une distri-butiondeprobabilité ontinue

p(x)

quel onque aumoyend'unedistributiondis rètede laforme

ˆ

p

N

(x)

,

N

X

i=1

w

(i)

δ(x

− x

(i)

),

ave

N

X

i=1

w

(i)

= 1,

(2.10)

2

(26)

de sorte que simuler un nombre selon la loi

p(x)

revient à séle tionner un é hantillon ouparti ule

x

(i)

ave laprobabilité oupoids

w

(i)

.Dèslors,touteintégrale

p(Φ)

,

Z

Φ(x)p(x)

d

x

(2.11)

relativeà l'espéran edel'image parune fon tion

Φ(.)

d'unevariablealéatoirese distri-buant selon

p(x)

peut êtreappro hée par

ˆ

p

N

(Φ)

,

Z

Φ(x)ˆ

p

N

(x)

d

x =

N

X

i=1

w

(i)

Φ(x

(i)

).

(2.12)

A-2 É hantillonnage  idéal  Dans le as où on sait é hantillonn er

p(x)

, une première appro he onsiste à dénir

x

(1)

, . . . , x

(N )

omme des variables aléatoires in-dépendantes identiquement distribuées (i.i.d.) selon

p(x)

, ou, de manière équivalente, ommedesnombresindépendam mentsimulésselon

p(x)

, etàlesae terdepoids iden-tiques.Sous es onditions, quel'on note

x

(i)

∼ p(x), w

(i)

=

1

N

,

(2.13)

on montrequel'estimateur

p

N

(Φ) =

1

N

N

X

i=1

Φ(x

(i)

)

(2.14)

est non biaisé, et, d'après laloi forte des grands nombres, onverge presque sûrement i.e. ave une probabilité de

1

 vers

p(Φ)

lorsque

N

tend vers l'inni. Si la varian e

σ

Φ

2

=

Var

(Φ(x))

estnie, alors lavarian e de

p

N

(Φ)

est égaleà

σ

2

Φ

N

. La onvergen e en loi de l'erreur d'estimation est alors garantie pour toute fon tion

Φ(.)

ontinue bornée par lethéorème entrallimite

N

σ

Φ

(p

N

(Φ)

− p(Φ))

loi

−→ N (0, 1),

(2.15)

d'oùpeuventêtreextraitsdesintervallesde onan ede

p(Φ)

entréssur

p

ˆ

N

(Φ)

lorsque

N

tendversl'inni[Campillo,2005,Millet, 2005℄.Onnotequelavitessede onvergen e

1

N

ne dépend pasde ladimension de l'espa edanslequel vit

x

.

A-3 É hantillonnage préférentiel Lorsqu'iln'est paspossible ou souhaitéde ti-rer des é hantillons de

p(x)

, la stratégie pré édente est inappli able. Une alternative est l'é hantillo nnage préférentiel ou importan e sampling / é hantillonn age pon-déré,qui onsiste àséle tionner

x

(1)

, . . . , x

(N )

selon unedistribution erronée,puisà ompenser numériquement ette opération dansles poids

w

(1)

, . . . , w

(N )

(27)

Plus pré isément, supposons queles parti ules

x

(1)

, . . . , x

(N )

soient é hantillonnées de manière indépendant e selon une densité ou loi d'importan e 

q(x)

telle que

p(x) > 0

implique

q(x) > 0

. L'intégrale

p(Φ)

dénie en(2.11) s'é rit également

p(Φ) =

Z

Φ(x)

p(x)

q(x)

q(x)

d

x,

(2.16)

de sorte qu'elle peut être approximée par la somme

1

N

Σ

N

i=1

w

∗(i)

Φ(x

(i)

)

, ave

w

∗(i)

=

p(x

(i)

)

q(x

(i)

)

. Cependant,l'estimateur

p

ˆ

N

(Φ)

denien(2.12)ave

w

(i)

=

1

N

w

∗(i)

ne sa-tisfaitpasla onditiondenormalisation

P

N

i=1

w

(i)

= 1

guranten(2.11).C'estpourquoi ilfautposer

w

(i)

=

w

∗(i)

P

N

j=1

w

∗(j)

.Enrésumé,l'ensembledeparti ulespondérées

{x

(i)

, w

(i)

}

onstitueune des ription ohérente de

p(x)

dèslors que

x

(i)

∼ q(x), w

(i)

p(x

(i)

)

q(x

(i)

)

,

(2.17)

préalablement à uneétape de normalisation telleque

P

N

i=1

w

(i)

= 1

.

Pour les mêmes raisons que pré édemment, l'estimateur

p

ˆ

N

(Φ)

ainsi onstruit est asymptotiquementnon biaiséet onvergepresquesûrementvers

p(Φ)

quellequesoit la distribution d'importan e

q(x)

dont lesupport re ouvre elui de

p(x)

. Sa varian e est nieseulement si l'espéran e

E

q(.)

2

(x)

p

2

(x)

q

2

(x)

) =

R Φ

2

(x)

p

2

(x)

q(x)

d

x

est nie. On retrouve unthéorème entrallimitesemblableà(2.15),quipermeti iaussid'en adrer

p(Φ)

dans unintervalle entrésur

p

ˆ

N

(Φ)

lorsque

N

−→ +∞

.

L'intérêt de l'é hantillo nnage préférentiel est double [Millet,2005, Moulines, 2002℄. D'unepart,ilpeutpermettreuneapproximationde

p(Φ)

pluse a e,par larédu tion delavarian edesonestimateur.Ce iimpliquequelerapport

p(x)

q(x)

soitborné,souspeine que les poids

w

(i)

varient beau oup et ne soient élevés que pour un nombre restreint de parti ules. D'autre part, omme ela a été indiqué plus haut, il permet de ne pas é hantillonner selon

p(x)

. Ce iestparti ulière ment intéressant lorsquelaloi

p(x)

n'est onnuequ'à une onstante denormalisation près.

Il onvient toutefois dementionner que espropriétés né essitent un eort al ula-toire plusimportant au niveau de l'évaluationdespoids.

À titre d'exemple, supposons que l'on souhaite simuler une loi normale

N

T

(µ, Σ)

de moyenne

µ

et de ovarian e

Σ

tronquée sur le segment

− T ; µ + T ]

. Une possibilité onsiste à séle tionner de manière équiprobable une parti ule parmi

N

i.i.d. selon

N

T

(µ, Σ)

. En outre, dénir

N

parti ules

x

(i)

i.i.d. selon la loi uni-forme de support

− T ; µ + T ]

, et leur ae ter des poids

w

(i)

proportionnels à

exp(

1

2

(x

(i)

− µ)

T

Σ

−1

(x

(i)

− µ))

permet également l'obtentiond'unedes ription parti- ulaire ohérente.

B Appli ation à la problématiquedu ltrage

B-1 É hantillonnage préférentiel Dans e ontexte, il s'agit don d'établir une représentationparti ulairedelaloi onjointe aposteriori

p(x

0:k

|z

1:k

)

oudelaloi

(28)

margi-nale

p(x

k

|z

1:k

)

.Dufaitque esdensitésnesontgénéraleme nt onnuesqu'àune onstante de normalisation près f.(2.6) ou (2.8) l'é hantillonnage préférentiel est invoqué.

On hoisitpour ela une distribution d'importan e

q(x

0:k

|z

1:k

)

pouvant être fa ile-ment é hantillonn ée et dontle supportin lut lesupportde

p(x

0:k

|z

1:k

)

, i.e.

∀x

0:k

∈ (R

n

x

)

k+1

, p(x

0:k

|z

1:k

) > 0

⇒ q(x

0:k

|z

1:k

) > 0.

(2.18) Conformément à (2.10), on peut é rire

p(x

0:k

|z

1:k

)

≈ ˆp

N

(x

0:k

|z

1:k

) =

N

X

i=1

w

0:k

(i)

δ(x

0:k

− x

(i)

0:k

),

(2.19)

dèslors queles é hantillons

x

(i)

0:k

sont i.i.d. et ae tésde poids

w

(i)

0:k

selon 3

x

(i)

0:k

∼ q(x

0:k

|z

1:k

), w

0:k

(i)

p(x

(i)

0:k

|z

1:k

)

q(x

(i)

0:k

|z

1:k

)

,

N

X

i=1

w

0:k

(i)

= 1.

(2.20) L'intégrale

I(f ) =

Z

f (x

0:k

)p(x

0:k

|z

1:k

)dx

0:k

(2.21) relative à l'espéran e a posteriori d'une fon tion

f (.)

de la traje toire d'état depuis l'instant

0

jusqu'à l'instant

k

estpar onséquentapproximéeau moyen de l'estimateur

ˆ

I

N

(f ) =

N

X

i=1

w

(i)

0:k

f (x

(i)

0:k

)

(2.22)

dont lespropriétés ont déjàété évoquéesauŸ2.1.2A.

Notons qu'une marginalisatio n triviale de (2.19) par rapport à

x

0:k−1

permet de déduire l'approximationparti ulaire de ladensitéde ltrage, quis'é rit

p(x

k

|z

1:k

)

≈ ˆp

N

(x

k

|z

1:k

) =

N

X

i=1

w

k

(i)

δ(x

k

− x

(i)

k

),

w

(i)

k

= w

(i)

0:k

.

(2.23)

B-2 É hantillonnage pondéréséquentiel etméthode séquentielle de Monte Carlo L'é hantillonnagepondéré ombinéàlaméthode d'intégratio nde Monte Carlo permet d'estimerladensitéa posteriori.Cetteestimationdoit ependant êtreformulée de manièreré ursive,i.e. l'approximatio nparti ulaire de

p(x

0:k

|z

1:k

)

doitêtre détermi-néeàpartirdunuagedeparti ulespondéréesappro hant

p(x

0:k−1

|z

1:k−1

)

ainsiquedela nouvelleobservation

z

k

.Sion hoisitunefon tiond'importan e ausale, satisfaisant

∀k

≥ k, q(x

0:k

|z

1:k

) = q(x

0:k

|z

1:k

),

(2.24)

3

Notations:

x

(i)

0:k

= i

me

parti ule,réalisationdelatraje toire

x

0:k

(29)

alors,du faitque

q(x

0:k

|z

1:k

) = q(x

k

|x

0:k−1

, z

1:k

)q(x

0:k−1

|z

1:k

)

s'é rit

q(x

0:k

|z

1:k

) = q(x

k

|x

0:k−1

, z

1:k

)q(x

0:k−1

|z

1:k−1

),

(2.25) haquenouvelle

i

ème parti ule

x

(i)

0:k

∼ q(x

0:k

|z

1:k

)

peutêtredénie ommel' augmenta-tiondela

i

ème

parti ule

x

(i)

0:k−1

∼ q(x

0:k−1

|z

1:k−1

)

àl'instantpré édent,parunnouvel état

x

(i)

k

séle tionnéselon

q(x

k

|x

(i)

0:k−1

, z

1:k

)

.

La substitutionde(2.25) et (2.6)dans(2.20) onduitàl'équation ré ursivede mise àjour despoidsd'importan e :

w

(i)

k

p(x

(i)

0:k

|z

1:k

)

q(x

(i)

0:k

|z

1:k

)

p(z

k

|x

(i)

k

)p(x

(i)

k

|x

(i)

k

−1

)p(x

(i)

0:k−1

|z

1:k−1

)

q(x

(i)

k

|x

(i)

0:k−1

, z

1:k

)q(x

(i)

0:k−1

|z

1:k−1

)

∝ w

(i)

k

−1

p(z

k

|x

(i)

k

)p(x

(i)

k

|x

(i)

k

−1

)

q(x

(i)

k

|x

(i)

0:k−1

, z

1:k

)

.

(2.26)

Si, deplus, lafon tion d'importan e satisfait

q(x

k

|x

0:k−1

, z

1:k

) = q(x

k

|x

k

−1

, z

k

)

, les poids (2.26)dépendent uniquement del'état pré édent et del'observation ourante,au sensoù

w

(i)

k

∝ w

(i)

k

−1

p(z

k

|x

(i)

k

)p(x

(i)

k

|x

(i)

k

−1

)

q(x

(i)

k

|x

(i)

k

−1

, z

k

)

.

(2.27)

Dans notre ontexte de suivi, nous supposons que la fon tion d'importan e est de la forme

q(x

k

|x

k

−1

, z

k

)

et nous ne nousintéressons qu'à l'estimation de la loi de ltrage

p(x

k

|z

1:k

)

.

Ces développement s permettent de dénir l'algorithme d'é hantillo nnage pondéré séquentiel (Sequential Importan e Sampling,

SIS

) résuméTable2.1, qui onstruit ré- ursivement unnuage de parti ulespondérées appro hant laloi de ltrage

p(x

k

|z

1:k

)

à l'instant

k

.Chaqueparti ule

x

(i)

k

−1

estpropagéeselon lafon tiond'importan e,puis lespoidssontmisàjourselon(2.27)préalablementàleurnormalisation.Rappelonsque l'approximatio n(2.19)delaloi onjointe a posteriori peutimmédiatement êtredéduite endénissant

x

(i)

0:k

=

{x

(i)

0

, . . . , x

(i)

k

}

et en utilisant lapropriété(2.23).

Cetalgorithmetrèssimpled'estimationdelaloideltrage

p(x

k

|z

1:k

)

possède l'avan-taged'êtreparallélisable.Toutefois,sanatureré ursivesoulève ertainsproblèmes.Dans lase tion suivante, nous abordons les di ultésliées à ette stratégie de ltrage, puis dis utonsdespointssensiblesetdesméthodesquipeuvent ontribueràuneamélioratio n

(30)

h

{x

(i)

k

, w

(i)

k

}

N

i=1

i

= SIS

h

{x

(i)

k−1

, w

(i)

k−1

}

N

i=1

, z

k

i

1: SI

k = 0

(INITIALISATION) ALORS

2: É hantillonner

x

(1)

0

, . . . , x

(i)

0

, . . . , x

(N )

0

i.i.d.selon

p(x

0

)

,etposer

w

(i)

0

=

N

1

3: FINSI 4: SI

k ≥ 1

ALORS 5: POUR

i = 1, . . . , N

,FAIRE 6: Propagerlaparti ule

x

(i)

k−1

ensimulantdemanièreindépendante

x

(i)

k

∼ q(x

k

|x

(i)

k−1

, z

k

)

7: Mettreàjourlepoids

w

(i)

k

selonl'équation

w

(i)

k

∝ w

(i)

k−1

p(z

k

|x

(i)

k

)p(x

(i)

k

|x

(i)

k−1

)

q(x

(i)

k

|x

(i)

k−1

, z

k

)

8: FIN POUR

9: Normaliserlespoidsd'importan e

w

k

(i)

=

w

(i)

k

P

N

j=1

w

(j)

k

desorteque

P

N

i=1

w

(i)

k

= 1

10: Lenuage

{x

(i)

k

, w

(i)

k

}

i=1...N

permetd'appro herlaloideltragepar

p(x

k

|z

1:k

) ≃

N

X

i=1

w

k

(i)

δ(x

k

− x

(i)

k

)

11: FINSI

Tab.2.1 Algorithmede ltrage par é hantillonn age pondéré séquentiel (

SIS

)

2.1.3 Di ult és et leviers

On a vu omment onstruire un estimateur ré ursif de la distribution onjointe a posteriori

p(x

0:k

|z

1:k

)

ainsiquedelaloideltrage

p(x

k

|z

1:k

)

.Lapré isiondel'estimateur peut êtrequaliéeaumoyendesavarian e.Dans ette se tion,nousnousproposonsde dis uter ertainsproblèmesrelatifsà e ritère,etprésentonsdesméthodesette hniques permettant leur minimisation.

A Dégénéres en e de l'algorithme

En raison de la nature ré ursive de l'algorithme

SIS

, la varian e in onditionnelle despoids dansletemps augmente [Kong et al.,1994℄, induisant une dégradation de la pré isiondel'estimation. Ce isetraduit parlephénomènededégénéres en e dunuage, ausensoùaprèsun ertainnombre d'étapesderé ursion,laplupartdesparti ulessont ae téesd'unpoidsnormalisénégligeable .Ilsepeutalorsquedesressour esimportantes soient né essaires aux al uls liés à leur évolution, pour une ontribution nalement insigniante dans l'approximatio n de

p(x

k

|z

1:k

)

. La dégénéres en e de l'algorithme est d'autantplussensiblequeladistributiond'importan e

q(x

0:k

|z

1:k

)

dièrede

p(x

0:k

|z

1:k

)

,

Figure

Fig. 2.1  F on
tion de vraisemblan
e et densité de prédi
tion pour diverses situations : (a) dynamique peu informative et observation étroite, (b) in
ohéren
e de l'observation vis à vis de la densité de prédi
tion et (
) dynamique trop peu informative en présen
e de fausses mesures
Fig. 3.5  Deux images originales et les pré-segmentati ons asso
iées
Fig. 3.8  Deux exemples de segmentation : (a) images originales, (b) segmentations par 
hrominan
e, (
) segmentations par 
hrominan
e puis luminan
e
Fig. 3.13  Exemple de vraisemblan
e en tout point image pour une mesure de distri- distri-bution 
olorimétrique (deux régions d'intérêt)
+7

Références

Documents relatifs

Soient I et J deux intervalles r´ eels (non n´ ecessairement born´ es), et (g n ) une suite de fonctions de I dans J qui converge uniform´ em´ ent vers une fonction g2. Montrer que si

En pratique le moyen le plus simple pour prouver la convergence uniforme d’une série de fonctions est de prouver qu’elle est normalement convergente.. Si l’on n’y parvient pas,

Oui, mais il n’e pas facile `a conruire : il faut prendre un ensemble de Cantor de mesure non nulle, puis dans chaque trou glisser un ensemble de Cantor plus petit, etc.. E

a boxplots of the vocal data for each model, ranked in order of median b pair-wise Wilcoxon signed-rank test results.. All comparisons shown in white are significant (P <

Copyright and moral rights for the publications made accessible in the public portal are retained by the authors and/or other copyright owners and it is a condition of

Ces résultats peuvent être contradictoires avec ceux exposés auparavant (voir Bandura & Jourden, 1991), mais certaines limites sont présentes dans

En agronomie, en écophysiologie ou en amélioration des plantes, les méthodes de phénotypage consistent à mesurer les principales caractéristiques d’une plante (comme son poids)

Obtention des cartes (χ t ) par transformée en curvelets La méthode de suivi utilise une signature basée sur l’éner- gie des sous-bandes de curvelets dans la fonction de