• Aucun résultat trouvé

Il est très di ile d'interpréter ou prédireun phénomène sans tenir ompte de son évolu-tion dans le temps. Nous nous intéressons dans ette se tion à la modélisation sto hastique de pro essus dynamiques

[

Puig, 2003 ℄

, en se basant sur le formalisme des réseaux bayésiens dynamiques(DBN)

16

.Cesréseauxsontuneextension desréseauxbayésiensstatiquesvus jus-qu'à présent. Les ltresde Kalman, les modèles de Markov a hés (HMM)

17

,... peuvent être représenté sous laformede réseauxbayésiens dynamiques

[

Murphy,2002 ℄

.

Dans de nombreuses appli ations dans lesquelles on modélise des systèmes dynamiques, on organise les variables

Zt = (Ut, Xt, Yt)

en trois sous-ensembles.

Ut

représente les variables d'entrées,

Xt

les variables d'états (non observables) et

Yt

les variables observées. On ne s'in-téressera qu'aux pro essus à temps dis ret, les pro essus à temps ontinu ne peuvent être représentés par emodèle

[Murphy ,

2002℄.

On rée un réseau bayésien dynamique, en dupliquant à pas de temps le réseau statique et en reliant es réseaux par des ar s indiquant les dépendan es temporelles. Chaque dupli a-tion orrespond àl'évolution temporelledu réseau.Dèslors, nousdevonsdénirlemodèlede transition,

P (Qt|Qt−1)

,lemodèled'observation,

P (Yt|Qt)

,etl'état initial,

P (Q1)

.Ces distri-butionspeuventêtre onditionnéesàl'entréede ommande

Ut

sielleestprésente.Dans e as, lemodèle detransitions'é rit

P (Qt|Qt−1, Ut−1)

.

Notonspar

B

leréseaubayésien temporelàdeuxpasdetemps (2TBN).Lemodèle de tran-sition et le modèle d'observation sont alors dénis dans le (2TBN) omme le produit de la distribution deprobabilités onditionnelles:

p(Zt|Zt−1) =

N

Y

i=1

p(Zti|pa(Zti))

(2.48)

Zti

est le

ime

n÷ud au pas de temps

t

qui peut être un élément de

Xt

,

Yt

ou

Ut

et

pa(Zi

t)

sont les parentsde

Zi

t

appartenants ou non au même pas de temps

t

.Les ar s reliant lesn÷udsentrelesdiérentspasdetempsvontdegau heversladroite, equiestraisonnable d'unpointde vuedela ausalité.Pourdesraisonsdesimpli ité, onsupposequelemodèleest

16

Dynami BayesianNetworks 17

Markoviend'ordre un 18

.Onpeutreprésenter l'étatinitial,

P (Z11:N)

,parunréseau bayésien à unpasdetemps,notépar

B1

.Ensemble,

B1

et

B

représentent leréseaubayésiendynamique. Ladistribution deprobabilitéjointepour

T

pasdetemps,peutêtreobtenuepar dérouler le réseau

T

fois,puisfaire leproduitde toutes les distributions deprobabilités onditionnelles:

p(Z1:T1:N) =

N

Y

i=1

pB1(Z1i|pa(Zti))×

T

Y

t=2

N

Y

i=1

pB→(Zti|pa(Zti))

(2.49)

L'exemple donné par la gure 2.16, montre un (2TBN) et sa version déroulée pour une séquen e de longueur

T = 4

.Dans e as,

Zt1 = Qt

,

Zt2 = Yt

,

pa(Qt) = Qt−1

et

pa(Yt) = Qt

, etladistribution deprobabilités jointes'é rit :

p(Q1:T, Y1:T) = p(Q1)p(Y1|Q1)×

T

Y

t=2

p(Qt|Qt−1)p(Yt|Qt)

S'ilexiste unar reliant lemême n÷ud

Zi

sur

T

pasde temps :

Z1i → Z2i → . . . → ZTi

, e n÷udestditpersistant. Lesar sentredeuxpasdetemps sontvus ommelapersistan ed'un phénomène au ours du temps, alors que les ar s au sein d'un même pas de temps sont vus omme uneet ausalimmédiat

[

Murphy,2002 ℄

.Cependant, onpeutavoir desar sreliants desn÷udsdiérentssur

T

pasdetemps :

Zi

1 → Z2j, Zi

2 → Z3j, . . . , Zi

T −1 → ZTj

.

Fig.2.16(a)Exemple d'unréseau (2TBN)(b)Modèledéroulépour4 pasde temps(T=4).

2.8.2 Inféren e

L'inféren e dansun réseau bayésien dynamique, onsiste à al uler ladistributionde pro-babilités des variables a hées à un instant donné, onnaissant la séquen e des observations passées et éventuellement futures. Tout au long de e do ument, nousnous fo alisons sur le asdu ltrage qui onsiste à estimer l'état ourant d'après les observations présentes et pas-sées :

p(Xt|y1:t)

. La prédi tion

p(Xt+k|y1:t), k > 0

et le lissage

p(Xt−k|y1:t), k > 0

ne seront pasutilisésdans e do ument.

Sinousdénissons le réseau bayésien dynamiquepar le ouple

(B1, B→)

,il sut de dérouler e réseau pour

T

pasde temps,etappliquer n'importequels algorithmes d'inféren e statique (voir l'algorithme d'inféren e JLO). Cette façon de pro éder est onnue par l'inféren e hors ligne.Une foisl'arbredejon tion onstruit,ilpeutêtreréutilisépouree tuerl'inféren eave diérentesséquen esd'observations.Lesdeuxétapesutiliséespourl'initialisation del'arbrede jon tionetpourlapropagationd'uneéviden esontutiliséesdelamêmefaçonpourle(2TBN) déroulé.

Malgré que ette façon de pro éder est simple à mettre en ÷uvre, la onstru tion de l'arbredejon tionserarapidementtrèslourde

19

pourdesgrandes valeursde

T

.L'algorithme de onstru tion de l'arbre de jon tion ne tenant pas ompte de la stru ture redondante du réseau,rend ette méthodenonoptimale entermedetemps d'exé utionet d'espa emémoire. Plusieurs solutions ont été proposées pour résoudre e problème.

L'algorithme de lafrontièreproposépar [

Zweig, 1996 ℄

, réeun ensemblede n÷uds appelé n÷uds de la frontière, noté par

F

.Les n÷uds à gau he et à droite de

F

seront notés par

L

et

R

respe tivement.A haquepasde temps

T

,

F

doit séparerl'ensemble

L

de

R

:

R⊥ L|F

. Notonspar

hF

et

eF

lesvariables a héesetleséviden esappartenant à

F

.

eL

et

eR

désignent leséviden es appartenant à

L

et

R

respe tivement.

Dans un premier temps (passage de l'information des feuilles vers la ra ine), nous pouvons al ulerladistributiondeprobabilitésjointe

p(F )def= p(hF, eF, eL)

ommesuit.Nousajoutons un n÷ud

N ∈ R

à la frontière

F

une fois que tous ses parents setrouvent dans

F

. On aura

p(eL, eF, hF, N ) = p(eL, eF, hF)p(N|eF, eF)

puisque

N ⊥ eL|eF, hF

. Ainsi, ajouter un n÷ud à l'ensemble

F

, onsiste à multiplier sa distribution de probabilités onditionnelles par la distributionjointe.

Onsupprime unn÷ud

N

appartenant à

F

(le dépla er de

F

vers

L

)lorsque tous sesenfants appartiennent à la frontière, e qui revient à faire une marginalisation sur la variable en question (len÷ud

N

).Dans le asoù

N

est a hé,alors

eL+N = eL

et

eF −N = eF

:

p(eL+N, eF −N, hF −N) = p(eL, eF, hF −N)

p(eL+N, eF −N, hF −N) =X

N

p(eL, eF, N, hF −N)

p(eL+N, eF −N, hF −N) =X

N

p(eL, eF, hF)

ar

hF −N ∪ {N} = hF

.

Le asoù

N

estobservé est similaire:

p(eL+N, eF −N, hF −N) = p(eL+N, eF −N, hF)

p(eL+N, eF −N, hF −N) = p(eL, eN, eF −N, hF)

p(eL+N, eF −N, hF −N) = p(eL, eF, hF)

Danslese ondpassage(delara ineverslesfeuilles),nouspouvons al ulerladistribution deprobabilitésjointe

p(F )def= p(eR|hF, eF)

enajoutant etsupprimant desn÷uds dansl'ordre inverse quenousavonsutilisé danslepremier passage.

L'algorithme de lafrontièredé rit i-dessusutilise à haque pasde temps,tousles n÷uds a héspour séparerlepassé dufuture. Dans

[

Murphy,2002 ℄

,l'auteurproposed'utiliser seule-ment l'ensemble des n÷uds possédant une transition sortante vers la tran he de temps sui-vante. Cetensemble, appeléInterfa e, d-séparelepassé dufutur :

{V1:t−1, Nt} ⊥ Vt+1:T|It

Nt= Vt\ It

.Leproblèmedeltrage seréduitalors au al ulde ladistribution deprobabilités

p(It|y1:t)

à partirde

p(It−1 |y1:t−1)

.Cet algorithme nouspermetde garder en mémoire uni-quement deuxpasde temps,qui estessentielpour leltrageen ligne.

L'arbre de jon tion est onstruit pour haque

Jt = It−1∪ Vt

(

Vt

est l'ensemble des n÷uds à 19

l'étape

t

) en s'assurant qu'il existe au moins une lique

Dt

ontenant l'interfa e

It−1

et une lique

Ct

ontenant l'interfa e

It

. Pour ette raison, il sut d'ajouter un lien entre toutes les variables de

It−1

et elles de

It

après l'étape de moralisation. Les arbres de jon tions

Jt

sont reliés au moyen de leurs interfa es

It

omme le montrent la gure 2.17. Nous pouvons ee tuer l'inféren e dans haque arbre séparément, puis transmettre les messages entre eux viales n÷uds d'interfa e.

Fig. 2.17 Appli ation de l'algorithmed'interfa e surleréseau de lagure2.16.

2.8.3 Inféren e dans le Swit hing Kalman Filter

Le Swit hing Kalman Filter est onnu sous plusieurs noms : swit hing linear dynami al system(LDS),swit hingstate-spa e model(SSM), jump-Markov model, jump-linearsystem, onditional dynami linear model (DLM),... Ce type de modèle est souvent utilisé pour ap-proximer les modèles non linéaires (en supposant que es modèles sont linéaires par mor- eaux)

[

Murphy, 2002 ℄

. Le Swit hing Kalman Filter est représenté par la gure 2.18 sous formede réseaubayésienhybrideoù

St

estunevariabledis rèteet

Xt

et

Yt

sontdesvariables ontinues représentant respe tivement la variable d'état et l'observation. La distribution de probabilités onditionnelles de haque variableestdonnéepar :

p(Xt= xt|Xt−1= xt−1, St= i)∼ N(xt; Aixt−1, Qi)

p(Yt= y|Xt= xt)∼ N(y; Cxt, R)

p(St= j|St−1 = i) = M (i, j)

Fig. 2.18Modèlede réseau bayésien représentant leSwit hing KalmanFilter. Le problèmefondamentalave etype deréseau (Swit hingKalmanFilter)est que l'infé-ren eestpratiquementinfaisable arlenombredegaussiennesdeladistributiondel'état roît de façon exponentielle à haque pas de temps. Pour voir ela, supposons que la distribution initiale

p(X1)

est un mélange de

K

gaussiennes, une pour haque valeur de

S1

. Lors de la phasede marginalisation sur

S1

, haque gaussienne doit êtrepropagée à travers

K

équations (unepour haque valeur de

S2

), de telle sorte que

p(X2)

est un mélange de

K2

gaussiennes. Al'instant

t

,ladistributionde probabilités

p(Xt|y1:t)

estun mélangede

Kt

gaussiennes, une

pour haque ombinaisonpossiblede

S1, ..., St

.

Bien quel'inféren eestpratiquementinfaisable dansle asdesmodèles detypeSwit hing Kalman Filter, il existe des as parti uliers où 'est possible. Le as trivial est lorsque la variabledis rète

Sk

estobservable. Dans e as, ladistribution deprobablilités delavariable ontinue est unimodale (une seule gaussienne). Le se ond as ou l'inféren e est possible, est lorsquelesvariablesdis rètesnesontpasreliéesd'uneétapeàuneautre.Unexempleillustratif estdonné dans

[Murphy,2002℄.

2.8.4 Te hniques de rédu tion du nombre de gaussiennes

Une manière d'atténuerle nombrede gaussiennesqui roît de façon exponentielle dansle tempsestdefaireappelauxte hniquesdesele tions. Lesalgorithmesditspruning algorithm-s par exemple réduisent le nombre de gaussiennes par élimination de ertaines gaussiennes. Cesalgorithmesgardentles

N

gaussiennesdefortes probabbilités, éliminent lesautres et nor-malisentles probabilitésdetels sorte quelasommeestégale à1.Lele teurpeuttrouverplus de détailssur es algorithmesdans

[Uri,2002℄ et

[Bar-Shalom

et Fortmann, 1988℄.

Uneautreappro hedite Collapsing ouGeneral Pseudo-Bayesian algorithms(GPB) onsiste à partitionnerles gaussiennes en

N

sous-ensembles.L'algorithme (GPB)limite lenombre de gaussiennes de l'état à

N

orrespondent aux nombres de sous-ensembles. Pour mieux om-prendre le fon tionnement de ette appro he, donnons un exemple tiré de la thèse de

[ Uri, 2002

. Supposons que nous avons

M

gaussiennes à l'étape

t = 1

.

M

est le nombre de om-binaisons possiblesde lavariable dis rète.Après laphasede propagation, nousobtenons

M2

gaussiennes. Ces

M2

gaussiennes sont  ollapsées en

M

gaussiennes. La gure 2.19 illustre ette appro he pour un nombre de gaussiennes égale à 3

(M = 3)

. Pour plus de details sur esappro hes, nousrenvoyonslele teur aufameux livrede

[Lauritzen, 1996℄ età lathèse de [ Uri,2002 ℄ .

Une autremanière pour faire fa eaunombrede gaussiennesqui roît de façon exponentielle, estl'utilisation desalgorithmesd'inféren eapproximatifs(exemplelesltresparti ulaires)qui ont étéutilisésave su èssur etype demodèle.Ces typesd'algorithmessont traitésplusen détailsdans [ Uri,2002 ℄ et [ Murphy,2002 ℄ .

Fig. 2.19  Exemple de fon tionnement de l'algorithme (GPB) : General Pseudo-Bayesian algorithmspour

M = 3

.Chaque er lereprésenteunegaussienne(lesre tanglesave lanoti e prop(),représentent lapropagation de haque gaussienne).

2.9 Con lusion

Ce hapitre adonné lesprin ipaux aspe ts on ernant lesréseauxbayésiens. Lanotion de fa torisation de ladistribution de probabilités jointes d'ungraphe triangulé est àla basedes modèles dé omposables. Par la suite, nous avons introduit le théorème de Jensen qui fait le lien entreles graphes triangulés etles arbres de jon tion.Le grapheinitial est transformé en un arbre de jon tion où haquefamille de n÷uds est regroupée dans une lique, l'arbreainsi trouvé satisfaitlarègle de haînage ( hainrule).

L'arbredejon tionestinitialisépournouspermettrede al ulerlesdistributionsdesvariables a hées. Cette initialisation se fait en deux étapes. On ommen e par remonter les ux des données à partir des feuilles jusqu'à la ra ine. La deuxième étape onsiste à faire passer les uxde lara ine jusqu'auxfeuilles. L'arbre atteint ainsiunétat d'équilibre.

Lapropagationd'unenouvelleobservationdansl'arbredejon tionutiliselemêmeprin ipeque l'algorithme d'initialisation de et arbre. La nouvelle observation est passée entre les liques voisines (depro he en pro he)etpar onséquent,les potentiels des liquesetdesséparateurs sont modiés.

Lesréseaux bayésiens permettent de manipulernon seulement les variablesdis rètesmais également les variables ontinues.Dans e ontexte, ona présentéles réseauxbayésiensà va-riables ontinues où la distribution de probabilités de haque variable est supposée linéaire Gaussienne. L'utilisation desvariables dis rètes et ontinues dansle même réseau est dé rite à la n de e hapitre. La seule parti ularité de e type de réseau est quela distribution de probabilitésde haquevariableest supposée onditionnelle Gaussienne(CG).

Lanon fermeturede la(CG)distribution (lasommede deuxGaussiennen'est pasune Gaus-sienne)nousobligeàutiliserdesapproximations.Uneautremanièrede ontourner eproblème est d'avoir re ours une autre fois à lathéorie des graphes. L'élimination de ertains hemins dansleréseau initial, donne à l'arbre dejon tion une nouvelle propriété. Onparle alors d'un arbredejon tionfortementdé omposable(présen ed'unera ineforte).Cettepropriétédonne aux liques une ohéren e de tellesorte qu'à lan de la phase de propagation desmessages, les liques ontiennent les mêmesinformations surlesvariables partagées.

La modélisation de pro essus dynamiques par le formalisme des réseaux bayésiens dyna-miques est abordée à la n de e hapitre. Ces réseaux sont onstruits en dupliquant à pas de temps le réseau statiqueet en reliant es réseaux par des ar s indiquant les dépendan es temporelles. Dès lors,nous devonsdénir le modèle de transition, lemodèle d'observation et l'étatinitial.

L'inféren edansle asd'unréseaubayésien dynamiquesuit lemêmes hémad'inféren epour le réseau bayésien statique. Il sut de dérouler le réseau pour

T

pas de temps, et appliquer l'algorithmes d'inféren e utiliser sur n'importe quel réseau statique. Cependant, la onstru -tion de l'arbrede jon tion sera rapidement très lourde pour desgrandes valeurs de

T

, e qui rendl'inféren eexa teimpossibledanslaplupartdes as.Pourrésoudre eproblème,plusieurs appro hes essayent d'exploiter laredondan e du réseau de tellesorte detrouver unensemble de n÷udsqui permetde séparerlefuture dupassé.

Le hapitresuivantprésentelaméthodedéveloppéepourlalo alisationd'unvéhi uleouun traindevéhi ulessurune arte.Nousavons hoisile adredesréseauxbayésiensdynamiques,

lesmodèlesutilisésdanslesappli ationsréelles,ainsiquel'in ertitudedonnéeparles apteurs. La fusion multi- apteurs par un réseau bayésien se fait de la même manière qu'un ltre de Kalman. Deplus, e type de réseau nouspermetd'utiliser les variables dis rèteset ontinues danslemêmeréseau. Cettedernière ara téristique estbienutiledansle hapitre suivant ar elle nous permetde représenter le problème de map-mat hing par un réseau bayésien dont lessegmentsderoutes sontreprésentés parune variabledis rèteetlapositionduvéhi ulesur le(s)segment(s) par une variable ontinue.

Lapartiegraphiquedesréseauxbayésiensoreunoutilintuitifetattra tifdontlamodélisation d'untrain de véhi ule est réalisée par simple dupli ation du réseau (servant à la lo alisation d'unvéhi ulesurune arte) pour haque élément du onvoi.

Appro he développée

3.1 Introdu tion

Le problème de la lo alisation peut être vu omme l'estimation de la position d'un ro-bot étant donné les mesures bruitées données par un ensemble de apteursproprio eptifs ou extéro eptifs. La tâ he de lo alisation peut se réaliser par un GPS. Or, omme mentionné auparavant,en milieuurbain, lemasquage dessignauxdessatellitespeut parfoisêtrelong, en raisondelanonvisibilitésatellitaireetdesmultitrajetsdesondesGNSS

20

.Ainsi,l'utilisation d'autres apteurs est né essaire si on her he un positionnement pré is, sûr, intègre et sans interruptiondeservi e.Cependant, au undes apteursutilisésdansledomaine dela lo alisa-tionqu'ilsoitextéro eptifouproprio eptifn'estparfaitàluiseulpourlatâ hedelo alisation.

Le problème de la lo alisation est parti ulièrement ritique dansle adre de l'a ro hage immatériel auquel nous nous sommes intéressé dans ette thèse. Rappelons qu'il s'agit de onstituer un train de véhi ules dont seul le premier est piloté par un opérateur humain, les véhi ules suiveurs étant en mode autopilotage. En eet, une géo-lo alisation pré ise d'ordre entimétrique de ha un des véhi ules est né essaire pour les modules de ontrle des véhi- ulessuiveurs (suivide traje toire duvéhi ulede têteetrespe td'uné artprédéni entreles véhi ules).

La fusion multi apteurs devient de e fait, né essaire et parti ulièrement importante autant d'un point de vue fondamental que pour les appli ations pratiques. Les données fusionnées reètent non seulement l'information générée par haque apteur, mais en ore l'information qui n'aurait pu être inférée par au un apteur pris séparément. Les modèles graphiques pro-babilistes et parti ulièrement les réseaux bayésiens sont parfaitement propi es dans e adre pour leur robustessevis-à-visde l'in ertitudetant desmodèles que desdonnéesmesurées.

Ce hapitre est divisé en deux parties. Dans un premier temps, nous nousintéressons au domainedelafusiondedonnéesparunréseaubayésienpourlalo alisationd'unrobot surune arte.Alan de ettepartie nousproposonsune méthode baséesurlesmodèles haînésdans lebutde ontourner leproblèmedelanonlinéarité. Cetteappro he onsisteare her herune transformationexa ted'unsystèmenonlinéaireanderéé rire esystème ommeunsystème linéaire.

20

La se onde partie de e hapitre on erne lamodélisation etlalo alisation par un réseau bayésien d'untrain devéhi ules dansle asoùles véhi ulessuiveurs onnaissent le hemin de référen e( eluiemprunté par levéhi ule detête).

Documents relatifs