• Aucun résultat trouvé

Si l’approche du math´ematicien face `a un probl`eme conduit souvent `a la for- mulation puis l’´etude th´eorique de nouveaux mod`eles math´ematiques, les algo- rithmes d´evelopp´es pour r´esoudre ces probl`emes de mani`ere rigoureuse peuvent parfois s’av´erer peu efficaces et dissuader de leur utilisation sur de vraies donn´ees. C’est typiquement le cas de l’approche TV-LSE pr´esent´ee `a la section 1.4 qui

1.5. L’importance des algorithmes rapides 31

constitue du point de vue math´ematique une alternative originale et ´el´egante au mod`ele MAP pour la restauration d’images conduisant `a des r´esultats th´eoriques (comme par exemple l’absence formelle de staircasing dans l’image d´ebruit´ee

avec TV-LSE) qui traduisent une compr´ehension avanc´ee des images produites avec ce mod`ele, mais dont le calcul pratique s’av`ere peu efficace du fait de la faible vitesse de convergence de la m´ethode MCMC mise en jeu. Dans le cas du mod`ele TV-LSE, nous avons vu qu’il ´etait possible de repartir du probl`eme math´ematique pour en formuler une nouvelle variante, TV-ICE, menant `a un algo- rithme beaucoup plus rapide (avec une vitesse de convergence lin´eaire par rapport au nombre d’it´erations), tout en conservant des r´esultats th´eoriques du mod`ele TV-LSE (comme l’absence de staircasing).

Un autre exemple o`u un mod`ele math´ematique m`ene `a un algorithme int´eressant mais peu efficace du point de vue computationnel est le mod`ele de d´etection de trajectoires r´eguli`eres `a partir d’une s´equence de nuages de points, propos´e par Primet [2011] durant sa th`ese (voir aussi [Primet et Moisan 2012]), sous le nom de astre (pour A-contrario Smooth TRajectory Extraction ).

Cet algorithme est bas´e sur la m´ethodologie a contrario d´evelopp´ee par De-

solneux, Moisan, et Morel [2008] (les concepts ont ´et´e introduits pour la premi`ere fois dans [Desolneux et al. 2000], voir aussi [Desolneux et al. 2003]), qui est bas´ee sur la formulation math´ematiques de grands principes de perception visuelle, dont le plus connu est le principe de Helmoltz (voir [Lowe 1985]). De mani`ere in-

formelle, ce principe stipule que le syst`eme perceptuel humain ne d´etecte que les structures (ou plus pr´ecis´ement lesgestalt, en r´ef´erence aux travaux effectu´es

par les  gestaltistes, du d´ebut du xxi`eme si`ecle tels que [Wertheimer 1923,

Metzger 1975]) qui n’auraient pu apparaˆıtre par hasard dans un bruit blanc. Une illustration de ce principe est propos´ee en Figure 1.7. Bas´ee sur le principe de Helmoltz, la m´ethodologie a contrario consiste `a d´etecter des structures par rejet d’un mod`ele de hasard (ou mod`ele na¨ıf) not´e H0, autrement dit, on cherche a

d´etecter les structures trop rares pour apparaˆıtre par chance dans H0.

Pour construire un d´etecteur a contrario, il faut dans un premier temps d´efinir un mod`ele H0 d´ecrivant ce que pourraient ˆetre des donn´ees tir´ees au hasard.

Par exemple, si l’on consid`ere le probl`eme de d´etection d’alignements de points ´

evoqu´e `a la Figure 1.7, les donn´ees consistent en une seule image de domaine Ω contenant N points. On peut alors formuler le mod`ele H0 suivant : les N

points de l’image ont ´et´e tir´es ind´ependamment selon une loi uniforme sur Ω .

Dans un second temps, on doit construire une fonction de mesure permettant de faire ressortir les structures rares dans H0. Toujours dans le cas du probl`eme de

Figure 1.7: Illustration du principe de Hemholtz (cette Figure est partiellement tir´ee de [Primet 2011]). Pourquoi un alignement de points dans l’image de gauche nous saute-t-il aux yeux ? D’apr`es le principe de Helmoltz, notre syst`eme perceptuel d´etecte cette structure car un tel alignement aurait peu de chances de se produire par hasard si les positions des points avaient ´et´e tir´eesau hasarddans cette image. Des alignements de points peuvent ˆetre

trouv´es dans l’image du milieu mais ils ne sautent pas aux yeux, car ils ne constituent pas des ´ev`enements rares dans du bruit. L’image de droite illustre l’approche d´ecrite dans [Desolneux et al. 2008] pour formaliser en termes math´ematiques l’effet de surprise associ´ee `a l’observation d’une structure donn´ee. En supposant que les positions des 13 points de cette image ont ´et´e tir´ees ind´ependamment et uniform´ement sur le domaine rectangulaire (ceci constitue notre mod`ele

H0), on s’´etonne de trouver 6 points dans une bande (d´elimit´ee par des pointill´es rouges) de

faible ´epaisseur. Ce niveau de surprise peut-ˆetre mesur´e en calculant la probabilit´e qu’un tel ´ev`enement se produise dansH0.

d´ecouper l’image en bandes B de faible ´epaisseur (on discr´etise les orientations des bandes et on note BΩ l’ensemble de toutes les bandes ainsi d´efinies). On

compte alors dans chaque bandeB le nombre de points n(B) contenus dans B. Plus n(B) est grand, plus on peut consid´erer comme rare dans H0 la structure

correspondant au groupe de points contenu dansB. Si n(B) constitue une mesure int´eressante sur les donn´ees, il serait n´eanmoins d´elicat d’essayer de la seuiller pour d´ecider si les points contenus dans B doivent ˆetre d´etect´es ou non comme des points align´es dans l’image. En effet, le choix d’un tel seuil promet d’ˆetre difficile car la quantit´e de surprise li´ee `a l’observation d’un nombre de points n(B) dans B reste tr`es d´ependante aux param`etres du probl`emes (le nombre total de points N , la surface de la bandeB et la surface du domaine de l’image Ω). Au lieu d’exploiter directement cette mesure, on l’utilise pour d´efinir une famille de fonctions {NFAB}B∈BΩ appel´ee Nombre de Fausses Alarmes (NFA)

pour la mesure n. Celle-ci est d´efinie par

∀B ∈ BΩ, ∀k ∈ [0, N ], NFAB(k) = #BΩ· PH0(n(B) = k) , (1.20)

1.5. L’importance des algorithmes rapides 33

bandes dans l’image. Ce Nombre de Fausses Alarmes satisfait la propri´et´e suivante EH0(# {B ∈ BΩ, NFAB(n(B)) ≤ ε}) ≤ ε , (1.21)

qui stipule que dans H0, on trouve en moyenne moins de ε bandes B satisfaisant

NFAB(n(B)) ≤ ε. On d´ecide de d´etecter les alignement par seuillage du NFA

avec un seuil ε > 0, c’est-`a-dire que l’on consid`ere comme align´es les points conte- nus dans une bande B d`es lors que NFAB(n(B)) ≤ ε, on dit alors que la bande B (ou le groupe de points qu’elle contient) est ε-significative. La propri´et´e (1.21) stipule alors qu’en moyenne, moins de ε d´etections sont faites dansH0. Cela donne

un sens concret au seuil ε, ce dernier repr´esente un majorant du nombre moyen de d´etections autoris´ees dans du pur bruit H0, c’est-`a-dire du nombre moyen

de fausses d´etections. Pour construire `a partir de (1.20) et (1.21) un algorithme concret de d´etection d’alignements de points, on adopte une d´emarche glou-

tonne, qui consiste `a retirer it´erativement des donn´ees le groupe de points qui

pr´esente le NFA le plus faible (si ce dernier est inf´erieur `a ε) et `a recommencer jusqu’`a ce qu’il ne reste plus de groupes de points de NFA inf´erieur `a ε dans la s´equence.

Depuis [Desolneux et al. 2000], des d´etecteurs a contrario ont ´et´e d´evelopp´es pour une grande quantit´e d’applications, telles que la d´etection de contours [De- solneux et al. 2001]), de segments [Von Gioi et al. 2008a,b], de jonctions [Xia et al. 2014], de spots (ou tˆaches) sur fond textur´e [Grosjean et Moisan 2009], de changement sous-pixelliques dans des images radars [Robin et al. 2009, 2010], et bien d’autres encore [Rabin et al. 2009,Akinlar et Topal 2013]. Parmi les princi- paux atouts de ces d´etecteurs, on met souvent en avant leur robustesse au bruit, ainsi que le fait qu’ils ne n´ecessitent le r´eglage que d’un seul param`etre ε et ce r´eglage est particuli`erement simple `a la lumi`ere de la propri´et´e (1.21) puisque le param`etre ε repr´esente un majorant du nombre de fausses d´etections autoris´ees. Un autre int´erˆet majeur de ce mod`ele est que la formule du NFA qu’il produit (par exemple (1.20) dans notre exemple de d´etection d’alignements) peut ˆetre utilis´ee pour filtrer les structures d´etect´ees `a l’aide d’un autre d´etecteur, afin d’en ´

eliminer les fausses d´etections. De mani`ere plus g´en´erale, le NFA peut ˆetre uti- lis´e pour quantifier la d´etectabilit´e d’une structure, au sens o`u, pour un seuil de d´etection ε donn´e (par exemple ε = 1 pour fixer les id´ees), toute structure ayant un NFA sup´erieur `a 1 apparaˆıtra en moyenne environ 1 fois dans des donn´ees al´eatoires H0, on peut alors dire qu’elle n’est pas d´etectable (au niveau de seuil

ε = 1). L’´etude du NFA conduit alors `a des r´esultats tr`es int´eressants concernant la d´etectabilit´e des structures, on peut par exemple dans le cas des alignements de points s’int´eresser au nombre minimal de points que doit contenir une bande

donn´ee B pour devenir d´etectable, on peut ´egalement ´etudier comment ´evolue ce nombre minimal de points en fonction du nombre total de points pr´esents dans les donn´ees N , de l’´epaisseur des bandes, de la taille du domaine Ω, etc. La m´ethodologie a contrario fait encore l’objet de recherches passionnantes, voir par exemple [Desolneux 2016, Desolneux et Dor´e 2016] o`u l’on s’int´eresse `a des mod`eles H0 plus riches que les mod`eles classiques, dans lesquelles on est capable

d’assurer qu’une structure donn´ee n’est pas significative (cette probl´ematique est ´egalement adress´ee dans la th`ese deDor´e [2014]).

Revenons `a pr´esent au probl`eme de d´etection de trajectoires consid´er´e parPri- met [2011]. Dans ce travail, on consid`ere comme point de d´epart la donn´ee d’une s´equence de points pr´ealablement d´etect´es dans une s´equence d’images. On consid`ere donc un ensemble {f1, . . . , fK} contenant K frames (le terme de frame

d´esigne ici un ensemble de points issus de la d´etection effectu´ee sur une image de domaine Ω), tel que chaque frame fk contienne Nk points (un point ´etant

repr´esent´e par ses coordonn´ees dans Ω). Les points traduisent la pr´esence d’ob- jets dans la s´equence d’image, n´eanmoins l’´etape de d´etection de ces points ´etant imparfaite, il faut garder `a l’esprit que ces donn´ees sont entach´ees d’erreurs : cer- tains points de la s´equence correspondent `a de fausses d´etections, on parle de points aberrants, d’autres sont au contraire manquants, c’est `a dire qu’ils n’ont pas ´et´e d´etect´es dans certaines frames. On s’int´eresse au probl`eme de d´etection de trajectoires r´eguli`eres (ou lisses) dans de telles donn´ees. Des probl´ematiques similaires sont couramment consid´er´ees (incluant ou non l’´etape de pr´e-d´etection des points) dans la litt´erature [Reid 1979, Bar-Shalom et al. 1983, Rangarajan et Shah 1991, Chetverikov et Verestoy 1999, Veenman et al. 2001, 2003, Bar- Shalom 2006, Fleuret et al. 2008, Berclaz et al. 2011]. De mani`ere g´en´erale, ces m´ethodes sont souvent con¸cues dans un cadre assez restreint et n´ecessitent des modifications ad hoc successives pour traiter le cas g´en´eral (pr´esence de points aberrants, ou points manquants) que l’on consid`ere ici. L’approche a contrario astre propos´ee dansPrimet[2011] se r´ev`ele extrˆemement efficace pour traiter ce probl`eme, mais conduit n´eanmoins `a un algorithme dont la complexit´e enO(K2) s’av`ere r´edhibitoire pour traiter de longues s´equences (typiquement d`es lors que K ≥ 1000 frames). Dans le Chapitre 6 de cette th`ese, nous nous int´eressons `a une variante de astre qui consiste `a d´ecouper la s´equence {f1, . . . , fK} en sous-

s´equences de taille plus petites (avec recouvrement), et `a traiter s´equentiellement ces sous-s´equences en d´efinissant une strat´egie de prolongement des trajectoires dans les zones de recouvrements entre les frames. Cette variante, appel´ee cu- tastre, conduit `a un algorithme de complexit´e O(K), tout en conservant la propri´et´e de NFA qui permet de contrˆoler le nombre de fausses d´etections. Cette

Documents relatifs