• Aucun résultat trouvé

III. Détetion de hangements à l'éhelle sous-pixelique 101

7.2. Détetion a ontrario

Leprinipededétetionaontrario,introduitenanalysed'imagespar[Desolneuxet al.,2000 ℄,

permetde alulerunniveaudesigniativitésansavoiràmodéliserleshangements,nià

quanti-er leséartsattendus(bruit,distortions,variabilitéintrinsèque,et.),i.e.en introduisanttrèspeu

d'informationapriori.Cetteapprohesystématiqueestbaséesurunprinipesimplede pereption

attribuéàHelmholtz.Selone prinipe,notrepereptionreposesur ladétetion destruturesqui

s'opposent au hasard. Il suggère don de déteter des strutures (lignes, ourbes, et.) en tant

qu'événement rare par rapport àun modèlenaïf, aléatoire (non struturé). Cette idéeest

essen-tiellepourlagénériitédesmodèlesaontrariopuisqu'ellepermetde déteterdesstruturessans

herheràlesmodéliserpréisément. Formellement,l'approheaontrarioreposesurunemesure

delasigniativitéd'unedétetionparl'espéranedunombredefaussesalarmespluttquela

pro-babilité d'unefausse alarmeomme pourles approhes statistiqueslassiques[Bonferroni, 1936℄,

[Hommel,1988℄.

Dénition 7.2.1 Soit

E

l'ensembledesévénementspotentiellementdétetables,et

P

la probabi-litésur

E

d'apparitiondesévénements.Atoutévénement

e ∈ E

estassoiésonnombredefausses

alarmes,déni par

N F A(e) = | E | · P (e)

(7.2.5)

et pourtout réel

ε > 0

,

e

est dit

ε −

signiatifsi etseulement si

N F A(e) ≤ ε.

(7.2.6)

Cette dénition ne peut être utilisée qu'après avoir déni un modèle naïf suivant le prinipe de

Helmholtz,modèlepermettantdedonnerunsensàlaprobabilité

P (e)

.Unetelledénitionpermet

de garantir que l'espérane du nombre de fausses alarmes soit inférieur à

ε

(f. preuve de la

proposition 7.2.4). L'utilisation de l'espérane permet de s'aranhir du fait que les détetions

multiplesnesoientpasindépendantespourdéterminerledomainededétetiondemanièreabsolue.

Il permet de ontrlerle nombre moyen de faussesdétetions et de déterminer automatiquement

leseuildedétetionenonséquene. Laméthodeestalorsréduiteàunseulparamètre:lenombre

de faussesalarmes.

Pour xer les idées sur le prinipe de ette approhe et l'avantage d'utiliser des

es-péranes plutt que des probabilités, reprenons l'exemple des dates d'anniversaire proposé par

[Desolneux et al.,2006 ℄. Dans un groupe de

N

personnes, supposons que deux d'entre ellesont

la mêmedate d'anniversaire. Cetévénementest-ilsigniatif,i.e.est-ilpossiblequee soit arrivé

par hasard ou y a-t-il une raison à ela? En aord ave le prinipe de Helmholtz, supposons,

en négligeant les années bissextiles, que toutes les dates d'anniversaire aient la même

probabi-lité d'ourene

1/365

. Pour évaluer la signiativitéde l'événement onsidéré,nous avons deux possibilités:

1. Caluler laprobabilitéquedeux personnes,au moins,aient lamêmedate d'anniversaire :

1 − 1 ·

Une tabulationest alorsnéessaire poursavoirsi ette probabilité estinférieure à

ε

.

2. Suivant la dénition7.2.5, onsidérons l'ensemble

E

desévénements

e kl =

"lespersonnes

k

et

l

ont la même date d'anniversaire, ave

1 ≤ k < l ≤ N

,et la mesure

µ

dénie par

Ce ritèreest beauoup plussimpleque(7.2.7)puisqu'il reliequadratiquement

N

à

ε

.

Réemment, [Grosjean etMoisan, 2006 ℄ ont proposé la dénitionsuivante du nombre de fausses

alarmes dansunadreplus général.

Dénition 7.2.2 Soit

(X i ) 1 i N

un ensemble de variables aléatoires. Une fontion

F (i, x)

est

un

N F A

(nombre de faussesalarmes) pourles variables aléatoires

(X i )

si

∀ ε, E [ |{ i, F (i, X i ) ≤ ε }| ] ≤ ε.

(7.2.9)

Ave ette dénition, si une fontion

F

vérie (7.2.9) , alors la famille de tests

F (i, X i ) ≤ ε

garantit un nombre moyen de fausses alarmes inférieurà

ε

.Le prinipe de la détetiona

ontra-rio permet don une ertaine objetivité dans la mesure où il utilise très peu d'information a

priori. Il permet ausside réduire tous les paramètresnéessaires à ladétetion à unseul ritère:

l'espérane du nombre de fausses alarmes. Ce dernier point est essentiel puisque, en pratique,

il rend la détetion entièrement automatique en xant le nombre attendu de fausses alarmes à

1

par exemple. Ce type de détetion a déjà été appliqué, notamment, à la détetion

d'aligne-ments [Desolneux et al.,2000℄, de bords ontrastés [Desolneux etal.,2001℄, de modes

d'histo-grammes et d'amas de points [Desolneuxet al.,2003 ℄, de rigidités entre deux nuages de points

[Moisan et Stival,2004 ℄.

Leproblèmedeladétetiondehangementssurlasurfaeterrestreàpartirdedonnéesde

télédetetion doittenirompted'un ertainnombredefateursspéiquesquirendentineaes

nombre de méthodes d'analyse d'images multitemporelles utilisées habituellement pour d'autres

appliations.Parexemple,lesvariationsd'illuminationetd'humiditédusol,lesdiérenesde

ali-brationduapteurentrelesdatesonsidérées,l'absened'informationapriorisurleshangements

attendus, ou les imperfetions de realage sont autant de fateurs à prendre en ompte, même

s'ilsdonnent lieu engénéral àunesériede prétraitementsspéiques(orretions radiométriques,

realage, et.). Les hangements suseptibles de se produire sur lasurfae terrestretels que, par

exemple,lesrotationsdeulture,laontaminationde parellesagrioles,lesoupesdeforêtoules

inendies,peuventêtrede tailleetd'intensitéradiométriquetrèsvariées.Dansl'objetifd'élaborer

uneméthode génériquede détetionde hangements, iln'estdonpas envisageablede listertous

les hangements possibles pour dénir un modèle a priori des hangements. De plus, les prols

d'évolutiontemporelledesdiérentstypesd'oupationdusolsontvariablesd'uneannéeàl'autre,

etd'unezonegéographique àuneautre. Unmodèleapriorisurlesnon-hangementssemblealors

aussidiileàdénir physiquement.

Nousproposonsdenousplaerdansleadredelamodélisationaontrariopourdéteter

un sous-domaine de l'image en tant que grande déviation à partir d'un modèle générique. Etant

donnée une labellisation

λ

(image HR onstante par moreaux) dérivant l'état de la surfae

étudiée à une date

t 0

xée , et une image BR de la même sène aquise ultérieurement à une date

t

(

t > t 0

), nous proposons de déteter dans quel sous-domaine spatial

D

la labellisation

λ

est enore orrete à la date

t

.L'ensemble des pixels BR orrespondant à un hangement de type d'oupation du sol est alors le omplémentairede

D

.Dans et objetif,nous introduisons unemesuredeohérene entrelalabellisationhaute résolutionet l'imageBRobservée fondéesur

le degré de ontradition qu'elle implique en référene à un modèlenon struturé, dit modèle a

ontrario. La méthode que nous proposons repose don sur la dénitiond'un modèle naïf, dit a

ontrario.

Dénition 7.2.3 (modèlea ontrario pour la BR) Lemodèleaontrario(

H 0 (m)

)pourl'image

basserésolutionest unhamp aléatoire

V

de

|D

BR

|

variablesgaussiennesi.i.d.

N (m, σ 2 I |D

BR

| )

m ∈ R |D

BR

|

et

σ > 0

sontxés.

Lehoixdesparamètresdumodèlenaïfestdisutédanslasetion7.3.L'éart-type

σ

estonsidéré

omme xé, et nous étudierons plusieurs possibilités pour le veteur des moyennes. Avant de

disuter les valeurs de esparamètres, poursuivons ladesription dumodèlede détetion dansle

as général.

Suivant le prinipe de Helmholtz, dérit pour la première fois en analyse d'images par

[Lowe,1985 ℄, deux éléments peuvent être groupés si leur position a une probabilité très faible

de résulter d'un arrangement aidentel; nous nous intéressons aux sous-domaines de l'image

pour lesquels l'erreur quadratique mesuréeentre l'image et sonestimée est trop petite pour être

raisonnablementexpliquée parlehasard. Enfait, ils'agitde s'étonner quel'intensitéobservée sur

un sous-domaine de

D

BR soit partiulièrementprohe, pour une ertainefamille de valeurs

µ

,de

l'intensitéestiméeà partir desproportions de haque label etde lafamille

µ

.Unedesprinipales

diultés estalorsladénitionobjetiveetautomatique d'unseuilaprioriàpartirduquel l'erreur

δ(v D )

n'est plus onsidérée omme aeptable. Un seuil de détetion

δ D

pourrait être hoisi de

manière àgarantir que

P ( ∃ D, δ(V D ) ≥ δ D ) ≤ ε,

(7.2.10)

ε

estunparamètre(parexemple

10 3

)et

δ(V D )

l'erreurquadratiqueobtenueenonsidérant lehampaléatoire

V

déritparlemodèleaontrario(imagedebruitblangaussien).Leparamètre

ε

permet de ontrler la abilité du test. En eet, plus

ε

est petit, plus le test est exigeant et

able. Cependant, les dépendanes entre les variables aléatoires

(δ(V D )) D ∈D

BR sonttrès diiles

à estimer,e quirend impossiblele alulexpliitede

P ( ∃ D, δ(V D ) ≥ δ D )

.

Suivantlestravaux[Desolneux et al.,2000 ,Desolneux et al.,2001 ,Desolneux et al.,2003 ℄,

nous proposons de mesurer l'espérane dunombre de fausses détetions plutt que de ontrler

laprobabilitédefaussesdétetions.Leritèrequenousproposons permetd'établir unemesurede

ohérene pourunsous-domainevis-à-visd'unelabellisation.Ilest modélisédemanièreàgarantir

quelenombrededétetionsobtenuessurdesdonnéesaléatoiressoitaussifaiblequesouhaité.Pour

ela,une quantiation dunombrede tests(nombrede sous-domainesétudiés) est néessaire.

Le nombre de tests

η

est un oeient de pondération apable de ontrler le nombre moyen de fausses détetions et, par la même oasion, d'éviter l'introdution d'un seuil de

dé-tetion. Cette dénition est guidée non seulement par la ontrainte de ne pas déteter à tort,

mais aussi par elled'obtenir une méthode à un paramètre unique :le nombre moyen de fausses

alarmes aeptable. En pratique, il sut de le xer à

1

pour obtenir une méthode automatique.

Les méthodes statistiques lassiques sont aussi, typiquement, dépendantes d'un seul paramètre

mais ils'agiten général duseuilde déision surlaprobabilité maximale.Cetype de seuilest très

dépendant du ontexte et des images utilisées. Dans l'objetif de ontrler le nombre de fausses

alarmes,[Desolneux etal.,2000 ℄ontintroduitlanotiond'événements

ε

-signiatifspermettantde déterminer automatiquementle seuilde détetion en fontiond'un unique paramètre :le nombre

maximalde fausses détetions autorisé.

Proposition 7.2.4 (nombre de fausses alarmes) Soient

η : N → N

et,pourtoutsous-domaine

D ⊂ D

BR,

P H 0 [δ(V D ) ≥ δ(v D )]

laprobabilité d'observer une erreur minimaleinférieure à

δ(V D )

sous l'hypothèse

H 0 (m)

.Larelation

N F A(D, δ(v D ), σ, m) = η( | D | ) · P H

0 [δ(V D ) ≥ δ(v D )]

(7.2.11)

dénit unnombrede faussesalarmesdès que

X

D ∈D

BR

1

η( | D | ) ≤ 1.

Soit

ε > 0

,unsous-domaine

D

de

D

BR estdit

ε

-signiatifsi

N F A(D, δ(v D ), σ, m) ≤ ε

.

Démonstration.

D'après ladénition7.2.2,

N F A(D, δ(v D ), σ, m) = η( | D | ) · P H

0 [δ(V D ) ≥ δ(v D )]

(7.2.12)

dénit un nombre de fausses alarmes si, pour tout

ε > 0

, l'espérane du nombre de domaines

ε

-signiatifs,sous

H 0 (m)

,est inférieureà

ε

.Notons

χ D

lavariablealéatoirebinairequivaut

1

si

le sous-domaine

D

de

D

BR est

ε

-signiatif,

0

sinon, i.e.

χ D =

( 1

si

N F A(D, δ(v D ), σ, m) ≤ ε 0

si

N F A(D, δ(v D ), σ, m) > ε.

La variable aléatoire

N DS ε = P

D ⊂D

BR

χ D

représente alors le nombre de sous-domaines

ε

-signiatifs dans

D

BR.Parlinéarité,l'espérane dunombrede sous-domaines

ε

-signiatifsest

E [N DS ε ] = X

sous-domaine de

D

BR, notons

δ ε (D)

le résidu minimal sur

D

tel que le sous-domaine

D

soit

ε

-signiatif :

Montronsqueette valeurestbiendénie.Pourela,onsidéronslafontion

f : I → [0, 1]

dénie

pourtout

δ ∈ I

par

f (δ) = P H

de variablesaléatoiresindépendantes àdensité.Lafontionde répartitiond'unevariableàdensité

étant ontinue,lafontion

f

estontinue de

I

dans

[0, 1]

.Paronséquent,

f 1

est ontinue en tant que fontion réiproque d'une fontion ontinue et monotone (la

fontion

f : δ 7→ P H 0 [δ(V D ) ≥ δ]

est déroissante). Ainsi,

n

δ ∈ I, P H 0 (δ(V D ) ≥ δ) ≤ η(| ε D |) o

estunensembleferméetbornéentantqu'imageréiproqued'unintervalleferméetbornéparune

fontion ontinueet saborneinférieure est atteinte.

Don l'espéranedunombre de domaines

ε

-signiatifssatisfait

X

Don

Ilsutdondehoisir

η

vériantetteinégalitépourgarantirunnombremoyendefaussesalarmes

inférieur à

ε

.

2

Le hoix le plus naturel pour le nombre de tests est de onsidérer l'ensemble de tous les

sous-domaines de

D

BR,soit

faussesdétetions.Deplus,ilpermetderépartirlerisqueuniformémentsurtouslessous-domaines

de

D

BR (quelquesoitleur tailleet mêmes'ilsse reouvrent).Eneet, pourtoutsous-domaine

D

de

D

BR,laprobabilitédedéteter

D

parerreur(i.e. que

D

soit

ε

-signiatifsousl'hypothèse

H 0

)

vaut alors

P H

0 (δ(V D ) ≥ δ(v D )) = ε

2 |D

BR

| ,

(7.2.21)

oùlemembrededroitenedépendpasde

D

.Unsous-domainedeardinal

k

estalorspénalisédela

mêmemanièrequ'unsous-domainedeardinal

k 6 = k

.Parhasard,lesdomainesdetaillesmoyennes

vontdonêtredavantage détetésparhasard(i.e. sous

H 0

)que euxdetaillesextrèmespuisqu'ils

sontplusnombreux.Aveenombrede tests,lemêmepoidsestattribuéàtouslessous-domaines

alors qu'intuitivement, pour l'appliation onsidérée, on souhaiterait bénéier d'une estimation

plus robuste sur les grands sous-domaines que sur les petits. De plus, il orrespond au alul du

nombre total de sous-domaines de l'image, de nombreux reouvrements des sous-domaines sont

alorsprisen ompte.

Le répartition des tests est nalement hoisie ave une ertaine liberté, elle peut être

vue omme une fontionde poids permettantd'exprimer una prioripour ladétetion.En e qui

onerne l'appliation visée, nous sommes tentés de favoriser la détetion des sous-domaines de

grande taille. Nousproposonsdon unealternativeen déterminant unnombre de testsquitienne

ompte de la taille des sous-domaines onsidérés et qui soit inférieur à

2 |D

BR

|

. Pour ela, nous

onsidérons unerépartitiondu risqueapable de onserverun nombre de domaines

ε

-signiatifs uniformesurlatailledusous-domaine :pour tout

D

,sous-domaine de

D

BR,

P H

Il sutalors de onsidérerlenombre de tests

Cehoixsatisfaitdonlaproposition7.2.4.Ilgarantitunnombremoyendedomaines

ε

-signiatifs inférieur à

ε

tout en répartissant le risque en fontion du ardinal des sous-domaines onsidérés.

Cette répartition, symétrique, traite de la même façon les domaines de tailles extrèmes (petits

et grands) de l'image.Si elle permet de ré-équilibrer le risque en faveur des domainesde grande

taille,elleagitdemêmesurlesdomainesdepetitetailleequin'estpaspartiulièrementreherhé.

Cependant, en pratique, leshangements ont tendane àaeter plutt unepartieminoritairede

l'image (

< 50%

) don 'este nombrede testsque nousonsidéronsdansla suitede l'étude.

Le paramètre

ε

permet de xer le nombre moyen de fausses détetions autorisé. En

pratique, nous hoisissonsde poser

ε = 1

de sorteà garantir, en moyenne, une fausse détetion.

Par ailleurs,unefois e paramètre xé,laméthode est alors entièrementautomatique.

Ainsidéni,plusle

N F A

estfaible,pluslesous-domaine

D

est ohérentavelemodèle

de l'image. Plusieurs stratégies sont alors envisageables. Par exemple,nous pourrions déider de

reherherlesous-domaine

D

detaillemaximaleettelquelenombredefaussesalarmesquiluiest

assoiésoit inférieuràunseuil

N F A min

.Cependant, nouspouvons onsidérerquelaformulation du nombrede fausses alarmesadoptée prend déjàen omptela tailledudomaineétudiéet,pour

desquestionsderobustesse,nouspréféronsretenirledomaineleplussigniatif.Nousproposons,

paronséquent,dereherherlesous-domaine

D

quiminimiselenombredefaussesalarmes.Ave

l'hypothèse aontrariodonnée parladénition7.2.3, le

N F A

peut êtrealuléexpliitement.

Théorème 7.2.5 Ave l'hypothèse a ontrario donnée par

H 0 (m)

, quelque soit

m ∈ R |D

BR

|

, le nombre de faussesalarmesassoié àunsous-domaine

D

d'uneimage

v

estdéterminépar

N F A(D, δ(v D ), σ, m) = η( | D | ) · f ( | D | − |L| , δ(v D ), σ, m),

(7.2.23)

η( | D | ) = |D

BR

| C |D | D |

BR

|

représente le nombre de tests,

|L|

le nombre de labels et, pour tout

q = | D | − |L|

,

B q (δ)

représente laboulede entre

0

et de rayon

δ

dans

R q

. Démonstration.

Sous l'hypothèse

H 0

,lenombre de faussesalarmesest déni (f.proposition7.2.4)par

N F A(D, δ(v D ), σ, m) = η( | D | ) · P H

0 [δ(V D ) ≥ δ(v D )].

(7.2.24)

Pour déterminer expliitement le nombre de faussesalarmes, ilfaut, étant donné

δ(v D )

,aluler

la probabilité

P H 0 [δ(V D ) ≥ δ(v D )].

(7.2.25)

L'erreur

δ

mesurée sur un sous-domaine

D

dépend de la labellisation à travers les proportions

α l (y)

de haque label

l

dansunpixel

y

de

D

.Soit

A D

lamatriedesproportions extraitesur un sous-domaine

D

,elleest déniepar

A D = (α l (y)) y ∈ D

.Remarquons quel'erreurrésiduelle

δ(V D ) = min

µ ∈R L

v u u t

X

y ∈ D

V (y) − X

l ∈L

α l (y)µ(l)

! 2

(7.2.26)

peut être interprétée en termes de distane du veteur

V D

à l'espae image de la matrie des

proportions

A D

,notéIm

A D

.Ladistaneminimaleestalorslanormedelaprojetionorthogonale de

V D

sur l'espae

(

Im

A D )

,i.e.

δ(V D ) = k p (

Im

A D ) (V D ) k .

(7.2.27)

Soit

n = | D |

, d'après l'hypothèse a ontrario, le veteur

V D

suit une loinormale

N (m D , σ 2 I n )

,

m D

représente la restrition du veteur

m

, vu omme une appliation, au sous-domaine

D

.

Soit

P

lamatriede projetionorthogonale de

p (

Im

A D )

alors

P [δ(V D ) ≥ δ(v D )] = P [ k p (

Im

A D ) (V D ) k geqδ(v D )]

= P [ k P V D k ≥ δ(v D )].

(7.2.28)

Comme

R n =

Im

A D (

Im

A D )

,il existe une base

e = (e 1 , ..., e n )

dans laquelle les

q

premiers

veteurs forment une base de Im

A D

et les

n − q

suivants une base de

(

Im

A D )

. Dans ette

nouvelle base, lamatriede projetion

P

est de laforme

M at e (p (

Im

A D ) ) = I q 0 0 0 n − q

!

q = dim(

Im

A D )

et

n − q = dim(

Im

A D )

. Dans le ontexte que nous nous sommes xé,

dim(

Im

A D ) = |L| = n − q

,i.e.

q = | D | − |L|

.

Laprobabilitépourquelavariablealéatoire

P V D

soitdansuneboule

B q (δ)

de

(

Im

A D ) ∼ R q

,de rayon

δ

,vérie

P (P V D ∈ B q (δ)) = P (V D ∈ P −1 ( B q (δ))).

(7.2.29)

Or

P 1 ( B q (δ)) = B q (δ) × R n q

, et, d'après le modèle a ontrario, le veteur aléatoire

V D

suit

et l'intégralede lagaussienne en dimension

n − q 1

Ladistributionobtenueest elledu

χ 2

à

q

degrésdeliberté.Rappelonsqu'une variable

χ 2

orres-pondàlasommedesarrésde variablesaléatoiresnormalesentréesréduites. Avel'hypothèse a

ontrariosurles variables

(V (y)) y ∈ D

,lavariable aléatoire

δ 2 (V D ) = X

y ∈ D

(V (y) − V ˆ (y, µ)) 2

orrespond à la somme de

| D |

variables aléatoires normales entrées mais non-réduites, elle ne orrespond don pas diretement à un

χ 2

. En revanhe, la variable

δ 2 (V σ 2 D )

est un

χ 2

don la

probabilitéà laquellenousnousintéressons (7.2.25) vérie

P (δ 2 (V D ) ≥ δ 2 ) = P (σ 2 χ 2 ≥ δ 2 )

= P (χ 2 ≥ δ 2

σ 2 ).

(7.2.32)

La loi du

χ 2

est utilisée pour de nombreuses appliations, aussi bien dans le adre des tests d'adéquation d'observations àune distributionthéorique quepour les testsd'indépendane entre

deux aratères qualitatifs ou les tests d'homogénéité qui permettent de tester si deux jeux de

variables aléatoiressuivent une même loi.Le problème de la détetion de hangements pourrait

être envisagé,par exemple,souslaformed'un testd'adéquation (f.Setion7.5).

Ave ette nouvelle mesure, notre objetif est de séletionner le domaine

D

le plus

ohérent avela labellisation initialeen tant que domaine minimisant le

N F A

. Avant d'étendre

le modèle de détetion au as multitemporel, nous disutons setion 7.3 le hoix du modèle a

ontrario

H 0

et de ses paramètres. De plus, le

N F A

n'est pas alulable numériquement sous la forme(7.2.31) avesusament de préision. Par onséquent,nous proposons setion 7.3 une

autre expressiondu

N F A

permettantunalulnumérique pluspréis.