III. Détetion de hangements à l'éhelle sous-pixelique 101
7.2. Détetion a ontrario
Leprinipededétetionaontrario,introduitenanalysed'imagespar[Desolneuxet al.,2000 ℄,
permetde alulerunniveaudesigniativitésansavoiràmodéliserleshangements,nià
quanti-er leséartsattendus(bruit,distortions,variabilitéintrinsèque,et.),i.e.en introduisanttrèspeu
d'informationapriori.Cetteapprohesystématiqueestbaséesurunprinipesimplede pereption
attribuéàHelmholtz.Selone prinipe,notrepereptionreposesur ladétetion destruturesqui
s'opposent au hasard. Il suggère don de déteter des strutures (lignes, ourbes, et.) en tant
qu'événement rare par rapport àun modèlenaïf, aléatoire (non struturé). Cette idéeest
essen-tiellepourlagénériitédesmodèlesaontrariopuisqu'ellepermetde déteterdesstruturessans
herheràlesmodéliserpréisément. Formellement,l'approheaontrarioreposesurunemesure
delasigniativitéd'unedétetionparl'espéranedunombredefaussesalarmespluttquela
pro-babilité d'unefausse alarmeomme pourles approhes statistiqueslassiques[Bonferroni, 1936℄,
[Hommel,1988℄.
Dénition 7.2.1 Soit
E
l'ensembledesévénementspotentiellementdétetables,etP
la probabi-litésurE
d'apparitiondesévénements.Atoutévénemente ∈ E
estassoiésonnombredefaussesalarmes,déni par
N F A(e) = | E | · P (e)
(7.2.5)et pourtout réel
ε > 0
,e
est ditε −
signiatifsi etseulement siN F A(e) ≤ ε.
(7.2.6)Cette dénition ne peut être utilisée qu'après avoir déni un modèle naïf suivant le prinipe de
Helmholtz,modèlepermettantdedonnerunsensàlaprobabilité
P (e)
.Unetelledénitionpermetde garantir que l'espérane du nombre de fausses alarmes soit inférieur à
ε
(f. preuve de laproposition 7.2.4). L'utilisation de l'espérane permet de s'aranhir du fait que les détetions
multiplesnesoientpasindépendantespourdéterminerledomainededétetiondemanièreabsolue.
Il permet de ontrlerle nombre moyen de faussesdétetions et de déterminer automatiquement
leseuildedétetionenonséquene. Laméthodeestalorsréduiteàunseulparamètre:lenombre
de faussesalarmes.
Pour xer les idées sur le prinipe de ette approhe et l'avantage d'utiliser des
es-péranes plutt que des probabilités, reprenons l'exemple des dates d'anniversaire proposé par
[Desolneux et al.,2006 ℄. Dans un groupe de
N
personnes, supposons que deux d'entre ellesontla mêmedate d'anniversaire. Cetévénementest-ilsigniatif,i.e.est-ilpossiblequee soit arrivé
par hasard ou y a-t-il une raison à ela? En aord ave le prinipe de Helmholtz, supposons,
en négligeant les années bissextiles, que toutes les dates d'anniversaire aient la même
probabi-lité d'ourene
1/365
. Pour évaluer la signiativitéde l'événement onsidéré,nous avons deux possibilités:1. Caluler laprobabilitéquedeux personnes,au moins,aient lamêmedate d'anniversaire :
1 − 1 ·
Une tabulationest alorsnéessaire poursavoirsi ette probabilité estinférieure à
ε
.2. Suivant la dénition7.2.5, onsidérons l'ensemble
E
desévénementse kl =
"lespersonnesk
etl
ont la même date d'anniversaire, ave1 ≤ k < l ≤ N
,et la mesureµ
dénie parCe ritèreest beauoup plussimpleque(7.2.7)puisqu'il reliequadratiquement
N
àε
.Réemment, [Grosjean etMoisan, 2006 ℄ ont proposé la dénitionsuivante du nombre de fausses
alarmes dansunadreplus général.
Dénition 7.2.2 Soit
(X i ) 1 ≤ i ≤ N
un ensemble de variables aléatoires. Une fontionF (i, x)
estun
N F A
(nombre de faussesalarmes) pourles variables aléatoires(X i )
si∀ ε, E [ |{ i, F (i, X i ) ≤ ε }| ] ≤ ε.
(7.2.9)Ave ette dénition, si une fontion
F
vérie (7.2.9) , alors la famille de testsF (i, X i ) ≤ ε
garantit un nombre moyen de fausses alarmes inférieurà
ε
.Le prinipe de la détetionaontra-rio permet don une ertaine objetivité dans la mesure où il utilise très peu d'information a
priori. Il permet ausside réduire tous les paramètresnéessaires à ladétetion à unseul ritère:
l'espérane du nombre de fausses alarmes. Ce dernier point est essentiel puisque, en pratique,
il rend la détetion entièrement automatique en xant le nombre attendu de fausses alarmes à
1
par exemple. Ce type de détetion a déjà été appliqué, notamment, à la détetiond'aligne-ments [Desolneux et al.,2000℄, de bords ontrastés [Desolneux etal.,2001℄, de modes
d'histo-grammes et d'amas de points [Desolneuxet al.,2003 ℄, de rigidités entre deux nuages de points
[Moisan et Stival,2004 ℄.
Leproblèmedeladétetiondehangementssurlasurfaeterrestreàpartirdedonnéesde
télédetetion doittenirompted'un ertainnombredefateursspéiquesquirendentineaes
nombre de méthodes d'analyse d'images multitemporelles utilisées habituellement pour d'autres
appliations.Parexemple,lesvariationsd'illuminationetd'humiditédusol,lesdiérenesde
ali-brationduapteurentrelesdatesonsidérées,l'absened'informationapriorisurleshangements
attendus, ou les imperfetions de realage sont autant de fateurs à prendre en ompte, même
s'ilsdonnent lieu engénéral àunesériede prétraitementsspéiques(orretions radiométriques,
realage, et.). Les hangements suseptibles de se produire sur lasurfae terrestretels que, par
exemple,lesrotationsdeulture,laontaminationde parellesagrioles,lesoupesdeforêtoules
inendies,peuventêtrede tailleetd'intensitéradiométriquetrèsvariées.Dansl'objetifd'élaborer
uneméthode génériquede détetionde hangements, iln'estdonpas envisageablede listertous
les hangements possibles pour dénir un modèle a priori des hangements. De plus, les prols
d'évolutiontemporelledesdiérentstypesd'oupationdusolsontvariablesd'uneannéeàl'autre,
etd'unezonegéographique àuneautre. Unmodèleapriorisurlesnon-hangementssemblealors
aussidiileàdénir physiquement.
Nousproposonsdenousplaerdansleadredelamodélisationaontrariopourdéteter
un sous-domaine de l'image en tant que grande déviation à partir d'un modèle générique. Etant
donnée une labellisation
λ
(image HR onstante par moreaux) dérivant l'état de la surfaeétudiée à une date
t 0
xée , et une image BR de la même sène aquise ultérieurement à une datet
(t > t 0
), nous proposons de déteter dans quel sous-domaine spatialD
la labellisationλ
est enore orrete à la datet
.L'ensemble des pixels BR orrespondant à un hangement de type d'oupation du sol est alors le omplémentairedeD
.Dans et objetif,nous introduisons unemesuredeohérene entrelalabellisationhaute résolutionet l'imageBRobservée fondéesurle degré de ontradition qu'elle implique en référene à un modèlenon struturé, dit modèle a
ontrario. La méthode que nous proposons repose don sur la dénitiond'un modèle naïf, dit a
ontrario.
Dénition 7.2.3 (modèlea ontrario pour la BR) Lemodèleaontrario(
H 0 (m)
)pourl'imagebasserésolutionest unhamp aléatoire
V
de|D
BR|
variablesgaussiennesi.i.d.N (m, σ 2 I |D
BR
| )
oùm ∈ R |D
BR|
etσ > 0
sontxés.Lehoixdesparamètresdumodèlenaïfestdisutédanslasetion7.3.L'éart-type
σ
estonsidéréomme xé, et nous étudierons plusieurs possibilités pour le veteur des moyennes. Avant de
disuter les valeurs de esparamètres, poursuivons ladesription dumodèlede détetion dansle
as général.
Suivant le prinipe de Helmholtz, dérit pour la première fois en analyse d'images par
[Lowe,1985 ℄, deux éléments peuvent être groupés si leur position a une probabilité très faible
de résulter d'un arrangement aidentel; nous nous intéressons aux sous-domaines de l'image
pour lesquels l'erreur quadratique mesuréeentre l'image et sonestimée est trop petite pour être
raisonnablementexpliquée parlehasard. Enfait, ils'agitde s'étonner quel'intensitéobservée sur
un sous-domaine de
D
BR soit partiulièrementprohe, pour une ertainefamille de valeursµ
,del'intensitéestiméeà partir desproportions de haque label etde lafamille
µ
.Unedesprinipalesdiultés estalorsladénitionobjetiveetautomatique d'unseuilaprioriàpartirduquel l'erreur
δ(v D )
n'est plus onsidérée omme aeptable. Un seuil de détetionδ D
pourrait être hoisi demanière àgarantir que
P ( ∃ D, δ(V D ) ≥ δ D ) ≤ ε,
(7.2.10)où
ε
estunparamètrexé(parexemple10 − 3
)etδ(V D )
l'erreurquadratiqueobtenueenonsidérant lehampaléatoireV
déritparlemodèleaontrario(imagedebruitblangaussien).Leparamètreε
permet de ontrler la abilité du test. En eet, plusε
est petit, plus le test est exigeant etable. Cependant, les dépendanes entre les variables aléatoires
(δ(V D )) D ∈D
BR sonttrès diilesà estimer,e quirend impossiblele alulexpliitede
P ( ∃ D, δ(V D ) ≥ δ D )
.Suivantlestravaux[Desolneux et al.,2000 ,Desolneux et al.,2001 ,Desolneux et al.,2003 ℄,
nous proposons de mesurer l'espérane dunombre de fausses détetions plutt que de ontrler
laprobabilitédefaussesdétetions.Leritèrequenousproposons permetd'établir unemesurede
ohérene pourunsous-domainevis-à-visd'unelabellisation.Ilest modélisédemanièreàgarantir
quelenombrededétetionsobtenuessurdesdonnéesaléatoiressoitaussifaiblequesouhaité.Pour
ela,une quantiation dunombrede tests(nombrede sous-domainesétudiés) est néessaire.
Le nombre de tests
η
est un oeient de pondération apable de ontrler le nombre moyen de fausses détetions et, par la même oasion, d'éviter l'introdution d'un seuil dedé-tetion. Cette dénition est guidée non seulement par la ontrainte de ne pas déteter à tort,
mais aussi par elled'obtenir une méthode à un paramètre unique :le nombre moyen de fausses
alarmes aeptable. En pratique, il sut de le xer à
1
pour obtenir une méthode automatique.Les méthodes statistiques lassiques sont aussi, typiquement, dépendantes d'un seul paramètre
mais ils'agiten général duseuilde déision surlaprobabilité maximale.Cetype de seuilest très
dépendant du ontexte et des images utilisées. Dans l'objetif de ontrler le nombre de fausses
alarmes,[Desolneux etal.,2000 ℄ontintroduitlanotiond'événements
ε
-signiatifspermettantde déterminer automatiquementle seuilde détetion en fontiond'un unique paramètre :le nombremaximalde fausses détetions autorisé.
Proposition 7.2.4 (nombre de fausses alarmes) Soient
η : N → N
et,pourtoutsous-domaineD ⊂ D
BR,P H 0 [δ(V D ) ≥ δ(v D )]
laprobabilité d'observer une erreur minimaleinférieure àδ(V D )
sous l'hypothèse
H 0 (m)
.LarelationN F A(D, δ(v D ), σ, m) = η( | D | ) · P H
0 [δ(V D ) ≥ δ(v D )]
(7.2.11)dénit unnombrede faussesalarmesdès que
X
D ∈D
BR1
η( | D | ) ≤ 1.
Soit
ε > 0
,unsous-domaineD
deD
BR estditε
-signiatifsiN F A(D, δ(v D ), σ, m) ≤ ε
.Démonstration.
D'après ladénition7.2.2,
N F A(D, δ(v D ), σ, m) = η( | D | ) · P H
0 [δ(V D ) ≥ δ(v D )]
(7.2.12)dénit un nombre de fausses alarmes si, pour tout
ε > 0
, l'espérane du nombre de domainesε
-signiatifs,sousH 0 (m)
,est inférieureàε
.Notonsχ D
lavariablealéatoirebinairequivaut1
sile sous-domaine
D
deD
BR estε
-signiatif,0
sinon, i.e.χ D =
( 1
siN F A(D, δ(v D ), σ, m) ≤ ε 0
siN F A(D, δ(v D ), σ, m) > ε.
La variable aléatoire
N DS ε = P
D ⊂D
BRχ D
représente alors le nombre de sous-domainesε
-signiatifs dans
D
BR.Parlinéarité,l'espérane dunombrede sous-domainesε
-signiatifsestE [N DS ε ] = X
sous-domaine de
D
BR, notonsδ ε ∗ (D)
le résidu minimal surD
tel que le sous-domaineD
soitε
-signiatif :Montronsqueette valeurestbiendénie.Pourela,onsidéronslafontion
f : I → [0, 1]
déniepourtout
δ ∈ I
parf (δ) = P H
de variablesaléatoiresindépendantes àdensité.Lafontionde répartitiond'unevariableàdensité
étant ontinue,lafontion
f
estontinue deI
dans[0, 1]
.Paronséquent,où
f − 1
est ontinue en tant que fontion réiproque d'une fontion ontinue et monotone (lafontion
f : δ 7→ P H 0 [δ(V D ) ≥ δ]
est déroissante). Ainsi,n
δ ∈ I, P H 0 (δ(V D ) ≥ δ) ≤ η(| ε D |) o
estunensembleferméetbornéentantqu'imageréiproqued'unintervalleferméetbornéparune
fontion ontinueet saborneinférieure est atteinte.
Don l'espéranedunombre de domaines
ε
-signiatifssatisfaitX
Don
Ilsutdondehoisir
η
vériantetteinégalitépourgarantirunnombremoyendefaussesalarmesinférieur à
ε
.2
Le hoix le plus naturel pour le nombre de tests est de onsidérer l'ensemble de tous les
sous-domaines de
D
BR,soitfaussesdétetions.Deplus,ilpermetderépartirlerisqueuniformémentsurtouslessous-domaines
de
D
BR (quelquesoitleur tailleet mêmes'ilsse reouvrent).Eneet, pourtoutsous-domaineD
de
D
BR,laprobabilitédedéteterD
parerreur(i.e. queD
soitε
-signiatifsousl'hypothèseH 0
)vaut alors
P H
0 (δ(V D ) ≥ δ(v D )) = ε
2 |D
BR| ,
(7.2.21)oùlemembrededroitenedépendpasde
D
.Unsous-domainedeardinalk
estalorspénalisédelamêmemanièrequ'unsous-domainedeardinal
k ′ 6 = k
.Parhasard,lesdomainesdetaillesmoyennesvontdonêtredavantage détetésparhasard(i.e. sous
H 0
)que euxdetaillesextrèmespuisqu'ilssontplusnombreux.Aveenombrede tests,lemêmepoidsestattribuéàtouslessous-domaines
alors qu'intuitivement, pour l'appliation onsidérée, on souhaiterait bénéier d'une estimation
plus robuste sur les grands sous-domaines que sur les petits. De plus, il orrespond au alul du
nombre total de sous-domaines de l'image, de nombreux reouvrements des sous-domaines sont
alorsprisen ompte.
Le répartition des tests est nalement hoisie ave une ertaine liberté, elle peut être
vue omme une fontionde poids permettantd'exprimer una prioripour ladétetion.En e qui
onerne l'appliation visée, nous sommes tentés de favoriser la détetion des sous-domaines de
grande taille. Nousproposonsdon unealternativeen déterminant unnombre de testsquitienne
ompte de la taille des sous-domaines onsidérés et qui soit inférieur à
2 |D
BR|
. Pour ela, nousonsidérons unerépartitiondu risqueapable de onserverun nombre de domaines
ε
-signiatifs uniformesurlatailledusous-domaine :pour toutD
,sous-domaine deD
BR,P H
Il sutalors de onsidérerlenombre de tests
Cehoixsatisfaitdonlaproposition7.2.4.Ilgarantitunnombremoyendedomaines
ε
-signiatifs inférieur àε
tout en répartissant le risque en fontion du ardinal des sous-domaines onsidérés.Cette répartition, symétrique, traite de la même façon les domaines de tailles extrèmes (petits
et grands) de l'image.Si elle permet de ré-équilibrer le risque en faveur des domainesde grande
taille,elleagitdemêmesurlesdomainesdepetitetailleequin'estpaspartiulièrementreherhé.
Cependant, en pratique, leshangements ont tendane àaeter plutt unepartieminoritairede
l'image (
< 50%
) don 'este nombrede testsque nousonsidéronsdansla suitede l'étude.Le paramètre
ε
permet de xer le nombre moyen de fausses détetions autorisé. Enpratique, nous hoisissonsde poser
ε = 1
de sorteà garantir, en moyenne, une fausse détetion.Par ailleurs,unefois e paramètre xé,laméthode est alors entièrementautomatique.
Ainsidéni,plusle
N F A
estfaible,pluslesous-domaineD
est ohérentavelemodèlede l'image. Plusieurs stratégies sont alors envisageables. Par exemple,nous pourrions déider de
reherherlesous-domaine
D
detaillemaximaleettelquelenombredefaussesalarmesquiluiestassoiésoit inférieuràunseuil
N F A min
.Cependant, nouspouvons onsidérerquelaformulation du nombrede fausses alarmesadoptée prend déjàen omptela tailledudomaineétudiéet,pourdesquestionsderobustesse,nouspréféronsretenirledomaineleplussigniatif.Nousproposons,
paronséquent,dereherherlesous-domaine
D
quiminimiselenombredefaussesalarmes.Avel'hypothèse aontrariodonnée parladénition7.2.3, le
N F A
peut êtrealuléexpliitement.Théorème 7.2.5 Ave l'hypothèse a ontrario donnée par
H 0 (m)
, quelque soitm ∈ R |D
BR|
, le nombre de faussesalarmesassoié àunsous-domaineD
d'uneimagev
estdéterminéparN F A(D, δ(v D ), σ, m) = η( | D | ) · f ( | D | − |L| , δ(v D ), σ, m),
(7.2.23)où
η( | D | ) = |D
BR| C |D | D |
BR
|
représente le nombre de tests,|L|
le nombre de labels et, pour toutq = | D | − |L|
,où
B q (δ)
représente laboulede entre0
et de rayonδ
dansR q
. Démonstration.Sous l'hypothèse
H 0
,lenombre de faussesalarmesest déni (f.proposition7.2.4)parN F A(D, δ(v D ), σ, m) = η( | D | ) · P H
0 [δ(V D ) ≥ δ(v D )].
(7.2.24)Pour déterminer expliitement le nombre de faussesalarmes, ilfaut, étant donné
δ(v D )
,alulerla probabilité
P H 0 [δ(V D ) ≥ δ(v D )].
(7.2.25)L'erreur
δ
mesurée sur un sous-domaineD
dépend de la labellisation à travers les proportionsα l (y)
de haque labell
dansunpixely
deD
.SoitA D
lamatriedesproportions extraitesur un sous-domaineD
,elleest dénieparA D = (α l (y)) y ∈ D
.Remarquons quel'erreurrésiduelleδ(V D ) = min
µ ∈R L
v u u t
X
y ∈ D
V (y) − X
l ∈L
α l (y)µ(l)
! 2
(7.2.26)
peut être interprétée en termes de distane du veteur
V D
à l'espae image de la matrie desproportions
A D
,notéImA D
.Ladistaneminimaleestalorslanormedelaprojetionorthogonale deV D
sur l'espae(
ImA D ) ⊥
,i.e.δ(V D ) = k p (
ImA D ) ⊥ (V D ) k .
(7.2.27)Soit
n = | D |
, d'après l'hypothèse a ontrario, le veteurV D
suit une loinormaleN (m D , σ 2 I n )
,où
m D
représente la restrition du veteurm
, vu omme une appliation, au sous-domaineD
.Soit
P
lamatriede projetionorthogonale dep (
ImA D ) ⊥
alorsP [δ(V D ) ≥ δ(v D )] = P [ k p (
ImA D ) ⊥ (V D ) k geqδ(v D )]
= P [ k P V D k ≥ δ(v D )].
(7.2.28)Comme
R n =
ImA D ⊕ ⊥ (
ImA D ) ⊥
,il existe une basee = (e 1 , ..., e n )
dans laquelle lesq
premiersveteurs forment une base de Im
A D
et lesn − q
suivants une base de(
ImA D ) ⊥
. Dans ettenouvelle base, lamatriede projetion
P
est de laformeM at e (p (
ImA D ) ⊥ ) = I q 0 0 0 n − q
!
où
q = dim(
ImA D )
etn − q = dim(
ImA D ) ⊥
. Dans le ontexte que nous nous sommes xé,dim(
ImA D ) = |L| = n − q
,i.e.q = | D | − |L|
.Laprobabilitépourquelavariablealéatoire
P V D
soitdansunebouleB q (δ)
de(
ImA D ) ⊥ ∼ R q
,de rayonδ
,vérieP (P V D ∈ B q (δ)) = P (V D ∈ P −1 ( B q (δ))).
(7.2.29)Or
P − 1 ( B q (δ)) = B q (δ) × R n − q
, et, d'après le modèle a ontrario, le veteur aléatoireV D
suitet l'intégralede lagaussienne en dimension
n − q 1
Ladistributionobtenueest elledu
χ 2
àq
degrésdeliberté.Rappelonsqu'une variableχ 2
orres-pondàlasommedesarrésde variablesaléatoiresnormalesentréesréduites. Avel'hypothèse a
ontrariosurles variables
(V (y)) y ∈ D
,lavariable aléatoireδ 2 (V D ) = X
y ∈ D
(V (y) − V ˆ (y, µ)) 2
orrespond à la somme de
| D |
variables aléatoires normales entrées mais non-réduites, elle ne orrespond don pas diretement à unχ 2
. En revanhe, la variableδ 2 (V σ 2 D )
est unχ 2
don laprobabilitéà laquellenousnousintéressons (7.2.25) vérie
P (δ 2 (V D ) ≥ δ 2 ) = P (σ 2 χ 2 ≥ δ 2 )
= P (χ 2 ≥ δ 2
σ 2 ).
(7.2.32)La loi du
χ 2
est utilisée pour de nombreuses appliations, aussi bien dans le adre des tests d'adéquation d'observations àune distributionthéorique quepour les testsd'indépendane entredeux aratères qualitatifs ou les tests d'homogénéité qui permettent de tester si deux jeux de
variables aléatoiressuivent une même loi.Le problème de la détetion de hangements pourrait
être envisagé,par exemple,souslaformed'un testd'adéquation (f.Setion7.5).
Ave ette nouvelle mesure, notre objetif est de séletionner le domaine
D
le plusohérent avela labellisation initialeen tant que domaine minimisant le
N F A
. Avant d'étendrele modèle de détetion au as multitemporel, nous disutons setion 7.3 le hoix du modèle a
ontrario
H 0
et de ses paramètres. De plus, leN F A
n'est pas alulable numériquement sous la forme(7.2.31) avesusament de préision. Par onséquent,nous proposons setion 7.3 uneautre expressiondu