6. Algorithmes et performanes empiriques 85
6.6. Sensibilité au fateur de résolution
Les méthodes sous-pixelliques sont souvent très limitées (f. hapitre 3) par le fateur
d'éhelleonsidéré.Laméthode quenousproposonsaété développée dansl'objetifde traiterde
fortsrapportsderésolution,telsque
15 × 15
pourl'utilisationoupléedesapteursSPOT/HRVIR etMeRISou50 × 50
pourSPOT/HRVIRetSPOT/VGT.Dans ettesetion, nousproposonsd'analyser l'évolutiondes performanes de laméthode en fontiondurapport de résolutionet de
latailledesrégionsrelativement aupixelbasse résolution.
Soit
N = |D |D
HR|
BR
|
le rapport de résolution entre les images haute et basse résolutiononsidérées. Apartirdujeu de
165
images HRsimulées(f. setion10.2),lesimages BRont étésimuléespour les rapports de résolutionsuivants :
15 × 15
,30 × 30
et50 × 50
.Compte tenu des limites naturelles qu'engendrent la présene de trop petites régions
dans la segmentation, nous alulons le taux d'oupation de toutes les régions mal labellisées.
Lagure6.8(a)-()présentel'histogrammedutaux d'oupationdesrégionsmallabelliséespour
des fateurs de résolution de
15 × 15
,30 × 30
et50 × 50
. Remarquons que es histogrammes sont très prohes, montrant ainsi que la performane de l'algorithme dépend de la taillerelativedesrégionsparrapportaux pixelsbasserésolutionmaispasdufateurde résolutionen lui-même.
De plus, es histogrammes montrent un pi d'ourenes pour les régions oupant une surfae
inférieureà
1%
dupixelbasserésolution.Cetteobservationpourraitêtreexploitéepourontraindre la segmentation à la réation de régions représentant plus de1%
du pixel basse résolution. Un pré-traitementdeetypeonduiraitprobablementàdiminuerdemoitiéleserreursdelabellisation.Par ailleurs, il semble raisonnable de ne pas s'intéresser à des objets de si petite taille devant
l'éhelle d'observation.
0 10 20 30 40 50 60 70 80 90 100
Fig. 6.8.:Histogramme dutaux d'oupationdes régionsmallabelliséesausein despixels basse
résolution pour diérents fateurs de résolution. L'axedes absissesreprésentele taux
d'oupationd'unerégion mallabelliséeauseind'un pixelbasse résolutionet l'axedes
ordonnées représente lepourentaged'ourene.
Le tableau 6.9 présente des statistiques réalisées sur le taux d'oupation des régions
mallabelliséesdansle pixelbasserésolution,selonlefateurde résolutiononsidéré.Remarquons
N
10
ème perentile médiane70
ème perentile80
ème perentile90
èmeperentile15 2
0.44 2 5 10 25.730 2
0.11 1.77 7.7 16.7 41.450 2
0.08 2 8.13 17.6 39.8Fig. 6.9.:Statistiquesdu taux d'oupation d'unerégion mallabelliséedansunpixel basse
réso-lutionen fontiondu fateurde résolutiononsidéré(
N
).que
50%
des régions représentent moinsde2%
du pixel basse résolution. Dans la littérature, la plupartdesméthodesquitraitentdesimagesBRdanslebutd'estimerles proportionsdeslassesd'oupation du sol onsidèrent des parelles représentant plus de
5%
du pixel basse résolution(f. [LeHégarat-Masle etal.,2005 ℄).
En e qui onerne la performane de la méthode en fontion du fateur de résolution
onsidéré, lagure 6.10 montre que les pourentages d'erreursde labellisation sontassez étalés.
Cette variabilitépeut êtreattribuée aufaitque lesexpérienesont été réalisées dansunontexte
monotemporelalorsquelesaratéristiquesde ertaineslassessontparfoistrèsprohes. Deplus,
lalignemédianemontredebonsrésultatspourunfateurderésolutionallantjusqu'à
30 × 30
,aussibien pour la version supervisée que pour la version non-supervisée (ave moins de
5%
de pixelsmallabelliséspour
N = 30 × 30
).Au-delà,lesperformanesdiminuentaveenviron20%
de pixelsmal labellisés pour un fateur de résolution
50 × 50
. Ladégradation des performanes lorsquele fateurderésolutionaugmenteestdonmanifeste,non-linéaire.Notons,ependant,quelenombred'expérienesréaliséespourlagure6.10(b)estmoinsonséquentqueeluiutilisépour6.10(a)en
raisondutempsdealulnéessaireàl'algorithmenon-supervisé,nettementsupérieuràlaversion
supervisée. Ce graphe est don diile à interpréter, en partiulier pour le rapport de résolution
N = 50 × 50
où les résultatssonttrèshétérogènes.Remarquons que, ontrairement au as étudié gure 6.8 où la taille des régions était
onsidérée en termes de pourentage d'oupation dans un pixel BR, la gure 6.10 présente les
pourentagesd'erreursde labellisationobtenuesen fontiondurapportde résolution
N
.L'analyseouplée des gures 6.8 et 6.10 permet de mettre en évidene le fait que les performanes de la
labellisation sedégradent prinipalement lorsque le rapportde résolutionaugmente, pare que la
proportiond'unerégiondonnéedansunpixelBRestd'autantplusfaiblequeerapportestgrand.
Les limites observées gure 6.10 lorsque
N ≥ 30
ne onstituent pas des limites absolues de laméthode. Elles orrespondent à un jeu de données simulées à partir d'extraits d'images réelles
de la Plaine du Danube, où les parelles sont de petite taille ontrairement, typiquement, à un
parellaire amériainoù les parellessontsouvent vastes.
0
Fig. 6.10.: Chaque roixreprésentele pourentagedespixels mallabellisésobtenus pourunjeu
de données et unrapport de résolution xé ave laversion supervisée (a) et ave la
version non-supervisée (b). Lerapport de résolution
N
est représenté en absissesetle pourentage en ordonnées. La ligne verte superposée orrespond à la médiane de
esvaleurs de pourentage.
Lesrésultatsprésentésdansettesetion,dansunontextemonotemporel,montrentune
ertaine robustesse de laméthode vis-à-visdu rapportde résolution. En eet, lorsquee rapport
augmente, les résultatssemblentstablesen termede tailledesrégionsrelativement àlatailledes
pixelsBR.Cependant,pourlejeudedonnéesonsidéré,lagure6.10montrequelasegmentation
est tropne pourl'utilisation de données BR aveun rapport de résolution
N = 50 × 50
.Pouraméliorer es résultats, la segmentation utilisée pourrait être ontrainte selon la grille de pixels
BR, de manière à e que toutes les régions de la segmentation oupent plus de
10%
environ(d'aprèslagure 6.8)despixelsBR. Les résultatsseraientalors optimisésenfontion durapport
de résolutiononsidéré.
Pour nir, nous proposons d'analyser les performanes de la méthode en fontion du
rapportde résolutiondansunadresimpled'appliation aux donnéesréelles.Dansetobjetif,la
méthodedelabellisationestappliquéeàdesimagespseudo-réellesdansunontextemonotemporel
supervisé. Nous utilisonsles mêmes extraitsde labase de données ADAM queeux utilisésdans
la setion 6.3, avant simulation, soit
165
images réelles HR. Ces images réelles (SPOT/HRV)sontmoyennées parblosde taille
5 × 5
à50 × 50
pourréerdesimages BRditespseudo-réelles.Lagure6.11présentelepourentagede pixelsmallabellisésen fontiondurapportderésolution
onsidéré. Elle montre, omme dans le as des données simulées, que le pourentage d'erreurs
obtenu présente uneertaine variabilité.Cependant, les pourentages d'erreurssont
signiative-ment plusimportants que dansle as simulé. En eet, lalabellisationà partirde donnéesréelles
omprend, en médiane,
4.5%
d'erreurs pour un rapport de résolution de15 2
alors que, dans leas de données simulées,seules
0.3%
d'erreurs ont été observées (en médiane). Cette diérene0 10 20 30 40 50 60 70
0 10 20 30 40 50 60
mislabeled pixels (%)
square root resolution ratio all errors
median
Fig. 6.11.:Pourentage des pixels mal labelisés obtenus ave l'algorithme supervisé, à partir
d'images réellesmonotemporelles.
signiativepeutêtreattribuéeaufaitquelesimagesréellesmonotemporellesnesontpastoujours
bien modéliséesparl'hypothèsegaussienne. Deplus,le jeude donnéesutiliséontientdes images
aquisesenhiver,périodeoùlaréponsespetraledessolsnuspeutêtretrèsspéique(modélisable
parunedensité de probabilitépartiulière).
Ces expérienes réalisées sur
165
extraits d'images pseudo-réelles en utilisant la version superviséede l'algorithmedelabellisationmontrentque,pourunesegmentationdonnée,laqualitéde la labellisation est très limitée lorsque le rapport de résolution onsidéré est supérieur à
30
.En partiulier, pour un rapport
N = 50 × 50
,30%
des pixels sont alors mal labellisés. Ces résultats montrentque laméthode nepermetune labellisationsatisfaisante,sur esdonnées, quesi
N ≤ 20 × 50
.Détetion de hangements à
l'éhelle sous-pixelique
de hangements
Dans e hapitre, nous présentons une méthode de détetion de hangements
basée sur la omparaison entre une séquene d'images BR (basse résolution) et une
lassiationHR(hauterésolution)dérivantunétatantérieurdelamêmesène.Toutes
esimagessontsupposéesgéométriquementgéoréférenéesentreelles,i.e.l'ensembledes
pixelsHRorrespondantsàhaquepixelBRestonnu.Laméthodedéveloppéeestbasée
sur l'élaboration d'un ritèreprobabiliste apable d'évaluer le degré de ohérened'une
séquene d'imagesvis-à-vis d'unelassiation. Ellene repose pas sur lamodélisation a
priorides données mais, au ontraire, sur lerejetd'un modèlenonstruturé, dit modèle a
ontrario,par l'observationde données struturées.
7.1. Modélisation du problème
Notre objetif,dansette partie, est de déteterl'ensembledes pixelspour lesquelsune
séquene temporelle d'images BR ne orrespond plus à la lassiation HR de référene. Cette
lassiation, quipeut être vue omme une labellisation assoiéeà une interprétationde haun
deslabels,n'estutiliséeiique pour salabellisation.En eet,e quinousintéresseestdavantage
le faitque diérentes régionsaient le même type d'oupation dusol que leurtype d'oupation
en lui-même. La labellisation, notée
λ
, dérit la sène observée à une datet 0
donnée, date deréférene pourladétetion de hangements.Formellement,ils'agitd'uneappliation
λ : D
HR→ L = { 1, ..., L }
quiassoieàhaquepixeldudomaineD
HRunlabelappartenantàL
quireprésenteson type d'oupationdu sol.Dansle butde déteterles hangements quiapparaissent au ours
d'une période donnée (séquene d'images BR) par rapport à la date de référene (labellisation
λ
),nous proposons,dans ette setion, de ommenerpar modéliser le problème onsidéré.Poursimplier, nous le présentons dans le as partiulierd'une séquene d'images réduite à uneseule
image BR, notée
v
. Le as général s'en déduit diretement en onsidérant un veteur d'imagesBR.
Selon lalabellisation
λ
, haque pixel dudomaineD
HR est pur, i.e. représente un seultype d'oupation du sol. L'image BR, en revanhe, est onstituée prinipalement de pixels dits
mixtes puisque la surfae représentée dans un pixel basse résolution est généralement
om-posée de plusieurs parelles, éventuellement d'oupation du sol diérentes. En eet, ave les
apteurs que nous onsidérons pour ette appliation, un pixel basse résolution peut ouvrir
une surfae allant de
300 × 300
m2
à1
km2
. Dans e as, l'intensité moyenne mesurée en un pixel basse résolution est déterminée par des réponses spetrales des diérents typesd'ou-pation du sol qui y sont représentés. Comme dans la partie II, nous supposons que ette
in-tensité moyenne est égale à la somme des valeurs aratéristiques (moyenne, en général) de
haque type d'oupation du sol pondérée par leur taux de représentation au sein du pixel.
Cette hypothèse, ouramment appelée modèle linéairede mélange, est très souvent utilisée pour
le problème de la désaggrégation de pixels mixtes[Faivreet Fisher,1997℄, [Faivreet al.,2000℄,
[Cardotet al.,2003℄, [Settleet Campbell,1998 ℄ mais aussi pour le mélange de plusieurs bandes
spetrales [Van DerMeer,1999 ℄, [Zhukov et al.,1999℄. Soit
y
un pixel appartenant au domaine basse résolutionD
BR etα l (y)
la proportion du pixely
oupée par le labell
. Par dénition,pour tout pixel
y
, la somme des proportions de haque label vaut 1, i.e.P
l ∈ L α l (y) = 1
. Siµ = (µ(l)) l ∈L
représente l'intensité moyenne aratéristique de la lasse de labell
, le modèlelinéaire de mélange permet alors d'estimer l'intensité d'un pixel basse résolution
y
à partir desproportions de haque lasseetde leur intensitémoyenne par
ˆ
v(y, µ) = X
l ∈L
α l (y)µ(l).
(7.1.1)Dans ette étude, 'est la moyenne statistique orrespondant à haque label qui est onsidérée
omme intensitémoyenne aratéristique.Nous dénissons àprésent ladistane entre l'intensité
observée
v(y)
en un pixely
et son estimationv(y, µ) ˆ
, pour tous les pixels d'un sous-domaineD
deD
BR. Supposons que l'image BRv
soit une réalisation d'un hamp aléatoireV
. Par souide simpliité, notons
v D = (v(y)) y ∈ D
etV D = (V (y)) y ∈ D
les restritions au sous-domaineD
,respetivement, de l'image observée et du hamp aléatoire dont elle est une réalisation. Cette
distane résiduellepeut êtremesuréepar lanormeeulidienne
δ µ (v D ) = k (v(y) − v(y, µ)) ˆ 1 D (y) k 2 ,
(7.1.2)=
s X
y ∈ D
(v(y) − v(y, µ)) ˆ 2 .
(7.1.3)Dans le ontexte que nous noussommes xé,les moyennes aratéristiques des lasses
µ(l)
sontinonnues. Elles peuvent, par exemple, être estimées par régression linéaire, i.e. en herhant la
famille
µ
quiminimiseδ µ (v D )
.Soit,dansleas monodimensionnel,δ(v D ) = min
µ ∈R L δ µ (v D ),
(7.1.4)la distaneminimalemesuréesur unsous-domaine
D
deD
BR.Le hoix de lanorme eulidienne pour mesurer la distane entre l'intensité observée et
l'intensitéestiméeest natureldansunontexte de régressionlinéaire.Cependant, lanorme
sup
aaussi été envisagée mais le faitqu'elle onduise automatiquement à rejeter les événements rares
n'inite pasàl'utiliserpour etyped'appliations.En eet,ilest généralementfailede diminuer
unedistanedénieparlanorme
sup
en éliminantquelqueséhantillons,quiorrespondent proba-blementàlaqueue de distribution. Deplus,les moyennesµ
étant inonnuesen pratique, lehoixde ette norme estdiretement assoiéàelui de l'estimateur.Les estimateursdénis àpartir de
lanorme
sup
étantparmi lesmoinsrobustes,nousne onsidéronspasdavantage ette possibilité.A e stade, la prinipale diulté de la détetion est alors la dénition d'un seuil a
priori sur l'erreur résiduelle
δ(v D )
, seuil au-delà duquel déider de l'apparition de hangements sur le sous-domaineD ∈ D
BR.Dans la setion 7.2, nous onstruisons un modèle de détetion a ontrariopermettant deombinerles diérents paramètresen unseul ritèreprobabiliste apablede déteter le sous-domaine sur lequel une image est ohérente ave une labellisation tout en
ontrlant le nombre moyen de fausses alarmes attendu. Le omplémentairede e sous-domaine
représentealors l'ensembledespixelssuseptibles de représenter deshangements.
7.2. Détetion a ontrario
Leprinipededétetionaontrario,introduitenanalysed'imagespar[Desolneuxet al.,2000 ℄,
permetde alulerunniveaudesigniativitésansavoiràmodéliserleshangements,nià
quanti-er leséartsattendus(bruit,distortions,variabilitéintrinsèque,et.),i.e.en introduisanttrèspeu
d'informationapriori.Cetteapprohesystématiqueestbaséesurunprinipesimplede pereption
attribuéàHelmholtz.Selone prinipe,notrepereptionreposesur ladétetion destruturesqui
s'opposent au hasard. Il suggère don de déteter des strutures (lignes, ourbes, et.) en tant
qu'événement rare par rapport àun modèlenaïf, aléatoire (non struturé). Cette idéeest
essen-tiellepourlagénériitédesmodèlesaontrariopuisqu'ellepermetde déteterdesstruturessans
herheràlesmodéliserpréisément. Formellement,l'approheaontrarioreposesurunemesure
delasigniativitéd'unedétetionparl'espéranedunombredefaussesalarmespluttquela
pro-babilité d'unefausse alarmeomme pourles approhes statistiqueslassiques[Bonferroni, 1936℄,
[Hommel,1988℄.
Dénition 7.2.1 Soit
E
l'ensembledesévénementspotentiellementdétetables,etP
la probabi-litésurE
d'apparitiondesévénements.Atoutévénemente ∈ E
estassoiésonnombredefaussesalarmes,déni par
N F A(e) = | E | · P (e)
(7.2.5)et pourtout réel
ε > 0
,e
est ditε −
signiatifsi etseulement siN F A(e) ≤ ε.
(7.2.6)Cette dénition ne peut être utilisée qu'après avoir déni un modèle naïf suivant le prinipe de
Helmholtz,modèlepermettantdedonnerunsensàlaprobabilité
P (e)
.Unetelledénitionpermetde garantir que l'espérane du nombre de fausses alarmes soit inférieur à
ε
(f. preuve de laproposition 7.2.4). L'utilisation de l'espérane permet de s'aranhir du fait que les détetions
multiplesnesoientpasindépendantespourdéterminerledomainededétetiondemanièreabsolue.
Il permet de ontrlerle nombre moyen de faussesdétetions et de déterminer automatiquement
leseuildedétetionenonséquene. Laméthodeestalorsréduiteàunseulparamètre:lenombre
de faussesalarmes.
Pour xer les idées sur le prinipe de ette approhe et l'avantage d'utiliser des
es-péranes plutt que des probabilités, reprenons l'exemple des dates d'anniversaire proposé par
[Desolneux et al.,2006 ℄. Dans un groupe de
N
personnes, supposons que deux d'entre ellesontla mêmedate d'anniversaire. Cetévénementest-ilsigniatif,i.e.est-ilpossiblequee soit arrivé
par hasard ou y a-t-il une raison à ela? En aord ave le prinipe de Helmholtz, supposons,
en négligeant les années bissextiles, que toutes les dates d'anniversaire aient la même
probabi-lité d'ourene
1/365
. Pour évaluer la signiativitéde l'événement onsidéré,nous avons deux possibilités:1. Caluler laprobabilitéquedeux personnes,au moins,aient lamêmedate d'anniversaire :
1 − 1 ·
Une tabulationest alorsnéessaire poursavoirsi ette probabilité estinférieure à
ε
.2. Suivant la dénition7.2.5, onsidérons l'ensemble
E
desévénementse kl =
"lespersonnesk
etl
ont la même date d'anniversaire, ave1 ≤ k < l ≤ N
,et la mesureµ
dénie parCe ritèreest beauoup plussimpleque(7.2.7)puisqu'il reliequadratiquement
N
àε
.Réemment, [Grosjean etMoisan, 2006 ℄ ont proposé la dénitionsuivante du nombre de fausses
alarmes dansunadreplus général.
Dénition 7.2.2 Soit
(X i ) 1 ≤ i ≤ N
un ensemble de variables aléatoires. Une fontionF (i, x)
estun
N F A
(nombre de faussesalarmes) pourles variables aléatoires(X i )
si∀ ε, E [ |{ i, F (i, X i ) ≤ ε }| ] ≤ ε.
(7.2.9)Ave ette dénition, si une fontion
F
vérie (7.2.9) , alors la famille de testsF (i, X i ) ≤ ε
garantit un nombre moyen de fausses alarmes inférieurà
ε
.Le prinipe de la détetionaontra-rio permet don une ertaine objetivité dans la mesure où il utilise très peu d'information a
priori. Il permet ausside réduire tous les paramètresnéessaires à ladétetion à unseul ritère:
l'espérane du nombre de fausses alarmes. Ce dernier point est essentiel puisque, en pratique,
il rend la détetion entièrement automatique en xant le nombre attendu de fausses alarmes à
1
par exemple. Ce type de détetion a déjà été appliqué, notamment, à la détetiond'aligne-ments [Desolneux et al.,2000℄, de bords ontrastés [Desolneux etal.,2001℄, de modes
d'histo-grammes et d'amas de points [Desolneuxet al.,2003 ℄, de rigidités entre deux nuages de points
[Moisan et Stival,2004 ℄.
Leproblèmedeladétetiondehangementssurlasurfaeterrestreàpartirdedonnéesde
télédetetion doittenirompted'un ertainnombredefateursspéiquesquirendentineaes
nombre de méthodes d'analyse d'images multitemporelles utilisées habituellement pour d'autres
appliations.Parexemple,lesvariationsd'illuminationetd'humiditédusol,lesdiérenesde
ali-brationduapteurentrelesdatesonsidérées,l'absened'informationapriorisurleshangements
attendus, ou les imperfetions de realage sont autant de fateurs à prendre en ompte, même
s'ilsdonnent lieu engénéral àunesériede prétraitementsspéiques(orretions radiométriques,
realage, et.). Les hangements suseptibles de se produire sur lasurfae terrestretels que, par
exemple,lesrotationsdeulture,laontaminationde parellesagrioles,lesoupesdeforêtoules
inendies,peuventêtrede tailleetd'intensitéradiométriquetrèsvariées.Dansl'objetifd'élaborer
uneméthode génériquede détetionde hangements, iln'estdonpas envisageablede listertous
les hangements possibles pour dénir un modèle a priori des hangements. De plus, les prols
d'évolutiontemporelledesdiérentstypesd'oupationdusolsontvariablesd'uneannéeàl'autre,
etd'unezonegéographique àuneautre. Unmodèleapriorisurlesnon-hangementssemblealors
aussidiileàdénir physiquement.
Nousproposonsdenousplaerdansleadredelamodélisationaontrariopourdéteter
un sous-domaine de l'image en tant que grande déviation à partir d'un modèle générique. Etant
donnée une labellisation
λ
(image HR onstante par moreaux) dérivant l'état de la surfaeétudiée à une date
t 0
xée , et une image BR de la même sène aquise ultérieurement à une datet
(t > t 0
), nous proposons de déteter dans quel sous-domaine spatialD
la labellisationλ
est enore orrete à la datet
.L'ensemble des pixels BR orrespondant à un hangement de type d'oupation du sol est alors le omplémentairedeD
.Dans et objetif,nous introduisons unemesuredeohérene entrelalabellisationhaute résolutionet l'imageBRobservée fondéesurle degré de ontradition qu'elle implique en référene à un modèlenon struturé, dit modèle a
ontrario. La méthode que nous proposons repose don sur la dénitiond'un modèle naïf, dit a
ontrario.
Dénition 7.2.3 (modèlea ontrario pour la BR) Lemodèleaontrario(
H 0 (m)
)pourl'imagebasserésolutionest unhamp aléatoire
V
de|D
BR|
variablesgaussiennesi.i.d.N (m, σ 2 I |D
BR
| )
oùm ∈ R |D
BR|
etσ > 0
sontxés.Lehoixdesparamètresdumodèlenaïfestdisutédanslasetion7.3.L'éart-type
σ
estonsidéréomme xé, et nous étudierons plusieurs possibilités pour le veteur des moyennes. Avant de
disuter les valeurs de esparamètres, poursuivons ladesription dumodèlede détetion dansle
as général.
Suivant le prinipe de Helmholtz, dérit pour la première fois en analyse d'images par
[Lowe,1985 ℄, deux éléments peuvent être groupés si leur position a une probabilité très faible
de résulter d'un arrangement aidentel; nous nous intéressons aux sous-domaines de l'image
pour lesquels l'erreur quadratique mesuréeentre l'image et sonestimée est trop petite pour être
pour lesquels l'erreur quadratique mesuréeentre l'image et sonestimée est trop petite pour être