• Aucun résultat trouvé

6. Algorithmes et performanes empiriques 85

6.6. Sensibilité au fateur de résolution

Les méthodes sous-pixelliques sont souvent très limitées (f. hapitre 3) par le fateur

d'éhelleonsidéré.Laméthode quenousproposonsaété développée dansl'objetifde traiterde

fortsrapportsderésolution,telsque

15 × 15

pourl'utilisationoupléedesapteursSPOT/HRVIR etMeRISou

50 × 50

pourSPOT/HRVIRetSPOT/VGT.Dans ettesetion, nousproposons

d'analyser l'évolutiondes performanes de laméthode en fontiondurapport de résolutionet de

latailledesrégionsrelativement aupixelbasse résolution.

Soit

N = |D |D

HR

|

BR

|

le rapport de résolution entre les images haute et basse résolution

onsidérées. Apartirdujeu de

165

images HRsimulées(f. setion10.2),lesimages BRont été

simuléespour les rapports de résolutionsuivants :

15 × 15

,

30 × 30

et

50 × 50

.

Compte tenu des limites naturelles qu'engendrent la présene de trop petites régions

dans la segmentation, nous alulons le taux d'oupation de toutes les régions mal labellisées.

Lagure6.8(a)-()présentel'histogrammedutaux d'oupationdesrégionsmallabelliséespour

des fateurs de résolution de

15 × 15

,

30 × 30

et

50 × 50

. Remarquons que es histogrammes sont très prohes, montrant ainsi que la performane de l'algorithme dépend de la taillerelative

desrégionsparrapportaux pixelsbasserésolutionmaispasdufateurde résolutionen lui-même.

De plus, es histogrammes montrent un pi d'ourenes pour les régions oupant une surfae

inférieureà

1%

dupixelbasserésolution.Cetteobservationpourraitêtreexploitéepourontraindre la segmentation à la réation de régions représentant plus de

1%

du pixel basse résolution. Un pré-traitementdeetypeonduiraitprobablementàdiminuerdemoitiéleserreursdelabellisation.

Par ailleurs, il semble raisonnable de ne pas s'intéresser à des objets de si petite taille devant

l'éhelle d'observation.

0 10 20 30 40 50 60 70 80 90 100

Fig. 6.8.:Histogramme dutaux d'oupationdes régionsmallabelliséesausein despixels basse

résolution pour diérents fateurs de résolution. L'axedes absissesreprésentele taux

d'oupationd'unerégion mallabelliséeauseind'un pixelbasse résolutionet l'axedes

ordonnées représente lepourentaged'ourene.

Le tableau 6.9 présente des statistiques réalisées sur le taux d'oupation des régions

mallabelliséesdansle pixelbasserésolution,selonlefateurde résolutiononsidéré.Remarquons

N

10

ème perentile médiane

70

ème perentile

80

ème perentile

90

èmeperentile

15 2

0.44 2 5 10 25.7

30 2

0.11 1.77 7.7 16.7 41.4

50 2

0.08 2 8.13 17.6 39.8

Fig. 6.9.:Statistiquesdu taux d'oupation d'unerégion mallabelliséedansunpixel basse

réso-lutionen fontiondu fateurde résolutiononsidéré(

N

).

que

50%

des régions représentent moinsde

2%

du pixel basse résolution. Dans la littérature, la plupartdesméthodesquitraitentdesimagesBRdanslebutd'estimerles proportionsdeslasses

d'oupation du sol onsidèrent des parelles représentant plus de

5%

du pixel basse résolution

(f. [LeHégarat-Masle etal.,2005 ℄).

En e qui onerne la performane de la méthode en fontion du fateur de résolution

onsidéré, lagure 6.10 montre que les pourentages d'erreursde labellisation sontassez étalés.

Cette variabilitépeut êtreattribuée aufaitque lesexpérienesont été réalisées dansunontexte

monotemporelalorsquelesaratéristiquesde ertaineslassessontparfoistrèsprohes. Deplus,

lalignemédianemontredebonsrésultatspourunfateurderésolutionallantjusqu'à

30 × 30

,aussi

bien pour la version supervisée que pour la version non-supervisée (ave moins de

5%

de pixels

mallabelliséspour

N = 30 × 30

).Au-delà,lesperformanesdiminuentaveenviron

20%

de pixels

mal labellisés pour un fateur de résolution

50 × 50

. Ladégradation des performanes lorsquele fateurderésolutionaugmenteestdonmanifeste,non-linéaire.Notons,ependant,quelenombre

d'expérienesréaliséespourlagure6.10(b)estmoinsonséquentqueeluiutilisépour6.10(a)en

raisondutempsdealulnéessaireàl'algorithmenon-supervisé,nettementsupérieuràlaversion

supervisée. Ce graphe est don diile à interpréter, en partiulier pour le rapport de résolution

N = 50 × 50

les résultatssonttrèshétérogènes.

Remarquons que, ontrairement au as étudié gure 6.8 où la taille des régions était

onsidérée en termes de pourentage d'oupation dans un pixel BR, la gure 6.10 présente les

pourentagesd'erreursde labellisationobtenuesen fontiondurapportde résolution

N

.L'analyse

ouplée des gures 6.8 et 6.10 permet de mettre en évidene le fait que les performanes de la

labellisation sedégradent prinipalement lorsque le rapportde résolutionaugmente, pare que la

proportiond'unerégiondonnéedansunpixelBRestd'autantplusfaiblequeerapportestgrand.

Les limites observées gure 6.10 lorsque

N ≥ 30

ne onstituent pas des limites absolues de la

méthode. Elles orrespondent à un jeu de données simulées à partir d'extraits d'images réelles

de la Plaine du Danube, où les parelles sont de petite taille ontrairement, typiquement, à un

parellaire amériainoù les parellessontsouvent vastes.

0

Fig. 6.10.: Chaque roixreprésentele pourentagedespixels mallabellisésobtenus pourunjeu

de données et unrapport de résolution xé ave laversion supervisée (a) et ave la

version non-supervisée (b). Lerapport de résolution

N

est représenté en absisseset

le pourentage en ordonnées. La ligne verte superposée orrespond à la médiane de

esvaleurs de pourentage.

Lesrésultatsprésentésdansettesetion,dansunontextemonotemporel,montrentune

ertaine robustesse de laméthode vis-à-visdu rapportde résolution. En eet, lorsquee rapport

augmente, les résultatssemblentstablesen termede tailledesrégionsrelativement àlatailledes

pixelsBR.Cependant,pourlejeudedonnéesonsidéré,lagure6.10montrequelasegmentation

est tropne pourl'utilisation de données BR aveun rapport de résolution

N = 50 × 50

.Pour

améliorer es résultats, la segmentation utilisée pourrait être ontrainte selon la grille de pixels

BR, de manière à e que toutes les régions de la segmentation oupent plus de

10%

environ

(d'aprèslagure 6.8)despixelsBR. Les résultatsseraientalors optimisésenfontion durapport

de résolutiononsidéré.

Pour nir, nous proposons d'analyser les performanes de la méthode en fontion du

rapportde résolutiondansunadresimpled'appliation aux donnéesréelles.Dansetobjetif,la

méthodedelabellisationestappliquéeàdesimagespseudo-réellesdansunontextemonotemporel

supervisé. Nous utilisonsles mêmes extraitsde labase de données ADAM queeux utilisésdans

la setion 6.3, avant simulation, soit

165

images réelles HR. Ces images réelles (SPOT/HRV)

sontmoyennées parblosde taille

5 × 5

à

50 × 50

pourréerdesimages BRditespseudo-réelles.

Lagure6.11présentelepourentagede pixelsmallabellisésen fontiondurapportderésolution

onsidéré. Elle montre, omme dans le as des données simulées, que le pourentage d'erreurs

obtenu présente uneertaine variabilité.Cependant, les pourentages d'erreurssont

signiative-ment plusimportants que dansle as simulé. En eet, lalabellisationà partirde donnéesréelles

omprend, en médiane,

4.5%

d'erreurs pour un rapport de résolution de

15 2

alors que, dans le

as de données simulées,seules

0.3%

d'erreurs ont été observées (en médiane). Cette diérene

0 10 20 30 40 50 60 70

0 10 20 30 40 50 60

mislabeled pixels (%)

square root resolution ratio all errors

median

Fig. 6.11.:Pourentage des pixels mal labelisés obtenus ave l'algorithme supervisé, à partir

d'images réellesmonotemporelles.

signiativepeutêtreattribuéeaufaitquelesimagesréellesmonotemporellesnesontpastoujours

bien modéliséesparl'hypothèsegaussienne. Deplus,le jeude donnéesutiliséontientdes images

aquisesenhiver,périodeoùlaréponsespetraledessolsnuspeutêtretrèsspéique(modélisable

parunedensité de probabilitépartiulière).

Ces expérienes réalisées sur

165

extraits d'images pseudo-réelles en utilisant la version superviséede l'algorithmedelabellisationmontrentque,pourunesegmentationdonnée,laqualité

de la labellisation est très limitée lorsque le rapport de résolution onsidéré est supérieur à

30

.

En partiulier, pour un rapport

N = 50 × 50

,

30%

des pixels sont alors mal labellisés. Ces résultats montrentque laméthode nepermetune labellisationsatisfaisante,sur esdonnées, que

si

N ≤ 20 × 50

.

Détetion de hangements à

l'éhelle sous-pixelique

de hangements

Dans e hapitre, nous présentons une méthode de détetion de hangements

basée sur la omparaison entre une séquene d'images BR (basse résolution) et une

lassiationHR(hauterésolution)dérivantunétatantérieurdelamêmesène.Toutes

esimagessontsupposéesgéométriquementgéoréférenéesentreelles,i.e.l'ensembledes

pixelsHRorrespondantsàhaquepixelBRestonnu.Laméthodedéveloppéeestbasée

sur l'élaboration d'un ritèreprobabiliste apable d'évaluer le degré de ohérened'une

séquene d'imagesvis-à-vis d'unelassiation. Ellene repose pas sur lamodélisation a

priorides données mais, au ontraire, sur lerejetd'un modèlenonstruturé, dit modèle a

ontrario,par l'observationde données struturées.

7.1. Modélisation du problème

Notre objetif,dansette partie, est de déteterl'ensembledes pixelspour lesquelsune

séquene temporelle d'images BR ne orrespond plus à la lassiation HR de référene. Cette

lassiation, quipeut être vue omme une labellisation assoiéeà une interprétationde haun

deslabels,n'estutiliséeiique pour salabellisation.En eet,e quinousintéresseestdavantage

le faitque diérentes régionsaient le même type d'oupation dusol que leurtype d'oupation

en lui-même. La labellisation, notée

λ

, dérit la sène observée à une date

t 0

donnée, date de

référene pourladétetion de hangements.Formellement,ils'agitd'uneappliation

λ : D

HR

→ L = { 1, ..., L }

quiassoieàhaquepixeldudomaine

D

HRunlabelappartenantà

L

quireprésente

son type d'oupationdu sol.Dansle butde déteterles hangements quiapparaissent au ours

d'une période donnée (séquene d'images BR) par rapport à la date de référene (labellisation

λ

),nous proposons,dans ette setion, de ommenerpar modéliser le problème onsidéré.Pour

simplier, nous le présentons dans le as partiulierd'une séquene d'images réduite à uneseule

image BR, notée

v

. Le as général s'en déduit diretement en onsidérant un veteur d'images

BR.

Selon lalabellisation

λ

, haque pixel dudomaine

D

HR est pur, i.e. représente un seul

type d'oupation du sol. L'image BR, en revanhe, est onstituée prinipalement de pixels dits

mixtes puisque la surfae représentée dans un pixel basse résolution est généralement

om-posée de plusieurs parelles, éventuellement d'oupation du sol diérentes. En eet, ave les

apteurs que nous onsidérons pour ette appliation, un pixel basse résolution peut ouvrir

une surfae allant de

300 × 300

m

2

à

1

km

2

. Dans e as, l'intensité moyenne mesurée en un pixel basse résolution est déterminée par des réponses spetrales des diérents types

d'ou-pation du sol qui y sont représentés. Comme dans la partie II, nous supposons que ette

in-tensité moyenne est égale à la somme des valeurs aratéristiques (moyenne, en général) de

haque type d'oupation du sol pondérée par leur taux de représentation au sein du pixel.

Cette hypothèse, ouramment appelée modèle linéairede mélange, est très souvent utilisée pour

le problème de la désaggrégation de pixels mixtes[Faivreet Fisher,1997℄, [Faivreet al.,2000℄,

[Cardotet al.,2003℄, [Settleet Campbell,1998 ℄ mais aussi pour le mélange de plusieurs bandes

spetrales [Van DerMeer,1999 ℄, [Zhukov et al.,1999℄. Soit

y

un pixel appartenant au domaine basse résolution

D

BR et

α l (y)

la proportion du pixel

y

oupée par le label

l

. Par dénition,

pour tout pixel

y

, la somme des proportions de haque label vaut 1, i.e.

P

l ∈ L α l (y) = 1

. Si

µ = (µ(l)) l ∈L

représente l'intensité moyenne aratéristique de la lasse de label

l

, le modèle

linéaire de mélange permet alors d'estimer l'intensité d'un pixel basse résolution

y

à partir des

proportions de haque lasseetde leur intensitémoyenne par

ˆ

v(y, µ) = X

l ∈L

α l (y)µ(l).

(7.1.1)

Dans ette étude, 'est la moyenne statistique orrespondant à haque label qui est onsidérée

omme intensitémoyenne aratéristique.Nous dénissons àprésent ladistane entre l'intensité

observée

v(y)

en un pixel

y

et son estimation

v(y, µ) ˆ

, pour tous les pixels d'un sous-domaine

D

de

D

BR. Supposons que l'image BR

v

soit une réalisation d'un hamp aléatoire

V

. Par soui

de simpliité, notons

v D = (v(y)) y ∈ D

et

V D = (V (y)) y ∈ D

les restritions au sous-domaine

D

,

respetivement, de l'image observée et du hamp aléatoire dont elle est une réalisation. Cette

distane résiduellepeut êtremesuréepar lanormeeulidienne

δ µ (v D ) = k (v(y) − v(y, µ)) ˆ 1 D (y) k 2 ,

(7.1.2)

=

s X

y ∈ D

(v(y) − v(y, µ)) ˆ 2 .

(7.1.3)

Dans le ontexte que nous noussommes xé,les moyennes aratéristiques des lasses

µ(l)

sont

inonnues. Elles peuvent, par exemple, être estimées par régression linéaire, i.e. en herhant la

famille

µ

quiminimise

δ µ (v D )

.Soit,dansleas monodimensionnel,

δ(v D ) = min

µ ∈R L δ µ (v D ),

(7.1.4)

la distaneminimalemesuréesur unsous-domaine

D

de

D

BR.

Le hoix de lanorme eulidienne pour mesurer la distane entre l'intensité observée et

l'intensitéestiméeest natureldansunontexte de régressionlinéaire.Cependant, lanorme

sup

a

aussi été envisagée mais le faitqu'elle onduise automatiquement à rejeter les événements rares

n'inite pasàl'utiliserpour etyped'appliations.En eet,ilest généralementfailede diminuer

unedistanedénieparlanorme

sup

en éliminantquelqueséhantillons,quiorrespondent proba-blementàlaqueue de distribution. Deplus,les moyennes

µ

étant inonnuesen pratique, lehoix

de ette norme estdiretement assoiéàelui de l'estimateur.Les estimateursdénis àpartir de

lanorme

sup

étantparmi lesmoinsrobustes,nousne onsidéronspasdavantage ette possibilité.

A e stade, la prinipale diulté de la détetion est alors la dénition d'un seuil a

priori sur l'erreur résiduelle

δ(v D )

, seuil au-delà duquel déider de l'apparition de hangements sur le sous-domaine

D ∈ D

BR.Dans la setion 7.2, nous onstruisons un modèle de détetion a ontrariopermettant deombinerles diérents paramètresen unseul ritèreprobabiliste apable

de déteter le sous-domaine sur lequel une image est ohérente ave une labellisation tout en

ontrlant le nombre moyen de fausses alarmes attendu. Le omplémentairede e sous-domaine

représentealors l'ensembledespixelssuseptibles de représenter deshangements.

7.2. Détetion a ontrario

Leprinipededétetionaontrario,introduitenanalysed'imagespar[Desolneuxet al.,2000 ℄,

permetde alulerunniveaudesigniativitésansavoiràmodéliserleshangements,nià

quanti-er leséartsattendus(bruit,distortions,variabilitéintrinsèque,et.),i.e.en introduisanttrèspeu

d'informationapriori.Cetteapprohesystématiqueestbaséesurunprinipesimplede pereption

attribuéàHelmholtz.Selone prinipe,notrepereptionreposesur ladétetion destruturesqui

s'opposent au hasard. Il suggère don de déteter des strutures (lignes, ourbes, et.) en tant

qu'événement rare par rapport àun modèlenaïf, aléatoire (non struturé). Cette idéeest

essen-tiellepourlagénériitédesmodèlesaontrariopuisqu'ellepermetde déteterdesstruturessans

herheràlesmodéliserpréisément. Formellement,l'approheaontrarioreposesurunemesure

delasigniativitéd'unedétetionparl'espéranedunombredefaussesalarmespluttquela

pro-babilité d'unefausse alarmeomme pourles approhes statistiqueslassiques[Bonferroni, 1936℄,

[Hommel,1988℄.

Dénition 7.2.1 Soit

E

l'ensembledesévénementspotentiellementdétetables,et

P

la probabi-litésur

E

d'apparitiondesévénements.Atoutévénement

e ∈ E

estassoiésonnombredefausses

alarmes,déni par

N F A(e) = | E | · P (e)

(7.2.5)

et pourtout réel

ε > 0

,

e

est dit

ε −

signiatifsi etseulement si

N F A(e) ≤ ε.

(7.2.6)

Cette dénition ne peut être utilisée qu'après avoir déni un modèle naïf suivant le prinipe de

Helmholtz,modèlepermettantdedonnerunsensàlaprobabilité

P (e)

.Unetelledénitionpermet

de garantir que l'espérane du nombre de fausses alarmes soit inférieur à

ε

(f. preuve de la

proposition 7.2.4). L'utilisation de l'espérane permet de s'aranhir du fait que les détetions

multiplesnesoientpasindépendantespourdéterminerledomainededétetiondemanièreabsolue.

Il permet de ontrlerle nombre moyen de faussesdétetions et de déterminer automatiquement

leseuildedétetionenonséquene. Laméthodeestalorsréduiteàunseulparamètre:lenombre

de faussesalarmes.

Pour xer les idées sur le prinipe de ette approhe et l'avantage d'utiliser des

es-péranes plutt que des probabilités, reprenons l'exemple des dates d'anniversaire proposé par

[Desolneux et al.,2006 ℄. Dans un groupe de

N

personnes, supposons que deux d'entre ellesont

la mêmedate d'anniversaire. Cetévénementest-ilsigniatif,i.e.est-ilpossiblequee soit arrivé

par hasard ou y a-t-il une raison à ela? En aord ave le prinipe de Helmholtz, supposons,

en négligeant les années bissextiles, que toutes les dates d'anniversaire aient la même

probabi-lité d'ourene

1/365

. Pour évaluer la signiativitéde l'événement onsidéré,nous avons deux possibilités:

1. Caluler laprobabilitéquedeux personnes,au moins,aient lamêmedate d'anniversaire :

1 − 1 ·

Une tabulationest alorsnéessaire poursavoirsi ette probabilité estinférieure à

ε

.

2. Suivant la dénition7.2.5, onsidérons l'ensemble

E

desévénements

e kl =

"lespersonnes

k

et

l

ont la même date d'anniversaire, ave

1 ≤ k < l ≤ N

,et la mesure

µ

dénie par

Ce ritèreest beauoup plussimpleque(7.2.7)puisqu'il reliequadratiquement

N

à

ε

.

Réemment, [Grosjean etMoisan, 2006 ℄ ont proposé la dénitionsuivante du nombre de fausses

alarmes dansunadreplus général.

Dénition 7.2.2 Soit

(X i ) 1 i N

un ensemble de variables aléatoires. Une fontion

F (i, x)

est

un

N F A

(nombre de faussesalarmes) pourles variables aléatoires

(X i )

si

∀ ε, E [ |{ i, F (i, X i ) ≤ ε }| ] ≤ ε.

(7.2.9)

Ave ette dénition, si une fontion

F

vérie (7.2.9) , alors la famille de tests

F (i, X i ) ≤ ε

garantit un nombre moyen de fausses alarmes inférieurà

ε

.Le prinipe de la détetiona

ontra-rio permet don une ertaine objetivité dans la mesure où il utilise très peu d'information a

priori. Il permet ausside réduire tous les paramètresnéessaires à ladétetion à unseul ritère:

l'espérane du nombre de fausses alarmes. Ce dernier point est essentiel puisque, en pratique,

il rend la détetion entièrement automatique en xant le nombre attendu de fausses alarmes à

1

par exemple. Ce type de détetion a déjà été appliqué, notamment, à la détetion

d'aligne-ments [Desolneux et al.,2000℄, de bords ontrastés [Desolneux etal.,2001℄, de modes

d'histo-grammes et d'amas de points [Desolneuxet al.,2003 ℄, de rigidités entre deux nuages de points

[Moisan et Stival,2004 ℄.

Leproblèmedeladétetiondehangementssurlasurfaeterrestreàpartirdedonnéesde

télédetetion doittenirompted'un ertainnombredefateursspéiquesquirendentineaes

nombre de méthodes d'analyse d'images multitemporelles utilisées habituellement pour d'autres

appliations.Parexemple,lesvariationsd'illuminationetd'humiditédusol,lesdiérenesde

ali-brationduapteurentrelesdatesonsidérées,l'absened'informationapriorisurleshangements

attendus, ou les imperfetions de realage sont autant de fateurs à prendre en ompte, même

s'ilsdonnent lieu engénéral àunesériede prétraitementsspéiques(orretions radiométriques,

realage, et.). Les hangements suseptibles de se produire sur lasurfae terrestretels que, par

exemple,lesrotationsdeulture,laontaminationde parellesagrioles,lesoupesdeforêtoules

inendies,peuventêtrede tailleetd'intensitéradiométriquetrèsvariées.Dansl'objetifd'élaborer

uneméthode génériquede détetionde hangements, iln'estdonpas envisageablede listertous

les hangements possibles pour dénir un modèle a priori des hangements. De plus, les prols

d'évolutiontemporelledesdiérentstypesd'oupationdusolsontvariablesd'uneannéeàl'autre,

etd'unezonegéographique àuneautre. Unmodèleapriorisurlesnon-hangementssemblealors

aussidiileàdénir physiquement.

Nousproposonsdenousplaerdansleadredelamodélisationaontrariopourdéteter

un sous-domaine de l'image en tant que grande déviation à partir d'un modèle générique. Etant

donnée une labellisation

λ

(image HR onstante par moreaux) dérivant l'état de la surfae

étudiée à une date

t 0

xée , et une image BR de la même sène aquise ultérieurement à une date

t

(

t > t 0

), nous proposons de déteter dans quel sous-domaine spatial

D

la labellisation

λ

est enore orrete à la date

t

.L'ensemble des pixels BR orrespondant à un hangement de type d'oupation du sol est alors le omplémentairede

D

.Dans et objetif,nous introduisons unemesuredeohérene entrelalabellisationhaute résolutionet l'imageBRobservée fondéesur

le degré de ontradition qu'elle implique en référene à un modèlenon struturé, dit modèle a

ontrario. La méthode que nous proposons repose don sur la dénitiond'un modèle naïf, dit a

ontrario.

Dénition 7.2.3 (modèlea ontrario pour la BR) Lemodèleaontrario(

H 0 (m)

)pourl'image

basserésolutionest unhamp aléatoire

V

de

|D

BR

|

variablesgaussiennesi.i.d.

N (m, σ 2 I |D

BR

| )

m ∈ R |D

BR

|

et

σ > 0

sontxés.

Lehoixdesparamètresdumodèlenaïfestdisutédanslasetion7.3.L'éart-type

σ

estonsidéré

omme xé, et nous étudierons plusieurs possibilités pour le veteur des moyennes. Avant de

disuter les valeurs de esparamètres, poursuivons ladesription dumodèlede détetion dansle

as général.

Suivant le prinipe de Helmholtz, dérit pour la première fois en analyse d'images par

[Lowe,1985 ℄, deux éléments peuvent être groupés si leur position a une probabilité très faible

de résulter d'un arrangement aidentel; nous nous intéressons aux sous-domaines de l'image

pour lesquels l'erreur quadratique mesuréeentre l'image et sonestimée est trop petite pour être

pour lesquels l'erreur quadratique mesuréeentre l'image et sonestimée est trop petite pour être