• Aucun résultat trouvé

Nous appelons donn´ees spatialis´ees un ensemble dont chaque ´el´ement com-porte deux composantes : une position et une caract´eristique. Les images num´eriques sont un exemple de donn´ees spatialis´ees : le pixel est caract´eris´e par un index dans une matrice et sa valeur num´erique indique la couleur associ´ee `a cette position dans l’image. Les catalogues des galaxies en astro-nomie, les bases de donn´ees recensant des ´elevages laitiers sont ´egalement des exemples des donn´ees spatialis´ees.

Un catalogue de galaxies contient la position dans notre univers et les ca-ract´eristiques (masse, luminosit´e, d´eplacement vers le rouge,forme, etc.) de chaque galaxie. Une base de donn´ees recensant des ´elevages laitiers contient la position dans le territoire et les caract´eristiques de chaque ferme (esp`ece et nombre d’animaux, filiation et lieu de naissance de chaque animal, etc.).

Dans ces derniers exemples, les positions des ´el´ements ne sont plus dispos´ees sur une grille r´eguli`ere, et les caract´eristiques correspondantes se pr´esentent

sous la forme de structures de donn´ees tr`es riches et tr`es complexes.

Le caract`ere spatialis´e des donn´ees implique que les r´eponses possibles aux questions que les donn´ees sugg`erent, comportent une forte composante mor-phologique.

Quelques exemples de questions : extraire les r´eseaux routiers pr´esents dans une image satellitaire, caract´eriser la r´epartition spatiale `a large ´echelle des galaxies de notre Univers, d´eterminer la tendance `a l’agr´egation des fermes ayant une grande pr´edisposition pour une certaine maladie. En effet, dans de nombreuses situations, pouvoir analyser des donn´ees spatialis´ees revient

`

a ˆetre capable de r´epondre `a la question suivante : quelle est la forme qui se trouve “cach´ee” dans les donn´ees ?

L’objectif de ce projet est d’´etudier et proposer des outils probabilistes et statistiques permettant de r´epondre `a cette question. Plus pr´ecis´ement, nous nous sommes focalis´es sur le d´eveloppement des outils suivants :

·mod´elisation stochastique : qu’est-ce que la forme que l’on cherche ?

·simulation de type MCMC : comment mettre en oeuvre la forme ?

·inf´erence statistique et ´evaluation : comment d´etecter la forme, quels sont les param`etres de la forme, la forme trouv´ee existe-t-elle vraiment ?

Structure du document

Le m´emoire est organis´e en quatre parties. Les trois premi`eres parties cor-respondent chacune `a une de ces questions. Chaque partie contient deux chapitres. Le premier chapitre introduit les outils math´ematiques utilis´es.

Le deuxi`eme chapitre pr´esente nos contributions comme r´eponses `a la ques-tion du projet. La quatri`eme et derni`ere partie du m´emoire est d´edi´ee aux conclusions et aux perspectives.

Liste des publications

[T1] X. Descombes, R. S. Stoica, L. Garcin, and J. Zerubia. A RJMCMC algorithm for object processes in image processing.

Monte Carlo Methods and Applications, 7(1-2) :149–156, 2001.

[T2] X. Descombes, R. S. Stoica, and J. Zerubia. Two Markov point processes for simulating line networks. InInternational Confe-rence on Image Processing Proceedings, Kobe, 1999. IEEE.

[T3] X. Descombes, M. N. M. van Lieshout, R. S. Stoica, and J. Ze-rubia. Parameter estimation by a markov chain monte carlo technique for the candy model. InStatistical Signal Processing Proceedings, Singapore, 2001. IEEE.

[T4] P. Gregori, J. Mateu, and R. S. Stoica. A marked point pro-cess for modelling three dimensional patterns. In A. Baddeley, P. Gregori, J. Mateu, R. S. Stoica, and D. Stoyan, editors, Spa-tial Point Process Modelling and its Applications, Castellon, Spain, 2004. Publicacions de la Universitat Jaume I.

[T5] P. Heinrich, R. S. Stoica, and V. C. Tran. Level sets estima-tion and vorob’ev expectaestima-tion of random compact sets. Spatial Statistics, 2 :47–61, 2012.

[T6] K. Kiˆeu, K. Adamczyk-Chauvat, H. Monod, and R. S. Stoica.

A completely random T-tessellation model and Gibbsian ex-tensions. Spatial Statistics, 6 :118–138, 2013.

[T7] M. N. M. van Lieshout and R. S. Stoica. The Candy mo-del revisited : properties and inference. Statistica Neerlandica, 57 :1–30, 2003.

[T8] M. N. M. van Lieshout and R. S. Stoica. Perfect simulation for marked point processes. Computational Statistics and Data Analysis, 51 :679–698, 2006.

[T9] M. N. M. van Lieshout and R. S. Stoica. A note on pooling of labels in random fields. Statistics and Probability Letters, 80 :1431–1436, 2010.

[T10] L. Roques and R. S. Stoica. Species persistence decreases with habitat fragmentation : an analysis in periodic stochastic

en-vironments. Journal of Mathematical Biology, 55(2) :189–205, 2007.

[T11] R. S. Stoica, F. Chatelain, and M. Sigelle. Inf´erence pa-ram´etriques pour les processus ponctuels marqu´es en ana-lyse d’images. In X. Descombes, editor, Applications de la g´eom´etrie stochastique `a l’analyse d’images (S´erie Signal et Image IC2). Herm`es Lavoisier, 2011.

[T12] R. S. Stoica, F. Chatelain, and M. Sigelle. Parametric inference for marked point processes in image analysis. In X. Descombes, editor,Stochastic Geometry for Image Analysis (Digital Signal and Image Processing series). John Wiley and Sons, 2012.

[T13] R. S. Stoica, X Descombes, M. N. M. van Lieshout, and J. Zeru-bia. An application of marked point processes to the extraction of linear networks from images. In J. Mateu and F. Montes, editors,Spatial statistics through applications. WIT Press, Sou-thampton, UK, 2002.

[T14] R. S. Stoica, X. Descombes, and J. Zerubia. Road extraction in remote sensed images using a stochastic geometry frame-work. InBayesian inference and maximum entropy methods in science and engineering : 20th International Workshop, volume 560, pages 531–542. AIP Conference Proceeding, 2001.

[T15] R. S. Stoica, X. Descombes, and J. Zerubia. A Gibbs point process for road extraction in remotely sensed images. Inter-national Journal of Computer Vision, 57 :121–136, 2004.

[T16] R. S. Stoica, E. Gay, and A. Kretzschmar. Cluster detection in spatial data based on Monte Carlo inference. Biometrical Journal, 49(2) :1–15, 2007.

[T17] R. S. Stoica, P. Gregori, and J. Mateu. Simulated annealing and object point processes : tools for analysis of spatial patterns.

Stochastic Processes and their Applications, 115 :1860–1882, 2005.

[T18] R. S. Stoica, P. Gregori, and J. Mateu. A versatile MCMC strategy for sampling posterior distributions of analytically in-tractable models. Publications IRMA Lille, 67(IV), 2007.

[T19] R. S. Stoica, S. Liu, Yu. Davydov, M. Fouchard, A. Vienne, and G. B. Valsecchi. Order statistics and heavy-tailed distributions for planetary perturbations on Oort cloud comets. Astronomy and Astrophysics, 513(A14) :1–9, 2010.

[T20] R. S. Stoica, V. J. Martinez, J. Mateu, and E. Saar. Detection of cosmic filaments using the Candy model. Astronomy and Astrophysics, 434 :423–432, 2005.

[T21] R. S. Stoica, V. J. Martinez, and E. Saar. A three dimensional object point process for detection of cosmic filaments. Journal of the Royal Statistical Society. Series C (Applied Statistics), 55 :189–205, 2007.

[T22] R. S. Stoica, V. J. Martinez, and E. Saar. Filaments in obser-ved and mock galaxy catalogues. Astronomy and Astrophysics, 510(A38) :1–12, 2010.

[T23] R. S. Stoica. Marked point processes for statistical and morpho-logical analysis of astronomical data. The European Physical Journal Special Topics, 186 :123–165, 2010.

[T24] E. Tempel, R. S. Stoica, and E. Saar. Evidence for spin align-ment of spiral and elliptical galaxies in filaalign-ments. Monthly No-tices of the Royal Astronomical Society, 428 :1827–1836, 2013.

[T25] E. Tempel, R. S. Stoica, E. Saar, V. J. Martinez, L. J. Lii-vam¨agi, and G. Castellan. Detecting filamentary pattern in the cosmic web : a catalogue of filaments for the SDSS. Monthly Notices of the Royal Astronomical Society, 438(4) :3465–3482, 2014.

Premi` ere partie

Mod´ elisation probabiliste

Qu’est-ce que la forme que l’on cherche ?

La r´ealisation d’un processus ponctuel marqu´e est un ensemble dont les

´el´ements ont deux composantes : une position et une marque, la caract´e-ristique de l’´el´ement. Par exemple, une forˆet peut ˆetre mod´elis´ee par un tel processus : des points al´eatoires repr´esentent les positions des arbres, alors que la marque en chaque point est donn´ee par un cercle de rayon al´eatoire centr´e au point. Celle-ci peut repr´esenter le diam`etre de la cou-ronne de chaque arbre. Naturellement, la marque peut ˆetre enrichie d’autres caract´eristiques, telles que l’esp`ece ou l’ˆage de l’arbre.

L’un des nombreux domaines d’application o`u l’utilisation des processus ponctuels marqu´es a enregistr´e un franc succ`es est le traitement d’images [T1, 60, 61, 105, 189, 169, 170, 168, T13, T15]. Cette r´eussite tient non seulement

`

a la qualit´e des solutions (approches compl`etement automatiques, robustes), mais aussi `a la possibilit´e de formuler et de formaliser des r´eponses naturelles aux questions pos´ees. Par exemple, pour d´etecter des objets dans l’image, la question pos´ee n’est plus quels sont les pixels qui remplissent les crit`eres d´efinissant des objets. En mod´elisant les objets recherch´es par un processus ponctuel marqu´e, il est possible de r´epondre directement `a la question : o`u se trouvent les objets dans l’image et quelles sont leurs caract´eristiques ? Dans cette partie nous ´etendons les id´ees mises en oeuvre en traitement d’image, afin que cette utilisation des processus ponctuels marqu´es profite aussi `a d’autres domaines d’application.

Posons comme principe que la forme que l’on cherche est une entit´e com-plexe construite `a partir d’objets g´en´erateurs simples qui interagissent. Par exemple, il est naturel d’imaginer que les r´eseaux routiers sont form´es `a par-tir de segments connect´es qui ont tendance `a s’aligner.

Il en r´esulte que si l’on peut d´efinir des objets g´en´erateurs et des interac-tions entre ces objets, la forme que l’on cherche peut ˆetre consid´er´ee comme la r´ealisation d’un processus ponctuel marqu´e. Il est tout `a fait possible math´ematiquement d’´ecrire la densit´e de probabilit´e d’un tel processus. Les param`etres de cette densit´e contrˆolent le nombre et la marque des objets g´en´erateurs ainsi que l’intensit´e des diff´erentes interactions. Ceci implique que les statistiques exhaustives du mod`ele pourraient ˆetre utilis´ees comme des descripteurs morphologiques de la forme ainsi construite.

Si le contexte le permet, il est possible de d´efinir des interactions de port´ee finie entre objets. Le mod`ele ainsi construit aura un caract`ere markovien.

Cette propri´et´e est tr`es int´eressante. Du point de vue th´eorique c’est avec cette propri´et´e que l’on brise la complexit´e de la forme. Du point de vue

pratique, elle peut r´eduire le coˆut calculatoire de la mise en oeuvre d’un tel mod`ele.

Cette partie pr´esente des mod`eles de formes construits `a partir de proces-sus ponctuels marqu´es. A partir de cet axe, des ramifications se cr´eent.

Ainsi, nous consid´erons ´egalement des mod`eles construits `a partir de champs al´eatoires discrets ou des processus de type Arak.

Pour cette pr´esentation nous avons suivi principalement [19, 36, 72, 190, 197, 141, 180]. Les r´ef´erences [45, 46, 157] traitent les processus ponctuels d’un point de vue plus th´eorique. Pour un point de vue plus orient´e vers les applications en statistiques spatiales et analyse d’image nous recomman-dons [6, 60, 61, 68, 90]. Nous recommanrecomman-dons ´egalement [4, 5] pour une pr´esentation th´eorique claire et pr´ecise en vue des applications dans le do-maine des t´el´ecommunications. Des parties de cette section ont ´et´e publi´ees dans [T6, T7, T9, T10, T17, T16, T21, T22, T23, T11, T12].

Chapitre 2

Processus ponctuels marqu´ es

2.1 Construction et d´ efinition

Soit ν la mesure de Lebesgue dans Rd, W un sous-ensemble compact1 de Rd, et (W,BW, ν) la restriction naturelle par rapport aW de (Rd,B, ν).

Pour chaque n ∈ N, soit Wn l’ensemble de toutes les configurations w = {w1, w2, . . . wn} form´ees par n points wi ∈ W. Les configurations ne sont pas ordonn´ees et les points ne sont pas obligatoirement distincts. La confi-guration videW0 ne contient aucun point. L’espace des configurations peut ˆetre donn´e par ΩW =S

n=0Wn. A cet espace est associ´e la tribuFW g´en´er´ee par les applications de comptage

FW =σ({w={w1, . . . , wn} ∈ΩW :n(wB) =n(w∩B) =m}) o`uB ∈ B et m∈N.

D´efinition 1 Un processus ponctuel sur W est une application mesurable d’un espace de probabilit´e(S,A) dans (ΩW,FW). Sa loi P est donn´ee par

P(X ∈F) =P{ω ∈ S :X(ω)∈F},

avec F ∈ FW. Un processus ponctuel a comme r´ealisation un ensemble de points de W.

Il est possible de rajouter des caract´eristiques `a chaque point. Dans ce cas, nous avons affaire `a un processus ponctuel marqu´e. Soit le processus ponctuel surW×M dont les r´ealisations sont donn´ees par les ensembles{(wi, mi)}ni=1. Ici les wi ∈ W repr´esentent les positions de chaque point et mi ∈ M les

1. Nous avons choisi W compact pour ˆetre le plus proche possible des applications.

Cependant, sous des conditions assez souples, la pr´esentation de ce chapitre est applicable directement aux parties mesurables deWRd.

marques correspondantes. L’espace des marques M est ´equip´e d’une tribu Met d’une mesure de probabilit´eνM.

La construction d’un processus ponctuel marqu´e est similaire `a celle d’un processus ponctuel. Pour chaquen∈N, Ξnest l’ensemble de toutes les confi-gurations non-ordonn´eesx={x1, . . . , xn}. Ces configurations sont form´ees par les points marqu´es non n´ecessairement distinctsxi ∈W×M. La configu-ration vide est Ξ0. L’espace des configurations est d´efini comme Ω =S

n=0Ξn

et il est ´equip´e d’uneσ−alg`ebreF. La tribuFest d´efinie par les applications qui comptent le nombre de points dans des bor´eliensA⊆W ×M.

D´efinition 2 Un processus ponctuel sur W ×M est un processus ponctuel marqu´e si la loi marginale des positions des points est un processus ponctuel sur W. Un processus ponctuel marqu´e est une application mesurable d’un espace de probabilit´e dans (Ω,F).

Les marques peuvent ˆetre par exemple des objets de forme g´eom´etrique simple : cercles, ellipses ou segments de droite. Dans ce cas, l’espace des marques repr´esente le domaine de d´efinition des param`etres des objets.

Par exemple, il est possible de consid´erer des espaces des marques comme Mcercle = (0,∞) ou Msegment = (0,∞)×[0, π]. Ces processus ponctuels marqu´es, avec les points indiquant la position de l’objet, et la marque pr´ecisant sa forme g´eom´etrique, sont connus sous les nom de processus germe-graine.

Un autre exemple de processus ponctuel marqu´e est le processus ponctuel avec plusieurs cat´egories de points. Dans ce cas,M ={1,2, . . . , k}repr´esente les diff´erents types de points ou d’objets. Ceci est ´equivalent `a un processus ponctuel multivari´e de dimension k. Un tel processus peut ˆetre vu comme unk−tuple de processus ponctuels (X1, X2, . . . , Xk), form´e par les processus X1, X2, . . . , Xk qui correspondent chacun `a un type d’objet.