• Aucun résultat trouvé

Analyse ` a l’´ echelle globale

2.2 Analyse de l’organisation spatiale

2.2.3 Analyse ` a l’´ echelle globale

2.2.3.1 Statistique spatiale

Analyse de mod`ele de points (PPA - Point pattern analysis en anglais) est l’´etude de la disposition spatiale des points dans l’espace de recherche (la r´egion d’´etude). La

2. Etat de l’art´ 14

Figure 2.7: Exemple : Illustration 2D de l’extraction de compartiment Promyelocytic Leukemia (PML) (l’image extraite `a partir de l’article de David J. Weston, voir [3]).

A) l’image d’origine B) PML est segment´e `a partir de cette image. C)Chaque noyau est remplac´e par son centre de gravit´e. Une question que nous pouvons poser, les com-posants (en vert ) PML sont distribu´ees au hasard ou ont des relations les uns aux

autres.

formulation la plus simple est un ensemble S={s∈P} o`u P est l’espace de recherche.

Dans une r´egion d’´etude, une question que nous pouvons poser, c’est que les objets observ´esS ={s∈P} (des ´ev´enements) sont distribu´ees au hasard ou ont des relations les uns aux autres. Notre objectif est de d´eterminer s’il y a une tendance des ´ev´enements pour exposer sch´ema syst´ematique sur une zone plutˆot que d’ˆetre distribu´ees au hasard.

Un exemple d’illustration sur la Promyelocytic Leukemia (voir la figure2.7). Le probl`eme devient comment trouver le motif (mod`ele) de points spatiaux ou la relation entre les points dans l’ensembleS. Les donn´ees ponctuelles ont souvent des attributs, mais nous sommes seulement int´eress´es par la localisation (la position du centre de cet objet) (voir l’article [4]).

Distributions statistiques

— Distribution al´eatoire (completely random pattern - CRS en anglais) - chaque point est ´egalement susceptible de se produire `a n’importe quel endroit et la position de chaque point n’est pas affect´ee par la position de n’importe quel autre point.

— Distribution uniforme (en anglais : uniform distribution, regular pattern, repul-sion) - chaque point est le plus loin possible de l’ensemble de ses voisins, la distance est uniforme entre tous les points.

— Mod`ele agr´eg´e, cluster (clustered pattern en anglais) - plusieurs points sont concentr´es rapproch´es, et il existe de grandes zones qui contiennent tr`es peu de points.

2. Etat de l’art´ 15

Figure 2.8: Diff´erents types de distribution spatiale. Les positions peuvent ˆetre uni-form´ement et ind´ependamment distribu´es (compl`etement al´eatoire mod`ele), ou at-traction mutuelle (mod`ele agr´eg´e) ou r´epulsion mutuelle (mod`ele r´egulier, uniforme)

(d’apr`es [4]).

2.2.3.2 Fonctions d’estimation de la distribution

Afin d’analyser leur distribution spatiale,toutes les r´egions ou les objets sont repr´esent´ees par leur centres de gravit´e. Nous essayons de trouver des fonctions qui peuvent estimer la distribution des points. Et les functions de distance sont des outils standards dans le processus d’analyse statistique. Certaines des fonctions tr`es utiles et largement utilis´e dans l’estimation du mod`ele des points sont les fonctions ’F-function’, ’G-function’ et

’H-function’

G-function: est une mesure simple, cette fonction examine la distribution de la fr´equence cumul´ee des plus proches des distances voisines. La fonction G d’un mod`ele de point est la fonction de distribution de la distance entre un point X typique du mod`ele et son plus proche voisin (voir l’´equation 2.1, plus d´etaill´e voir l’article [4]).

G(x) =P(X < x) (2.1)

Apr`es avoir trouv´e le plus proche voisin, nous allons calculer la distance entre ces deux paires des ´ev´enements. A partir de ces r´esultats, nous allons compter le nombre des points avec la distance inf´erieur d’un mesure de distance (voir l’´equation 2.2). Ce ratio est calcul´e par le nombreux de paires de points o`u rmin ≤ r divise par le total de nombreux de point dans la r´egion d’´etude (voir la formulation2.2).

G(r) = [rmin(si)< r]

n (2.2)

F-function: est un mesure simple, cette function examine la distribution de la fr´equence cumul´ee de la distance Y entre une position typique dans le noyau et son point le plus

2. Etat de l’art´ 16

Figure 2.9: G-function, les points observ´es - ´ev´enements (events en anglais) : 1, 2, 3,...,12 dans une r´egion d’´etude . Pour chaque ´ev´enement, nous avons trouv´e leur voisin avec la plus proche de distance possible (nearest neighbor). Par exemple : le plus proche

de l’´ev´enement 1 est l’´ev´enement 10 avec la distancermin= 25.59. (d’apr`es [5])

Figure 2.10: Graphe du G-function. La forme de function G nous pr´esente la fa¸con dont les ´ev´enements sont espac´ees dans un mod`ele (pattern) de points. (d’apr`es [5])

proche dans la r´egion d’´etude(plus d´etaill´e voir l’article [4], [3] et [5]).

F(y) =P(Y < y) (2.3)

Trois ´etapes de calcul de F-function :

— Produire al´eatoirement n points (p1, p2, ..., pn).

— Calculer dmin(pi, s) comme le plus courte distance de la location pi `a tous les

´

ev´enements dans le mod`ele des points S.

— CalculerF(d) (voir l’´equation 2.4).

2. Etat de l’art´ 17

Figure 2.11:La F-function est la function de distribution cumul´ee de la distance entre les points qui ont ´et´e g´ener´e al´eatoirement dans la r´egion d’´etude (croix bleues) et leur

plus proche ´ev´enement (points observ´es - des cercles dans la figure) (d’apr`es [5])

Figure 2.12:Le r´esultat SDI du F-function (graphe en couleur noire) est la mesure de la distance du vide dans la r´egion d’´etude. Cette distance a la tendance `a ˆetre grande pour le mod`ele agr´eg´e et plus petite pour le mod`ele r´egulier. Si le graphe de F-function est situ´e entre deux graphes avec les valeurs de confiance 5% et 95%, des ´ev´enement ont la distribution al´eatoire. Si cette graphe est situ´e au-dessous du graphe de 5%,

c’est-`

a-dire une distribution agr´eg´e (cluster) et au-dessus du graphe de 95%, c’est-`a-dire egularit´e (uniformit´e) des ´ev´enements dans la r´egion d’´etude.

F(r) = [rmin(si)< r]

n (2.4)

Notre objectif est de trouver la signification des fonctions et d´efinir la distribution ou le mod`ele des ´ev´enements dans la r´egion d’´etude (soit agr´eg´e, soit uniformit´e, soit distri-bution al´eatoire). Une des m´ethodes populaire (voir [5]) est d’utiliser les param`etres de

2. Etat de l’art´ 18 confiance.

— D’abord, on va simuler un grand nombre (n fois, par exemple n = 10000 fois) de processus spatiaux et et estimer la fonction d’estimation pour chacune de celles-ci.

— Ensuite on va enregistrer les valeurs obtenues de cette function G pour tous les processus et les normaliser dans le range [0,1].

— De plus, a partir de ce range, on peut observer les valeurs de confiance 5% et 95%.

— Enfin, on peut trouver la signification de la function G en se basant sur les valeurs de confiance (voir la figure 2.12).

Documents relatifs