• Aucun résultat trouvé

1.2 Objectif du stage

2.1.2 Cancer du sein

Le cancer du sein (plus d´etaill´e voir [9]) est un type de cancer tr`es r´epandu, surtout pour les femmes. En principe, cancer est un probl`eme tr`es s´erieux car il n’y a pas de rem`ede efficace, et il est estim´e que pr`es de 1 femme sur 8 aux ´Etat Unis d´eveloppera un cancer du sein invasif au cours de sa vie. Ce type de cancer se forme dans les tissus du sein, habituellement les conduits et les lobules.

2. Etat de l’art´ 7 Etapes du cancer du sein´ Le cancer du sein, g´en´eralement comme toute sorte de cancer, a des diff´erentes ´etapes. Ainsi, le cancer du sein peut ˆetre ”ductal” ou ”lobular”, et pour ces emplacements, ”in situ” ou ”envahissants”. En g´en´eral, 80 % de cas sont le carcinome ductal. Nous montrerons les diff´erents ´etapes de cancer dans la figure (2.2).

2. Etat de l’art´ 8

Figure 2.2: Etapes du cancer du sein :´ Normal cells, Ductal hyperplasia - trop de cellules. Atypical ductal hyperplasia - trop de cellules qui commencent `a apparaˆıtre anormale (´egalement connu sous le nom ADH) .Ductal carcinoma in situ - trop de cellules qui se d´eveloppent comme un cancer mais sont encore confin´es `a l’int´erieur du conduit (DCIS).DCIS-MI (DCIS avec micro-invasion) - plusieurs sous-types de DCIS, certains plus graves que d’autres.Invasive ductal cancer - L’´etat incontrˆol´e des cellules

qui ont pass´e `a travers des barri`eres tissulaires normales.

2. Etat de l’art´ 9 2.1.3 Diab`ete et insuline

L’insuline est une hormone s´ecr´et´ee par le pancr´eas, plus pr´ecis´ement par des cellules sp´ecialis´ees situ´ees dans les ˆılots de Langerhans. Elle agit comme une cl´e qui ouvre une porte permettant ainsi l’entr´ee du glucose (sucre) dans les cellules de l’organisme.

Celles-ci utiliseront le glucose comme carburant ou le mettront en r´eserve pour une utilisation future. L’insuline joue donc un rˆole de r´egulateur en maintenant la glyc´emie

`

a des valeurs normales. Si le pancr´eas, pour une raison ou une autre, est incapable de fournir une quantit´e suffisante d’insuline ou que celle-ci n’arrive pas `a faire son travail, le diab`ete apparaˆıt.

Les ˆılots de Langerhans (plus d´etaill´e voir [10], [11], [1]) sont de petits organes situ´es aux pancr´eas qui sont cruciaux pour l’hom´eostasie du glucose. Les hormones produites par les ˆılots de Langerhans sont s´ecr´et´ees directement dans la circulation sanguine par au moins quatre types de cellules :

1. L’insuline est produite par les cellules β (65-80 % des ˆılots).

2. Le glucagon est produit par les cellules α (15-20 %).

3. La somatostatine est produite par les cellules δ (3-10 %).

4. Le polypeptide pancr´eatique par les cellules F (ou PP) (1 %).

Dans notre travail, nous essayons d’estimer la distribution et l’interaction entre les types de cellulesα,β,δ. De plus, nous allons proposer d’autres organisation de ces cellules.

2. Etat de l’art´ 10

Figure 2.3:Les ˆılots de Langerhans (A-D) Les micrographies confocales montrent des ˆılots pancr´eatiques de Langerhans `a partir de sections chez l’humain (A), le singe (B), la souris (C) et le cochon (D). L’insuline immunor´eactive (rouge) -β cellule, glucagon immunor´eactive (vert) -αcellule, et la somatostatine-immunor´eactives (cellules bleues

-δcellule) (d’apr`es [1]) .

2.2 Analyse de l’organisation spatiale

2.2.1 Travaux similaires

La mod´elisation de l’organisation spatiale a ´et´e un sujet de recherche actif et a attir´e l’int´erˆet de diff´erentes communaut´es scientifiques. `A l’heure actuelle, il existe des tra-vaux qui se focalisent sur ce th`eme, par exemple le travail men´e par Robert F. Murphy et son ´equipe (voir l’article [12]) qui ont propos´e des m´ethodes de calcul, `a partir de donn´ees d’image, g´en´erer des mod`eles statistiques de formes cellulaires et nucl´eaires et calculer l’arrangement des structures sous-cellulaires et des prot´eines en leur sein. Une autre recherche de David J. Weston concernant la cellule (voir l’article [3]) nous montre l’organisation spatiale des objets nucl´eaires. Particuli`erement, en analysant de motifs de points spatiaux pour chaque image, nous pouvons distinguer des mod`eles de points diff´erents, les points sont distribu´es au hasard, de mani`ere uniforme ou regroup´es.

2. Etat de l’art´ 11 Diverses approches sous-tendent la mod´elisation des relations spatiales, qui est un do-maine h´et´erog`ene et interdisciplinaire. Une premi`ere classification est r´ealis´ee entre trois niveaux de repr´esentation : g´eom´etrique, informatique, et utilisateur.

Au niveau g´eom´etrique, les objets spatiaux peuvent ˆetre consid´er´es comme des ensembles de points, et les relations peuvent ˆetre formellement d´efinies en termes math´ematiques (voir la section 2.2.2, 2.2.3.1). Au niveau informatique, les objets sont repr´esent´es en tant que types de donn´ees spatiaux et les relations sont calcul´ees au moyen d’op´erateurs spatiaux (voir la section 2.2.2). Au niveau utilisateur, les objets et les relations appar-tiennent `a une ontologie d´ependante du contexte (voir la section 3.0.5). Nous essayons d’analyser les relations spatiales dans deux ´echelles locale, globale et `a trois niveaux de repr´esentation.

2.2.2 Analyse `a l’´echelle locale

Actuellement, nous consid´erons les applications d’imagerie intelligentes qui visent `a ef-fectuer un certain niveau de raisonnement m´ecanique sur le contenu de l’image. Et la connaissance des relations entre les r´egions est une notion important dans ce proces-sus. Particuli`erement, une m´ethodologie en se basant sur la M´er´eotopologie Discr`ete (voir l’article [2]) est souvent utilis´ee. Cet m´ethodologie pr´esente la logique spatiale en Morphologie Math´ematique et permet de fournir un ensemble de relations spatiales qui peuvent ˆetre utilis´es pour d´ecrire la topologie et l’organisation des images num´eriques.

Ces relations spatiales sont un ensemble de contacts dans l’espace 2D discret existent entre des paires de zones binaires dans une image, ainsi qu’entre r´egions `a travers diff´erentes images (tels que des images multi-canaux, o`u les structures marqu´ees de la mˆeme image sont cod´es dans des s´epar´es canaux).

Nous pouvons d´efinir la m´er´eotopologie discr`ete (DM) = mereology + topologie comme une logique combinant mereologie (comme la th´eorie des relations d’inclusion) et de la topologie de l’espace. Nous pouvons ´egalement utiliser un langage de contraintes spa-tiale RCC8 qui est une sous-th´eorie de la logique spatiale RCC (Region Connection Calculus en anglais) pour la connexion des r´egion. L’ensemble RCC8 d´ecrit huit rela-tions disjointes sur des paires de r´egions X et Y (DC, EC, PO, EQ, TPP, NTPP, TPPi, NTPPi). L’ensemble RCC5 d´ecrit cinq relations disjointes conjointement exhaustives sur des paires de r´egions X et Y (DR, PO, EQ, PP, PPi).

Les principales relations sont pr´esent´es comme suit : 1. DC : disjoints et ext´erieur l’un `a l’autre..

2. EC : connexion externe, se touchent.

2. Etat de l’art´ 12

Figure 2.4: Les relations RCC5D et RCC8D. Les r´egions sont repr´esent´ees en des cercles 2 dimentions (l’objet plus lumineux est X et l’objet fonc´e est Y).

3. PO : s´ecants partiel.

4. TPP : tangents int´erieurement - X est int´erieux de Y.

5. NTPP : tangents int´erieurement - disjoints, X est int´erieur de Y..

6. EQ : deux objets identiques : confondus.

7. TPPi : est invers´e de TPPi, tangents int´erieurement - connection int´erieur, Y est int´erieur de X.

8. NTPPi : est invers´e de NTPP, tangents int´erieurement - Disjoints, int´erieur Y `a X.

Une des raisons qui fait que la m´er´eotopologie discrete est tr`es populaire et est ap-pliqu´e largement, c’est la correspondance entre m´er´eotopologie discrete et morpholo-gie math´ematique. De plus, les op´erations de morphologie math´ematique sont facile `a impl´ementer en traitement d’image. La formule ”X⊕A” dans le tableau (2.5) indique

Figure 2.5: La correspondance de Discrete er´eotopologie et Morphologie Math´ematique, d´efini dans RCC8D (d’apr`es [2]).

une dilatation de l’imageX avec le noyauA , et ”T

” signifie intersection, ”∅” indique un r´esultat nul, et ”−” signifie l’ensemble th´eorique diff (la diff´erence asym´etrique ou soustraction logique) op´eration calcul´ee entre les deux images binairesX etY.

Particuli`erement, en se basant sur les relation RCC5 et RCC8, Landini, Randell et Gal-ton (voir l’article [7], [2]) ont impl´ement´e un algorithme efficace pour calculer les relations

2. Etat de l’art´ 13 RCC5 et RCC8 entre les r´egions dans deux images. Elle consiste `a encoder les images binaires avec des valeurs 0, 1 pour imageXet 0, 2 pour imageY , o`u on inspecte l’histo-gramme de la somme des deux images (les valeurs 1, 2 ou 3). Cette algorithme est illustr´e dans la figure (2.6) suivante : Ces auteurs ont d´evelopp´e un plugin ”RCC8D Multi”

Figure 2.6: Algorithme de d´etection des relations spatiales entre les r´egions . Cet algorithme 0, 1 est cod´ee pour l’image X et 0, 2 est cod´e pour Image Y (0 est le plan arri`ere, le fond et 1, 2 repr´esente la r´egion pixels). L’histogramme de la somme (X + Y) ne contient que valeurs de 0 (fond), 1 (r´egion X), 2 (r´egion Y), ou 3 (ces deux r´egions occupent l’emplacement de ce pixel) et il peut ˆetre utilis´e pour trouver la relation RCC5D entre les r´egions. Par exemple si le nombre de pixels de l’histogramme 1 et 2 (les valeurs de r´egions X et Y) sont tous ´egaux `a 0 et la somme S (valeur ´egal `a 3) est

sup´erieure `a 0, la relation est EQ (d’apr`es [2]).

pour effectuer cette tˆache (voir sur le site :http ://www.dentistry.bham.ac.uk/landinig/

software/spatial/rcc8d.html). Cet algorithme donne des avantages en analysant des re-lations spatiales entre des paires de zones binaires dans une seule image, ainsi qu’entre les r´egions `a travers diff´erentes images. Nous allons appliquer ces r´esultats de recherche pour mod´eliser l’organisation cellulaire et tissulaire.

2.2.3 Analyse `a l’´echelle globale

2.2.3.1 Statistique spatiale

Analyse de mod`ele de points (PPA - Point pattern analysis en anglais) est l’´etude de la disposition spatiale des points dans l’espace de recherche (la r´egion d’´etude). La

2. Etat de l’art´ 14

Figure 2.7: Exemple : Illustration 2D de l’extraction de compartiment Promyelocytic Leukemia (PML) (l’image extraite `a partir de l’article de David J. Weston, voir [3]).

A) l’image d’origine B) PML est segment´e `a partir de cette image. C)Chaque noyau est remplac´e par son centre de gravit´e. Une question que nous pouvons poser, les com-posants (en vert ) PML sont distribu´ees au hasard ou ont des relations les uns aux

autres.

formulation la plus simple est un ensemble S={s∈P} o`u P est l’espace de recherche.

Dans une r´egion d’´etude, une question que nous pouvons poser, c’est que les objets observ´esS ={s∈P} (des ´ev´enements) sont distribu´ees au hasard ou ont des relations les uns aux autres. Notre objectif est de d´eterminer s’il y a une tendance des ´ev´enements pour exposer sch´ema syst´ematique sur une zone plutˆot que d’ˆetre distribu´ees au hasard.

Un exemple d’illustration sur la Promyelocytic Leukemia (voir la figure2.7). Le probl`eme devient comment trouver le motif (mod`ele) de points spatiaux ou la relation entre les points dans l’ensembleS. Les donn´ees ponctuelles ont souvent des attributs, mais nous sommes seulement int´eress´es par la localisation (la position du centre de cet objet) (voir l’article [4]).

Distributions statistiques

— Distribution al´eatoire (completely random pattern - CRS en anglais) - chaque point est ´egalement susceptible de se produire `a n’importe quel endroit et la position de chaque point n’est pas affect´ee par la position de n’importe quel autre point.

— Distribution uniforme (en anglais : uniform distribution, regular pattern, repul-sion) - chaque point est le plus loin possible de l’ensemble de ses voisins, la distance est uniforme entre tous les points.

— Mod`ele agr´eg´e, cluster (clustered pattern en anglais) - plusieurs points sont concentr´es rapproch´es, et il existe de grandes zones qui contiennent tr`es peu de points.

2. Etat de l’art´ 15

Figure 2.8: Diff´erents types de distribution spatiale. Les positions peuvent ˆetre uni-form´ement et ind´ependamment distribu´es (compl`etement al´eatoire mod`ele), ou at-traction mutuelle (mod`ele agr´eg´e) ou r´epulsion mutuelle (mod`ele r´egulier, uniforme)

(d’apr`es [4]).

2.2.3.2 Fonctions d’estimation de la distribution

Afin d’analyser leur distribution spatiale,toutes les r´egions ou les objets sont repr´esent´ees par leur centres de gravit´e. Nous essayons de trouver des fonctions qui peuvent estimer la distribution des points. Et les functions de distance sont des outils standards dans le processus d’analyse statistique. Certaines des fonctions tr`es utiles et largement utilis´e dans l’estimation du mod`ele des points sont les fonctions ’F-function’, ’G-function’ et

’H-function’

G-function: est une mesure simple, cette fonction examine la distribution de la fr´equence cumul´ee des plus proches des distances voisines. La fonction G d’un mod`ele de point est la fonction de distribution de la distance entre un point X typique du mod`ele et son plus proche voisin (voir l’´equation 2.1, plus d´etaill´e voir l’article [4]).

G(x) =P(X < x) (2.1)

Apr`es avoir trouv´e le plus proche voisin, nous allons calculer la distance entre ces deux paires des ´ev´enements. A partir de ces r´esultats, nous allons compter le nombre des points avec la distance inf´erieur d’un mesure de distance (voir l’´equation 2.2). Ce ratio est calcul´e par le nombreux de paires de points o`u rmin ≤ r divise par le total de nombreux de point dans la r´egion d’´etude (voir la formulation2.2).

G(r) = [rmin(si)< r]

n (2.2)

F-function: est un mesure simple, cette function examine la distribution de la fr´equence cumul´ee de la distance Y entre une position typique dans le noyau et son point le plus

2. Etat de l’art´ 16

Figure 2.9: G-function, les points observ´es - ´ev´enements (events en anglais) : 1, 2, 3,...,12 dans une r´egion d’´etude . Pour chaque ´ev´enement, nous avons trouv´e leur voisin avec la plus proche de distance possible (nearest neighbor). Par exemple : le plus proche

de l’´ev´enement 1 est l’´ev´enement 10 avec la distancermin= 25.59. (d’apr`es [5])

Figure 2.10: Graphe du G-function. La forme de function G nous pr´esente la fa¸con dont les ´ev´enements sont espac´ees dans un mod`ele (pattern) de points. (d’apr`es [5])

proche dans la r´egion d’´etude(plus d´etaill´e voir l’article [4], [3] et [5]).

F(y) =P(Y < y) (2.3)

Trois ´etapes de calcul de F-function :

— Produire al´eatoirement n points (p1, p2, ..., pn).

— Calculer dmin(pi, s) comme le plus courte distance de la location pi `a tous les

´

ev´enements dans le mod`ele des points S.

— CalculerF(d) (voir l’´equation 2.4).

2. Etat de l’art´ 17

Figure 2.11:La F-function est la function de distribution cumul´ee de la distance entre les points qui ont ´et´e g´ener´e al´eatoirement dans la r´egion d’´etude (croix bleues) et leur

plus proche ´ev´enement (points observ´es - des cercles dans la figure) (d’apr`es [5])

Figure 2.12:Le r´esultat SDI du F-function (graphe en couleur noire) est la mesure de la distance du vide dans la r´egion d’´etude. Cette distance a la tendance `a ˆetre grande pour le mod`ele agr´eg´e et plus petite pour le mod`ele r´egulier. Si le graphe de F-function est situ´e entre deux graphes avec les valeurs de confiance 5% et 95%, des ´ev´enement ont la distribution al´eatoire. Si cette graphe est situ´e au-dessous du graphe de 5%,

c’est-`

a-dire une distribution agr´eg´e (cluster) et au-dessus du graphe de 95%, c’est-`a-dire egularit´e (uniformit´e) des ´ev´enements dans la r´egion d’´etude.

F(r) = [rmin(si)< r]

n (2.4)

Notre objectif est de trouver la signification des fonctions et d´efinir la distribution ou le mod`ele des ´ev´enements dans la r´egion d’´etude (soit agr´eg´e, soit uniformit´e, soit distri-bution al´eatoire). Une des m´ethodes populaire (voir [5]) est d’utiliser les param`etres de

2. Etat de l’art´ 18 confiance.

— D’abord, on va simuler un grand nombre (n fois, par exemple n = 10000 fois) de processus spatiaux et et estimer la fonction d’estimation pour chacune de celles-ci.

— Ensuite on va enregistrer les valeurs obtenues de cette function G pour tous les processus et les normaliser dans le range [0,1].

— De plus, a partir de ce range, on peut observer les valeurs de confiance 5% et 95%.

— Enfin, on peut trouver la signification de la function G en se basant sur les valeurs de confiance (voir la figure 2.12).

2.3 Estimation de la distance

Nous avons pr´esent´e le cadre conceptuel pour la description de l’organisation spatiale `a l’´echelle locale et `a l’´echelle globale. Actuellement, notre travail vise `a estimer la distance pour chaque ´ev´enement dans la r´egion d’´etude en analysant les attributs d’une image. Il est n´ecessaire de trouver un outil puissant pour estimer la distance. La transformation de distances r´epond `a notre besoin.

La notion de distance joue un rˆole central en analyse d’image et description de formes.

Elle intervient par exemple pour la mesure de la longueur ou de l’´epaisseur des objets pr´esents dans une image, pour la mesure de similarit´e entre les formes et la mise en correspondance, dans les transformations de distances, en morphologie math´ematique, etc.

De nombreuses fonctions de distances existent selon les espaces `a mesurer. Dans certains cas o`u les r´egions ont les formes convexes, la distance euclidienne (plus d´etaill´e voir [13][14] [15]) ( euclidean distance en anglais) peut-ˆetre manipul´ee directement, il poss`ede des avantages (simplicit´e et rapidit´e des algorithmes, notion de plus court chemin,...).

Dans le cas o`u la r´egion a une forme non convexe, un autre type de distance qu’on utilise souvent pour calculer la carte de distance est la distance de chanfrein (Chamfer distance en anglais) (voir l’article [13]). Nous allons prendre en d´etail la transformation de distance dans ces deux cas.

2.3.1 Distance euclidienne

La distance la plus naturellement utilis´ee est la distance euclidienne, d´efinie pour deux pointsp= (p1, p2, ...pn) et q= (q1, q2, ..., qn) de Rn par :

dE(p, q) =p

(p1−q1)2+ (p2−q2)2+....(pn−qn)2 (2.5)

2. Etat de l’art´ 19

Figure 2.13: Le processus de production de carte de distance pour chaque image.

Transformations de distances [13] : Apr`es avoir parl´e de la distance entre points, nous d´efinissons maintenant la distance d’un point `a un ensemble, une m´ethode utile est la transformation de distance (DT - Distance Transformation en anglais). Le but principal de la DT est de calculer la distance de chaque point `a un ensemble. Nous pouvons appliquer la transformations de distances en calculant la distance euclidienne pour tous les pixels dans une image. Les r´esultats que nous allons obtenir est la carte de distance euclidienne pour chaque image (voir la figure2.13.)

En traitement d’image, nous pouvons d´efinir la transformation de distances par la fa¸con suivante : Soit I : Ω⊂Z2 → {0,1} est une image binaire o`u le domaine Ω est convexe.

Particuli`erement, Ω ={1, ..., n} × {1, ..., n}. Par convention, la valeur O est associ´ee au noir, 1 est associ´ee au blanc. De plus, nous avons un objet W

repr´esent´e par des pixels blancs.

_={p∈Ω|I(p) = 1} (2.6)

L’ensemble W

est un objet ou le premier plan peut ˆetre constitu´e des plusieurs sous-ensembles dans le domaine d’image. Ωc = Ω\ W

est un ensemble des pixels noirs dans Ω qui est appell´e le plan arri`ere (background en anglais). Du point de vue de la transformation de distances, les pixels en plan d’arri`ere sont appell´e les points d’int´erˆet, la source.

D´efinition : La transformation de distance (DT) est la transformation qui g´en`ere une carte D dont la valeur de chaque pixel p est la plus petite distance de ce pixel `a Ωc. L’image D est la carte de distance deI. La figure 2.15 est un exemple du calcul de la carte de distance.

Normalisation de la distance : Pour r´eutiliser les r´esultats de la carte de distance dans l’analyse de l’organisation spatiale, nous essayons de normaliser la carte de distance dans le range [0,1]. Le but de ce travail est d’obtenir un volume constant [0,1] `a partir des r´esultats de distance. Pour normaliser de la distance, initialement, nous calculerons le nombre des points possibles dans le domaine possible. Apr`es, nous donnerons une valeur moyenne de distance pour tous les points qui ont la mˆeme distance dans le domaine possible. Enfin, nous diviserons cette valeur sur la valeur maximale de distance. Le r´esultat de normalisation est la carte de distance dans un volume constant [0,1].

2. Etat de l’art´ 20

(a) Image binaire d’origine, la r´egion d’´etude en blanc, le plan arri`ere en

noir.

(b)Image binaire d’origine invers´ee,la egion d’´etude en blanc, le plan arri`ere

en noir.

(c) La carte de distance pour image d’origine - r´esultat obtenu en appli-quant la function ’distance map’ dans le logiciel ImageJ. Il s’agit de la dis-tance euclidienne de chaque pixel au pixel noir le plus proche. Les r´egions plus claires sont plus loins du plan

arri`ere.

(d) La carte de distance pour image d’origine `a l’inverse. - r´esultat obtenu en en appliquant la function ’distance map’ dans le logiciel ImageJ. Il s’agit de la distance euclidienne de chaque pixel au pixel noir le plus proche. Les egions plus claires sont plus loins du

plan d’arri`ere.

Figure 2.14: Exemple du calcul de la carte de distance Euclidienne

2.3.2 Distances g´eod´esiques

La distance euclidienne est tr`es utile pour calculer la distance entre deux points dans une r´egion qui a la forme convexe. Dans le cas o`u la r´egion a la forme non convexe, la

La distance euclidienne est tr`es utile pour calculer la distance entre deux points dans une r´egion qui a la forme convexe. Dans le cas o`u la r´egion a la forme non convexe, la

Documents relatifs