• Aucun résultat trouvé

3.3 Architecture du système

3.3.2 Segmentations à basse résolution de l’image

La première étape de notre méthode consiste à écarter de l’analyse des zones facile-ment reconnaissables à basse, voire à très basse résolution. Ceci permet de diminuer la quantité de données à analyser à plus forte résolution et ainsi d’économiser du temps de calcul. Cette première étape peut également servir à éliminer des objets ou des compar-timents détectables à basse résolution, mais qui vont perturber l’analyse à forte résolu-tion. Ces segmentations peuvent également servir d’images de probabilités a priori lors du calcul des cartes de probabilité d’appartenance aux classes. Si la confiance dans ces segmentations est importante, elles peuvent être directement utilisées lors de l’étape de fu-sion/décision. Les simplifications envisagées dans un premier temps sont la segmentation

des larges zones de fond et d’épithélium.

3.3.2.1 Segmentation du fond

Le fond des images est homogène et très contrasté par rapport au tissu. Il peut donc être segmenté par une analyse de l’histogramme. L’étude de l’histogramme des lames virtuelles montre que celui-ci est indépendant du niveau de résolution. La figure 3.11 pré-sente l’histogramme couleur d’une lame virtuelle ainsi que les histogrammes de la même image décimée plusieurs fois. La décimation est réalisée par extraction de la sous-bande d’approximation (HH) de la transformée en ondelettes de l’image réalisée avec une base de Daubechies 2. On constate que visuellement, les histogrammes sont semblables. Ceci est confirmé par la table 3.1. Celle-ci présente trois mesures classiquement utilisées pour évaluer la distance entre histogrammes : la distance euclidienne entre les segments, la distance de Dorlet [Neuilly, 1993] et la distance euclidienne appliquée à l’histogramme cumulé. Les distances sont normalisées par la taille de l’image. On peut également dis-cerner sur ces histogrammes trois modes correspondant au fond, aux tissus foncés (princi-palement l’épithélium et le stroma inflammatoire) et aux tissus clairs (princi(princi-palement les autres compartiments stromaux) (cf. figure 3.12).

TAB. 3.1 – Distances entre l’histogramme de l’image à pleine résolution et les histo-grammes de versions décimées de l’image Cyla06 (les histohisto-grammes sont normalisés par le nombre de pixels de l’image).

Décimations Distance Distance Euclidienne Distance de Dorlet

Distance Euclidienne sur l’histogramme cumulé 1 0.041588 0.043491 172.806532 2 0.038442 0.073931 173.047189 3 0.033143 0.135799 173.338166 4 0.023591 0.273637 173.741019 5 0.016625 0.603424 174.115402 6 0.015525 1.026974 174.229283 7 0.016298 1.231248 173.976674

Nous avons choisi de séparer le tissu et le fond à très basse résolution : l’image est décimée 6 fois (par une approche basée sur une transformée en ondelettes), et un pixel représente 32µm x 32µm. Il a été trouvé expérimentalement que cette résolution est un bon compromis entre le volume de données à analyser et la qualité de la segmentation produite.

La méthode utilisée est la suivante : nous allons considérer que l’histogramme est un mélange de trois gaussiennes (une pour le fond, une pour le tissu clair et une pour le tissu foncé) dont il faut estimer les paramètres µc, σc et Pc (moyenne, écart type et probabilité d’apparition pour chaque classe c). Une fois ces paramètres estimés, la vraisemblance pour

a)

b)

c)

d)

FIG. 3.11 – L’histogramme couleur de l’image Cyla06 à différentes résolutions : a) pleine résolution, b) décimée 1 fois, c) décimée 6 fois, d) décimée 7 fois.

FIG. 3.12 – Histogramme de la composante rouge de l’image Cyla06 décimée 6 fois.

chaque pixel i de valeur xi d’appartenir à l’une des gaussiennes est calculée. L’image est ensuite segmentée par maximum de vraisemblance (cf. figure 3.13) :

ˆ cM Li := arg max ci∈{1,...,Nc} " Pc 1 p2πσ2 c exp−(xi− µc) 22 c # . (3.1)

Les paramètres des gaussiennes sont estimés de la manière suivante : la moyenne et la valeur maximale des gaussiennes sont déterminées en recherchant les trois plus grands maxima locaux4 de l’histogramme5. En recherchant l’intervalle compris entre la valeur à mi-hauteur à gauche (xmiHg) et à droite (xmiHd) du pic (largeur à mi-hauteur), il est simple de calculer la valeur de l’écart type de chaque gaussienne :

σ = |xmiHg − xmiHd| 2p(2 ln 2) .

Cette segmentation par maximum de vraisemblance est appliquée sur la composante rouge dans la majorité des cas, puis sur la composante verte lorsque la première segmentation n’a pas été concluante (c’est-à-dire lorsque la surface de tissu détectée est inférieure à un seuil, fixé empiriquement à 10% de la surface de l’image).

Cette segmentation est suivie de quelques opérations de morphologie mathématique (éro-sion géodésique notamment) afin d’écarter les pixels isolés.

3.3.2.2 Segmentation de l’épithélium

La méthode de segmentation de l’épithélium que nous introduisons ici est inspirée des traitements à basse résolution décrits dans [Elie et al., 2003]. Développée initialement pour des images générées par un scanner photographique de 4000dpi, elle a été adaptée, au GRECAN, au traitement des lames virtuelles microscopiques de cancer de l’ovaire. La méthode est appliquée sur une image décimée 3 fois (par une approche basée sur une transformée en ondelettes). Un pixel représente alors 4µm x 4µm.

4Pour limiter l’influence d’un artefact dont la présence pourrait modifier l’histogramme, celui-ci est préalablement filtré.

5Dans les cas où le mode du tissu clair ou le mode du tissu foncé est inexistant, la méthode doit être adaptée avec pour hypothèse de base un mélange de deux gaussiennes.

Composante couleur (rouge ou verte) de l’image

Calcul et filtrage de l’histogramme

Recherche des 3 plus grands maxima locaux correspondant au fond et aux zones claires et foncées du tissu

Pour chaque mode, calcul des paramètres (µ, σ, P ) de la gaussienne l’approximant

Pour chaque pixel de l’image, calcul de la vraisemblance d’appartenir à

l’une des gaussiennes

Segmentation par maximum de vraisemblance

Image de fond segmentée

L’épithélium est séparé des zones de stroma par un seuillage adaptatif6des zones foncées, recherché entre les bornes 0 et 50% de la distribution des valeurs de gris, à l’intérieur des zones de tissu (préalablement détectées), sur la composante rouge de l’image, après application d’un filtrage moyenneur et d’une augmentation de contraste des zones foncées.