• Aucun résultat trouvé

Analyse conjugée de la forme et des relations spatiales

La méthode d’aide au diagnostic pour images histologiques ici présentée vise à analyser la texture, la forme et l’organisation spatiale des types de tissus, ou populations de cellules, et des objets biologiques à l’intérieur de chaque catégorie de tissu. L’analyse de la texture est utilisée afin de détecter la présence de tissu cancéreux dans l’image alors que la description finale se fonde essentiellement sur les formes et les relations spatiales. La figure 5.1

illustre le principe de fonctionnement de cette méthode afin de décrire un specimen représenté par un ensemble d’images histologiques.

5.3.1

Analyse de la texture pour la détection de tissu

cancéreux

Cette analyse cherche à décrire les différentes populations de cellules, une première étape est donc de détecter si ces différentes populations sont présentes dans l’image. Puisque ce chapitre traite de l’évaluation de la sévérité des cancers, les différentes populations font généralement références aux tissus sains et cancéreux. Cependant, toutes les images histologiques ne présentent pas de cellules cancéreuses, la suite de la méthode se doit donc de prendre en compte une information supplémentaire concernant la présence de tissu malade. Détecter la présence de tissu affecté par le cancer revient donc à établir un diagnostic par ordinateur de l’image. De ce fait, la méthode d’aide au diagnostic par l’analyse de texture présentée dans le chapitre 3 offre donc une solution satisfaisante pour fournir cette information sémantique.

5.3.2

Analyse des relations spatiales et des formes

Les relations spatiales et les formes sont mesurées par la méthode des FHD, présentée en détails dans le chapitre 4. Toutes les FHD mesurées dans cette partie analysent 180 directions avec la force constance ∀r ∈ R+, ϕ0(r) = 1. Ainsi les FHD ne prennent pas en compte l’information de distance mais peuvent décrire des objets se superposant et assurent l’homogénéité entre les description de formes et de relations spatiales. Afin de réduire l’information contenue dans les FHD en conservant le plus de pertinence possible, la signature fondée sur les séries de Fourier est utilisée, garantissant ainsi une représentation invariante en rotation.

Figure 5.1 – Schéma illustrant le principe de la méthode d’analyse pro- posée. Un ensemble d’images décrivant un unique objet est décrit par les mesures de formes et d’organisation spatiale à la fois des différents types de tissus présents dans chaque image et des différents types d’objets biolo- giques présents dans chaque type de tissu. Un algorithme de sac de mots permet d’agglomérer et de synthétiser les descriptions issues des différentes

5.3.3

Définition des fenêtres d’observation pour l’ana-

lyse des objets biologiques

L’objectif ici est d’avoir une mesure locale de l’organisation spatiale et de la forme des objets biologiques à l’intérieur d’une population de cellules qui soit la plus pertinente possible sans être influencée par la forme globale de la région. Pour cela, une fenêtre d’observation circulaire est définie pour chaque type de tissu ; la forme de disque est choisie afin que les mesures de forces ne soit pas influencée par la direction considérée. Des FHD sont ensuite mesurées sur chacune de ces fenêtres, offrant ainsi une description à priori la moins biaisée possible de l’organisation spatiale à l’intérieur d’une population.

Les fenêtres d’observation doivent toutes avoir la même taille et sont définies de sorte à contenir suffisamment de tissu correspondant à la ré- gion ciblée. Pour cela, l’ensemble de composantes 8-connexes de la strate correspondante est estimée. Le groupe de composantes connexes le plus représentatif est sélectionné selon trois critères imbriqués :

1. le rayon équivalent doit être supérieur à celui de la fenêtre d’obser- vation,

2. le groupe doit avoir plus grande solidité possible, qui est ici définie comme le rapport entre sa surface et celle de son eveloppe convexe, et

3. la plus grande surface possible.

Dans le cas où aucun ensemble de composantes connexes ne correspond à ces critères, celui avec la plus grande surface est conservé. La fenêtre d’observation circulaire est finalement définie centrée sur le barycentre du groupe de composantes connexes retenu dans l’image originale.

Une autre solution consiste à mesurer la transformée de distance sur le masque correspondant à la région et à placer le centre de la fenêtre d’ob- servation sur son maximum. Cette méthode a l’avantage d’assurer que la fenêtre est centrée sur du tissu appartenant à la région considérée. Les deux approches donnent des positions différentes et sont brièvement comparées dans la section 5.4. Afin d’éviter que les fenêtres débordent sur l’extérieur de l’image, une zone tampon est définie dont la largeur est égale au rayon de la fenêtre.

5.3.4

Décomposition des régions et des objets

biologiques

Les strates nécessaires aux calculs des FHD peuvent être obtenues par les méthodes présentées dans la partie5.2.1. Les images histologiques étant bruitées, la sensibilité des FHD impose donc de réduire le bruit avant de les décrire. Dans le cas de la séparation des régions, le débruitage dépend de la méthode de décomposition utilisée. Pour la séparation des objets bio- logiques, les méthodes rapides telles que la déconvolution des couleurs sont conseillées afin de ne pas alourdir les calculs. Puisque que les strates doivent être binaires et que la déconvolution donne un résultat bruité, les images de chaque marqueur sont seuillées par la méthode d’Otsu, qui permet de maximiser la variance, avec trois classes. L’une d’entre elles correspond aux objets ciblés dans l’image, la seconde correspond au bruit et aux zones où les marqueurs sont mal définis et enfin la dernière correspond au reste de l’image. Si les objets non marqués sont recherchés, ils sont finalement définis par les pixels qui n’ont pas été attribués à un type d’objet.

5.3.5

Regroupement des informations et classification

Le grade recherché est celui du specimen et non des images indivi- duelles. Afin d’estimer l’état du cancer affectant un specimen, il convient de regrouper les descriptions issues des images qui le caractérisent. Pour cela, un modèle de sac de mots, adapté pour les images et la vidéo parSivic

et Zisserman[2003], est mis en œuvre avec une stratégie de coding-pooling.

Cette méthode impose la définition d’un dictionnaire visuel composé de descripteurs prototypes, nommés mots visuels. Ici, un descripteur corres- pond à la description complète mesurée sur une unique image, donc à la concaténation de plusieurs FHD. Un specimen est alors décrit en compta- bilisant les occurences de chaque mot visuel parmi ses images. Le diction- naire visuel est construit en appliquant un algorithme de K-means sur des données d’apprentissage afin de regrouper les descripteurs.

La stratégie de coding-pooling consiste à diviser le processus en deux étapes. Chaque descripteur est tout d’abord associé au mot visuel le plus proche du dictionnaire. Une signature binaire est alors obtenue où un 1 cor- respond à l’index du mot visuel le plus similaire. La seconde étape consiste à regrouper toutes les signatures en une unique description en les sommant. Le spécimen est finalement décrit par un vecteur contenant les occurences de chaque mot visuel du dictionnaire parmi les images le caractérisant. Cette stratégie est plus complexe à mettre en œuvre que le sac de mots classique mais permet de conserver une signature de faible dimension. La

classification finale est réalisée en appliquant un classifieur naïf bayesien sur les vecteurs issus du sac de mots avec coding-pooling.

Cette méthode de regroupement permet de cumuler efficacement les informations issues des différentes images décrivant un specimen et d’as- socier chaque descripteur au prototype le plus proche maximisant ainsi la variance entre les descriptions. Cela permet également de réduire drasti- quement la dimension des signatures passant de la taille de plusieurs FHD concaténées au nombre de mots présents dans le dictionnaire.