• Aucun résultat trouvé

Système d'aide à la décision médicale

3. Les systèmes d’aide au diagnostic/ détection

3.2. Composition d’un système d’aide au diagnostic (CADx)

3.2.3. Extraction des caractéristiques

3.2.3.2. Les caractéristiques de texture

La texture est une notion très générale difficile à décrire en mots. La texture concerne principalement une structure spécifique, spatialement répétitive, de surfaces formées en répétant un élément particulier ou plusieurs éléments dans différentes positions spatiales relatives. John R. Smith définit la texture comme étant des motifs visuels ayant des propriétés d'homogénéité [Smith 1996]. Les caractéristiques de texture sont également une autre expression des caractéristiques visuelles qui est pratique dans le traitement d'image médicale, et qui sont largement appliquées durant la conception des systèmes CADx [Moon 2011 ; Liu 2013 ; Sundararaj 2014].

De nombreuses méthodes ont été proposées pour décrire la caractéristique de texture. Nous présentons ci-dessous une brève étude de quelques techniques existantes sur l’extraction des caractéristiques de texture appliquées à l’analyse des images médicales.

3.2.3.1.1 La matrice de co-occurrence à niveau de gris

L’une des méthodes les plus utilisées pour décrire la caractéristique de texture est la matrice de co-occurrence à niveau de gris (Gray Level Cooccurrence Matrix (GLCM)). Introduite par [Haralick 1973], la matrice de cooccurrence permet de déterminer la fréquence d’apparition des paires de valeurs de pixels situés à une certaine distance dans l’image. Cette méthode considère la relation entre deux pixels voisins, le premier pixel est connu comme une référence et le second est connu comme un pixel voisin.

La matrice de co-occurrence à niveau de gris consiste à calculer la probabilité pd,θ(i,j) qui représente le nombre de fois où un pixel de niveau de gris i apparaît à une distance relative (d) d’un pixel de niveau de gris j et selon l'orientation de la direction (θ). Généralement, d=1 et θ= 0°, 45°, 90°, 135° donnent les meilleurs résultats [Zhang 2001 ; Sharma 2001].

4 3 2

0 X 1

6 7 8

Figure 1.7. Les quatre pixels les plus proches du pixel X selon les 4 directions. Haralick [Haralick 1973] a proposé d’extraire treize caractéristiques de texture à partir de GLCM pour une image. Ces caractéristiques sont les suivantes :

- Energie : ce paramètre permet de mesurer l’uniformité de la texture. Il atteint de fortes valeurs lorsque les pixels sont similaires en d’autres termes, lorsque la distribution des niveaux de gris est constante ou de forme périodique.

𝑃1 = ∑ ∑ (𝑝(𝑖, 𝑗))2 𝑁𝑔−1 𝑗=0 𝑁𝑔−1 𝑖=0 (1.1)

- Le contraste : Le contraste est une mesure de l'intensité ou des variations du niveau de gris entre le pixel de référence et son voisin. Dans la perception visuelle du monde réel, le contraste est déterminé par la différence de couleur et de luminosité de l'objet et d'autres objets dans le même champ de vision.

𝑃2 = ∑ ∑ ((𝑖, 𝑗)2× 𝑝(𝑖, 𝑗)) 𝑁𝑔−1 𝑗=0 𝑁𝑔−1 𝑖=0 (1.2)

- L’entropie : Ce paramètre mesure le désordre dans l’image. Contrairement à l’énergie, l’entropie atteint de fortes valeurs lorsque la texture est complètement aléatoire (sans structure apparente). Elle est fortement corrélée (par l’inverse) à l’énergie.

𝑃3 = − ∑ ∑ (log(𝑝(𝑖, 𝑗)) × 𝑝(𝑖, 𝑗)) 𝑁𝑔−1 𝑗=0 𝑁𝑔−1 𝑖=0 (1.3)

- La variance : La variance mesure l’hétérogénéité de la texture. Elle augmente lorsque les niveaux de gris diffèrent de leur moyenne. La variance est indépendante du contraste.

θ =0° θ =45° θ =90°

𝑃4 = ∑ ∑ ((𝑖 − 𝜇)2× 𝑝(𝑖, 𝑗)) 𝑁𝑔−1 𝑗=0 𝑁𝑔−1 𝑖=0 (1.4)

- La corrélation : La fonction de corrélation montre la dépendance linéaire des valeurs de niveau de gris dans la matrice de cooccurrence.

𝑃5 = ∑ ∑ 𝑝(𝑖, 𝑗)(𝑖 − 𝜇)(𝑗 − 𝜇) 𝜎 𝑁𝑔−1 𝑗=0 𝑁𝑔−1 𝑖=0 (1.5)

- Le moment inverse : (Inverse Difference Moment (IDM)) mesure l’homogénéité de l’image. Ce paramètre est corrélé à une combinaison linéaire des variables d’énergie et de contraste. 𝑃6 = ∑ ∑ 1 1 + (𝑖 − 𝑗)2𝑝(𝑖, 𝑗) 𝑁𝑔−1 𝑗=0 𝑁𝑔−1 𝑖=0 (1.6)

- Moyenne des sommes :

𝑃7 = ∑ 𝑖. 𝑝𝑥+𝑦(𝑖) 2(𝑁𝑔−1)

𝑖=0

(1.7)

Avec 𝑝𝑥+𝑦(𝑘) = ∑𝑖=0𝑁𝑔−1∑𝑁𝑗=0𝑔−1𝑝(𝑖, 𝑗) , 𝑘 = 𝑖 + 𝑗 = 0,1,2, … ,2(𝑁𝑔− 1)

- Variance des sommes :

𝑃8 = ∑ (𝑖 − 𝑃7)2𝑝 𝑥+𝑦(𝑖) 2(𝑁𝑔−1)

𝑖=0

(1.8)

- Entropie des sommes :

𝑃9= − ∑ 𝑝𝑥+𝑦(𝑖)log (𝑝𝑥+𝑦(𝑖)) 2(𝑁𝑔−1)

𝑖=0

- Variance de différence : 𝑃10 = ∑ (𝑖 − 𝑃10′ )2𝑝𝑥−𝑦(𝑖) 2(𝑁𝑔−1) 𝑖=0 (1.10) Où 𝑝𝑥−𝑦(𝑘) = ∑𝑁𝑖=0𝑔−1∑𝑁𝑗=0𝑔−1𝑝(𝑖, 𝑗) , 𝑘 = |𝑖 − 𝑗| = 0,1,2, … ,2(𝑁𝑔− 1) 𝑃10= ∑ 𝑖. 𝑝 𝑥−𝑦(𝑖) 𝑁𝑔−1 𝑖=0 (1.11) - Entropie de différence : 𝑃11 = − ∑ 𝑝𝑥−𝑦(𝑖)log (𝑝𝑥−𝑦(𝑖)) 𝑁𝑔−1 𝑖=0 (1.12)

- Informations sur la Mesure de Corrélation : 𝑃12 = 𝑃9− 𝐻𝑋𝑌1 max (𝐻𝑋, 𝐻𝑌) (1.13) 𝑃13= [1 − exp (−2(𝐻𝑋𝑌2 − 𝑃9))]1/2 (1.14) Avec : 𝐻𝑋𝑌1 = − ∑ ∑ 𝑝(𝑖, 𝑗) log{𝑝𝑥(𝑖)𝑝𝑦(𝑗)} 𝑗 𝑖 (1.15) 𝐻𝑋𝑌2 = − ∑ ∑ 𝑝𝑥(𝑖)𝑝𝑦(𝑗) log{𝑝𝑥(𝑖)𝑝𝑦(𝑗)} 𝑗 𝑖 (1.16)

La GLCM a contribué dans l’étude et le diagnostic de plusieurs maladies dangereuses [Radhakrishnan 2012 ; Goel 2015 ; Khomkham 2017]. A titre d’exemple, dans le diagnostic du cancer du sein, la majorité, pour ne pas dire la totalité des contributions utilisent la GLCM pour extraire les caractéristiques de texture du tissu mammaire [Djaleel 2014 ; Gaike 2015]. Dans un travail de [Biswas 2016], la GLCM a été utilisée pour extraire les caractéristiques de texture de la région d’intérêt. Avec une précision égale à 95%, les auteurs ont montré que GLCM décrit efficacement les caractéristiques pertinentes et nécessaires de la région d’intérêt. Une combinaison de la matrice de cooccurrence au niveau de gris et du modèle de Réseau de

Neurones Artificiel (RNA) a été réalisée par Man To Wong et al. [Wong 2012]. La GLCM est utilisée pour produire douze caractéristiques de l’image mammaire. Les résultats significatifs de la GLCM ont été utilisés comme données d'entrée pour le modèle RNA afin de classer la région en bénigne ou maligne. Le taux de précision de cette recherche est d'environ 86%.

Nous trouvons aussi que la GLCM a été appliquée avec succès dans le diagnostic d’autres maladies. Par exemple, pour le diagnostic des anomalies pulmonaires, les auteurs [Pham 2017] ont utilisé les caractéristiques de Haralick pour détecter le type de l'anomalie dans les poumons. Malgré la présence de faible contraste et de bruit élevé dans les images, cette méthode présente des résultats prometteurs dans la détection de l'anomalie des poumons chez la plupart des patients et suggère que certaines des caractéristiques sont significativement recommandées. Cependant, pour la maladie du glaucome, un système CADx utilisant les caractéristiques de Haralick a été proposé dans [Simonthomas 2014]. Le GLCM des images du fond d’œil sont calculées pour les quatre directions (0 °, 45 °, 90 ° et 135 °) et combiné en additionnant et en faisant la moyenne pour obtenir une matrice unique composée à partir des matrices à quatre directions. Un classifieur KPPV (K plus proche voisin) a été utilisé pour classer les images comme étant normales ou glaucomes. La précision d'une base de données locales comprenant 60 images rétiniennes s'est avérée être de 98%.

3.2.3.1.2 Matrice de longueurs de plages à niveau de gris

La matrice de longueur de plages à niveaux de gris (Gray Level Run Length Matrix (GLRLM)), a été proposée par Galloway en 1975 [Galloway 1975]. Le terme plage signifie un ensemble linéaire consécutif de pixels ayant le même niveau de gris. La GLRLM est utilisée pour décrire la fréquence d'apparition d'un ensemble de pixels consécutifs, sur une direction imposée, ayant la même valeur de gris. D’habitude, quatre directions sont considérées (verticales, horizontale et les deux diagonales principales), pour des raisons de simplicité d’implémentation.

Cette méthode consiste donc, en premier lieu à déterminer l’ensemble des plages présentes dans l’image et en second lieu, d'extraire des statistiques sur leur longueur. Pour l’extraction de caractéristiques de texture, plusieurs attributs statistiques peuvent être tirés de cette matrice telles que : la proportion des petites plages, la proportion des longues plages, l'hétérogénéité de couleurs, l'hétérogénéité des plages et la proportion des plages [Cocquerez 1995].

La GLRLM a été appliquée avec succès dans le diagnostic médical. [Filipczuk 2012] ont utilisé la matrice de cooccurrence de niveau de gris et la matrice de longueur de plage à niveau

de gris pour développer un système de diagnostic automatique du cancer du sein sur des images cytologiques de biopsie à l'aiguille fine. Les résultats de la classification montrent 90% d'efficacité pour détecter la malignité dans l'image mammaire. Les auteurs dans [Park 2016] ont réalisé une analyse des caractéristiques de texture dans la conception des systèmes d’aide au diagnostic en utilisant la GLRLM et GLCM et des statistiques de premier ordre. Ils ont montré que les combinaisons qui incluent les caractéristiques GLRLM ont une grande précision.

3.2.3.1.3 Les motifs binaires locaux

Les descripteurs de texture basés sur les motifs binaires locaux (Local Binary Pattern (LBP)) ont initialement été proposés par Ojala en 1996 [Ojala 1996]. Ces descripteurs ont le pouvoir de bien caractériser les textures présentes dans des images en niveaux de gris. Ils consistent à attribuer à chaque pixel P d’une image 𝑀(𝑖, 𝑗) à analyser, une valeur caractérisant le motif local autour de ce pixel. Ces valeurs sont calculées en comparant le niveau de gris du pixel central P aux valeurs des niveaux de gris des pixels voisins.

Les caractéristiques issues de la méthode LBP ont été utilisés dans diverses applications pour la classification des textures. Ils sont largement considérés comme des descripteurs de texture de référence en raison de leur faible complexité de calcul et de leur invariance par rapport aux changements de résolution.

En imagerie médicale, les LBPs ont été utilisés pour identifier des cellules mammaires malignes [Ponraj 2017], pour trouver des lésions cérébrales mises en évidence par l'imagerie par résonance magnétique [Unay 2008], pour le diagnostic de la maladie du glaucome [Mohamed 2015], dans le diagnostic du cancer du poumon [Soltaninejad 2014]. Des travaux récents ont également étudié les LBP dans la classification automatisée des images de phénotypes cellulaires [Nanni 2008].