• Aucun résultat trouvé

CHAPITRE 2 REVUE DE LITTÉRATURE

2.2 Méthodes de recalage d’images médicales

2.2.1 Extraction de primitives correspondantes

Comme mentionné dans la section précédente, le recalage peut s’effectuer en utilisant des pri- mitives correspondantes dans les deux images ainsi servant de points de repère. Ces primitives sont des éléments, qui peuvent être des pixels ou bien des entités plus complexes (par exemple une forme géométrique), et qui peuvent être repérés dans toutes les images à impliquer dans le recalage. La correspondance entre les primitives des deux images à recaler sera utilisée pour calculer la trans- formation qui amènera la première image dans l’espace de la deuxième. Idéalement, les primitives correspondantes doivent être locales, invariantes aux transformations qui existent entre les images à recaler, distinctes, suffisantes pour pouvoir calculer la transformation, et précises afin d’obtenir une transformation précise. Dans ce document, les primitives correspondantes seront aussi appelées des points de repère, des points de correspondance ou des repères anatomiques, même si un point occupe plus d’un pixel.

La méthode la plus facile qui nous permet d’obtenir des primitives consiste à les extraire ma- nuellement à partir des images. Par exemple, sur des images de visages humains, le centre des pupilles des yeux peut être repéré manuellement. Par contre, cette méthode d’extraction peut en- traîner des inexactitudes dans la localisation des points et donc amènera à un recalage moins précis. Les contours d’objets sont utilisés comme repères entre des images. Il s’agit d’appliquer des al- gorithmes de détection de contours aux images à recaler, et ensuite de faire une correspondance entre les contours des images afin de calculer la transformation. Par exemple, Pop et al. [22] montrent un exemple de recalage entre des images RX d’un fémur acquises durant une opération et un modèle tridimensionnel préopératoire du fémur. Ce recalage permet d’utiliser les données per- opératoires afin de mettre à jour le modèle tridimensionnel préopératoire. À ces fins, la silhouette du fémur dans l’image RX et l’image du modèle est détectée. Cette silhouette sert de correspondance entre les deux images. Le squelette des objets peut aussi être utilisé comme repère entre les images [23]. Le squelette d’un objet est un regroupement de lignes médianes au centre de l’objet, et est une signature unique à l’objet. Le calcul des squelettes est par contre sensible au bruit et est encore un sujet de recherche ouvert. Les repères invariants sont très populaires, à cause de leur habilité d’être extraits à partir des images suite à l’application de transformations. Par exemple, il existe des re- pères qui sont invariants à la rotation et à la translation. Ces repères peuvent être distingués dans les images même si une combinaison de translations et de rotations a été effectuée sur une des images. Des exemples de ces types de repères sont la courbure d’objets, où la valeur absolue de la courbure principale peut être utilisée, ou bien les coins. Les détecteurs de coins sont très populaires et aussi invariants à la rotation. Deux détecteurs de coins sont couramment utilisés. Le détecteur Hessien par exemple obtient les repères en calculant le déterminant du Hessien [24]. Le détecteur de coins Harris [25], qui calcule les repères en calculant le carré des dérivés des images, en appliquant un filtre gaussien, et en calculant le déterminant et la trace.

Des extensions des méthodes de Haris et Hessian sont les Harris Laplace (des coins Haris à plusieurs échelles), Harris Affine (initialisation avec Harris Laplace et la forme est estimée en utilisant la matrice de moments du deuxième ordre). Ces méthodes détectent des régions ainsi que des coins. Ces méthodes sont moins précises que celles mentionnées ci-haut, donc sont moins pratiques pour le recalage.

Des repères qui sont invariants à la rotation et à la mise en échelle ont été introduits par Lowe [26]. Ceux-ci sont obtenus par un flou gaussien progressif. Des images à plusieurs échelles sont construites, où chaque image L(x, y, kσ) est obtenue à partir d’un flou gaussien de l’image I(x, y) de l’échelle précédente. Ensuite, chaque image à une échelle précise i est soustraite de l’image de l’échelle inférieure j ce qui produit une image de différences de gaussiennes D(x, y,σ) calculée de la façon suivante :

D(x, y,σ) = L(x, y, kiσ)− L(x,y,kjσ). (2.2)

Cette image de différence agit comme un filtre bande passante qui maintient un intervalle spéci- fique de fréquences de l’image originale, dépendamment de l’échelle. Ensuite, les points extrêmes sont calculés à travers l’espace des différentes échelles en comparant chaque pixel à ses voisins.Ces points ont un bon contraste comparativement aux voisins. Des points clés sont choisis à partir de ces extrêmes, et les points qui ont un faible contraste sont éliminés. Un histogramme de gradients de directions est ensuite calculé à partir des valeurs d’intensité des points clés, et les points clés sont représentés par un vecteur de 128 éléments. L’avantage de la méthode de Lowe est qu’elle est simple et rapide et est plus efficace dans la détection des blobs (un blob est une région de l’image dont les pixels ont une cohérence).

Suite à l’extraction des points de repère à partir des différentes images à recaler, une mise en correspondance entre les points des différentes images doit être effectuée. Par exemple, s’il s’agit d’un recalage entre des images RM et RX, il s’agit de correspondre les points extraits à partir des images RM à ceux extraits à partir des images RX. Plusieurs méthodes existent à ces fins, dont une est la méthode "iterative closest point" (ICP) [27]. Cette méthode cherche à minimiser la distance entre deux nuages de points. La première étape qui consiste à trouver une correspondance initiale entre les points se fait en trouvant le voisin le plus proche de ce point. Ensuite, la moyenne carrée de la distance entre les points correspondants est calculée, et cette moyenne est utilisée pour approximer les paramètres de la transformation entre les deux nuages de points. La transformation est ensuite appliquée aux points. Les étapes sont répétées jusqu’à ce que les correspondances ne varient plus.

Dans le cas des images que nous désirons recaler (RM, RX, TP), il y a un manque de repères cor- respondants : les images TP ne représentent que la surface externe du tronc, et donc ne contiennent aucune information sur la colonne vertébrale ni sur les tissus mous. Par contre, les reconstructions

obtenues à partir des images RX ne représentent que la colonne vertébrale, et ne contiennent au- cune information sur la surface du tronc. Donc, il y a aucune correspondance entre les images TP et RX. Finalement, les vertèbres sont visibles à partir des images RM. Par contre, ces images ont une résolution plus basse que les images RX, et ont particulièrement un grand espacement entre les tranches axiales consécutives. Par conséquent, ces images ont une moins bonne représentation de la colonne vertébrale. Les images RM sagittales offrent une meilleure représentation de la colonne vertébrale comparativement aux images axiales, et permettent de distinguer les corps vertébraux. Une correspondance par valeurs d’intensité ne peut se faire présentement entre les images RM et RX, puisque aucune fonction n’existe à présent qui relie les valeurs d’intensités de ces deux mo- dalités d’images. Pour ce qui est de correspondance entre les images TP et RM, les contours du tronc sont visibles à partir des images RM, mais la grande distance entre les tranches consécutives fait en sorte qu’une représentation lisse de la surface du tronc à partir des tranches RM ne peut être obtenue. Ce manque de correspondances rend le processus de recalage plus difficile.

Pour trouver la transformation entre les images, nous avons besoin de spécifier la fonction qui sert à approximer la transformation, la mesure de similarité utilisée entre les images, et la méthode d’optimisation. Toutes ces composantes seront décrites ci-dessous.