• Aucun résultat trouvé

Les résultats de nos questionnaires montrent des grandes différences entre les observateurs pour le choix de la meilleure image par série, ainsi que pour l’évaluation de chacun des trois critères. De plus les observateurs n’évaluent pas la même manière des images tout à fait identiques que nous avons insérées dans une série et celles qui se retrouvent dans les autres séries. A tout cela s’ajoute le fait que, finalement, nos données objectives et subjectives ne se rejoignent pas. Globalement, à paramètres constants, les hautes tensions sont préférées par nos observateurs, alors que selon la théorie la tension basse permet une meilleure visualisation, car il y a un meilleur CNR. Pour mieux comprendre ces différences, nous avons choisi d’analyser les influences et biais à l’origine de nos résultats.

4.1 Différences inter- et intra-observateurs

La qualité de l’image est définie par la résolution, le contraste et le bruit, que nous pouvons quantifier de manière objective. L’évaluation de la qualité par des observateurs est soumise à différents facteurs, tels que le type, l’expérience et, la profession de l’observateur. L’évaluation est ici subjective. Pour notre recherche, comme nous n’avons eu que six observateurs (3 légistes, 2 radiologues et 1 TRM) et avec des proportions différentes du point de vue de l’expérience et de la profession. Il était difficile de dégager de manière significative les préférences d’images par profession, comme dans l’article de Ween, Kristoffersen, Hamilton & Olsen (2005), qui met en évidence des différences pour l’évaluation de la qualité d’image entre les TRM (techniciens en radiologie médicale) et les radiologues, grâce à un échantillon de population plus grand (19 TRM et 18 radiologues). Malgré tout pour notre travail, il est possible de dégager une tendance de ce groupe d’observateurs en particulier, à savoir, une préférence pour la tension de 120 kV, ainsi que pour les reconstructions ASIR 0 et ASIR 50.

Les résultats montrent aussi des différences intra-observateurs, c’est-à-dire que pour une série donnée contenant deux images identiques l’observateur ne va pas les évaluer de la même manière malgré la présence de deux images parfaitement identiques. Cela a été constaté pour la plupart des observateurs, sauf pour deux observatrices, médecins légistes, qui étaient plus constantes dans leur évaluation des images similaires. Nous avons émis l’hypothèse que ces deux observatrices avaient plus d’expérience avec la visualisation d’images d’angio-CT. Par contre, nous avons été surprises que les radiologues n’aient pas identifié et évalué avec des notes proches une seule fois des images identiques. Nous avons supposé que cela était dû au fait que ces radiologues n’étaient pas habitués aux images post mortem. Le TRM, quant à lui, a noté de manière semblable les images identiques dans deux séries sur les six présentes dans le questionnaire. Pour les autres séries les images identiques avaient des notes qui n’étaient pas totalement éloignées. Nous supposons ici que l’évaluation faite par le TRM est influencée par ces années d’expériences au sein du CURML.

33 | P a g e

Comme nous comparons différents types de reconstructions et de tensions, chaque image se retrouve inévitablement dans plusieurs séries (tableau 6). Nous avons constaté qu’une même image selon la série dans laquelle elle se trouve n’est pas évaluée de la même manière, car l’évaluation est faite par série en fonction de l’ensemble des images d’une série. De ce fait, l’observateur est influencé par la série à laquelle il est confronté. Donc nous constatons que la manière dont nous disposons nos images influence aussi l’évaluation de celles-ci.

Nous nous sommes aussi interrogées quant aux possibles influences exercées par le questionnaire que nous avons soumis aux observateurs. Les différents critères étaient-ils compris de la même manière ? Pour certains, le bruit sera bien, tandis que pour d’autre non ? L’évaluation avec l’échelle était elle aussi sujette à différentes interprétations : certains observateurs sont plus sévères, d’autres plus modérés dans l’évaluation des images, comme par exemple le TRM qui n’attribue que rarement les notes extrêmes de -2 et +2. L’échelle était donc très subjective. Selon une étude d’Oca Pernas et al. (2014), qui porte sur la comparaison de la qualité d’image en clinique avec également un faible échantillon d’observateurs, il n’a pas été possible de tirer des conclusions significatives quant aux critères de subjectivité de la qualité d’image.

4.2 Comparaison des tensions

Les résultats des professionnels pour les premières séries (1-2-3) ne concordent pas avec notre calcul de CNR. Les professionnels ont tendance à préférer les images avec une tension de 120 kV, qui selon les scores donne une meilleure visualisation des contours de la plaque, alors que selon notre calcul, le CNR est meilleur pour la tension de 80 kV. Et devrait donc mettre en évidence la plaque pour cette basse tension. En observant nos images, nous pouvons constater qu’effectivement les images avec une tension de 120 kV montrent bien notre plaque. Alors que pour les autres tensions, il semblerait que nous ne soyons pas au même niveau de coupe. (Figure 13). Nous avons donc cherché ce qui aurait pu causer cette erreur de niveau de coupe. Nous nous sommes aperçues que le niveau de coupe était correct. Et que le véritable problème était dû au remplissage des vaisseaux.

Lors de l’acquisition aux différentes tensions, il y a eu un mouvement du produit de contraste entre l’acquisition des 120kV et celles des autres tensions. Il y a probablement eu des fluctuations du produit, dû aux pressions (force de gravité et pression d’injection) durant le laps de temps séparant l’injection et la deuxième acquisition, influençant le remplissage des vaisseaux. La plaque n’apparaît donc malheureusement pas de la même façon sur les images de 80-100kV et celle de 120 kV.

34 | P a g e

Figure 13 : Niveaux de coupe équivalents montrant comment apparaît la plaque pour les différentes tensions

a) Image à 120 kV b) Image à 80 kV et 100 kV

Ainsi nous supposons que cela a biaisé nos résultats, car la plaque est mieux visible seulement sur les images de l’acquisition à 120 kV. Les professionnels ont peut-être préféré l’image de 120 kV, contrairement aux autres, sur lesquels nous ne voyons que la paroi du vaisseau de l’artère coronaire. Nous le constatons aves les résultats : pour chaque série une seule image correspondait à la tension 120 kV avec la plaque bien visible, les trois autres étaient de tensions 80 kV, 100 kV et 100 kV avec une plaque moins visible à cause de cette fluctuation du produit de contraste entre les acquisitions. Et ainsi pour chacune de ces trois séries, l’image de 120 kV était préférée de manière presque unanime.

Donc pour cette partie, nous supposons fortement que ces résultats ont été influencés par ce biais que nous n’avons pu éviter, et que nous n’avions pas constaté lors de l’étude pilote.

De plus, selon Saba, Argiolas & Piga (2013), en clinique, il a été démontré significativement, au moyen de tests statistiques, qu’en augmentant la tension le rehaussement au sein de la plaque diminue.

4.3 Comparaison des reconstructions

Pour les séries 4, 5 et 6, qui étaient comparées par tensions avec les différents ASIR, nous n’assistons pas au même problème rencontré que pour les premières séries. Ici chaque série a des images qui correspondent au même aspect de la plaque. Les constations qui en résultent ne sont que peu biaisés par la variation du niveau de coupe lié aux fluctuations du produit injecté.

Ainsi pour les tensions de 80 kV et 100 kV, ASIR 0 (la reconstruction FBP exclusive) est préféré par la moitié des observateurs. Pour la tension de 120 kV ASIR 50 est préféré par 4 observateurs sur 6. Nous avons supposé, que, comme jusqu’il y a peu de temps les professionnels travaillaient avec l’ancien CT qui ne possédait que la reconstruction FBP, ils étaient habitués à ces images-là. Nous le remarquons surtout avec les médecins légistes qui ont tendance à préférer la reconstruction ASIR 0 et quelques fois

35 | P a g e

ASIR 50, mais jamais la reconstruction ASIR 100. Les radiologues, eux n’ont eu que peu d’expérience avec l’ancien CT, mais leurs préférences oscillent entre ASIR 0 et ASIR 50. De plus, un des radiologues nous a confié avant le questionnaire ne pas du tout aimer la reconstruction ASIR 100, à cause de son aspect « plastique », mais l’a tout de même choisi comme meilleure image pour la série 4.

Le TRM par contre a plus tendance à préférer ASIR 100, ce que nous expliquons par le fait que l’image apparaît lisse et très peu bruitée, conférant à l’image une impression de signal suffisamment bonne.

Voici un autre point que nous avons constaté : pour les deux premières séries de tensions (80 kV et 100 kV) la plaque est peu visible (dû à la fluctuation du produit) et les résultats des préférences sont presque les mêmes (préférences de ASIR 0 pour la moitié des observateurs). Par contre, pour la dernière série avec la tension de 120 kV, la plaque est bien visible, et là les résultats montrent une préférence majoritaire et plus marquée pour ASIR 50. Etant donné que la plaque est visualisable et non influencée par la fluctuation du produit dans cette série, nous supposons que les observateurs ont pu comparer de manière adéquate les différents ASIR et l’impact de la modification de la reconstruction sur les critères de visibilité de la plaque que nous avons établis dans le questionnaire. Alors que pour les premières séries, la plaque n’étant pas tout à fait visualisable, il était difficile pour nos observateurs d’apprécier l’impact de la modification sur la plaque même et non sur l’ensemble de l’image.

Nous avons aussi constaté lors du calcul du CNR, que celui-ci est meilleur avec les reconstructions ASIR. Cela est également rapporté dans l’article de Deak, et al (2013) : le niveau de bruit est significativement différent entre les reconstructions : le niveau de bruit pour la reconstruction FBP est 14-68% plus élevé que pour ASIR. Par contre, bien qu’il y ait moins de bruit pour la reconstruction avec ASIR 100, nos observateurs ont tendance à la rejeter : les images avec ASIR 100 étaient les moins appréciées. Nous pouvons ainsi dire par cette constatation que nous retrouvons également en post mortem une gêne à l’interprétation des images reconstruites à ce degré d’ASIR. Ce type de reconstruction d’image donne un aspect lissé des voxel. Par ailleurs, en clinique nous constatons que la reconstruction ASIR 40-60 % permet un compromis entre une qualité d’image suffisante et une diminution de la dose, comme le spécifie Leipsic et al, (2010) dans leur étude sur la qualité d’image en employant ASIR lors d’examens d’angio-CT coronaires.

4.4 Les limites de notre travail

Tout au long de notre travail nous avons été confrontées à plusieurs difficultés que nous avons essayé tant bien que mal de surmonter. Le changement de scanner dû au déménagement du CURML a eu un impact important sur le temps que nous avions à disposition pour réaliser ce travail. A cela s’ajoute le fait que pour l’acquisition d’images de plaques d’athérome, nous avons dû attendre qu’un corps ayant

36 | P a g e

les caractéristiques nécessaires se présente. Ces deux limites ont passablement restreint notre temps à disposition pour acquérir nos données et élaborer la suite de notre travail.

Un autre point important à considérer était le fait que nous ne devions pas gêner la réalisation des acquisitions CT de routine, et le déroulement (autopsie et CT) habituel des étapes. Il a donc fallu que nous appliquions nos modifications pas seulement sur la région thoracique – comme nous le souhaitions au départ, dans le but d’améliorer la résolution avec un SFOV plus petit – mais sur le corps entier. Cela impliquait une importante quantité d’informations, de reconstructions, de traitements des données, ainsi qu’un chargement assez long sur les CD. De plus, comme l’acquisition était faite sur tout le corps, nous avons été confrontées au fait qu’entre deux acquisitions, des fluctuations de l’Angiofil® dans les coronaires ont eu lieu. Ce qui fait que notre plaque est bien visible sur la première acquisition avec 120 kV, alors qu’elle est moins visible et avec du volume partiel sur les acquisitions de 80 kV et de 100 kV. Comme il était difficile de trouver des sujets avec des plaques nous avons dû garder ces acquisitions-là.

Un autre problème s’est hissé dans notre étude lors de la mise en place des ROI. La condition idéale pour qu’une étude puisse être à 100% qualifiée de comparative, est le placement identique de l’outil de mesure, par conséquent de notre ROI. En effet, celui-ci devrait se situer au même niveau de coupe et avoir la même surface de pixel (mm2) pour obtenir une valeur de HU équivalente sur chaque série d’image. Il aurait fallu pouvoir copier-coller le ROI, de même surface et au même emplacement, mais la console dont nous avons fait usage, ne nous permettait, malheureusement pas, cette manœuvre. Nous avons également rencontré quelques difficultés quant à l’analyse subjective. Comme le spécifie ce terme « subjectif », le jugement de chacun à propos de la qualité d’une image est bien un critère spécifique à chacun. Tout observateur a ses propres façons d’émettre un avis critique sur une image. Certes, il peut y avoir des coïncidences résultant à une concordance inter-observateurs, mais il y a également beaucoup de divergences lors du jugement d’un critère précis relatif à la qualité d’image. D’après des entretiens avec les divers observateurs, à la suite du remplissage du questionnaire, certains nous ont fait part de leurs façons de juger certains critères. Par exemple ; pour certains une image bruitée est préférable à une image lissée car cela leur permet un meilleur diagnostic. L’inverse était également signalé. Cela est donc problématique pour notre travail, car il est essentiellement fondé sur l’avis subjectif des observateurs. On ne peut homogénéiser cela car il sera toujours dépendant de la personne qui juge. Chacun a ses propres façons de faire et habitudes.

Nous n’avons malheureusement pas pu faire de tests statistiques dans notre travail à cause des différents biais exposés ci-dessus. Il aurait fallu en faire afin que nos résultats soient totalement pertinents et congruent. Des tests de Kappa afin de juger les différences inter- et intra-observateurs nous auraient certainement permis une meilleure mise en évidence de certaines constatations relative à la subjectivité, mais nous ne les avons pas fait à cause de notre petit échantillon d’observateurs. Des droites de régression et corrélation auraient incontestablement apporté des fondements plus concrets à l’influence de nos différents kilovoltages et reconstructions sur notre qualité d’image.

37 | P a g e

Documents relatifs