• Aucun résultat trouvé

Construction d’une CC

Dans le document en fr (Page 43-46)

1.3 Etat de l’art du d´eveloppement de mod`ele radiomique

2.1.1 Construction d’une CC

2.1.2 Utilisation des CC en radiomique . . . 36 2.1.3 ´Etat de l’art de l’usage des CC en radiomique TEP . . . 40 2.2 ´Etude du potentiel et des limites de l’exploration des donn´ees au moyen

de cartes de chaleur . . . 44 2.2.1 M´ethode . . . 44 2.2.2 R´esultats . . . 47 2.2.3 Discussion . . . 57 2.3 Conclusion . . . 59 Dans ce chapitre, nous ´etudions si les cartes de chaleur (CC) qui sont une m´ethode d’analyse non supervis´ee permettent de d´eterminer si les donn´ees `a disposition contiennent de l’information pr´edictive. Pour cela, les clusters (ou groupes) identifi´es sur les CC sont analys´es dans le but d’en d´eduire des profils radiomiques discriminants pour une tˆache de classification consid´er´ee.

2.1 Utilisation de CC en radiomique

2.1.1 Construction d’une CC

Les CC sont utilis´ees pour visualiser graphiquement des donn´ees statistiques en repr´esentant l’intensit´e de la variable par une gamme de couleurs.

Ce sont des matrices 2D color´ees. Pour pr´esenter les donn´ees sous la forme d’une CC, celles-ci doivent subir une ´etape de classification hi´erarchique. Cela a pour but de regrouper les patients qui pr´esentent des similarit´es entre eux et de rapprocher les

caract´eristiques de leurs profils qui sont corr´el´ees. Cette ´etape assure que les couleurs de la CC sont bien organis´ees.

Ces 2 avantages (la pr´esentation graphique des donn´ees et le fait que les CC regroupent les patients et les caract´eristiques) nous ont incit´es `a les ´etudier.

La classification hi´erarchique regroupe des techniques d’apprentissage non supervis´ees qui ont pour but d’identifier des clusters dans le JDD. Cette m´ethode s´epare les donn´ees en sous-groupes qui contiennent des ´el´ements similaires.

La m´ethode la plus populaire que nous avons utilis´ee est celle d’approche ascendante. Ainsi chaque ´el´ement du JDD forme son propre cluster, puis il est ensuite regroup´e avec d’autres clusters en fonction de leurs similarit´es pour former un nouveau cluster. Ce proc´ed´e continue jusqu’`a ce que tous les sous-groupes fusionnent.

Ceci peut ˆetre visualis´e avec un dendogramme qui ressemble `a un arbre `a l’envers comme illustr´e figure 2.1.

15

10

5

0

12 11 17 4 8 5 16 15 1 9 18 3 21 2 14 10 13 6 7 19 Figure 2.1 – Dendogramme qui repr´esente la classification hi´erarchique de 20

´echantillons.

Les ´etapes de ce type de classification hi´erarchique sont les suivantes : 1. Chaque ´el´ement du JDD est un cluster individuel. Pour chacune des n

2paires (n

´etant le nombre d’´el´ement du JDD), la similarit´e entre les 2 vecteurs est calcul´ee. 2. Pour i = n, n-1, ..., 2.

— Inspection de toutes les mesures de similarit´es entre chaque paire de clusters puis regroupements des clusters qui sont le plus similaires. Le niveau de similarit´e entre 2 clusters dicte la hauteur de leur fusion dans le dendogramme.

— Pour chacun des C clusters restants, calcul des C

2mesures de similarit´e pour

chacune des paires.

Pour mesurer la similarit´e, diff´erentes possibilit´es existent. La plus courante est la distance euclidienne entre les clusters. Puisque chaque ´echantillon du JDD peut ˆetre

repr´esent´e par un vecteur de taille identique P, la distance entre 2 ´echantillons xj1 et xj2 peut ˆetre calcul´ee comme dans l’´equation 2.1

d= v u u u t P X f=1 (xj1 f − x j2 f )2 (2.1)

xj1 et xj2 ´etant respectivement les vecteurs de caract´eristiques radiomiques des patients j1 et j2 et xjf1 et x

j2

f ´etant respectivement la valeur de la fe caract´eristique radiomique

des patients j1 et j2.

Dans nos travaux, nous avons ´egalement utilis´e la corr´elation de Pearson comme distance. Celle-ci consiste `a mesurer le degr´e de la relation lin´eaire entre 2 profils et est d´efinie par l’´equation 2.2. d= 1 − PP i=1(xjf1 − ¯xj1)(x j2 f − ¯xj2) qPP i=1(xjf1− ¯xj1)2 qPP i=1(xjf2− ¯xj2)2 (2.2) avec ¯x = 1 P PP i=1xj1.

Puisqu’une distance est calcul´ee, il est important de normaliser les valeurs des caract´eristiques comme expliqu´e dans le chapitre 1 (partie 1.2.2.4).

Nous obtenons donc une mesure de distance entre chacun des patients pris 2 `a 2 ce qui va nous permettre ensuite de les regrouper en fonction de la proximit´e de leurs profils.

Afin de prendre des d´ecisions concernant les r´esultats de calcul des distances pour former des clusters, il est important de choisir une m´ethode de couplage appropri´ee. Les 3 m´ethodes de couplage les plus utilis´ees sont les suivantes :

— Couplage par distance maximum : consiste `a minimiser la distance la plus grande entre les ´el´ements de 2 clusters. Les dendogrammes sont pour la plupart ´equilibr´es et moins sensibles au bruit dans les donn´ees et aux valeurs aberrantes. N´eanmoins, les gros clusters peuvent ˆetre inutilement s´epar´es puisqu’ils peuvent ˆetre biais´es par rapport aux clusters de mˆeme taille.

— Couplage par distance minimum : consiste `a minimiser la distance minimale entre les ´el´ements de 2 clusters. Cette technique est sensible au bruit et aux valeurs aberrantes et peut ˆetre `a l’origine de la cr´eation de nombreux petits clusters tr`es similaires de ceux `a proximit´e.

— Couplage par distance moyenne : consiste `a minimiser la distance moyenne entre les ´el´ements de 2 clusters.

La figure 2.2 repr´esente sch´ematiquement ces 3 techniques.

La m´ethode de couplage influe donc sur la mani`ere donc vont ˆetre regroup´es 2 clusters en fonction de la distance calcul´ee entre ces 2 clusters. Ces clusters d’´el´ements sont ensuite repr´esent´es sur une CC.

Maximum

Moyenne

Minimum

Figure 2.2 – Illustration des 3 m´ethodes de couplage.

La mˆeme chose est effectu´ee pour regrouper les caract´eristiques d´ecrivant chaque ´el´ement du JDD.

Regrouper `a la fois les colonnes (´el´ements du JDD) et les lignes (caract´eristiques qui les d´ecrivent) permet de visualiser quels ´el´ements sont similaires et forment des clusters ainsi que les caract´eristiques de chacun de ces clusters.

Dans le document en fr (Page 43-46)