• Aucun résultat trouvé

Méthode "ABnorm"

La normalisation par quantile rend les distributions des intensités identiques entre les 588 échan-tillons. Cela a pour conséquence de supprimer la différence de variabilité entre les différents lots. En effet, si tous les échantillons ont la même distribution d’intensités, alors les lots ont également la même distribution d’intensités. L’objet de la normalisation par quantile est de minorer les variations artefactuelles (c’est-à-dire les variations liées à l’effet de lot) et de ne faire ressortir que les variations biologiques.

La correction "ABnorm" se différencie de la correction "SWAN" car "ABnorm" est une norma-lisation par quantile des intensités entre les échantillons alors que "SWAN" est une normanorma-lisation par quantile entre les intensités Infinium I et Infinium II au sein d’un même échantillon. La méthode "ABnorm" testée ici est basée sur une méthode proposée à l’origine pour la biopuce Illumina HM27k (Z. Sun, Chai et al. 2011). Je l’ai adaptée ici pour la puce HM450k en normalisant par quantile les intensités des signaux méthylés (signal B) et non méthylés (signal A), séparément pour les sondes de type Infinium I et II. Le principe de la normalisation par quantile est de trier par ordre croissant les intensités, puis d’attribuer pour chaque rang la valeur correspondante à la moyenne des valeurs du rang. Une fois les nouvelles valeurs obtenues, il faut réordonner les valeurs dans leur ordre initial. Une normalisation par quantile est réalisée pour les intensités B de type Infinium I, B de type Infinium II, A de type Infinium I et A de type Infinium II séparément. Les intensités des 588 échantillons ont une distribution identique au sein de chacun des 4 groupes. Pour illustrer cette méthode, prenons les intensités des signaux méthylés. Pour chacun individu, les intensités sont triées par ordre croissant. L’intensité d’un rang i pour un individu ne correspondra pas au même site CpG que l’intensité du même rang pour un autre individu. La moyenne de toutes les valeurs du rang i remplacera les valeurs de ce rang. Les individus auront donc la même valeur pour le rang i mais cela ne correspondra pas au même site CpG. Lorsque les normalisations par quantile ont été réalisées, le β est ensuite calculé comme précédemment.

La normalisation par quantile des intensités va rendre les distributions des intensités au sein des individus identiques ce que confirme la figure 3.33. Cette figure représente des diagrammes en boites des intensités des signaux méthylés non normalisés (gauche) et normalisés par la méthode "ABnorm" (droite) par puces (ou lots) pour les 588 échantillons. On voit sur la figure de droite que les différents

lots ont la même distribution d’intensités.

Figure 3.33 – Diagrammes en boites des intensités des signaux méthylés bruts (gauche) et normalisés par la méthode "ABnorm" (droite) par puces (ou lots) pour les 588 échantillons.

Le fait de rendre les distributions des intensités identiques va se répercuter sur les distributions des valeurs des β, comme on le voit sur les diagrammes en boites de la figure 3.34. La figure 3.34 représente des diagrammes en boites des β calculées à partir des valeurs des intensités non normalisées (gauche) et à partir des valeurs des intensités par la méthode "ABnorm" (droite) par lots (ou puces) pour les 588 échantillons. La distribution des β n’est pas identique entre les lots après normalisation mais on remarque tout de même une uniformisation et donc une diminution de l’effet de lot.

Figure 3.34 – Diagrammes en boites des β calculées à partir des valeurs des intensités non normalisées (gauche) et à partir des valeurs des intensités par la méthode "ABnorm" (droite) par puces (ou lots) pour les 588 échantillons.

Dans l’optique d’améliorer la méthode de normalisation "ABnorm", j’ai proposé une variante de la méthode "ABnormNeg" qui inclut les sondes de contrôles négatifs lors de la normalisation par quantile des intensités. Ces intensités sont traitées comme s’il s’agissait d’intensités de sondes mesurant les niveaux de méthylation. Les graphiques représentant les fonctions des densités des intensités, les diagrammes en boites des intensités du signal méthylé et des β étant identiques à ceux obtenus avec la méthode "ABnorm", ne sont pas présentés dans ce rapport.

Autres méthodes de normalisation par quantile

La méthode "Lumi" consiste à normaliser par quantile non pas les intensités méthylées et non méthylées comme dans la méthode "ABnorm", mais les intensités d’une part obtenues via le fluoro-chrome "Cy3" et d’autre part les intensités obtenues via le fluorofluoro-chrome "Cy5" (Z. Sun, Chai et al. 2011). Cette normalisation est identique à "ABnorm" pour les sondes Infinium II où chaque état est mesuré par un fluorochrome spécifique mais différe pour les sondes Infinium I où chaque état peut être mesuré soit par le fluorochrome Cy3 ou Cy5.

La méthode "QNBeta" consiste à normaliser par quantile les valeurs β (Pidsley et al. 2013 ; Z. Sun, Chai et al. 2011). Cette méthode a l’inconvénient d’être trop drastique et d’effacer certaines différences biologiques pertinentes.

Méthode "ComBat"

La méthode largement utilisée "ComBat" est proposée par Johnson et al. 2007 et est disponible dans le package Bioconductor "sva". Cette méthode utilise une approche empirique bayésienne para-métrique ou non parapara-métrique pour corriger l’effet de lot en faisant l’hypothèse que l’effet de lot est composé d’un effet additif suivant une loi normale et d’un effet multiplicatif suivant une loi gamma inverse. Pour plus de détails sur la méthode statistique de "ComBat", j’invite le lecteur à se référer à l’article la décrivant en détail (Johnson et al. 2007).

Les diagrammes en boites de la figure 3.35 représentent les distributions des valeurs β normalisées (droite) et non normalisées (gauche) par la méthode "ComBat" et par puces.

Figure 3.35 – Diagrammes en boites des β non normalisées (à gauche) et normalisées (à droite) par la méthode ComBat pour les 588 échantillons.

On peut voir qu’après la normalisation les distributions des valeurs β sont plus semblables qu’avant la normalisation, la normalisation par la méthode "ComBat" a diminué la variabilité entre les puces et donc l’effet de lot.

Autres méthodes

Il existe diverses autres méthodes pour corriger l’effet de lot comme les méthodes "LOESS", "LOWESS" et "SPLINES" qui n’ont pas été traitées dans ce travail de thèse mais qui mériteraient d’être étudiées dans le cas des données de méthylation.

Documents relatifs