• Aucun résultat trouvé

3   APPORTS  DE  L’ACGH  EN  MEDECINE  DE  PRECISION

3.4   L IMITES  A  L ’ ANALYSE  A CGH  EN  MEDECINE  DE  PRECISION

3.4.4   Limites  des  outils  existants

représentative du niveau d’amplification ou de perte d’une région, et par conséquent des gènes qu’elle contient. Or, il n’existe pas, à notre connaissance, de consensus sur les valeurs seuils de gain (ou perte) traduisant un réel effet biologique, et pouvant justifier une décision thérapeutique.

De même, la taille des segments anormaux, ainsi que leur incidence sur des dysfonctionnements potentiellement actionnables, est discutée : si certains auteurs préfèrent se concentrer sur des altérations de petite taille, dites focales (Mermel et al. 2011), d’autres ont montré que des altérations plus longues, incluant des régions non codantes et des promoteurs, pouvaient impacter l’expression des gènes (Miyaguchi et al. 2011).

L’absence de règles de décisions claires sur les valeurs de segments et leurs longueurs, pourrait être à l’origine des ambiguïtés concernant l’intérêt de considérer certains gènes tels que FGFR1 et EGFR, comme discuté précédemment.

3.4.4 Limites  des  outils  existants  

Plusieurs plateformes de microarray sont disponibles, et chaque fabricant propose des outils d’analyse et de visualisation, dédiés à leur propre technologie. Agilent propose Agilent CytoGenomics, un ensemble de solutions supportées par les principaux systèmes d’exploitation. Ces outils ne peuvent toutefois pas être installés sur un système linux. Les suites logicielles Affymetrix et Illumina, quant à elles, ne sont développées que pour les systèmes Windows.

Plusieurs auteurs ont proposé des outils d’analyse, indépendants et portables, mais ceux-ci sont parfois dédiés à des plateformes spécifiques, et peuvent manquer de flexibilité. En outre, aucun de ces outils ne propose de visualisations adaptées à la prise de décision en médecine de précision, et pouvant être partagées pour des discussions en comité scientifique.

CGHcall (Van De Wiel et al. 2007) combine une approche bayesienne et l’analyse de mélanges gaussiens pour estimer les probabilités à posteriori des altérations.

39 Les segments sont ensuite assignés à 3 ou 4 classes : perte, normal, gain, amplification, les 2 dernières pouvant être concaténées en une seule selon les spécifications de l’utilisateur.

Limites : CGHcall nécessite une cohorte d’échantillons pour redéfinir les régions de gains, amplification et pertes, et ne peut pas être appliqué sur un échantillon unique.

CGHnormaliter (van Houte et al. 2009) s’appuie sur une méthode itérative de normalisation des signaux : après segmentation, les valeurs de sondes définies comme ‘normales’ sont utilisées pour ajuster l’ensemble du profil avant une nouvelle segmentation. L’ensemble du processus est répété jusqu’à atteindre un critère d’arrêt, ou un nombre maximal d’itérations spécifié par l’utilisateur.

Limites : La méthode définissant des sondes dites ‘normales’ n’est pas explicitée. De plus, CGHnormaliter n’est implémenté que pour des données issues d’hybridations à 2 couleurs, e.g. données Agilent.dual-color.

GAP (Popova et al. 2009) recherche des clusters de valeurs dans un plan défini par les fréquences alléliques (B-allele frequency, BAF) en abscisse, et les LRR en ordonnée (Figure 9).

Figure 9 : dans GAP, les fréquences alléliques (a) et les LRR après segmentation (b) sont projetés dans un plan pour la recherche de clusters (c). Les clusters proches de BAF=0.5, LRR=0 sont assignés au statut 2-copies, hétérozygote AB. Les autres statuts sont déduits de cette position.

40 Les BAF, sont initialement calculés à partir des signaux des sondes SNP :

BAFi= Bi

Ai+ Bi , où Ai et Bi sont respectivement les signaux des allèles A et B pour le snp i.

GAP propose une modélisation des BAF prenant en considération de possibles effets de dilution dus à la présence de tissu normal dans l’échantillon :

BAF =

(

1− p

)

.nBT + p.nBN 1− p

( )

. nBT + nAT

( )

+ 2 p

où p est la proportion d’ADN normal dans l’échantillon - de fait, (1-p) représente la proportion d’ADN tumoral dans l’échantillon, nAT

et nBT

sont respectivement les valeurs des allèles A et B dans la tumeur, et nBN

la proportion de l’allèle B dans le tissu normal contaminant.

De même, les LRR sont modélisés comme une fonction linéaire dont la pente est un coefficient de ‘contraction’ q, représentant les effets de dilution liés à la présence possible de clones ne partageant pas les mêmes altérations :

LRRn = q. log2 n 2 ! " # $ %

& = q.LRRn, où n est le nombre de copies.

Limites : construite sur les scores BAF, cette méthode n’est applicable que si ces valeurs peuvent être calculées, c’est à dire pour des microarrays proposant des sondes dédiées aux SNP. En outre, si le code est disponible sur demande, il n’est, à ce jour, pas formalisé sous la forme d’un package pouvant être distribué.

PAIR (Yang et al. 2013) propose également une recherche du niveau d’équilibre et une normalisation construites sur les pertes d’hétérozygoties estimées à partir des sondes SNP.

Limites : comme GAP, PAIR n’est applicable que sur des données issues de microarrays proposant des sondes SNP. De plus, cette méthode requiert les signaux obtenus à partir du tissu normal, apparié à l’échantillon analysé.

41 GISTIC (Mermel et al. 2011) est un algorithme développé par le Broad Institute, et largement exploité dans les analyses du TCGA. Cette approche itérative complexe vise à reconstruire la segmentation d’un ensemble de profils à partir d’un modèle de bruit, ce modèle étant optimisé à chaque itération. Après reconstruction, GISTIC estime la significativité d’altérations focales, définies comme des régions de forte amplitude, identifiées de manière récurrente au sein de la cohorte analysée.

Limite : cet algorithme est destiné à l’analyse de cohortes et semble difficile à évaluer dans le cadre de l’analyse de profils uniques.

popLowess (Staaf et al. 2007) propose une optimisation de centralisation par un ajustement des biais de cyanines, dans le cas d’hybridations utilisant 2 fluorochromes. Une régression locale est appliquée sur la population majoritaire, définie comme telle après une classification des LRR par la méthode des Kmeans à 3 centres. La médiane des valeurs ainsi ajustées, est ensuite utilisée pour corriger l’ensemble du profil.

Limites : cette méthode n’est applicable qu’aux hybridations utilisant 2 fluorochromes, e.g. plateforme Agilent, et se focalise sur la population majoritaire, alors considérée comme une population de référence à 2 copies.

Documents relatifs