• Aucun résultat trouvé

RÔLE DE VARIANTS GÉNÉTIQUES RARES DANS LA

SUSCEPTIBILITÉ GÉNÉTIQUE À UNE MALADIE

Le fait de séquencer un petit échantillon d’individus pour détecter la présence de variants rares semble être une approche efficace, puisque 74 variants génétiques répondant à la définition préétablie d’un variant rare ont été identifiés. La très grande majorité de ces variants n’auraient pu être identifiés via une étude pangénomique d’association.

Limites de l’étude et améliorations potentielles

5.4.1.

Des décisions méthodologiques et les caractéristiques de la cohorte étudiée ont pu limiter l’étude.

L’ADN séquencé et génotypé pendant le projet a été extrait à partir des cellules sanguines des participants à l’étude. Compte tenu de la provenance de l’ADN qui a été utilisé, il est impossible de confirmer que des variants rares somatiques des gènes étudiés ne se retrouvent pas dans le tissu osseux des individus étudiés. D’ailleurs, des mutations présentes uniquement dans l’ADN provenant du tissu osseux de deux patients pagétiques, ont déjà été observées au sein du gène SQSTM1. (Merchant et al., 2009) Des mutations ou des variants rares somatiques pourraient notamment expliquer le caractère focal de la MOP.

Une approche gène candidat a été utilisée pour ce projet. Des gènes dont les fonctions sont peu connues jusqu’à ce jour et des gènes impliqués dans des mécanismes physiopathologiques de la MOP non élucidés jusqu’à maintenant ont donc pu être rejetés de l’étude au stade de la sélection des meilleurs gènes candidats à la MOP.

Les variants rares ont été recherchés uniquement dans les exons, les jonctions intron-exon et les promoteurs des gènes sélectionnés. Cette stratégie est communément utilisée pour la recherche de variants rares et a permis d’identifier de nombreux variants ayant des répercussions fonctionnelles importantes sur certains gènes ou certaines protéines qui sont impliqués dans le développement d’autres maladies (Cohen et al., 2004; Fearnhead et al., 2004; Hershberger et al., 2010; Iascone et al., 2011; Nejentsev et al., 2009) Toutefois, des variants associés à la MOP pourraient aussi se situer au sein de régions non codantes qui n’ont pas été séquencées au cours du projet. En fait, plus de 80 % des variants pour lesquels des associations avec une maladie ont été identifiées jusqu’à maintenant sont non codants. Aussi, plusieurs différences phénotypiques sont attribuables à des variations au sein de régions régulatrices ou à la modification du niveau d’expression de certains gènes. (Cooper et Shendure, 2011) Ces observations appuient l’hypothèse selon laquelle des variants fonctionnels pourraient être situés dans des régions non codantes. (Manolio et al., 2009) D’ailleurs, une mutation causale d’une forme sévère de rétinite pigmentaire liée à l’X a récemment été identifiée dans une région intronique à plus de 700 pb d’un exon du gène OFD1. L’approche de séquençage de gènes candidats avait préalablement échoué à déceler une mutation causale à l’intérieur d’un locus de susceptibilité. (Webb et al., 2012)

La technologie de séquençage de nouvelle génération, pourrait être utilisée pour contourner les deux limites énoncées précédemment. Grâce à cette technologie, il serait possible de séquencer en entier les deux régions chromosomiques étudiées dans le projet. Cette méthode permettrait de détecter tous les variants rares des régions introniques et intragéniques dont les individus de l’échantillon de découverte sont porteurs, en plus d’éviter les biais causés par la sélection a priori des gènes candidats à séquencer. De nouveaux mécanismes physiopathologiques pourraient ainsi être mis en évidence.

Les variants génétiques identifiés ont été définis comme des variants rares si la MAF répertoriée dans la base de données EntrezSNP était inférieure à 5 % (0,05) ou encore si aucune valeur de MAF de référence n’était disponible dans cette même base de données. Bien qu’il soit probable que la majorité des variants non répertoriés dans cette base de données soient effectivement peu fréquents, il est impossible de le garantir. De plus, certaines estimations des MAFs de variants génétiques sont basées sur les données obtenues pour quelques individus; les valeurs de référence indiquées ne sont donc pas toujours représentatives des MAFs

populations, la MAF moyenne d’un variant au sein de plusieurs populations ne représente pas nécessairement la MAF de ce variant dans la population canadienne-française. Inversement, les résultats obtenus dans cette étude d’association ne sont pas généralisables à d’autres populations. (Marian, 2012) De plus, le fait d’étudier une population à effet fondateur peut avoir mené à la détection de variants population-spécifiques qui ne sont pas spécifiques à la maladie étudiée. L’utilisation des MAFs répertoriées dans la population européenne selon le Projet 1000 génomes aurait permis une meilleure estimation des MAFs dans la population canadienne- française. Malheureusement, il n’était pas possible d’utiliser ces données au début de l’étude. Compte tenu qu’un très grand nombre de variants génétiques répondaient à la définition préétablie d’un variant rare, il serait envisageable de réduire le seuil de MAF de référence d’un variant rare à 3 % lors d’un projet futur visant à identifier des variants rares.

La sélection des variants rares pour l’étude d’association a été effectuée en se fiant à des prédictions in silico à propos des effets fonctionnels des variants identifiés. Les outils de prédictions in silico sont d’une grande aide pour prioriser les variants à étudier. Toutefois, il existe un risque d’erreur relié à leur utilisation. Ainsi, des variants réellement fonctionnels peuvent être prédits bénins, alors que des variants bénins peuvent être prédits dommageables pour la fonction d’un gène. Généralement, plusieurs outils d’analyse in silico ont été utilisés pour étudier une même caractéristique, ce qui augmente à la fois la probabilité que les prédictions d’effets fonctionnels soient exactes et la probabilité d’avoir rejeté un variant réellement fonctionnel. Par exemple, le chevauchement entre les prédictions de SIFT et de PolyPhen varie entre 5% et 70% selon les paramètres programmés dans chacun de ces deux outils basés sur l’analyse de la conservation des acides aminés. (Hicks et al., 2011) Les différences parfois observées entre les prédictions émises s’expliquent notamment par l’utilisation d’algorithmes distincts qui utilisent des espèces et des seuils de conservation différents et qui incluent ou non des données structurales ou fonctionnelles. (Chun et Fay, 2009; Di et al., 2009; Naken et al., 2007) La sensibilité individuelle de ces deux outils est d’environ 70%. (Flanagan et al., 2010) Somme toute, le fait de considérer les résultats de plusieurs outils de prédiction des effets d’une modification d’un acide aminé au sein d’une protéine a semblé une bonne façon d’identifier des variants associés à la MOP. En effet, cette stratégie a mené à l’identification d’une association entre un variant rare du gène TM7SF4 et la MOP. Par ailleurs, l’apparence de spécificité d’un variant rare à la MOP dans un échantillon de découverte comportant un nombre disproportionné de cas et de témoins ne s’est pas avérée être un bon critère de priorisation des variants rares. Aussi, l’étude de la ségrégation familiale ne s’est pas avérée essentielle pour sélectionner les variants rares à étudier davantage; aucune ségrégation familiale entre la maladie et un variant rare n’a été observée. Cette observation n’est guère surprenante puisque la pénétrance de la plupart des variants rares serait inférieure au seuil nécessaire pour causer une ségrégation familiale perceptible qui est d’environ 50 %. (Bodmer et Bonilla, 2008) Dans un projet futur, il serait préférable

sites d’épissages par les variants identifiés, afin de confronter les résultats prédits par les différents outils. Les programmes NNSPLICE et SplicePredictor seraient de bons choix. Ils sont faciles à utiliser et ils ont permis d’identifier l’ajout d’un site d’épissage causant la création d’un nouvel exon du gène OFD1 impliqué dans la rétinite pigmentaire liée à l’X. (Webb et al., 2012) Il serait aussi important que des variants rares qui altèrent ou qui créent un site d’épissage ou un site de liaison à un facteur de transcription soient sélectionnés pour une étude d’association afin de déterminer si ce type de prédictions doit être utilisé pour prioriser les variants à étudier. De plus, si l’apparence de spécificité à la MOP demeurait un critère de sélection des variants à étudier, l’échantillon de découverte devrait contenir un plus grand nombre d’individus témoins. Aussi, l’étude de la ségrégation familiale ne devrait être réalisée qu’après avoir effectué l’étude d’association, dans le but de vérifier si un variant génétique absent chez tous les individus sains est une mutation.

L’étude d’association entre la MOP et les variants rares sélectionnés parmi ceux identifiés dans l’échantillon de découverte a comporté certaines difficultés. Les faibles MAF de ces variants ont contribué à ce qu’aucun individu homozygote ne soit présent dans l’échantillon génotypé pour trois des quatre variants rares sélectionnés. Aussi, peu de variants ont été génotypés, ce qui a empêché le regroupement pertinent de plusieurs variants dans une même analyse génétique. Il a donc été impossible de vérifier si les individus atteints par la MOP possédaient globalement plus de variants rares que les individus sains. Un plus grand nombre de variants pourraient être sélectionnés pour effectuer l’étude d’association, afin d’être en mesure d’effectuer le regroupement, dans une seule analyse statistique, de plusieurs variants appartenant au même locus, au même gène ou encore faisant partie de la même voie de signalisation. Il faudrait notamment s’assurer de sélectionner plusieurs variants appartenant aux mêmes gènes pour l’étude d’association. Le regroupement de variants permettrait entre autres de réduire l’influence des faibles valeurs des MAF sur la puissance de notre cohorte. Il va sans dire qu’une plus grosse cohorte pourrait aussi permettre d’obtenir des associations significatives en dépit des faibles MAF des variants étudiés. Plus la taille de la cohorte est restreinte, plus l’observation d’association significative est difficile malgré une différence importante des MAF entre les cas et les témoins. (Li et al., 2010) Toutefois, en pratique, il est difficile d’augmenter considérablement la taille de la cohorte.

L’échantillon utilisé pour l’étude d’association était composé d’individus atteints de MOP et non apparentés, alors que l’échantillon de découverte était composé d’individus souffrant d’une forme familiale de MOP. Or, il est impossible de confirmer que les mêmes variants sont impliqués dans les deux formes de la maladie. D’ailleurs, le variant CTHRC1_2, pour lequel un effet protecteur a été identifié dans le sous-groupe « Paget Non-Mutés », semble être un facteur de risque pour les individus porteurs de la mutation SQSTM1/P392L. Par contre, puisque l’échantillon utilisé pour effectuer l’étude d’association comportait peu d’individus possédant la

mutation SQSTM1/P392L, il est difficile de confirmer si ce variant a un effet modificateur lorsqu’il se retrouve chez un individu muté.

Forces de l’étude