• Aucun résultat trouvé

Novel diagnostic tool for prediction of variant spliceogenicity derived from a set of 395 combined in silico/in vitro studies: an international collaborative effort

I. Les prédictions des défauts d’épissage : les avancées et limites

Le nombre croissant de variants nucléotidiques détectés par NGS a eu pour conséquence l’essor d’outils

in silico de prédiction pour aider à interpréter ces variants. La prédiction des défauts d’épissage est un parfait exemple de cet essor au vue du nombre d’outils publiés au cours de ces dernières années.

1. Quels outils de prédiction pour quels motifs d’épissage

Ainsi, lors de ce travail de thèse, nous avons dans un premier temps réévalué les recommandations existantes concernant l’utilisation de ces prédictions d’une altération des sites consensus donneur/accepteur publiées par le GGC [254]. Ce travail a conduit au développement d’un nouvel outil : SPiCE.

SPiCE combine les deux outils de prédiction MES et SSF. SPiCE a démontré des performances supérieures à l’utilisation des scores MES et SSF seuls ainsi qu’à ces précédentes recommandations. Par ailleurs ses performances sont maintenues lorsque SPiCE est évalué sur d’autres variants que

BRCA1/BRCA2. A partir des scores fournis par SPiCE, nous avons dégagé deux seuils décisionnels pour prioriser ou non une étude ARN in vitro. Le premier seuil a été conçu pour maitriser le risque de faux négatifs en définissant une sensibilité optimale. En effet dans un contexte de diagnostic moléculaire, il est crucial de ne pas exclure à tort des variants splicéogéniques, ces derniers pouvant être pathogènes. Le second seuil décisionnel a été défini par rapport à une spécificité optimale dans le but de prioriser au titre de la recherche ces variants. Ces deux seuils peuvent aussi s’utiliser de façon concomitante avec la création d’une zone grise entre eux. Néanmoins nous avons observé que seulement 10 % des variants utilisés pour la validation de SPiCE étaient observés dans cette zone (16/160 et 9/90). Ainsi SPiCE s’est révélé être un outil particulièrement efficace pour prioriser les études ARN in vitro pour les variants situés dans les régions consensus d’épissage.

Cependant les motifs consensus d’épissage sont loin d’être les seuls signaux utilisés par le splicéosome. Les variants situés dans les motifs consensus donneur/accepteur d’épissage sont largement étudiés. Cependant pour les autres motifs d’épissage, l’impact de variants est bien moins décrit. Les points de branchement illustrent ce défaut. Actuellement, sur le site de Pubmed, 1 136 articles sont recensés avec les mots clés « consensus site splice » contre 340 avec les mots clés « branch point splice » (septembre 2019).

142

Aussi durant ce travail de thèse nous nous sommes dans un second temps focalisés sur l’étude des prédictions des points de branchement en comparant 6 outils : HSF, SVM-BPfinder, BPP, Branchpointer, LaBranchoR et RNABPS. Deux problématiques ont été considérées :

- La capacité des outils à identifier des points de branchement uniquement devant les sites accepteurs reconnus par le splicéosome.

- La capacité des outils à détecter une altération d’un point de branchement.

Ainsi nous avons pu identifier l’outil Branchpointer comme optimal pour discriminer la présence ou non d’un point de branchement. Cet outil met en valeur l’intérêt du deep learning sur lequel il repose, pour la détection des motifs d’épissage par rapport aux précédents algorithmes. En effet BPP, SVM-BPfinder et HSF, publiés antérieurement à Branchpointer, utilisent respectivement : un modèle mixte, SVM et PWM [146], [153], [261]. Néanmoins l’utilisation du deep learning ne permet pas à elle seule de justifier des performances de Branchpointer, car RNABPS et LaBranchoR utilisent également un tel algorithme [167], [168]. En réalité, Branchpointer intègre aussi la structure des transcrits dans le calcul du score tandis que RNABPS et LaBranchoR ne considèrent que la séquence nucléotidique. De plus Branchpointer a été entrainé uniquement sur les points de branchement associés aux transcrits majoritairement exprimés, nommés high-confidence par les auteurs [166]. Ce dernier point permet notamment d’expliquer l’excellente spécificité sur les données Ensembl (99.49 %). A l’inverse, Branchpointer ne parvient pas à détecter de points de branchement pour les transcrits faiblement exprimés observés par RNA-seq, sensibilité de 32.1 %. Ceci met en lumière l’importance du choix des stratégies d’entrainement des outils, notamment pour ceux basés sur le deep learning.

Nous avons également établi une des plus importantes collections de variants, situés dans la région des points de branchement, avec leurs études ARN in vitro (120 variants), grâce à une collaboration nationale au sein du GGC, de l’ANPGM et internationale via ENIGMA. Nous avons ainsi pu identifier que pour détecter l’altération d’un point de branchement l’outil Branchpointer n’est plus l’outil optimal. En effet, c’est l’outil BPP dans cette situation qui présente les meilleures performances. Par ailleurs, les variants splicéogéniques sont concentrés sur les motifs de points de branchement prédits par BPP, notamment sur le A du point de branchement et le T deux nt en amont. Il en résulte que nous pouvons prédire un variant comme splicéogénique s’il se situe dans le motif TRAY du point de branchement prédit [262].

En parallèle de l’étude des points de branchement, nos collègues Rouannais, de l’équipe Inserm U1245, ont grandement contribué à la caractérisation des ESRs. Ils ont ainsi étudié la relation entre la prédiction de ces motifs et les défauts d’épissage. Dans un premier temps les variants des gènes MLH1, BRCA1,

BRCA2, CFTR et NF1 ont été pris comme modèle d’étude [276]. Les outils de prédiction considérés étaient ΔtESRseq, ΔHZEI et SPANR [150], [173], [327]. Actuellement cette étude est étendue sur une

143

plus large cohorte de gènes [328]. Ces travaux ont ainsi montré que l’outil de prédiction des ESR, ΔtESRseq, est un des outils optimaux pour prédire un défaut d’épissage.

Ainsi la définition des outils in silico de prédiction optimaux offre une aide significative dans la démarche visant à l’interprétation des variants. Cependant la plupart de ces outils sont spécifiques d’un motif d’épissage ou d’un même groupe de motifs. Aussi se pose la question d’une méthode apte à prédire un défaut d’épissage indépendamment de la position du variant et du motif d’épissage pouvant être impacté.

Dans le but de répondre à cette question nous avons développé SPiP. En effet, cet outil s’adresse à la diversité des motifs d’épissage quel que soit la localisation du variant dans le gène. Grâce à la combinaison d’outils optimaux pour chaque motif, SPiP a atteint une exactitude de 80.21 % avec une sensibilité de 90.96 %, sur un jeu de 2 784 variants. En outre, cette sensibilité s’est révélée supérieure à celle obtenues par les deux récents outils de deep learning, SPIDEX (78.37 %) et SpliceAI (70.71 %). Par ailleurs, SPiP a été conçu pour rapporter quel est le motif altéré et la probabilité d’altération de l’épissage, afin de faciliter l’interprétation des résultats. Effectivement, la probabilité d’observer un défaut d’épissage varie en fonction du motif altéré. Ainsi nous avons observé une amplitude de 0.9 % à 90 %, respectivement pour la création d’un site d’épissage dans l’intron profond et l’altération d’un motif consensus du site naturel d’épissage. Au total, les motifs dont l’altération induit une probabilité élevée de défaut d’épissage, sont ceux contribuant à définir les jonctions exon/intron : motif consensus donneur/accepteur, tract polypyrimidique, point de branchement et ESRs. A l’inverse la création d’un nouveau motif d’épissage, notamment à distance des sites naturels, présente un plus faible risque de modifier l’épissage. Le calcul de ces probabilités, nous a aussi révélé que les prédictions négatives de SPiP permettent d’exclure les variants pour une étude ARN in vitro. Par conséquent, SPiP a le potentiel d’être un outil de décision à large échelle pour aiguiller le généticien vers les variants splicéogéniques.

2. Faut-il se limiter à la seule prédiction d’une altération de l’épissage

Il existe une grande variété d’outils de prédiction pour l’épissage, et au cours de ce travail de thèse nous avons pu proposer un ensemble d’outils qualifiés comme optimaux pour prédire un défaut d’épissage. Cependant un point majeur à souligner est que ces outils prédisent l’altération/création des motifs d’épissage et non la nature du défaut d’épissage. Cette différence entre ces deux notions s’illustre particulièrement pour les sites consensus donneur/accepteur. En effet, notre outil SPiCE a montré une exactitude de 95.6 % pour prédire un défaut d’épissage. Néanmoins, même au sein des vrais positifs de SPiCE du jeu de validation (n = 207), nous pouvons observer aussi bien un saut d’exon (156/207) que l’utilisation d’un nouveau site d’épissage (51/207). De plus parmi les 2 784 variants utilisés pour développer SPiP, nous avons aussi pu constater que des variants situés dans les sites consensus étaient

144

à l’origine d’une rétention complète d’intron (n = 4) et l’apparition de pseudo-exon (n = 2). Une partie de cette diversité peut s’expliquer par la présence de l’épissage alternatif comme nous avons pu le montrer pour le gène PALB2 [264]. Cependant, les variants de BRCA2 : c.8754G>A ; c.8754G>C ; c.8754+1G>A ; c.8754+1G>C ; c.8754+3G>C ; c.8754+4A>G ; c.8754+5G>A ; c.8754+5G>T, tous situés dans le site consensus donneurs de l’exon 21, entrainent systématiquement l’utilisation d’un site donneur à 46 nt dans l’intron [254], [260], [303], [304]. Or cette rétention des 46 premières nt ne correspond à aucun épissage alternatif connu de BRCA2 [131], [191].

Aussi certains outils de prédiction se proposent de rechercher la présence d’un site alternatif pouvant être utilisé en relai du site naturel. Par exemple, l’outil CRYP-SKIP calcule la probabilité d’utilisation d’un site cryptique au lieu du saut d’exon [171]. Cependant CRYP-SKIP a une utilisation restreinte puisqu’il n’est applicable que pour les variants altérant l’épissage. Plus récemment, nous pouvons également citer SpliceAI pour répondre à cette question. En effet, cet outil fournit deux scores, un pour la perte des sites d’épissage et le second pour le gain d’un autre site d’épissage [298]. Aussi, si nous étudions les scores de SpliceAI pour les variants consensus et splicéogéniques (n = 783) issus des 2 784 variants de SPiP. Parmi ces 783 variants, 288 variants entrainent l’utilisation d’un nouveau site d’épissage. SpliceAI détecte ces évènements avec une exactitude de 75.9 % (595/783), une sensibilité de 55.2 % (159/288) et une spécificité de 88.1 % (436/495). L’utilisation d’un tel outil récent basé sur le deep learning ne permet de détecter guère plus de la moitié de l’utilisation d’un nouveau site d’épissage lorsque le site naturel est altéré. De plus, ni CRYP-SKIP, ni SpliceAI n’ont été conçus pour détecter l’utilisation d’un pseudo-exon ou la rétention complète d’intron lorsque le site naturel est endommagé.

Nous avons également pu remarquer cette diversité des défauts d’épissage pour l’altération d’un même type de motif dans le cadre de l’étude des prédictions des points de branchement. En effet parmi les 120 variants collectés pour cette étude, 38 variants modifiaient l’épissage dont 7 entrainaient l’utilisation d’un site accepteur alternatif à distance du site naturel. A titre d’exemple, le variant KCNH2 c.2399-28A>G induit l’utilisation d’un site accepteur alternatif à 147 nt en amont du site naturel [329]. Par ailleurs grâce aux 1 294 variants splicéogéniques rapportés dans la collection des 2 784 variants de SPiP, nous avons observé que les rétentions complètes d’intron s’observaient fréquemment lorsque le point de branchement était altéré. Ainsi, sur les 16 variants induisant une rétention complète d’intron, 7 sont prédits comme altérant un point de branchement. Cependant pour prouver l’association entre ces deux évènements, des études complémentaires sont nécessaires.

Outre la diversité des altérations, un allèle muté peut produire différents transcrits en proportion variable. En effet, un variant peut engendrer à la fois un transcrit aberrant et le transcrit naturel, ce phénomène est alors qualifié d’effet partiel. Ainsi se pose la question de savoir si un score de prédiction d’altération de l’épissage est corrélé au niveau d’expression de ces différents transcrits. Lors du développement de

145

SPiCE, nous avons pu constater que la majorité des variants ayant un effet partiel a un score intermédiaire, c’est-à-dire la classe medium de SPiCE. Durant l’étude des prédictions des points de branchement, les sites accepteurs alternatifs, identifiés par RNA-seq, ont un niveau d’expression significativement plus élevé lorsqu’un point de branchement est prédit en amont du site. Cependant cette corrélation reste plus que faible au regard du coefficient de détermination (R²) maximal de 0.0062 pour RNABPS. Effectivement, l’expression d’un transcrit dépend d’un certain nombre de facteurs. Parmi lesquels nous pouvons mentionner de manière non exhaustive :

 La présence d’autres motifs d’épissage, les séquences des sites donneurs/ accepteurs ou bien la composition en séquences régulatrices ESRs.

 L’existence d’autres variants pouvant modifier l’impact d’un variant sur l’épissage [255].  Différents facteurs régulant la transcription et la traduction, par exemple les snRNAs et les

micro ARNs.

L’expression tissu-spécifique des gènes comme nous l’a montré le projet GTEx

(Genotype-Tissue Expression) (https://gtexportal.org/home/) [330].

 Le recrutement du NMD pour les transcrits avec un PTC.  La présence des épissages alternatifs.

De surcroit d’autres études de développement d’outils se sont proposés de corréler leurs scores au niveau d’expression des transcrits. Parmi ces derniers, nous pouvons citer un outil récemment publié MMSplice (modular modeling of splicing) [293]. Le score MMSplice est calculé par un algorithme de neural network à partir des séquences exoniques et introniques bordant le variant. Les auteurs de MMSplice

ont confronté leur score aux données d’expression du projet Vex-seq [100]. Le projet Vex-seq consistait à étudier par RNA-seq le niveau d’inclusion d’un exon dans les transcrits issus de tests minigènes à haut débit. Ainsi les auteurs du projet Vex-seq ont pu caractériser l’impact de 2 059 variants sur l’inclusion de 110 exons. En outre, la construction artificielle des minigènes a permis de réduire l’impact d’éventuel polymorphisme, de facteur de transcription, de l’expression tissu-spécifique, du NMD et des épissages alternatifs. Aussi ces données présentent des conditions optimales pour tester la corrélation entre un score de prédiction et le niveau d’expression des transcrits. Bien que MMSplice ait montré une corrélation plus importante que ses prédécesseurs comme SPANR ou HAL [25], [173]. Il n’a pas atteint un coefficient de détermination supérieur à 0.5 (R² = 0.46). En d’autre terme, même dans ces conditions optimales et avec un outil surpassant ses prédécesseurs, plus de la moitié de la variabilité d’expression d’un transcrit n’est pas expliquée par les scores de prédiction.

A l’ère du séquençage NGS, les prédictions de l’altération des motifs d’épissage apportent une aide capitale pour détecter et prioriser les variants splicéogéniques. Toutefois, la somme de ces arguments indique que ces prédictions ne peuvent se substituer aux études ARN in vitro pour préciser la nature et le degré d’altération du défaut d’épissage, afin de conclure sur la pathogénicité le cas échéant.

146