• Aucun résultat trouvé

4.1 Sujets à l’étude

Un total de 443 patients a participé, après un consentement écrit libre et éclairé, à cette étude approuvée par le comité d’éthique de la recherche de l’IUCPQ. Ces patients sont des canadiens français, hommes et femmes ayant subi une première résection chirurgicale d’un adénocarcinome de stade 1 à l’IUCPQ entre 2002 et 2014.

Les 443 échantillons ont été étudiés en deux cohortes distinctes et indépendantes. La première, comptant 233 patients constitue la cohorte de découverte alors que la seconde de 210 patients, constitue la cohorte de validation de l’étude. Les échantillons ont été sélectionnés puis répartis dans l’une ou l’autre cohorte parmi les échantillons tumoraux de la biobanque de l’IUCPQ.

Afin de créer une cohorte homogène, et ainsi pallier aux limitations des études décrites dans les sections précédentes, nous avons choisi de travailler exclusivement sur des adénocarcinomes de stade 1. Comme décrit dans l’introduction, l’histologie de la tumeur, ainsi que son niveau de différenciation ont un impact sur l’agressivité de la maladie et donc sur la survie des patients35-39, 45-48, 68.

Aucun des patients de notre étude n’a subi de thérapie adjuvante avant ou après l’ablation de la tumeur. En effet, les thérapies adjuvantes ont un impact sur l’intégrité de la tumeur et donc sur les caractéristiques phénotypique et génétique de cette dernière. Ainsi, les niveaux d’expression d’ARNm modifiés biaiseraient nos analyses. De plus, ces traitements ont un impact direct sur l’évolution de la maladie et donc sur la survie du patient.

Les patients ayant un historique de cancer, quelques soient le type histologique et le stade, ont été exclus de l’étude également. En effet, il est impératif d’écarter les tumeurs pulmonaires pouvant être issues de métastases afin d’analyser les caractéristiques des néoplasies pulmonaires spécifiquement. De plus, comme décrit précédemment, les patients ayant subi des traitements adjuvants sont exclus de l’étude. Dans le cadre d’un traitement pour un cancer antérieur, les thérapies, notamment lorsqu’elles sont systémiques, peuvent également avoir un impact sur une tumeur secondaire et même sur une néoplasie éloignée de la tumeur traitée.

Les non-fumeurs ont également été exclus de cette étude. Nous l’avons décrit précédemment, les non- fumeurs ont un patron d’expression génique bien distinct des fumeurs et ex-fumeurs10, si bien qu’il serait illogique de les considérer comme un même profil de patient dans le cadre de l’élaboration d’outils de pronostic basés sur l’expression des gènes.

Le diagnostic pathologique ainsi que la stadification ont été réalisé par un pathologiste immédiatement après l’ablation tumorale.

4.2 Extraction et réverse transcription des ARN

Les échantillons ont été fragmentés, cryogénisés et placés à -80˚C à la biobanque de l’IUCPQ moins de 30 minutes après chirurgie. Les ARN totaux ont été extraits à partir de 30 mg de tissu tumoral avec le kit « RNeasy Universal Plus Mini » de Qiagen. La concentration en ARN ainsi que la pureté ont été vérifiées par spectrophotométrie en mesurant le ratio d’absorbance 260/280 nm. Pour se faire, le spectrophotomètre « NanoVue » de GE Healthcare a été employé, les ratios compris entre 1,9 et 2,1 ont été acceptés. La réverse transcription de 2 µg d’ARN en ADNc a ensuite été réalisée avec le kit « Quantitect Reverse Transcription » de Qiagen.

4.3 Sélection des gènes

Nous avons réalisé une approche par gène candidat, sélectionnant ainsi des gènes dont l’expression a été mise en relation avec la survie des patients atteints d’un cancer du poumon dans la littérature scientifique (Tableau

2.1). Ainsi, dans un premier temps, une revue de littérature nous a permis de sélectionner 11 gènes, étant décrits

comme facteur de bon ou de mauvais pronostic vital. Nous avons inclus les études traitant de tout type histologique et stade pathologique de cancer du poumon, dont la période de suivi a été ou non, censuré à 5 ans. Dans un second temps, nous avons filtré cette sélection en utilisant PRECOG100, une méta-analyse des études de survie associant l’expression génique à la probabilité de survie des patients, par type histologique de cancer. Cet outil fourni un score de risque pour chaque gène et pour chaque type histologique. Ainsi, nous avons comparé les scores PRECOG de nos gènes, et avons retenu les plus prometteurs, soit ceux dont le score de risque était inférieur à -3 (bon pronostic vital) et supérieur à 3 (mauvais pronostic vital). Enfin, nous avons utilisé un de nos jeux de données pour filtrer cette sélection. Cette dernière est issue d’une analyse d’expression génique à grande échelle par micropuces à ADN, dans le tissu tumoral, ainsi que le parenchyme pulmonaire non-tumoral situé à 0, 2, 4, et 6 cm de la lésion (Figure

4.1)109. Nous avons donc utilisé ces données pour comparer les niveaux d’expression de nos gènes d’intérêt dans le tissu tumoral comparativement au tissu non-tumoral et ainsi sélectionner les gènes ayant une expression significativement modulée au sein de la tumeur.

Figure 4.1. Représentation schématique des tissus prélevés dans le projet 0246106.

4.4 Amplification en chaine par polymérase en temps réel

Pour quantifier les ARN messagers d’intérêt, nous avons optimisé notre technique de qPCR en appliquant les recommandations du « MIQE guidelines »87. Dans un premier temps, nous avons sélectionné manuellement des amorces spécifiques de 20 à 25 bases nucléotidiques, produisant des amplicons de 80 à 150 paires de bases, et ayant une température de liaison d’environ 60˚C. Les oligonucléotides ne s’apparient sur aucun polymorphisme connu, et ont été constitués de telle sorte que l’ADN génomique ne puisse être amplifié, soit parce que les amorces chevauchent deux exons, soit parce que les introns sont de très grande taille (> 4 kilobases). De plus, nous avons choisi des amorces sans probabilité de former des dimères ou des structures en épingle pouvant nuire à l’amplification de nos séquences d’intérêt. Toutes ces possibilités ont été testées in silico sur UCSC (www.genome.ucsc.edu/cgi-bin/hgBlat) ainsi que l'outil de vérification offert par la compagnie Integrated DNA Technologies (www.idtdna.com). Nous avons ensuite réalisé les qPCR en utilisant le « SsoAdvanced Universal SYBR Green Supermix » de BioRad et le système CFX384 Real Time PCR de BioRad pour les gènes BTG2, SELENBP1, NFIB, RRM1 et EZH2. Pour le gène FOXM1, nous avons utilisé le même système mais avec le « PowerUp SYBR Green Master Mix » de Thermo Fisher Scientific car ce dernier nous permettait d'obtenir une meilleure sensibilité pour ce gène faiblement exprimé. Le volume final de nos réactions préparées manuellement était de 10 µL. Les cycles de transition de température choisis sont: 1 cycle de 30 secondes à 95˚C puis 39 cycles de 15 secondes à 95˚C puis 30 secondes à 60˚C. Le premier cycle permet l’activation de la polymérase. Ensuite les 39 cycles sont les cycles d’amplification, les 15 secondes à 95˚C induisent le bris des liaisons hydrogènes qui rassemblent les deux brins d’ADN en double hélice. Ensuite, les 30 secondes à 60˚C incluent la liaison spécifique

des amorces sur le brin complémentaire, ainsi que l’élongation réalisée par la polymérase à partir de l’extrémité 3’OH de l’oligonucléotide. Pour les gènes SELENBP1 et FOXM1, nous avons utilisé un cycle particulier « Touchdown » afin de pallier aux difficultés d’amplification que nous avons rencontré. À noter que 3 températures de liaisons entre nos oligonucléotides et notre gène d’intérêt ont été testées et les amplicons déposés sur gel d’agarose pour vérifier la spécificité de notre amplification. La température la plus élevée, et produisant une bande unique à la taille attendue sur le gel a été choisie. Quatre gènes de référence (GAPDH, ACTB, BAT1 et B2M) ont été utilisés pour quantifier de façon relative nos échantillons. Chacun des gènes a été testé en triplicata et le coefficient de variation (CV) a été calculé. Les CV supérieurs à 17% indiquaient une possible erreur de pipetage. Ces échantillons ont donc été repris une nouvelle fois jusqu'à satisfaire nos exigences.

4.5 Statistiques

Les probabilités de survie ont été estimées par des analyses de Kaplan-Meier et le test du logrank a été utilisé pour vérifier l’existence d’une différence significative entre le groupe ayant une forte expression du gène d’intérêt et celui ayant une faible expression de ce dernier (Package R « Survival »). La médiane a été utilisée comme seuil arbitraire pour séparer ces deux groupes. Les tests ont d’abord été réalisés en tenant compte de la survie totale (Overall Survival) des patients, c’est à dire le nombre de jours entre la chirurgie de résection et le décès du patient. La survie sans récidive de la maladie (Disease Free Survival) a également été testée, il s’agit cette fois du nombre de jours entre l’ablation chirurgicale et la récidive de la maladie.

Des analyses univariées nous ont d’abord permis de tester la capacité de nos biomarqueurs à distinguer les patients à risque dans l’ensemble de notre échantillon. Dans un second temps, des analyses multivariées incluant les variables cliniques (i.e. sexe, stade pathologique et âge) nous ont permis de vérifier l’existence de différentes strates dans notre échantillon. Dans un troisième temps, nous avons combinés les données de nos gènes les plus prometteurs ainsi que les données cliniques pertinentes afin d’obtenir le modèle le plus performant selon le critère d’Akaïke.

Nous avons également évalué l’existence de corrélations entre l’expression des gènes testés par qPCR en utilisant le test de corrélation de Spearman. Les valeurs p inférieures à 0,05 ont été considérées comme significatives. Toutes les analyses statistiques décrites ci-dessus ont été exécutées à l’aide du logiciel de statistiques R version 3.2.2.

CHAPITRE 5. TUMOR-BASED GENE EXPRESSION

Documents relatifs