UNIVERSITE LIBRE DE BRUXELLES
FACULTE DE MEDECINE
LABORATOIRE D’EPIGENETIQUE DU CANCER
Portrait, caractérisation et intérêt clinique
des ARNs non codants dans le cancer du
sein
"Tu apprendras à faire tourner la roue de la Vie en ta faveur. Tu accepteras le jeu de la
Vie et ce que tu appelais difficultés, tu appelleras cela désormais Opportunités."
Résumé
Ces dernières années, les avancées technologiques ont révélé qu’une majeure partie
de notre génome est transcrit en ARNs non codants, qui sont impliqués dans de
nombreuses pathologies. Dès lors, nous avons voulu, lors de cette thèse, mieux
comprendre le rôle des ARNs non codants dans le cancer du sein.
Dans un premier temps, nous avons étudié les micros ARNs non codants
(miRs) dans un modèle cellulaire de cancer mammaire. Nous avons identifié deux
miRs qui sont exprimés dans les lignées mammaires normales, mais pas dans les
lignées cancéreuses. La surexpression de miR-137 entraine une diminution de la
prolifération et de la migration des cellules cancéreuses. De plus, nous avons identifié
que miR-137 cible directement la protéine histone déméthylase KDM5B et diminue
son expression génique et protéique. Ensuite, nous avons cherché si d’autres histones
déméthylases de la famille KDM5 pouvaient être régulées par les miRs. Nous avons
découvert que KDM5C, qui est surexprimée dans les lignées mammaires cancéreuses,
est une cible directe de miR-138. La surexpression de miR-138 dans les lignées
tumorales diminue l’expression de KDM5C et entraine une chute de la prolifération
cellulaire. Globalement, ces résultats révèlent que les miRs peuvent réguler les
protéines épigénétiques KDM5 et contrôler la prolifération cellulaire.
La deuxième partie de cette thèse est consacrée à un nouveau sujet de
recherche pour la communauté scientifique : l’étude des longs ARNs non codants
(lncRNAs). Des études pionnières révèlent que quelques lncRNAs sont impliqués
dans les cancers du sein. Des milliers de lncRNAs existent, mais très peu ont été
caractérisés. Dès lors, nous avons décidé d’évaluer globalement leur profil
d’expression dans une large cohorte de cancers du sein. Nous avons identifié 215
lncRNAs dérégulés dans les tumeurs. Nos résultats révèlent que l’expression des
lncRNAs permet de classer les cancers du sein en différents sous-types. Des analyses
bioinformatiques ont permis de prédire leurs fonctions et leurs implications dans
différentes voies moléculaires clés du cancer du sein telles que les voies
PI3K/AKT/mTOR et MAPK. Nous avons également découvert que 210 lncRNAs
sont des marqueurs pronostics indépendants du risque de rechute. Enfin, nous avons
choisi deux lncRNAs que nous avons étudiés expérimentalement. Nous avons montré
que lnc-KIN-2 contrôle la prolifération cellulaire en régulant l’expression des gènes
GATA3 et ESR1. Ensuite, nous avons découvert que CYTOR, un lncRNA
surexprimé dans les tumeurs mammaires, régule des gènes de la voie EGFR/mTOR et
est requis pour la prolifération et la migration cellulaire ainsi que pour le maintien du
cytosquelette et de la morphologie normale de la cellule.
Remerciements
Ce travail est le fruit de longs efforts et de longues discussions menées par
diffé-rents acteurs talentueux. Je remercie toutes les personnes qui ont contribué
di-rectement ou indidi-rectement au bon déroulement de mon travail de thèse.
D’abord François, mon promoteur qui m’a sélectionné pour jouer le rôle
princi-pal et qui, lors de nombreuses réunions, m’a donné les idées et les outils
néces-saires à l’aboutissement de ce projet. Ensuite, tous les membres du laboratoire
qui ont joué des rôles plus ou moins importants, mais qui ont toujours été là
pour me conseiller lorsque j’en ressentais le besoin. Je les remercie sincèrement
pour tous les bons moments passés dans, et surtout hors du laboratoire. En
parti-culier Eric et nos débats interminables sur d’innombrables sujets, les filles de
mon bureau qui ont toujours été présentes pour une bonne tranche de rire et nos
formidables techniciennes qui ont réalisé des expériences de grande qualité.
Je n’oublie pas Martin, sans qui cette thèse n’aurait pas été possible. Il a réalisé
un travail extraordinaire d’analyses bioinformatiques, et il a surtout pris le
temps de me transmettre une (toute petite) partie de son savoir. Je remercie
Christos Sotiriou, Jana et Matthieu qui m’ont également apporté toute leur
ex-pertise sur le cancer du sein ainsi que nos autres collaborateurs de l’institut
Bor-det, de l’IB², de l’UGENT et de la KUL. Je pense aussi à toi Ioly, qui a toujours
été d’une écoute attentive, ainsi qu’à Maud qui m’a remonté le moral lorsque
mon projet patinait.
Merci à Elise pour sa relecture et ses conseils concernant ma rédaction. Merci
également à Céline mon épouse, et à ma maman qui ont aussi fait le gros effort
de relire ce manuscrit.
Ajoutons évidement Céline, mes parents, ma famille et mes amis qui ont cru en
moi.
Enfin, je remercie le Télévie, le FNRS et la région wallonne qui ont financé mes
recherches ainsi que les membres du jury qui ont pris le temps de lire ce
manus-crit.
12
Bibliographie ... 167
A
NNEXEI ... 181
Liste des abréviations
5caC 5-carboxylcytosine 5fC : 5-formylcytosine 5mC : 5-méthylcytosine 5hmC : 5-hydroxy-méyhylcytosine 6mA : N6-méthyladénosine3’-UTR : région non traduite en 5’ (five prime untranslated region) 5’-UTR : région non traduite en 5’ (three prime untranslated region) 5-Aza : 5-aza-2-désoxycytidine
ADN : acide désoxyribonucléique ARN : acide ribonucléique ATP : adénosine triphosphate
CpG : dinucléotide cytosine-phosphate-guanine
DNMT : ADN méthyltransférase (DNA methyltransferase)
EGFR : récepteur au facteur de croissance épithéliale (epidermal growth factor receptor) EMT : transition épithélio-mésenchymateuse (epithelial-mesenchymal transition) ER : récepteur aux œstrogènes (estrogen receptor)
ER+ : tumeurs exprimant le récepteur aux œstrogènes ER- : tumeurs n’exprimant pas le récepteur aux œstrogènes FBS : serum fœtal bovin (fetal bovine serum)
FDA : agence américaine des produits alimentaires et médicamenteux (Food and Drug Administration)
FDR : taux de faux positif (false discovery rate) FT : facteur de transcription
H3K4 : lysine 4 de l’histone 3
H3K4me1 : histone 3 monométhylée sur la lysine 4 H3K4me3 : histone 3 triméthylée sur la lysine 4 H3K27 : lysine 27 de l’histone 3
HAT : histone acétyltransférase HDAC : histone désacétylases
HDACi: inhibiteur d’HDAC (HDAC inhibitor) HDM : histone déméthylase
HER2 : récepteur au facteur de croissance épidermale humain 2 (human epidermal growth factor receptor-2)
HKMT : histone lysine méthyltransférase HMT : histone méthyltransférase
HR : ratio de risque (hazard ratio) JAK : janus kinase
lncARN : long ARN non codant (long noncoding RNA) LNA : acide nucléique bloqué (locked nucleic acid)
miRISC : complexe effecteur de silençage par les miR (miRNA-induced silencing complex) m7G : N-7-méthylguanine
Mb : mégabase
MBP : protéine liant les CpG méthylés (mCpG binding protein) miR : micro-ARN
mRNA :ARN messager
mTOR : gène cible de la rapamycine chez les mammifères (mamalian target of rapamycin) ncRNA :ARN non codant (noncoding RNA)
PR : Récepteur à la progestérone PI3K: phosphatidylinositol-3-kinase PR : Récepteur à la progestérone
14
RBP : protéine liant l’ARN (RNA binding protein) RIN: Score d’intégrité de l’ARN (RNA integrity number) RNAse : ribonucléase
qPCR : réaction en chaine par polymérase, quantitative (quantitative polymerase chain reaction) SAM : S-adénosylméthionine