• Aucun résultat trouvé

Analyse génétique de la sensibilité au cancer mammaire

N/A
N/A
Protected

Academic year: 2021

Partager "Analyse génétique de la sensibilité au cancer mammaire "

Copied!
103
0
0

Texte intégral

(1)

Faculté des Sciences

Département de Biologie Moléculaire (IBMM) Laboratoire de Biologie du Développement Profs. C. Szpirer et J. Roscam-Szpirer

Analyse génétique de la sensibilité au cancer mammaire

Thèse soumise à l’Université Libre de Bruxelles En vue de l’obtention du grade de

Docteur en Sciences Stieber Daniel

Décembre 2005

(2)

Introduction 1

1)Le cancer du sein 1

a) Généralités 1

b) Les facteurs de risque 1

c) Facteurs de risques non génétiques 2

d) L’agrégation familiale 2

2)Le cancer est une maladie génétique 3

a) Historique 3

b) La prédisposition au cancer dû à des allèles rares de pénétrance

élevée 4

c) Le cancer est une maladie polygénique 5

d) Difficulté de l’analyse chez l’humain 6

3)Le modèle animal 7

4)L’analyse génétique 9

a) La notion de QTL 9

b) Le contexte : loci de sensibilité chez le rat 10

c) La recherche de QTL 11

c

1

) Les microsatellites 11

c

2

) La notion de LOD score 12

c

3

) La cartographie par intervalle 12

c

4

) Les seuils de signification 13

d) Les lignées congénique 14

e) L’approche du gène candidat 15

f) L’analyse d’expression de gènes à large échelle 16

But du travail 18

Résultats 19

1)Croisement WKY x SPRD-Cu3 : Cartographie de QTL 19

a) Analyse Phénotypique 19

b) Analyse de liaison et identification génétique des QTL 19

c) Cartographie de QTL 20

c

1

) QTL de multiplicité 20

c

2

) QTL de latence 21

c

3

) QTL d’agressivité 21

2)Analyse histopathologique des tumeurs 22

(3)

b) Phénotypage des lignées congéniques 23

c) Lignée congénique du chromosome 5 24

d) Lignée congénique du chromosome 9 26

e) Lignée congénique du chromosome 18 27

4)Comparaison du profil d’expression des lignées parentales 28

a) Analyse par puces à ADN 28

b) Etude de certains transcrits par qRT-PCR 29

c) Localisation chromosomique 31

5)Recherche de polymorphismes de séquence 33

a) Principe et applications 33

b) Application à certains gènes candidats 34

c) Pla2g2a 35

d) Jun 38

6)Recherche d’une signature des résistance commune 41

Discussion 47

1)Identification de nouveaux QTL contrôlant le développement tumoral 47

2)Les lignées congéniques 50

3)Recherche de gènes candidats 52

4)Recherche de polymorphismes de séquence 53

5)Recherche d’une signature de résistance commune 55

Références bibliographiques 58

Annexes

Annexe 1, Liste des Abréviations 65

Annexe 2, Matériel et Méthodes 66

Annexe 3, Liste des gènes différentiellement exprimés entre SPRD et WKY

Annexe 4, Publications

(4)

Introduction

1) Le cancer du sein a) Généralités

Le cancer du sein est le type de cancer non-cutané le plus fréquent chez les femmes dans les pays occidentaux. Plus de 186000 nouveaux cas et plus de 46000 morts sont enregistrés chaque année aux seuls Etats-Unis

1

. Il est estimé que 12,5% de toutes les femmes américaines vont développer un cancer du sein au cours de leur vie et que 3,4% vont en mourir (Ries et al. 1998). L’incidence du cancer du sein a

augmenté de plus de 40% de 1973 à 1998 (Howe et al. 2001), il s’agit donc d’une maladie en constante progression au cours des dernières décennies. Il existe par ailleurs une grande variation internationale dans l’incidence du cancer du sein qui varie d’un facteur cinq entre le Japon (6 cas pour 100000 « années femme ») et le pays de Galles et l’Angleterre (30 cas) (Brinton et Devesa 1996 ). Cliniquement, le cancer du sein est presque exclusivement dû à une prolifération de l’épithélium mammaire producteur de lait maternel. Une transformation maligne des éléments du stroma ou du tissu adipeux qui englobe l’épithélium est extrêmement rare. Il est à noter que la taille du sein, qui est pour la majeure partie due au tissu adipeux et aux éléments du stroma, n’est pas un facteur de risque pour le développement d’un cancer du sein parce toutes les femmes possèdent une quantité similaire d’épithélium

mammaire.

b) Les facteurs de risque

Le cancer du sein, comme la plupart des types de cancers et l’ensemble des cancers communs, est une maladie complexe. Il s’agit d’un trait multifactoriel qui possède clairement une composante génétique mais celle-ci est modulée par des facteurs environnementaux tels l’état hormonal, l’alimentation, le statut socio- économique ou encore l’exposition à des carcinogènes environnementaux.

1Les chiffres américains sont cités faute d’avoir pu trouver des chiffres précis concernant l’UE.

(5)

c) Facteurs de risque non-génétiques

L’histoire familiale est le facteur de risque le plus important en ce qui

concerne le cancer du sein, mais il n’est pas le seul. Il existe une multitude de facteurs de risque non-génétiques. Ceux-ci peuvent êtres divisés en deux catégories :

hormonaux et non-hormonaux. D’une manière générale, les facteurs hormonaux peuvent augmenter le risque de cancer du sein via l’augmentation de l’exposition aux oestrogènes ou, au contraire, diminuer ce risque en réduisant cette exposition. Un corollaire de ceci est que tout ce qui élève le nombre de cycles menstruels augmente le risque de cancer du sein. Dans ce cadre on peut citer la nulliparité ainsi qu’un âge élevé à l’entrée en ménopause. Au contraire, le risque diminue à chaque naissance et des longues périodes de lactation semblent également diminuer celui-ci, sans doute en diminuant le nombre de cycles. Il existe également une faible corrélation positive entre un poids élevé et le risque de développer un cancer du sein (Pujol et al. 1997).

Les facteurs non-hormonaux, en particulier l’exposition à de radiations ionisantes augmentent également le risque (John et Kelsey 1993). Ainsi, des jeunes filles traitées pour la maladie d’Hodgkin par des radiations ionisantes possèdent un risque fortement augmenté, celui-ci est d’autant plus fort qu’elles ont été traitées précocement.

d) L’agrégation familiale

Le cancer du sein est une maladie complexe et l’on peut observer de l’agrégation familiale pour de multiples raisons. Des mutations dans des gènes de prédisposition à haute pénétrance comme BRCA1 et BRCA2 sont transmises de façon autosomale dominante et confèrent un risque de développer un cancer du sein très élevé par rapport au risque observé dans la population générale. D’autres rares syndromes de sensibilité au cancer héréditaires comme les syndromes de Li-

Fraumeni, de Cowden et de Muir-Torre sont associés à un risque élevé de cancer du sein. Mais ces syndromes sont beaucoup moins fréquents dans la population que le syndrome de cancer du sein héréditaire dû à des mutations dans BRCA1 et BRCA2.

Des facteurs non génétiques peuvent également être à l’origine d’une agrégation dans

certaines familles. Évoquons par exemple une exposition géographiquement limitée à

certains carcinogènes environnementaux qui pourrait affecter une famille vivant dans

une proximité géographique relative. L’on peut également penser à certains

(6)

comportements liés à la culture qui pourraient altérer le risque comme l’âge à la première naissance ou le choix des moyens de contraception. Finalement des influences socioéconomiques pourraient être à l’origine d’un comportement alimentaire spécifique par exemple, comportement qui pourrait être un facteur de risque.

2) Le cancer est une maladie génétique a) Historique

Au cours de ces vingt dernières années, la perception concernant la contribution de la sensibilité génétique aux types de cancers les plus communs a considérablement changé. L’hypothèse de Knudson (Knudson et al. 1971) et sa confirmation moléculaire dans le cas du retinoblastome (Friend et al. 1986) ont attiré l’attention sur le rôle que joue la prédisposition génétique dans certaines formes de cancers très rares. Mais les cancers communs étaient encore largement considérés comme « environnementaux » au début des années 1980 (Doll et al. 1981 ; Peto et al.

2001). C’est à partir de cette époque que le rôle de la prédisposition génétique dans le cadre de cancers communs a été de plus en plus remarqué. Les études

épidémiologiques de cette période aboutissaient à un modèle plutôt génétique qu’environnemental pour expliquer la distribution familiale observée. Il a également été suggéré que les effets génétiques pourraient être responsables d’une fraction substantielle des cas de cancer, sans qu’on ne soit nécessairement en présence d’une agrégation familiale évidente de la maladie (Newman et al. 1988 ; Claus et al.1991).

Les derniers doutes restants sur la contribution de la composante génétique dans le

cadre de la sensibilité aux cancers communs furent sans doute balayés par la

démonstration, au début des années 1990, de liaison génétique dans des familles

atteintes de cancer du sein (Hall et al. 1990). Cette découverte majeure fut rendue

possible par la mise en évidence de nouveaux polymorphismes de séquence d’ADN,

les microsatellites.

(7)

b) La prédisposition au cancer dû à des allèles rares de pénétrance élevée

Les premiers gènes de prédisposition ont été identifiés comme des allèles rares mutés qui élèvent de façon significative le risque de cancer s’il sont transmis par la lignée germinale. Ces gènes mutés qui aboutissent à de multiples cas de la maladie dans une même famille ont été repérés par des études de liaison génétique et de clonage positionnel dans des familles humaines. Le gène « prototypique » associé à des syndromes de cancer familial est le gène du rétinoblastome (RB1), qui par la suite s’est avéré être l’un des moyeux centraux des cascades de signalisation cellulaire (Weinberg 1995). D’autres facteurs clés des voies de signalisation tels que p53 (codé par TP53) ont été dans un premier temps identifiés comme des cibles importantes de virus ou de mutations somatiques dans des tumeurs (Linzer et al. 1979 ; Lane et al.

1979 ; Baker et al. 1989). Par la suite on a également découvert que des allèles mutés de ces gènes pouvaient être transmis par la lignée germinale et être la cause de syndromes de cancers familiaux. (Malkin et al. 1990). La découverte des allèles à haute pénétrance a permis de comprendre toute une série d’aspects fondamentaux de la biologie du cancer, comme l’identification des voies de signalisation d’APC, de la β -caténine et de Tcf4 (Kinzler et al. 2002), ainsi que de PTEN qui est impliqué dans le syndrome de Cowden et le développement de toute une série de types de tumeurs (Stambolic et al. 1998). En ce qui concerne les types de cancers les plus communs, les analyses se sont focalisées sur l’identification d’allèles de sensibilité ségrégant avec la maladie dans de larges familles touchées par celle-ci. Les analyses de liaison

génétique ont permis la localisation de gènes hautement pénétrants liés à la sensibilité à plusieurs types de cancers communs. Ceci est en particulier vrai dans le cadre du cancer du sein et des ovaires (BRCA1 et BRCA2) (Hall et al. 1990, Wooster et al.

1994), du cancer du côlon avec APC (Adenomatous Polyposis Coli) (Bodmer et al.

1987) et HNPCC (les gènes de réparation des mésappariements MSH2 et MLH1),

(Lindbolm et al 1993 ; Peltomaki et al. 1993). C’est également vrai dans le cadre du

mélanome avec CDNK2A (Canon-Albright et al. 1992) et du cancer des testicules

avec TCG1 situé sur le chromosome X (Rapley et al. 2000)

(8)

c) Le cancer est une maladie polygénique.

En terme de santé publique, la prédisposition due à une combinaison de variants génétiques de faible importance est sans doute nettement plus significative que le risque individuel très élevé observé dans le cadre des syndromes relativement rares de cancer strictement héréditaires. Cet argument est développé par Pharoah (Pharoah et al. 2002) dans une étude concernant le cancer du sein. Des études épidémiologiques de la maladie ont établi que seulement 10 à 20% des cas

d’agrégation familiale étaient observés dans des familles dans lesquelles ségrége une mutation à haute pénétrance de BRCA1 ou BRCA2 (Figure1). En principe les 80 à 85% restants pourraient avoir une origine soit génétique soit environnementale (ou une combinaison des deux). Mais des évidences provenant d’études de jumeaux atteints de cancer du sein (Lichtenstein et al. 2000), d’études de l’incidence tumorale dans le sein contre-latéral (Lichtenstein et al. 2000), ainsi que d’études du mode de transmission dans des familles (Antoniou et al. 2002) suggèrent que les facteurs génétiques sont prédominants. L’article de Pharoah et al. suggère également qu’il est peu vraisemblable que d’autres gènes majeurs du type de BRCA soient responsables du risque génétique restant ; l’on peut mieux expliquer ce risque par un autre modèle qui décrit l’action combinée de plusieurs facteurs ayant chacun une contribution relativement faible (Antoniou et al. 2002). En d’autres termes, la majorité de la prédisposition génétique au cancer du sein serait due aux effets d’une combinaison de variants génétiques à plusieurs (peut-être une multitude) de loci différents. Ceci pourrait également être le cas d’autre types de cancers communs (Peto 2002).

L’influence du contexte génétique s’observe même dans le cas de cancers dépendants

d’allèles à haute pénétrance comme le gène NF1 (neurofibromatose de type1) ou

encore BRCA1 et 2. En effet, dans ces cas, les phénotypes observés sont le plus

similaires chez des jumeaux monozygotiques et moins semblable chez les membres

plus éloignés de la famille (Fodor et al. 1998, Nathanson et al. 2001). Ceci démontre

que le contexte génétique est capable d’influer sur le développement de la maladie

chez l’humain. Ceci a également été observé chez la souris (Balmain et Nagase 1998,

Nadeau 2001). Ces observations plaident pour l’existence de gènes modificateurs

(encore appelés gènes de sensibilité mineure) capables d’influer sur le comportement

des gènes à effet majeur. Pour étayer cette hypothèse, citons en exemple l’étude de

Struewing et al. (1997) laquelle établit que la pénétrance des allèles de sensibilité de

(9)

BRCA1 et BRCA2 n’est que de 56%, voire inférieure dans certaines populations, plaidant ainsi clairement pour la ségrégation, dans ces populations, de plusieurs allèles de résistance de gènes qui restent encore à découvrir.

d) Difficulté de l’analyse chez l’humain

A ce jour, peu des ces gènes de « faible » prédisposition ont pu être identifiés.

Les seuls exemples connus sont CYP1A1 (Taioli et al. 1995) et la kinase de point de contrôle CHEK2 (The CHEK2- Breast Cancer Consortium 2002) dans des familles ne ségrégant pas d’allèles délétères de BRCA1 ou BRCA2. Il paraît clair que les

méthodes de « chasse au gène » classiques, qui ont été tellement efficaces par le passé pour identifier les gènes majeurs responsables de toute une collection de phénotypes familiaux, ne sont pas adaptées aux maladies complexes dont le cancer, du moins chez l’humain. Ceci est entre autres dû à l’hétérogénéité génétique des populations

humaines ce qui implique que le polymorphisme causal responsable du phénotype peut être diffèrent de famille à famille. Une autre raison qui pourrait rendre l’analyse difficile serait l’existence d’une multitude de loci à faible pénétrance interagissant entre eux, qui n’atteindraient un seuil acceptable de significativité que dans de rares cas, dépendant du contexte génétique ou des facteurs environnementaux.

On peut conclure dès lors que la probabilité individuelle des femmes à

développer un cancer du sein est influencée à la fois par le contexte génétique et par

des facteurs environnementaux. Les allèles qui influencent le développement de

cancer du sein comprennent ceux qui sont rares dans la population mais possèdent une

pénétrance élevée comme les suppresseurs de tumeur BRCA1 et BRCA2. A ceux-ci

s’ajoute toute une série d’autres allèles possédant une pénétrance nettement plus

faible, mais dont la fréquence dans la population est nettement plus élevée. Une de

nos hypothèses de travail est que les allèles qui augmentent la sensibilité au cancer ne

forment qu’une moitié des allèles de sensibilité, l’autre moitié étant formée par des

allèles conférant une certaine résistance au cancer. L’identification des deux types

d’allèles est importante pour l’estimation des risques individuels de développer un

cancer du sein. Cependant, l’identification d’allèles de résistance n’est pas aisée dans

des cohortes humaines, entre autres parce qu’il est difficile de discriminer parmi les

familles à faible taux de cancer celles qui le sont pour des raisons génétiques de celles

(10)

qui le sont par le fait de la chance. Comme on a pu le constater, il est très difficile sinon impossible d’identifier des gènes de sensibilité mineure ou de résistance chez l’humain, en tout cas avec les moyens techniques actuels. Dans un futur pas trop éloigné, on pourra sans doute attaquer ce problème par l’utilisation d’études d’association. Dans le contexte actuel, il est utile sinon indispensable d’utiliser une approche génétique alternative afin d’identifier des allèles de sensibilité mineure et/ou de résistance au cancer.

3) Le modèle animal

Dans le cadre de ce travail, nous avons décidé d’identifier ces allèles de sensibilité en utilisant un organisme modèle. Notre choix s’est porté sur le rat (Rattus norvegicus). Le rat a été préféré à la souris parce que le cancer mammaire de rat est un meilleur modèle pour la situation humaine, particulièrement en ce qui concerne l’histopathologie et la dépendance hormonale. De plus, aucune étiologie virale n’est associée au cancer mammaire chez le rat, comme chez l’homme et ce contrairement à la situation murine (MMTV, mouse mammary tumor virus) (Gould, 1993, 1995;

Russo and Russo, 1996a, 1996b; Shepel and Gould,1999). En outre, les cancers induits chez la souris possèdent des périodes de latence plus longues et une incidence moindre. Il existe plusieurs souches consanguines de rat montrant une sensibilité hautement variable au développement de cancer de différents types et de cancer mammaire en particulier. Ainsi certaines souches telles que Copenhagen (COP) ou Wistar Kyoto (WKY) sont complètement résistantes au cancer mammaire tant induit que spontané, tandis que d’autres comme Sprague Dawley (SPRD) et Wistar Furth (WF) sont hautement sensibles, présentant de multiples tumeurs avec des temps de latences très courts après induction, d’autres encore manifestent une sensibilité intermédiaire comme la souche F344. Actuellement le rat est aussi un excellent outil génétique puisque l’on dispose d’une cartographie bien établie

(http://www.rgd.mcw.edu), de la séquence génomique complète (Rat Genome

Sequencing Project Consortium, 2004) et d’une large collection de marqueurs

génétiques (SSLPs, Simple Sequence Lenght Polymorphism comme les Mini et les

Microstaellites et SNPs, Single Sequence Polymorphism) bien définis dans la plupart

des souches consanguines.

(11)

Le caractère de résistance ou de sensibilité est spécifique du tissu mammaire et s’exprime de manière cellulaire autonome. Ceci a été démontré par des greffes entre animaux de sensibilités divergentes. Il est à noter que les phénotypes de résistance ou de sensibilité au cancer mammaire sont également observés en absence d’induction chimique. Ces phénotypes sont donc « carcinogène indépendants », mais l’utilisation d’un carcinogène accélère le processus. Le carcinogène le plus fréquemment utilisé est le DMBA (7,12-dimethyl-benz- α -anthracène) lequel doit être métabolisé par l’organisme avant d’exhiber son potentiel génotoxique, mais le NMU (1-methyl-1- nitrosurée), un agent alkylant direct est aussi fréquemment employé et induit les mêmes effets. Les tumeurs mammaires induites par ces agents chimiques montrent une dépendance hormonale à la fois pour l’induction et pour la croissance. La sensibilité de la glande mammaire à l’induction chimique est maximale si l’on administre le carcinogène à de jeunes femelles vierges, âgées de 45 à 60 jours et possédant un système endocrinien fonctionnel. Cette période se caractérise par une organogenèse active et un taux de prolifération élevé de l’épithélium glandulaire.

Ajoutons que les rats COP et WKY d’une part et SPRD et WF d’autre part présentent des différences de sensibilité au seul cancer mammaire. Le trait est donc bien

spécifique du tissu mammaire.

Le développement des tumeurs mammaires induites par un carcinogène

comme le DMBA est un processus en plusieurs étapes. L’élément déclencheur est une lésion biochimique due à l’interaction du carcinogène et de l’ADN. Si le dommage à l’ADN n’est pas réparé convenablement, il en résulte des mutations, des

translocations chromosomiques, l’inactivation de gènes de régulation ou des

changements génétiques plus subtils non encore clairement identifiés. D’un point de vue histologique, une transformation néoplasique comporte aussi plusieurs étapes. Au moment de l’administration du DMBA, vers 55 jours, la glande mammaire n’est pas encore complètement différenciée, les premiers signes de la cancérisation consistent en l’élargissement de quelques terminaisons des canaux lactifères, appelés TEB (terminal end bud), dont on pense qu’elles sont la cible préférentielle des

carcinogènes. Ensuite, vers deux à trois semaines après l’administration du DMBA,

on observe la prolifération de cellules caractérisées par un noyau plus rond et un

nucléole plus important, et dont la taille est approximativement deux fois supérieure à

celle des cellules des TEBs ; elles forment des IDPs (intraductal proliferation). Ces

(12)

structures vont s’accroître et vont former des carcinomes : les DCIS (ductal carcinoma in situ) qui vont évoluer vers des lésions malignes, invasives et ultérieurement

métastasiques (Russo et al. 2000). Il est remarquable qu’après administration d’une seule dose intragastrique de DMBA (65mg/kg), les femelles SPRD ou WF

développent des tumeurs mammaires à une fréquence élevée atteignant 100%, tandis que des rats COP ou WKY ne développent aucune tumeur dans ces conditions (Issacs et al . 1986, Hsu et al. 1994, Shepel et al. 1998, Lan et al. 2001). En outre, il a pu être établi que la résistance des rats COP est due à une disparition de lésions

préneoplasiques plutôt qu’à l’absence de telles lésions

,

(Korkola et al. 1999) .

4) L’analyse génétique.

a) La notion de QTL

Lorsque l’on compare le phénotype des individus d’une population d’un

croisement avec leur composition génétique, on constate souvent qu’il existe une

association entre la différence de valeur phénotypique pour un caractère complexe

étudié et une différence de génotype à certaines régions du génome. Lorsque cette

association atteint le seuil de signification statistique, on conclut à la présence d’un

quantitative trait locus ou QTL. Un QTL est un locus dont au moins deux formes

alléliques sont associées à des valeurs phénotypiques moyennes différentes pour le

caractère étudié. Un caractère complexe est généralement sous le contrôle de plusieurs

QTL. Un QTL est généralement identifié au départ sous la forme d’une région du

génome qui couvre plusieurs dizaines de mégabases, contenant plusieurs centaines de

gènes. L’identification du gène responsable de l’effet phénotypique observé nécessite

de réduire la taille de cette région chromosomique. Il n’est pas rare, lors de ces études

génétiques, de constater que l’effet de la région correspond à la combinaison additive

ou interactive de l’effet de plusieurs gènes liés (chacun constituant donc en fait un

QTL). Cette situation pourrait résulter d’une sélection naturelle qui aurait favorisé des

haplotypes, c’est-à-dire des associations alléliques de QTL liés, associés à des valeurs

phénotypiques très différentes. Elle pourrait également résulter de la façon dont les

QTL sont détectés : du fait que leur effet individuel est en général faible sur le

caractère complexe étudié, ceux qui sont liés ont davantage de chance d’être détectés

(13)

(dans le cas où les haplotypes rencontrés associeraient des allèles dont les effets induisent une variation quantitative du caractère complexe qui va dans le même sens).

b) Le contexte : loci de sensibilité chez le rat

L’équipe de M.Gould au Medical College of Wisconsin a commencé au début des années 1990 à analyser des croisements entre la souche résistante COP et la souche sensible WF. Ces chercheurs ont pu établir que la sensibilité au cancer induit par le DMBA est contrôlée par quatre loci de trait quantitatif (QTL), qu’ils ont appelé Mcs1 à Mcs4 (mammary cancer susceptibility) (Hsu et al. 1994, Shepel et al. 1998).

Ces QTL sont situés sur les chromosomes 2, 7, 1 et 8 respectivement. L’analyse d’un croisement unique ne permet pas de détecter tous les gènes de prédisposition mineure.

C’est dans cette optique que l’équipe de Gould a analysé un croisement entre la même souche sensible WF et une autre souche résistante WKY. Cette étude (Lan et al. 2001) a permis de mettre en évidence quatre autres loci (Mcs5 à 8) situés sur les

chromosomes 5, 7, 10 et 14. De plus cette étude a révélé l’existence d’une interaction entre Mcs8 et une région sur le chromosome 6 appelé Mcsm1 (modifier of Mcs), qui n’a pas d’effet direct sur le phénotype de sensibilité au cancer mammaire. Ces études suggèrent donc fortement que la sensibilité au cancer mammaire est contrôlée par des gènes différents dans des souches différentes. Il s’agit d’une situation similaire à la sensibilité au cancer utérin (Roshani et al. 2001) et à d’autres traits quantitatifs tels que l’hypertension ou la prédisposition autoimmune (Rapp 2000 ; Griffiths et al.

1999). Afin d’identifier de nouveaux QTL contrôlant la sensibilité au cancer

mammaire notre laboratoire a choisi d’étudier un croisement avec une souche sensible

autre que WF. Nous avons sélectionné la lignée consanguine sensible SPRD-Cu3 que

nous avons croisé à la lignée résistante WKY.

(14)

c) La recherche de QTL c

1

) Les microsatellites

Pour repérer les QTL qui participent à l’expression d’un phénotype dans le cadre d’un trait complexe, il est nécessaire de réaliser des analyses de liaison

génétique à l’aide de marqueurs polymorphes répartis tout au long du génome. Or, il existe au sein des génomes, de nombreuses petites séquences d’ADN faites de

répétitions d’un même motif. Les motifs les plus souvent observés dans le génome de rongeur appartiennent à la catégorie des dinucléotides. En tenant compte de la

complémentarité, il n’existe que quatre types de répétitions dinucléotidiques possibles. (CA)

n

:(GT)

n

, (GA)

n

:(CT)

n

, (CG)

n

:(GC)

n

et (TA)

n

:(AT)

n

. De ces quatre motifs, deux ne sont pas utiles en tant que marqueurs ; (CG)

n

:(GC)

n

n’est présent qu’à une fréquence peu élevée dans les génomes de mammifères tandis que de

longues répétitions (TA)

n

:(AT)

n

ne permettent pas de former des hybrides stables aux températures de PCR usuelles. Des deux classes restantes, ce sont les répétitions (CA)

n

:(GT)

n

qui sont les plus communes. Chaque répétition flanquée de part et d’autre d’une séquence d’ADN unique forme un ensemble appelé microsatellite. Il constitue un marqueur polymorphe (le plus souvent dit « anonyme » si aucun gène n’y est associé) quand le nombre de répétitions du motif est différent d’une souche à l’autre. Ceci confère aux séquences d’origine différentes une taille différente qui peut être visualisée après amplification PCR, (Figure 2).

Dès lors que des croisements entre rats de sensibilité divergente au cancer mammaire ont été générés (intercroisements F2, croisements en retour N2), le phénotype des descendants peut être analysé en parallèle avec leur génotype. En pratique, les rats sont caractérisés pour une large collection (une centaine) de

marqueurs polymorphes distribués de manière continue tout au long des 21 autosomes

de rat. Puis, par les études de liaison génétiques proprement dites on essaye d’établir

une corrélation entre le génotype et le phénotype.

(15)

c

2

) La notion de LOD score

Afin de déterminer la signification statistique de la corrélation existante entre phénotype et génotype, la valeur statistique classiquement utilisée pour mesurer la signification de la présence d’un QTL est le LOD score. Il s’agit du résultat d’un test d’hypothèse qui estime la vraisemblance relative de deux hypothèses. Dans le cas présent, le LOD score est le logarithme base 10 du rapport entre la vraisemblance d’observer les résultats obtenus (association phénotypes-génotypes) sous l’hypothèse de la présence d’un QTL au marqueur analysé et la vraisemblance d’observer ces résultats sous l’hypothèse de l’absence de QTL. Plus le LOD score est élevé, plus la présence d’un QTL à cet emplacement est probable. Un LOD score de 3 indique que l’hypothèse de la présence d’un QTL à cette position est 1000 fois plus probable que l’hypothèse d’une absence de QTL.

c

3

) La cartographie par intervalle

Plusieurs méthodes statistiques pour l’analyse des données de cartographie dans le cadre de la recherche de QTL dans les organismes modèles ont été

développées (Lander et Botstein 1989). Au départ, la cartographie de QTL était effectuée via des tests d’association entre des marqueurs individuels et un phénotype donné. Une approche plus puissante, la cartographie par intervalle, a ensuite été introduite par Lander et Botstein (1989). Par cette approche, on peut déterminer la présence d’un QTL à n’importe quel endroit du génome en exploitant toute la puissance d’une carte de liaison complète. Le principe de la cartographie par intervalles est assez simple : Les données de génotypage disponibles concernent uniquement des locus espacés. Pour calculer le LOD score à des positions

chromosomiques intermédiaires entre ces marqueurs il faudrait connaître le génotype

des animaux à ces positions. Puisqu’on ne le connaît pas, un programme informatique

génère, pour une position intermédiaire donnée, toutes les combinaisons de génotypes

possibles pour ces animaux, compatibles avec les génotypes des animaux aux deux

marqueurs situés de part et d’autre et avec les fréquences de recombinaison attendues

entre cette position intermédiaire et les deux marqueurs – le programme effectue une

interpolation à partir des génotypes connus aux deux marqueurs. Pour chacune de ces

combinaisons de génotypes théoriques, il calcule le LOD score correspondant. Il

(16)

retient finalement la combinaison de génotypes qui donne la plus forte probabilité de présence d’un QTL à cette position. En faisant de même pour toutes les positions intermédiaires entre les deux marqueurs, on établit une courbe de LOD score qui indique, pour chaque position du chromosome comprise entre deux marqueurs génotypés, la vraisemblance de la présence d’un QTL. On conclut à la présence d’un QTL dans une région donnée lorsque la courbe passe par un maximum, avec une valeur de LOD score supérieure à un seuil dit de signification.

c

4

) Les seuils de signification

Les problèmes liés à la décision des seuils appropriés de signification sont pour parti techniques et pour parti de nature plus philosophique. Il faut tout d’abord différencier entre seuil de détection à un point (« pointwise » ou nominal) et au niveau d’un génome entier (« genome-wide »). La valeur de p « pointwise » d’une statistique de liaison est la probabilité d’excéder la valeur observé à une position donnée dans le génome, en admettant l’hypothèse nulle d’absence de liaison. La valeur de p

« genome-wide » correspond à la probabilité que la valeur observée est dépassé

quelque part dans le génome en admettant l’hypothèse nulle d’absence de liaison. En

ce qui concerne une étude génome-entier, le seuil de signification approprié est une

valeur pour laquelle la probabilité de trouver un faux-positif à n’importe quel endroit

du génome est de 0.05. Des arguments théoriques développés par Kruglyak et Lander

(1995b) suggèrent l’emploi d’un seuil de LOD score « genome-wide » de 3.3 dans le

cadre d’un croisement en retour dans des populations expérimentales. Dans notre cas,

nous avons estimé les seuils de signification par simulation en ayant recours à la

méthode dite de permutations (Churchill et al.1995) : l’on génère par ordinateur 1000

permutations aléatoires des données expérimentales avec des génotypes aléatoires à

chacun des marqueurs mais en gardant les valeurs phénotypiques et les fréquences de

recombinaison observés. L’on effectue alors une analyse de liaison complète sur

chacun des 1000 ensembles de données simulées et le LOD score maximal observé est

noté. Le seuil de signification « genome-wide » est alors la valeur de LOD score qui

est excédée dans moins de 5% des réplicats (pour p<0,05). Il faut noter qu’une valeur

de p nominale de 1x10

-5

n’est pas équivalente à un LOD score de 5 : Un LOD score

de 5 implique que les donnés sont 10

5

plus probables sous l’hypothèse de liaison

donnée que sous l’hypothèse nulle. Une valeur de p de 1x10

-5

implique que la valeur

(17)

de LOD score observé ne sera observé qu’une seule fois par 10

5

observations en admettant l’hypothèse nulle.

Dans notre cas, la localisation chromosomique des QTL a été établie en ayant recours à une variante non-paramétrique de la cartographie par intervalles basé sur la méthode de la somme des rangs de Wilcoxon qui a été implémentée avec le logiciel HSQM (Coppieters et al. 1998). Cette méthode est basée sur une statistique Z

W

qui généralise le test nonparamétrique de la somme de rangs de Wilcoxon à une situation de cartographie par intervalles. Il est avantageux d’utiliser une approche non

paramétrique; en effet, Kruglyak et Lander (1995a) ont montré que l’hypothèse de départ pour les tests paramétriques à savoir une distribution normale du phénotype, n’était pas toujours vérifiée (une distribution binomiale négative peut par exemple être observée comme c’est le cas pour la multiplicité tumorale dans cette étude) et donc l’interprétation des résultats peut être faussé.

d) Les lignées congéniques

Dans le but d’identifier les gènes qui sous-tendent un QTL, il est classique d’isoler une lignée congénique spécifique à ce QTL, afin de confirmer d’une manière

« physique » les résultats statistiques de liaison génétique observés. Cette approche, qui fut développée au départ pour disséquer la complexité génétique des locus MHC, consiste, à l’aide de croisements successifs, à introduire la région contenant le QTL de la lignée donneuse, et elle seule, dans le génome d’une lignée receveuse. Cette

approche est utile à plusieurs égards : tout d’abord, elle permet de vérifier

l’implication de chacun des différents QTL dans le contrôle du trait étudié. Ensuite, elle permet par croisement des différentes souches entre elles de tester l’effet phénotypique des différentes combinaisons génétiques, ainsi que les relations de dominance, de récessivité ou d’épistasie des différents allèles entre eux. Finalement elle permet de réduire la taille des différents QTL par croisement avec la souche parentale donneuse et création de lignées dites « sous-congéniques ».

Pour produire une lignée congénique, plusieurs croisements en retour avec le

parent « receveur » sont réalisés en partant d’une génération F1 (appelé N1 dans ce

cas). Au niveau de la génération N2, les animaux sont génotypés pour les marqueurs

(18)

compris dans les différents QTLs impliqués. Seuls sont retenus pour parents de la génération suivante les animaux homozygotes « receveurs » pour tous les marqueurs des QTL, à l’exception des marqueurs définissant le QTL que l’on veut isoler pour lesquels on choisi les hétérozygotes. On réalise ensuite des croisements successifs avec le parent « receveur », en sélectionnant à chaque génération pour l’hétérozygotie au niveau du locus différentiel (par génotypage microsatellitaire) (Figure 3). À la fin de l’expérience, au bout de 9 générations (N9), on aboutit ainsi à des animaux homozygotes « receveurs » pour l’ensemble du génome à l’exception du locus différentiel pour lequel ils seront hétérozygotes. En croisant les individus N9 entre eux (N9F1) et en sélectionnant cette fois pour l’homozygotie « donneuse » au niveau du locus différentiel, on aboutit à des individus congéniques pour ce locus. L’on croise ensuite de tels animaux entre eux et on établit ainsi une lignée congénique. Il est à noter qu’à chaque génération, le degré d’hétérozygotie du génome diminue de 50% et corollaire de ceci, le degré d’homozygotie « receveur » augmente d’autant. Si bien que en N9 le génome sera à 99,25% « receveur », les 0,75% restants étant majoritairement dû au locus différentiel (Figure 4).

e) L’approche du gène candidat

L’objectif ultime de ce type d’étude génétique est l’identification du ou des gènes qui sous-tendent le phénotype étudié dans la région chromosomique mise en évidence. La taille des QTL identifiés dans les croisements expérimentaux est relativement élevée (généralement entre 5 et 50cM). Le génome de rat contient environ 30000 gènes, et la longueur de sa carte génétique est d’environ 2200cM. La densité moyenne est donc de 13,5 gènes par cM, et l’on peut en déduire que pour les QTL généralement repérés, il y aurait entre 66 et 650 gènes potentiellement candidats.

Cette faible résolution peut être amélioré par une augmentation importante des

cohortes étudiées (jusqu’à plusieurs milliers d’individus). Une telle approche n’est à

la portée que de très gros laboratoires. Les chercheurs de laboratoires plus modestes

se trouvent donc en présence d’une large collection de gènes parmi lesquels il faut

identifier celui responsable du phénotype. Face à ce problème l’approche du gène

candidat paraît la plus indiquée. Celle-ci consiste à repérer parmi tous les gènes

candidats positionnels (ceux qui sont localisés dans le QTL), un (ou quelques) gène(s)

dont le produit exerce une fonction telle qu’il pourrait être impliqué dans le phénotype

(19)

(candidat fonctionnel). Cette approche a déjà porté ses fruits dans l’identification de gènes associés à plusieurs maladies mendélienes chez l’humain. Grâce à la réalisation et la mise à disposition dans les bases de données de la séquence génomique de rat (quoique toujours à l’état « brouillon »), nous sommes aujourd’hui en mesure d’appliquer cette approche du gène candidat dans le cas de cet animal modèle.

f) L’analyse d’expression de gènes à large échelle

L’approche du gène candidat s’est avérée extrêmement puissante en ce qui concerne l’analyse de l’architecture génétique de divers traits complexes. Pourtant, il existe certains traits d’intérêt pour lesquels il y a peu de gènes candidats a priori définis sur une base biologique. Il est dès lors difficile d’identifier des gènes candidats potentiels sur la seule base de leur fonction. A l’inverse, il existe d’autres traits

complexes, telle en particulier la sensibilité au cancer, où les candidats fonctionnels sont légion. Dans ce cas, il est très difficile de choisir les gènes candidats dans une région génomique relativement large et de décider auxquels il faut accorder la priorité pour les études fonctionnelles subséquentes. L’on peut alors rapidement se retrouver dans une situation de «cauchemar logistique» si l’on décide quand même d’étudier tous les candidats à la fois. En l’absence de gènes candidats a priori, la sélection des loci choisis pour validation doit être basée en partie sur une combinaison de

cartographie de QTL et d’expériences de cartographie fine et pour l’autre partie sur

«l’intuition biologique». Il existe donc une certaine nécessité pour une approche expérimentale supplémentaire dans la chasse au QTN (quantitative trait nucleotide), qui permettrait de combler le vide entre la cartographie de QTL qui génère des centaines de gènes et les techniques de validation que l’on ne peut appliquer qu’à une dizaine de gènes candidats au plus (Wayne et McIntyre 2002).

Une des méthodes qui peut être utilisée afin de ramener le nombre de gènes à

tester à un chiffre raisonnable est l’analyse d’expression génique quantitative. En

effet, plusieurs études indiquent que des variations de régulation sont importantes

dans une série de traits complexes dans une série d’organismes, (Mackay 2001, Stam

et Laurie 1996, Doebley 1992). Des méthodes d’étude d’expression quantitatives

comme les puces à ADN (DNA microarrays), peuvent révéler des variations de

régulation de gènes dans le cadre de traits complexes y compris pour des traits

(20)

complexes pour lesquels il n’existe pas de candidat a priori. La seule utilisation de puces à ADN génère des informations importantes en ce qui concerne la variation entre lignées, mais ne permet pas de lier cette variation à un phénotype particulier. En combinant la cartographie de QTL et l’étude massive, parallèle, d’expression génique pour les mêmes lignées, l’on est en mesure d’identifier des gènes candidats

positionnels pour un certain phénotype, gènes dont l’expression est divergente entre les lignées étudiées. Le but de cette approche n’est pas de générer une liste exhaustive de gènes candidats, ni ne s’agit-il d’une approche pour établir un lien fonctionnel entre un gène et un phénotype. Il s’agit plutôt d’identifier un nombre « gérable » de gènes pour les études de validation. Cette approche a déjà porté ces fruits, notamment chez la drosophile (Wayne et McIntyre 2002), mais également chez le rat où le groupe d’Aitman a pu identifier Cd36 comme étant un gène causal dans la résistance à

l’insuline dans une souche de rat hypertendu (Aitman et al 1999).

(21)

des cas de cancer du sein (à droite). Les gènes connus pour leur implication dans l’agrégation familiale de la maladie (BRCA1 et 2), ne sont responsables que d’environ 20 % de l’ensemble des cas familiaux.

La plupart des variants génétiques qui contribuent au risque de développer un cancer du sein sporadique restent inconnus. Beaucoup de ces facteurs peuvent interagir avec des facteurs environnementaux comme, par exemple, les radiations ionisantes dont on sait par des études

épidémiologiques et expérimentales qu’elles peuvent être une cause de cancer. (Figure d’après Balmain et al. 2003)

(22)

Figure2:

Exemple d’un microsatellite et de sa détection.

Trois allèles différents d’un locus microsatellite composé de répétitions CA sont représentés. Les demi- flèches représentent les amorces PCR spécifiques du locus. En dessous, une illustration des différents types de migration sur gel qui seraient observés avec les différentes combinaisons allèliques indiquées.

(D’après Silver 1995)

(23)

Figure 3:

Principe de la génération d’une lignée congénique.

(D’après Silver 1995)

Figure 4:

Représentations graphiques de l’hétéro et de l’homogénéité génétique durant la génération d’une lignée congénique. (D’après Silver 1995)

(24)

But de ce travail

Ce travail s’inscrit dans le cadre de la recherche d’allèles de sensibilité ou de résistance au cancer mammaire, un trait génétique complexe, en utilisant le rat comme animal modèle. Il comporte quatre parties.

La première partie a consisté en l’étude génétique d’un nouveau croisement entre une souche de rat sensible au cancer mammaire (SPRD-Cu3) et une souche résistante (WKY), le but étant d’identifier de nouveaux loci associés à la sensibilité au cancer mammaire, différents de ceux déjà détectés par d’autres études (Shepel et al.

1998, Lan et al. 2001). Pour cela nous avons testé trois phénotypes tumoraux distincts (agressivité, multiplicité et latence tumorale).

Une deuxième partie a consisté en la création et l’étude phénotypique de lignées congéniques SPRD-Cu3.WKY- pour chacun des loci identifiés dans l’analyse génétique. Ceci dans le but de confirmer « physiquement » l’existence des QTL prédits par l’analyse statistique et de quantifier l’effet d’un allèle WKY dans chacune de ces régions sur le phénotype de la lignée parentale SPRD.

Dans la partie trois nous avons recherché des candidats dans les régions des QTL identifiés au préalable. Pour cela nous avons étudié les différences d’expression génique entre les deux souches parentales et nous nous sommes intéressés à la

localisation chromosomique des gènes exprimés de façon divergente entre SPRD et WKY. Les gènes à la fois exprimés différentiellement et localisés dans l’un des QTL constituent des candidats de choix. Nous avons alors testé la candidature de quelques- uns de ces gènes candidats.

Dans la dernière partie, nous avons porté notre intérêt sur la recherche d’un

mécanisme de résistance ou de sensibilité qui serait commun à plusieurs souches de

rat. Pour cela nous avons analysé l’expression génique de deux souches résistantes

(COP et WKY) et de deux souches sensibles (SPRD et WF), le but étant de déterminer

s’il existe un profil d’expression typique des souches résistantes ou sensibles et

d’essayer de le relier à un mécanisme biologique spécifique.

(25)

Résultats

1) Croisement WKY x SPRD-Cu3 : cartographie de QTL a) Analyse phénotypique

Afin de permettre l'identification de nouveaux locus de sensibilité au cancer mammaire chez le rat, un croisement entre une souche résistante (WKY-E56) et une souche sensible (SPRD-Cu3) a été organisé au laboratoire de Biologie du

Développement par J.F Laes et X. Quan, projet auquel j’ai été amené à collaborer à partir du mois de septembre 2000. Pour cela, un croisement en retour (SPRD X WKY)F1 X SPRD a été étudié. Nous avons généré 230 femelles N2 lesquelles ont été traitées avec le carcinogène DMBA (7,12-diméthyl-benz-α-anthracène). 187 femelles ont survécues à l’administration du carcinogène et ont été testées pour l'apparition de tumeurs mammaires. Afin de générer les données phénotypiques, les femelles ont été palpées une fois par semaine, ceci à partir de la quatrième semaine post-DMBA. À chaque palpation, le nombre de tumeurs par animal et la taille de chaque tumeur ont été relevées. Trois phénotypes tumoraux distincts ont été pris en considération ; la multiplicité tumorale (le nombre de tumeurs développées par chaque animal à la fin de l’expérience), la latence tumorale (la période écoulée entre l’induction et la découverte par palpation d’une première tumeur) et l’agressivité tumorale (la vitesse de croissance). 95,2% des femelles injectées ont développé au moins une tumeur mammaire (le nombre de tumeurs par animal variant de 1 à 12). Toutes les femelles ont été euthanasiées 19 semaines après le traitement carcinogène et nous avons prélevé des échantillons de tumeurs pour chaque femelle.

b) Analyse de liaison et identification génétique des QTL.

Les 187 femelles N2 ont été génotypées pour 118 marqueurs microsatellites autosomaux polymorphes ségrégant dans le croisement de retour. Des recherches de liaison génétique ont été effectuées en collaboration avec l’équipe du Prof. M.

Georges de l'ULg. En utilisant TWOPOINT, nous avons dans un premier temps

effectué des analyses de liaison deux par deux entre toutes les paires de marqueurs

possibles afin de les grouper par groupe de liaison. L’ordre des marqueurs à l’intérieur

(26)

du groupe de liaison a ensuite été établi en utilisant l’option BUILD du logiciel ad Hoc CRIMAP. Il s’en suit une carte qui couvre 1754 cM (Kosambi) en longueur et possède une densité moyenne d’un marqueur tous les 22.4 cM. Le degré

d’informativité moyen de la carte est de 78% et selon la position génomique ce contenu informatif varie entre 28% et 100%.

c) Cartographie de QTL

Sept QTL reliés à la sensibilité au cancer mammaire ont pu être identifiés en utilisant une approche non-paramétrique basée sur la somme des rangs, implémenté par le logiciel HSQM, (Coppieters et al. 1998). Quatre de ces QTL sont liés à la multiplicité tumorale et sont localisés sur les chromosomes 1, 2 et 5 respectivement.

Un QTL contrôlant la latence a été identifié sur le chromosome 9 et deux QTL reliés à l’agressivité tumorale ont été localisés sur les chromosomes 10 et 18. L’ensemble des lod scores associés à ces QTL excèdent la valeur de 1.75 qui correspond au seuil de suggestivité dans notre analyse (voir Matériel et Méthodes). Le QTL d’agressivité sur le chromosome 18 excède le lod score 3.3 qui correspond au seuil de significativité suggéré par Kruglyak et Lander (1995b). De plus, il est à noter que trois autres QTL (situés sur les chromosomes 1ptel, 9 et 10) atteignent un lod score de 3, qui est proche du seuil de significativité. Ces QTL peuvent dès lors être qualifiés de fortement suggestifs.

c

1

) QTL de multiplicité

Le chromosome 1 contient deux QTL contrôlant la multiplicité tumorale, l’un

situé en 1q télomérique (1qtel), voisin du marqueur D1Rat88 associé à un lod score de

3.0 et l’autre en 1ptel, associé à un lod score de 2.4 (pic à D1Rat246) (Figure 5a). Il

faut par ailleurs noter que pour le QTL situé en 1qtel, c’est l’allèle SPRD qui

augmente le nombre de tumeurs alors qu’en ce qui concerne le QTL situé en 1ptel

c’est, de façon surprenante, l’allèle WKY qui augmente la sensibilité. Nous sommes

donc en présence d’un allèle cryptique à cet endroit. Un troisième QTL de multiplicité

a été identifié sur le chromosome 2. La position la plus vraisemblable de ce QTL

coïncide avec le marqueur D2Rat4 à la position 34 cM (lod score de 2,6) (Figure 5a),

cependant l’intervalle de confiance pour ce QTL est assez large, couvrant 140cM sur

(27)

ce chromosome. En ce qui concerne ce dernier cas, comme pour celui situé en 1ptel, le QTL est cryptique puisque c’est l’allèle WKY qui confère une sensibilité accrue.

Le QTL situé sur le chromosome 5 est associé à un lod score de 2.5 à la position 57 cM. L’intervalle de confiance qui lui est associé couvre environ 60 cM (Figure 5a). Le profil de lod est assez large et tri-modal, ce qui pourrait suggérer l’existence de deux QTL distincts aux positions 25 cM et 86 cM du chromosome 5. Ceci pourrait générer un QTL « fantôme » entre ces deux marqueurs si on considère un modèle de QTL unique. Nous avons dès lors analysé ces données en utilisant la cartographie par intervalle composite (Composite Interval Mapping) via le logiciel QTL cartographer.

Nous avons observé par cette analyse un signal maximal aux alentours de la position 57 cM comme dans notre première analyse, observation qui n’appuie pas l’hypothèse d’un QTL « fantôme ». L’étendue du profil de lod score suggère néanmoins que plusieurs QTL influant le nombre de tumeurs pourraient exister sur ce chromosome.

c

2

) QTL de latence

Nous avons identifié un locus associé à la latence tumorale situé à la position 17 cM du chromosome 9 (lod score de 3.0). L’intervalle de confiance pour ce QTL est assez réduit, comprenant les 20 cM proximaux du chromosome (Figure 5b). De façon inattendue, c’est l’allèle WKY qui diminue la latence tumorale, il s’agit donc une nouvelle fois d’un QTL cryptique. Cette région n’a pas été associée à l’un des deux autres phénotypes (multiplicité et agressivité).

c

3

) QTLd’agressivité

Nous avons découvert deux QTL reliés à l’agressivité tumorale sur les

chromosomes 10 et 18, associés à des lod scores de 3.0 et 3.3 respectivement (Figure

5b). La position la plus vraisemblable pour le QTL sur RNO10 est 95 cM, l’intervalle

de confiance comprenant presque tout le chromosome. Pour le QTL situé sur RNO18,

la position la plus vraisemblable est 40 cM, l’intervalle de confiance s’étendant de la

position 20 cM à la position 50 cM. Pour ces deux QTL, c’est l’allèle SPRD qui

augmente l’agressivité tumorale. Il est utile de mentionner ici qu’aucune analyse

génétique n’a jamais été menée sur le phénotype d’agressivité tumorale et que ces

deux QTL sont donc les premiers qui ont été reliés à ce phénotype.

(28)

2) Analyse histopathologique des tumeurs

Plusieurs animaux de la génération N2 ont développé des tumeurs atteignant une taille de 4,0 à 5,5 cm en diamètre une à trois semaines après leur première

détection. Ce phénomène n’a pas été observé dans la lignée parentale SPRD-Cu3 où la taille maximale des tumeurs ne dépassait jamais 4 cm, même 7 à 8 semaines après la première détection. Nous avons voulu savoir si le caractère agressif que nous avons défini comme une mesure de la croissance tumorale était associée à l’évolution histopathologique de la tumeur. Dans ce but, nous avons effectué une analyse histopathologique des tumeurs agressives en collaboration avec le Prof. J. Russo du Fox Chase Cancer Center à Philadelphie. Ceci nous a permis d’établir que les tumeurs agressives sont effectivement différentes des tumeurs habituelles. Non seulement leur vitesse de croissance est plus élevée, mais ces carcinomes progressent plus

rapidement vers un état invasif, stade ultime avant la dissémination métastasique.

Histologiquement, les tumeurs agressives ont été décrites comme étant des adénocarcinomes invasifs de type « cribriforme », tandis que les tumeurs moins agressives ont été classifiées comme étant des adénocarcinomes de type papillaire I et II, ce qui correspond au type de tumeurs classiquement rencontrés chez les rats SPRD.

3) Les lignées congéniques

a) Génération des lignées congéniques.

Après l’identification des loci associés à la sensibilité au cancer mammaire,

nous avons entrepris de générer des lignées congéniques pour chacun des loci pris

isolément. Les lignées congéniques sont obtenues par des croisements successifs (au

départ d’individus N2) avec le parent sensible (SPRD-Cu3), en sélectionnant à chaque

génération pour l’hétérozygotie (WKY/ SPRD-Cu3) au niveau du locus différentiel

(par génotypage microsatellitaire). À la fin de l’expérience, au bout de 9 générations,

on aboutit ainsi à des animaux homozygotes SPRD-Cu3 pour l’ensemble du génome

à l’exception du locus différentiel pour lequel ils sont hétérozygotes. En croisant les

individus N9 entre eux (N9F1) et en sélectionnant cette fois pour l’homozygotie

(29)

«donneuse» (WKY/WKY) au niveau du locus différentiel, on aboutit à des individus congéniques pour ce locus.

Au cours de ce travail nous avons entamé la génération de lignées congéniques pour chacun des locus identifiés. Ce travail a été mené à terme et nous disposons actuellement de 7 lignées congéniques établies. En raison de la quantité de travail associée à cette tâche et surtout du nombre considérable d’animaux à générer, ce travail a été scindé en 2 parties. Dans un premier temps, nous avons généré quatre lignées complètement congéniques (génération N9F1 et au-delà) pour les loci situés sur les chromosomes 2, 5, 9 et 18. Dans un deuxième temps, nous avons entamé la génération des lignées congéniques pour les QTL restants, à savoir ceux situés sur les chromosomes 1 (2 lignées congéniques) et 10, travail qui s’est achevé en toute fin de cette thèse. Ces souches n’ont pas encore été phénotypées. Plus de 3000 rats et plus de 30000 génotypages ont été nécessaires à la réalisation de ce travail.

b) Phénotypage des lignées congéniques.

Le phénotype des animaux congéniques N9F1 a été établi pour un certain nombre de ces lignées. Les femelles ont été traitées par une seule dose intragastrique de DMBA à l’âge de 55jours. La tumorigenèse a été suivie par palpation une fois par semaine à partir de la quatrième semaine après injection, et ceci pendant 19 semaines.

À chaque palpation, le nombre de tumeurs par animal et la taille de chacune des tumeurs ont été relevés. Dans le cadre de cette thèse, nous avons phénotypé trois lignés congéniques à savoir celles qui sont dérivées à partir des QTL situés sur le chromosome 5, 9 et 18. En parallèle, nous avons également phénotypé une collection de femelles de la souche parentale SPRD-Cu3, phénotype qui nous a servi de « ligne de base » par rapport à laquelle toutes les autres lignées ont été comparées. Bien entendu, pour chaque lignée étudiée, les phénotypes de multiplicité, de latence et d’agressivité tumorale ont été établis. Les valeurs phénotypiques rapportées ci-après sont exprimées en terme de moyenne ± l’erreur standard (SE). Les comparaisons des divers groupes entre eux ont été effectuées en utilisant la fonction «pairwise

comparison» du logiciel SigmaStat, qui effectue soit un test t, soit un test de la somme

des rangs de Mann-Whitney en fonction du fait que les valeurs phénotypiques dans

les deux catégories sont normalement distribuées ou non. Ces tests engendrent une

(30)

valeur de p qui traduit la force statistique de la différence entre les deux groupes étudiés. Un résumé des résultats de phénotypage des lignées congéniques est présenté dans le tableau 1. Les résultats sont présentés ensuite, plus en détail, lignée par lignée.

Nom de la lignée N Multiplicité (#) p-value / SPRD Significatif

SPRD-Cu3 48 11,23 ± 0,51 N/A N/A

Congenic 5T (Mcstm1) 14 3,93 ± 0,64 p<0,001 oui

Congenic 9 (Mcstl1) (WKY/WKY) 20 9,45 ± 0,56 p=0,045 non

Congenic 9 (Mcstl1) (WKY/SPRD) 23 9,35 ± 0,51 power of test to low non

Congenic 18 (Mcstm2) (WKY/WKY) 46 7,6 ± 0,45 p<0,001 oui

Congenic 18 (Mcstm2) (WKY/SPRD) 8 10,13 ± 0,61 power of test to low non

Nom de la lignée N Latence (jrs) p-value / SPRD Significatif

SPRD-Cu3 59 43,86 ± 0,95 N/A N/A

Congenic 5T (Mcstm1) 16 53,38 ± 2,45 p<0,001 oui

Congenic 9 (Mcstl1) (WKY/WKY) 25 51.0 ± 1,97 p<0,001 oui

Congenic 9 (Mcstl1) (WKY/SPRD) 25 48,96 ± 1,86 p=0,012 oui

Congenic 18 (Mcstm2) (WKY/WKY) 54 45,91 ± 1,27 p=0,191 non

Congenic 18 (Mcstm2) (WKY/SPRD) 14 47,21 ± 1,62 p=0,061 non

Nom de la lignée N Agressivité (cm/sem) p-value / SPRD Significatif

SPRD-Cu3 59 0,7 ± 0,03 N/A N/A

Congenic 5T (Mcstm1) 18 0,617 ± 0,08 p=0,222 non

Congenic 9 (Mcstl1) (WKY/WKY) 25 0,72 ± 0,04 p=0,725 non

Congenic 9 (Mcstl1) (WKY/SPRD) 24 0,638 ± 0,04 p=0,207 non

Congenic 18 (Mcstm2) (WKY/WKY) 28 0,787 ± 0,05 p=0,188 non

Congenic 18 (Mcstm2) (WKY/SPRD) 14 0,638 ± 0,04 p=0,396 non

Tableau 1:

Vue d’ensemble des données phénotypiques observées dans les lignées

congéniques étudiées. N représente le nombre d’animaux dans la population, les valeurs phénotypiques sont présentées sous forme de moyenne ± SE

.

p value / SPRD désigne la valeur p associé à la

comparaison de la population en question par rapport à la population SPRD contrôle.

c) Lignée congénique du chromosome 5

Nous avons construit une lignée congénique de rat, SPRD-Cu3.WKy- D5Rat190/D5Rat114, le segment différentiel de laquelle couvre 74 cM sur le chromosome 5 de rat (RNO5). On a appelé cette lignée Congenic5. Cet intervalle couvre l’entièreté de l’intervalle de confiance du QTL identifié sur le chromosome 5.

Cet intervalle de confiance a été défini comme étant le plus petit segment contigu de

chromosome qui contient 95% de 1000 échantillons de «boostrap», dans l’analyse de

liaison génétique. Nous avons montré que la lignée Congenic5 était homozygote

(31)

SPRD-Cu3 pour l’ensemble des marqueurs anonymes situés dans les autre QTL de sensibilité identifiés dans notre étude de liaison (sur les chromosomes 1,2,9,10,18 respectivement), (voir le tableau 2 pour l’ensemble des marqueurs utilisés). Cette lignée a été phénotypée pour la sensibilité au cancer mammaire induite au DMBA à la génération N9F2. Les rats contrôles SPRD-Cu3 (n=43) ont développés 11.23 ± 0.506 carcinomes par rat en moyenne 19 semaines post-DMBA. Les animaux de la lignée Congenic5 (n=14) avaient en moyenne 3.93 ± 0.64 tumeurs par animal, ce qui équivaut à une réduction de 65% de la charge tumorale par rapport à la lignée parentale sensible. Un test de la somme des rangs de Mann-Whitney a mis en évidence que la différence entre les deux groupes est statistiquement robuste

(p<0,001). Ce résultat constitue une confirmation « physique » du fait que la région flanquée par les marqueurs D5Rat190 et D5Rat114 contient au moins un locus de sensibilité au cancer mammaire que l’on a appelé Mcstm1 (Mammary Cancer

Susceptibility, Tumor Multiplicity 1). De plus, il est apparu lors du phénotypage que les animaux Congenic5 présentaient une latence plus élevée que la population

parentale. En effet, les rats Congenic5 développaient des tumeurs en moyenne 53,38 ± 2,45 jours après le traitement carcinogène, à comparer à la latence moyenne de 43,86

± 0,95 jours observés chez les rats contrôles. La différence entre ces deux groupes est

statistiquement robuste (p<0,001). Le QTL Mcstm1 a donc également un effet sur la

latence tumorale qui va dans le sens de la résistance (augmentation du temps de

latence).

(32)

Chromosome 1ptel: D1Rat88, D1Rat306, D1Rat81, D1Rat77, D1Rat324 Chromosome 1qtel: D1Rat260, D1Rat20, D1Rat15, D1Rat1, D1Rat246 Chromosome 2: D2Mit29, D2Rat4, D2Rat6, D2Rat14

Chromosome 5: D5Rat2, D5Rat138, D5Rat100, D5Rat92, D5Rat196, D5Rat26, D5Rat184, D5Rat114, D5Rat39

Chromosome 9: D9Rat139, D9Rat41, D9Rat158

Chromosome 10: D10Rat97, D10Rat203, D10Rat19, D10Rat116, D10Rat 71, D10Rat47

Chromosome 18: D18Rat102, D18Rat55, D18Rat89,

D18Wox16,D18Wox13, D18Wox6, D18Wox11, D18Rat14, D18Rat45, D18Rat44

Tableau 2:

Liste des marqueurs utilisés, situés dans les QTL. Ce sont ces marqueurs qui ont été utilisés pour le génotypage du segment différentiel dans les lignées congéniques et pour s’assurer de l’homozygotie WKY dans les autres QTL.

d) Lignée congénique du chromosome 9

Nous avons généré une lignée congénique de rat, SPRD-Cu3.WKY-

D9Rat139/D9Rat158, qui se caractérise par un segment WKY du chromosome 9 de 21cM. Ce segment couvre et borde l’intervalle de confiance du QTL situé sur RNO9, défini comme étant relié à la latence tumorale. L’homozygotie SPRD-Cu3 dans les autres QTL identifiés a été établi pour cette lignée que nous avons appelé Congenic9.

Nous avons établi le phénotype de cette lignée. Aucune différence statistiquement valable par rapport à la lignée parentale SPRD-Cu3 n’a été observée en ce qui concerne les phénotypes de multiplicité et d’agressivité tumorale. Par contre, nous avons pu établir qu’il existe une différence en terme de latence. En effet, les animaux Congenic9 homozygotes WKY pour le locus différentiel (n=25) ont une latence moyenne de 51 ± 1,97 jours qui est significativement différente de celle des animaux contrôle (n= 59) : 43,86 ± 0,86 jours, (p<0,001). Nous avons également établi le phénotype d’une population hétérozygote SPRD-Cu3/WKY au locus différentiel de Congenic9 (n=25). Dans ce cas, nous observons également une augmentation de la latence, celle-ci étant de 48,96 ± 1,86 jours dans cette population ce qui est

significativement différent de la latence observée dans le groupe contrôle (p=0,012).

Nous observons donc un « effet de dose » à ce locus puisque le phénotype de

l’hétérozygote est intermédiaire entre la Congenic9 homozygote WKY au locus et la

Références

Documents relatifs

b) - Faire l’étude des variations simultanées de x et y sur R .On précisera les points + où les tangentes sont verticales et horizontales ainsi que les points

Concours externe d’Agent de Maîtrise Territorial 2019 – Spécialité « BTP, VRD » 1.. CENTRE DE GESTION DE LA FONCTION PUBLIQUE TERRITORIALE

[r]

Reproduire la figure ci-contre puis mesurer les longueurs de ses côtés et de ses diagonales.... Sur une feuille quadrillée, tracer

traitement (traitement orthopédique ou programme chirurgical d’égalisation par allongement ou raccourcissement).. Allongement sur clou Allongement

• Surélévation anticipée du lit dans la partie amont de l’élargissement pour réduire l’érosion dans le canal vers l’amont. • Limitation de la surélévation ∆H par

Dans un triangle rectangle, il existe un coefficient multiplicateur permettant de passer de la longueur de l'hypoténuse à la longueur d'un côté adjacent à un angle choisi..

Aide 1 : Je vous conseille de faire la figure à main levée et d’y indiquer les longueurs connues et la longueur cherchée.. En effet, on cherche la longueur des des morceaux de