• Aucun résultat trouvé

I.2.1 Gène

Nous considérons qu’un gène est une entité insécable et qu’il a une

orienta-tion définie par la direcorienta-tion de sa transcriporienta-tion par l’ADN polymérase, de

l’extrémité 5’ (start) à l’extrémité 3’ (end). L’extrémité d’un gène nommé A sera notée (A, s) s’il s’agit de l’extrémité 5’ et (A, e) s’il s’agit de l’extrémité 3’.

5' 3' 3' 5' chromosome Transcription et épissage A B C gène A gène B notre modélisation du chromosome d'origine ARNm les plus courts

sans la coiffe en 5' et sans la queue poly-A

exon UTR

gène C

Figure I.6 – Modélisation des chromosomes avec nos gènes. À

mi-hauteur, trois gènes codant pour des protéines sont représentés sur un chro-mosome commun. Les UTRs sont représentés par des rectangles quadrillés et les exons par des rectangles blancs. Les gènes A et C sont encodés sur le brin d’ADN du dessus, dont l’orientation 5’-3’ va de la gauche vers la droite. Le gène B est encodé sur le brin d’ADN complémentaire. Le gène C contient deux sites de début de transcription représentés par des flèche coudées. Au dessus de chaque gène sont représentés leurs ARNm les plus courts après épissage. La coiffe 5’ et la queue poly-A ne sont pas représentées. Enfin, tout en bas, il y a notre modélisation d’un chromosome en une liste ordonnée de trois gènes orientés. L’ordre des gènes correspond à l’ordre des extrémités 5’ des transcripts les plus courts et leurs localisations sont matérialisées par les lignes en pointillées.

I.2.2 Chromosome

Un chromosome sera, à notre échelle, une liste ordonnée de gènes. Tous nos chromosomes sont linéaires. Nous ne considérerons pas les chromosomes circulaires spécifiques aux procaryotes et nous ne considérons pas non plus les plasmides ou les chromosomes circulaires des organites de cellules eucaryotes comme la mitochondrie ou le chloroplaste.

Quand nous représenterons un chromosome nous définirons, parfois ex-plicitement parfois imex-plicitement, une origine de la liste des gènes du chromo-some. Cette origine est choisie arbitrairement. Si un chromosome est composé des gènes ABCDE, les uns à la suite des autres, la liste peut être ordonnée de A à E ou de E à A. Le choix de l’origine définit une orientation de référence (ou un ordre de référence) de l’origine jusqu’à l’extrémité opposée. Si le gène A est choisi comme origine, l’orientation de référence va de A à E : le 1er gène est A, le 2ème est B, . . . et le dernier gène est E. Nous noterons parfois un chromosome, c, composé de N gènes, de la manière suivante

c = [g1, . . . , gN] = [gk]k∈[1,N ]

avec gkle kèmegène du chromosome c. Dans ce cas, l’origine du chromosome c est le gène g1 et l’orientation de référence va de g1 à gN. L’orientation du gène

gk dans ce chromosome est notée o(gk); elle est égale à +1 si la transcription du gène gk est réalisée dans la même direction que l’orientation de référence du chromosome c, dans le cas contraire o(gk) = −1.

Comme nous l’écrivions précédemment, les gènes sont indexés par leurs extrémités 5’ et par la suite nous considérerons qu’à notre échelle d’étude les gènes ne se chevauchent pas. Une explication graphique est donnée par la figure I.7.

Dans un chromosome, un intergène est une région chromosomique située entre deux gènes adjacents, voir figure I.8. Les deux régions aux extrémités d’un chromosome sont appelées télomères. Les deux extrémités de gènes qui flanquent un intergène sont les flancs de cet intergène et un télomère a un

flanc unique. Par exemple, dans la figure I.8

• les extrémités (B, e) et (C, s) sont les deux flancs du 2ème intergène • et l’extrémité (L, e) est le flanc unique du télomère de droite.

Dans les espèces métazoaires que nous étudierons les chromosomes sont soit autosomiques, soit sexuels. Les chromosomes autosomiques sont souvent nommés par un chiffre (1, 2, 3, . . . ) alors que les chromosomes sexuels sont habituellement nommés par des lettres (X et Y pour l’humain, W et Z pour le poulet).

A

B D C

E

A C B D E

A B C D E

gènes ordonnés par les extrémités les plus à gauche

A B C D E

chromosome avec gènes

en échelle physique E D B C A A B C D E

un ordre de gènes ordre des gènes inverse

gènes ordonnés par leus extrémités 5'

Figure I.7 – Indexage des gènes. La première colonne du tableau

représente un chromosome avec origine le gène A. Trois représentations de ce chromosome sont visibles en dessous. De haut en bas, la première image montre les localisations des gènes et leurs extensions spatiales. Dans cet ex-emple le gène B chevauche entièrement les gènes C et D. La deuxième image représente l’ordre des gènes lorsqu’ils sont ordonnés par leur 1ère extrémité (la plus à gauche, la plus proche de l’origine) et la troisième image donne l’ordre des gènes lorsqu’ils sont ordonnés par leur extrémité 5’. La deuxième colonne représente les mêmes informations lorsque l’ordre de référence du chromosome est inverse, de E vers A. L’origine est alors le gène E. Cette seconde colonne illustre bien que, parmi les deux indexages, l’indexage des gènes par leurs extrémités 5’ est le seul à générer un ordre consistant d’une orientation du chromosome à l’autre.

A B C K L

télomère de gauche 1er intergène 2nd intergène dernier intergène télomère de droite

Figure I.8 – Intergènes et télomères d’un chromosome. L’extrémité

de gauche du chromosome est par convention l’origine du chromosome et l’orientation de gauche à droite correspond à l’orientation de référence.

I.2.3 Génome

Un génome est un ensemble de chromosomes. Dans notre étude il s’agit du génome d’une cellule représentative d’un individu, lui-même représentatif d’une espèce.

I.2.4 Espèce

Il est courant d’approximer une espèce à un ensemble d’individus interféconds dont la descendance est féconde. Entre deux espèces différentes, des incom-patibilités morphologiques et/ou génétiques empêchent systématiquement la fécondation, le développement de l’embryon ou alors rendent le descendant in-capable de se reproduire. C’est le cas du mulet, hybride issu de l’accouplement d’un âne (Equus asinus) et d’une jument (Equus caballus). Comme nous l’avons expliqué précédemment nous considérerons que le génome d’un indi-vidu est représentatif des autres génomes de l’espèce car le polymorphisme intra-spécifique des espèces que nous étudierons semble suffisamment faible [Leffler et al., 2012] pour le permettre. Une espèce sera donc caractérisée par un génome de référence.