• Aucun résultat trouvé

Organisation physique et génétique des génomes

N/A
N/A
Protected

Academic year: 2022

Partager "Organisation physique et génétique des génomes"

Copied!
59
0
0

Texte intégral

(1)

Organisation physique et

génétique des génomes

(2)

Table des matières

• Organisation physique de l’ADN

– Nucléosomes – Chromatine

• Principes d’organisation des génomes

– Exemple d’un génome bactérien – Exemple du génome humain

• Evolution des génomes: duplication et

recombinaison

(3)

§ Structures organisées qui contiennent l’ADN

Les molécules d’AND sont arrangées avec des protéines appelées histones de manière à tenir dans un espace très réduit. L’ensemble ADN + histones est appelé

chromatine

§ On peut avoir plusieurs chromosomes dans le noyau

Ils sont organisés en paires de copies parentales

(diploïde) ou seuls (haploïde) ou encore en nombre pair de copies quelconque (polyploïde)

Chromosomes

(4)

La structure du

chromosome eucaryote

Différents niveaux de compaction

Chromatine =

ADN + protéines

(histones +

non-histones)

(5)

Nucléosomes

(6)

Nucléosomes

(7)

Nucléosomes et organisation de

l’ADN

(8)

Nucléosomes

(9)

Nucléosomes et réplication

(10)

Nucléosomes et transcription

(11)

Chromatine et inactivation génique

(12)

Chromatine et transcription

(13)

Organisation génétique des

génomes

(14)

Taille des génomes

• La longueur du génome et le nombre de gènes sont corrélés chez les procaryotes, pas chez les eucaryotes

• Le pourcentage de séquence codantes (densité) est très

variable en fonction des

organismes

(15)

E. coli 4,7 Mb Protozoa

Amoeba dubia 700 000 Mb

MAN 3400 Mb

Xenopus 3100 Mb Amphibia

Newt 100 000 Mb

Dipnoi Lungfish 150 000 Mb

Taille des génomes et complexité

(16)

Gènes essentiels

• Un gène dont la délétion est létale est dit essentiel

• La recherche du

sous ensemble

minimal de gènes

pour parvenir à faire

vivre un organisme

vivant est toujours

d’actualité (environ

500 actuellement)

(17)

Un génome bacterien : E.coli

(18)

Diversité des génomes bactériens

Le nombre de plasmides des génomes bactériens varie de 0 à plus de 20

(dans ce cas 36% du génome)

(19)

Les contraintes en GC se traduisent au niveau protéique

• Les génomes riches ou pauvres en GC ont des possibilités restreintes en termes de séquences protéiques

• Le niveau de GC dans les génomes dépend de facteurs évolutifs et

environnementaux

(20)

Le génome de la mitochondrie

• Le génome de la

mitochondrie ressemble fortement à celui d’une petite bactérie

• Il n’est pas

autosuffisant: besoin d’import de certains composés depuis la cellule

• Idem pour les

chloroplastes

(21)

ATG Stop polyA

promoteur

gène

ARNm

protéine exon intron

transcription, maturation

traduction

AAAAAAAA

5’UTR 3’UTR UTR: régions transcrites non-traduites

Tailles moyennes

Gene 45 kb

CDS 1500 nt

Exon (interne) 145 nt

Intron 5200 nt

5'UTR 210 nt

3'UTR 740 nt

Intron / Exon

Nombres d'introns: 6 ±3 introns / kb CDSIntrons / (introns + CDS): 92%

Epissage alternatif dans plus de 30% des gènes

Structure des gènes humains

(22)

POL II

promoter polyadenylation site

transcription maturation

5'p m7Gppp AAAAAAAAAA

small nucleolar

RNA mRNA

N-myc gene

N-cym gene

IA IB II III III II I

Gènes partiellement superposés

Petit ARN nucléolaire dans un intron de gène codant

Chevauchement?

(23)

tRNA (70-100 nt) : ~ 350

rRNA :

18S (1.8kb), 5.8S (160 nt), 28S (5kb) : 150-200

5S (120 nt): 200-300

snRNA (small nuclear RNA) (70-200 nt): > 100

Notamment épissage: U1, U2, U4, ...

snoRNA (small nucleolar RNA) (70-200 nt): > 100

Maturation des rRNA dans le nucléole

miRNA (micro RNA) : 250 identifiés

Régulation traduction, stabilité mRNA, transcription

ARN interférents: ??

Gènes non traduits

(24)

- 5,00 10,00 15,00 20,00 25,00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X 0

500 1000 1500 2000 2500 3000 3500

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X

Nb. of genes (estimation)Genes / Mb (estimation)

0 50 100 150 200 250

1 2 3 4 5 6 7 8 9 1011 12 1314 15 16 1718 1920 21 22 X

Taille (Mb) http://www.ncbi.nlm.nih.gov/Science96/

Localisation des gènes

(25)

Génome de Vertébrés Variations de la composition en bases le long des chromosomes

Sequence of human MHC

Définition Régions > 300 kb homogène dans sa composition en bases

Isochores

(26)

20 60 100 140

Number of genes / Mb

L1+L2 H1+H2 H3 Mouchiroud et al. 1991

R el at ive ge ne de nsit y

G+C%

20

0 4 8 12 16

30 40 50 60 70

Corrélation isochores riches en G+C / densité génique

Isochores

(27)

Average intron length (bp)

Gene compaction

(intron length/coding region length)

400 800 1200 1600 2000

2 4 6 8 10 12

L1L2 H1H2 H3

L1L2 H1H2 H3

M ed ia n i n tr o n l en g th M ed ia n e x o n l en g th

G+C%

30 40 50 60

2500

0 1000 1500 2000

500

à Incidence sur la structure génique

Isochores et introns

(28)

Genes, regulatory elements: ~ 2-5%

20 000 – 25 000 proteic genes tRNA, rRNA, snRNA, miRNA UTR

Non-coding sequences: ~ 95-98%

Satellite DNA(centromeres) ~ 6-7%

Microsatellites ~ 2%

Transposable elements ~ 46%

Pseudogenes ~ 1%

Other (ancient -telements?) ~ 42%

Variations in gene, repeat density and base composition (isochores) along chromosomes

>90% sans fonction connue

ADN intergénique 61%

Introns 31%

Elements fonctionnels non-quantifiés:

- ARN non-traduits

- Promoteurs, enhancers - ORI, MAR, télomères

Eléments non-fonctionnels:

- Pseudogènes : 1.2%

- Elements transposables : 46%

Et l’ADN non codant?

(29)

Proportion of functional elements within genomes 85%

2%

13%

E. coli

2% 70%

28%

S. cerevisiae

1.5 % 0.05 %

98%

Human

Coding (protein) RNA Non-coding

17%

0.5 % Drosophila

82% 0.05 %

0.01%

Lungfish (dipnoi)

99.5%

28%

0.5 %

71%

C. elegans

ADN non codant

(30)

Tandem repeats

Motif(nt) L(repeat) %

Satellite 2-2000 à 10Mb 6.5

Minisatellite 2-64 100-20000 0.3

Microsatellite 1-6 10-100 2

Interspersed repeats

DNA transposon (rares)

Retroelement 46%

Slippage of the DNA-pol: CACACACACACA Unequal crossing-over:

Les séquences répétées

(31)

Evolution des génomes

(32)

32

• Probabilité de substitution par site par untié de temps est α

• Substitution : 3 remplacements possibles (e.g. C → {A,G,T})

• Non-substitution: 1 seule possibilité (e.g. C → C)

Le modèle Jukes-Cantor

(33)

33

La matrice de transition de la chaîne de Markov a la forme suivante:

M JC =

A C G T

A 1- α α /3 α /3 α /3 C α /3 1- α α /3 α /3 G α /3 α /3 1- α α /3 T α /3 α /3 α /3 1- α

Le modèle Jukes-Cantor

(34)

34

Purines et pyrimidines

(35)

35

Transitions et transversions

(36)

36

Inclut le biais de substitution entre transistions et transversions Probabilité de transition (G↔A et T↔C) par site par unité de temps est α

Probabilité de transversion (G↔T, G↔C, A↔T, and A↔C) par site par unité de temps est β

Le modèle de Kimura

(37)

37

La matrice de transition de la chaîne de Markov a alors la forme suivante:

M K2P =

A C G T

A 1- α - β β α β

C β 1- α - β β α

G α β 1- α - β β

T β α β 1- α - β

Le modèle de Kimura

(38)

Modèles de substitution plus avancés

• Plus réalistes

• Le modèles de Kimura a une distribution uniforme stationnaire comme solution, ce qui n’est pas vrai

• Une possibilité: la probabilité de substitution d’une purine à une pyrimidine est différente de celle d’une pyrimidine à une purine (solution dynamique).

• Le modèle HKY capture ce biais

(39)

Paralogues

dérivent d’une duplication Gène ancestral

Orthologues

Assument la même fonction chez des espèces

différentes sp. A

sp. B sp. C

Divergence & perte de fonction (pseudogène)

Acquisition d’une nouvelle fonction Conservation de la

même fonction (redondance) -

Spécialisation

Devenir des gènes dupliqués

PSEUDOGENISATION SUB-

FONCTIONNALISATION

NEO-

FONCTIONNALISATION

Duplications géniques

(40)

Evolution des espèces

Lamproie Amphioxus Mixine

Chondrychtyens Teleostéens

Tétrapodes duplications

"2R"

4 4-7

3 1

G na th os to me s

4

Hox clusters

Duplications de groupes de gènes

(41)

A B C

A B C

A B C

Duplications, paralogie et phylogénie

(42)

ACQUISITION DU NOYAU

(43)

Synténie

(44)

Transfert horizontal

Transformation – une bactérie ingère de l’ADN provenant du milieu environnant.

Conjugaison – La bactérie donneuse envoie de l’ADN à une autre bactérie par l’intermédiaire d’un pilus sexuel.

Transduction – Un bactériophage transfère une portion d’ADN d’une bactérie à l’autre au cours d’infections multiples .

16-44

(45)

16-45

Transformation

(46)

16-46

Conjuguaison

(47)

16-47

Transduction

(48)
(49)
(50)

Chromosome Packing

(51)
(52)
(53)

Duplications géniques & génomiques

Identification des orthologues et des paralogues de globine

(54)

Evolution des globines

Duplications géniques & génomiques

(55)
(56)
(57)
(58)

Les bandes chromosomiques

(59)

Duplications géniques & génomiques

Phylogénie d’orthologues = Phylogénie des espèces Phylogénie de paralogues = Phylogénie différente A

B C

B C A A

B C A B C

A B C

Les espèces

Phylogénies obtenues en comparant des

orthologues Phylogénie obtenues en comparant des orthologues et

des paralogues

(Si le paralogue chez A a fortement divergé)

Identification des orthologues et des paralogues

Références

Documents relatifs

Il faut choisir un solvant extracteur non miscible avec l’eau et dans lequel l’huile essentielle d’eucalyptus y est très soluble.. Ce solvant doit être le moins dangereux pour

PRODUIT et MATERIEL. 1 verre de montre propre et sec.. Verser la masse de sulfate de cuivre dans la fiole de 100 mL à l’aide de l’entonnoir.. Rincer le verre de montre et

Définir la fréquence puis donner la relation entre la période et la fréquence (1pt) 4.. Calculer sa fréquence f, qui est celle des battements

Vérification graphique : Utilisation de GeoGebra Il faut trouver la valeur du rayon du cylindre qui donne comme volume

1.1 Un essai en moteur, alimenté sous sa tension nominale avec un courant inducteur Ie= +25 A, a permis de mesurer un courant dans l'induit I= +440 A pour une fréquence de rotation

Cette belle histoire n’est cependant pas terminée et maintenant que nous avons réussi à construire un socle solide, il est urgent d’assurer le vrai basculement pour une part

Il faut comparer les ordonnées de deux points de même abscisse, l’un sur C f , l’autre sur (D)... En discutant suivant les valeurs du réel m, trouver graphiquement le nombre

[r]