• Aucun résultat trouvé

Familles de gènes

N/A
N/A
Protected

Academic year: 2022

Partager "Familles de gènes"

Copied!
34
0
0

Texte intégral

(1)

Familles de gènes

Nadia El-Mabrouk

(2)

Les gènes

• Parties codantes de l’ADN

• Unités de base de l’héridité.

• Une fois les gènes identifiés, ils doivent être

annotés pour leur fonction.

(3)

Familles de gènes

• Des gènes « apparentés » peuvent être

regroupés en clusters, ou éparpillés dans un ou

dans plusieurs chromosomes. Par exemple les

gènes Globin:

(4)

Opazo J C et al. PNAS 2008;105:12950-12955

Genomic structure of the β-globin gene cluster

in therian mammals.

(5)

Duplication de gènes

• Ohno, 1970, « Evolution by gene duplication »:

La duplication de gènes (créant des

paralogues) est l’évènement évolutif principal entraînant l’émergence de nouvelles

fonctions. L’une des deux copies échappe à la

pression de sélection et est libre d’évoluer.

(6)

Duplication de gènes

• Cause la plus courante: Recombinaisons

inégales au cours de la méiose. En général du à la présence de répétitions. Donne lieu à des duplications en tandem.

a) b)

(7)

Évolution des gènes

1 2 3 4

1 c 1 a 2 a 2 b 3 b 4 b

a

a

a b

a

c a

1 2 3 4

S

b

(8)

Évolution des gènes

1 2 3 4

1 c 1 a 2 a 2 b 3 b 4 b

1 2 3 4

S

(9)

Évolution des gènes

1 c 1 a 2 a 2 b 3 b 4 b

1 2 3 4

S

(10)

Homologie, orthologie, paralogie

• Homologues: Gènes ayant un ancêtre commun.

• Orthologues: Leur plus récent ancêtre commun a subit une spéciation.

• Paralogues: Leur plus récent ancêtre commun a subit une duplication

• Xénologues: Gènes ayant été transmis

par transfert horizontal.

(11)

Évolution des gènes

1 2 3 4

S

1 c 1 a 2 a 2 b 3 b 4 b

orthologues

(12)

Évolution des gènes

1 2 3 4

S

1 c 1 a 2 a 2 b 3 b 4 b

paralogues

(13)

Évolution des gènes

1 2 3 4

S

1 c 1 a 2 a 2 b 3 b 4 b

paralogues

(14)

Arbre de gènes

• Pour inférer orthologues/paralogues:

1. Regrouper les gènes par famille.

2. Inférer un arbre de gènes.

3. Le « réconcilier » avec l’arbre des espèces pour

identifier les duplications et les spéciations.

(15)

Familles de gènes

• Les gènes sont généralement regroupés par similarité de séquences.

• Hypothèse sous-jacentes: Des gènes

« similaires » sont originaires d’une même copie ancestrale, i.e. sont homologues.

• Une variété d’outils de regroupements des gènes en familles: COG, InParanoid,

OrthoMCL, Proteinortho.

(16)

Méthode d’homologie de séquence

• Méthodes des « best BLAST hits »: Regroupe les copies le plus

« similaires » en fonction des scores de BLAST.

• BBH « Bi-directional best Blast Hit »: Meilleur score de

similarité dans « les deux sens »

(17)

La base de données COG

• COG: Clusters of Orthologous Groups of Genes Classifie les protéines des génomes complètement séquencés en se basant sur le concept d’orthologie.

• Idée générale: un « bidirectional best hit » n’est considéré que s’il est « confirmé » par une troisième séquence.

• Les membres d’un COG doivent appartenir à au moins 3 espèces.

• Cette validation avec une 3 ème séquence a pour but d’éviter les erreurs causées par la perte de gènes: choix d’un

paralogue plutôt qu’un orthologue.

a

b c

(18)

Arbre de gènes

• Pour inférer orthologues/paralogues:

1. Regrouper les gènes par famille;

2. Inférer un arbre de gènes

3. Le « réconcilier » avec l’arbre des espèces pour

identifier les duplications et les spéciations.

(19)

Arbres de gènes

• Méthodes phylogénétiques diverses et variées

– PHYLIP, NJ, PAUP, PhyML, MrBayes, RAxML…

• Banques de données d’arbres de gènes divers et variés:

– Ensembl Compara, PHOG, MetaPHOrs,

PhylomeDB, PANTHER.

(20)

EXEMPLE – Arbre d’Ensembl

Hedgehog proteins (Sonic, Indian, Desert)

(21)

Arbre de gènes

• Pour inférer orthologues/paralogues:

1. Regrouper les gènes par famille;

2. Inférer un arbre de gènes

3. Le « réconcilier » avec l’arbre des espèces pour

identifier les duplications et les spéciations.

(22)

Réconciliation

• Arbre de gènes G pour une famille {g1, g2, g3, g4, g5} provenant des génomes {a,b,c,d}

g1:a g2:b G

g3:b g4:c g5:d

a b c d

S

(23)

Réconciliation

• On ne garde que le nom du génome de provenance

a b

G

b c d

a b c d

S

(24)

Réconciliation

• Expliquer la différence entre G et S par des événements de spéciation,

duplication et pertes.

a b

G

b c d

a b c d

S

(25)

Réconciliation

• Spéciation.

a b

G

b c d

a b c d

S

Speciation

(26)

Réconciliation

• Duplication

– deux copies dans le génome b

a b

G

b c d

a b c d

S

(27)

Réconciliation

• Duplication

– deux copies dans le génome b – une duplication doit avoir eu lieu

a b

G

b c d

a b c d

S

Duplication

(28)

Réconciliation

• Duplication

– deux copies dans le génome b

– une duplication doit avoir eu lieu à l’un des deux ancêtres

a b

G

b c d

a b c d

S

Duplication

(29)

Réconciliation

• Perte

– Duplication avant la spéciation a-b: a aurait dû avoir deux copies aussi

– Une copie a dû être perdue dans a

a b

G

b c d

a b c d

S

Perte

(30)

Réconciliation

a b

G

b c d

a b b c d

(31)

Réconciliation

• Critère de parcimonie: Minimiser

duplications+pertes (mutation cost)

G

a1 b1 b2 c1 d1 a b c d

S

Arbre réconcilié

a1 b1 a2 b2 c1 d1

e f

g

e e

e

f

g

(32)

LCA Mapping

G

a b b c d

a b c d

S

• LCA Mapping (Bonizzoni et al., 2003)

– Chaque nœud de G est associé au LCA de ses feuilles dans S.

e f

g

(33)

LCA Mapping

a b b c d

a b c d

e f

g

e

e

f

• LCA Mapping (Bonizzoni et al., 2003)

– Chaque nœud de G est associé au LCA de ses feuilles dans S.

S g G

(34)

LCA Mapping

a b b c d

a b c d

e f

g

e

e

f

• LCA Mapping (Bonizzoni et al., 2003)

– Chaque nœud de G est associé au LCA de ses feuilles dans S.

– Un nœud de G une duplication ssi il a la même étiquette que l’un (ou les deux) de ses fils.

S g Duplication G

Références

Documents relatifs

To study the impact of these WGDs on the evolution of banana gene families, we have focused on genes involved in the ethylene biosynthesis and signalling

Nous montrons (i) que les différentes régions régulatrices apportent des informations diffé- rentes et complémentaires et (ii) que la seule information de leur composition

Profil d’expression du gène rapporteur lacZ dans des embryons E 10,5 ( x 1000) de trois lignées phléal obte- nues à partir d’une construction piège codant pour une protéine

Cette expression dans des structures segmentées rapprochée du fait que les gènes Pax ont été iso­ lés sur la base d ' une homologie avec des séquences de

Cependant, le gène nm23 semble plu­ tôt amplifié et hyperexprimé dans les neuroblastomes agressifs ainsi que dans les cancers colorectaux, sans relation avec le

A gene from the human sex­ determining region encodes a protein with homology to a conserved DNA-binding motif.. Chromosome Y et détermination du

En effet, des expériences plus anciennes, consistant à hybrider entre elles des cellules immortalisées provenant de lignées différentes et à analyser les clones

Das unscheinbare Ereignis, dass die hl. Familie am rechten Seiten- altar von Fiesch um die Wende vom 18. Jahrhundert die Mit- patrone verdrängte, wirkt wie ein früh