• Aucun résultat trouvé

preuve aMIG - Contr

N/A
N/A
Protected

Academic year: 2021

Partager "preuve aMIG - Contr"

Copied!
6
0
0

Texte intégral

(1)

´

Epreuve aMIG - Contrˆ

ole terminal - 28 avril 2009

J.R. Lobry, L. Duret

27 avril 2009

Les deux probl`

emes sont compl`

etement ind´

ependants.

(Dur´

ee : 2 heures)

Documents autoris´

es

1

Probl`

eme 1 (J.R. Lobry)

On utilise principalement ici le g´

enome complet de la bact´

erie Chlamydia

trachomatis qui est distribu´

e avec le paquet seqinr, il n’y a donc pas besoin de

connection internet pour r´

ecup´

erer ces donn´

ees.

library(seqinr)

ctf <- system.file("sequences/ct.fasta", package = "seqinr") myseq <- read.fasta(ctf)[[1]]

1.1

Question 1

Quelle est la taille du g´

enome, exprim´

ee en paires de bases (bp), de

Chlamy-dia trachomatis ? Donner le code

permettant d’obtenir ce r´

esultat. Comment

se situe la taille de ce g´

enome par rapport aux autres g´

enomes bact´

eriens ?

1.2

Question 2

Quel est le taux de G+C, exprim´

e en %, de ce g´

enome ? Donner le code

permettant d’obtenir ce r´

esultat (sans utiliser la fonction pr´

e-d´

efinie GC() du

paquet seqinr). Comment se situe le taux de G+C ce g´

enome par rapport aux

autres g´

enomes bact´

eriens ?

1.3

Question 3

On s’int´

eresse au nombre total des 4 bases, exprim´

e en Kb. Que montre le

graphique suivant ?

na <- sum(myseq == "a")/10^3 nc <- sum(myseq == "c")/10^3 ng <- sum(myseq == "g")/10^3 nt <- sum(myseq == "t")/10^3

mydf <- data.frame(list(na = na, nc = nc, ng = ng, nt = nt)) lims <- c(0, 1.2 * max(mydf))

panel.lm <- function(x, y, ...) { points(x, y, ...)

(2)

abline(coef = c(0, 1), col = "blue") }

pairs(mydf, xlim = lims, ylim = lims, pch = 19, cex = 2, las = 1, lower.panel = panel.lm, upper.panel = panel.lm, labels = c("A (Kb)",

"C (Kb)", "G (Kb)", "T (Kb)"), main = "Chlamydia trachomatis")

A (Kb)

0 100 200 300 ● ● 0 100 200 300 0 100 200 300 ● 0 100 200 300 ●

C (Kb)

● ● ● ●

G (Kb)

0 100 200 300 ● 0 100 200 300 0 100 200 300 ● ● 0 100 200 300 ●

T (Kb)

Chlamydia trachomatis

1.4

Question 4

Pour savoir si la propri´

et´

e mise en ´

evidence dans la question pr´

ec´

edente

pr´

esente un caract`

ere de g´

en´

eralit´

e on r´

ecup`

ere les donn´

ees suivantes :

load(url("http://pbil.univ-lyon1.fr/R/donnees/big50.RData")) dim(big50) [1] 80590 7 head(big50) mnemo bp A C G T O 1 A48542 133894 39195 27151 27347 40201 0 2 A69720 53789 6707 19183 20504 7395 0 3 A79350 320040 66253 93201 94558 66028 0 4 A79351 236165 48909 68589 69313 49354 0 5 A93002 320040 66253 93201 94558 66028 0 6 A93003 236165 48909 68589 69313 49354 0

Il s’agit du nombre de bases nucl´

eotidiques dans 80590 fragments d’ADN

simple brin de plus de 50 Kb (extraits de GenBank le 24 novembre 2004). Donner

le code

permettant de produire le graphique ci-dessous et votre interpr´

etation

du r´

esultat obtenu.

(3)

1.5

Question 5

Le graphique ci-dessous a ´

et´

e obtenu `

a partir des donn´

ees sur le g´

enome de

Chlamydia trachomatis. Donner le code

permettant de produire ce graphique.

Que montre ce graphique ?

(4)

−15 −10 −5 0 5 10 15 −10 −5 0 5 10 15

Chlamydia trachomatis DNA walk

T − A in Kb

C − G in Kb

2

Probl`

eme 2 (L. Duret)

2.1

Prot´

eine de souris

La prot´

eine MaProt (de souris) a ´

et´

e caract´

eris´

ee en 1998. Cette prot´

eine a

´

et´

e compar´

ee `

a la banque de donn´

ees SwissProt `

a l’aide du logiciel BLASTP.

La liste des s´

equences similaires d´

etect´

ees `

a l’´

epoque par BLASTP est indiqu´

ee

ci-dessous :

############################################################################ BLASTP 2.0.5 [May-5-1998]

Query= MaProt Database: SwissProt

600,231 sequences; 186,808,058 total letters

Score E

Sequences producing significant alignments: (bits) Value

Seq1 264 Human Seq1 protein. 1851 0

Seq2 193 Chicken Seq2 protein 138 1e-55

Seq3 351 Zebrafish Seq3 protein. 92 1e-03

Seq4 558 Drosophila Seq4 protein. 31 0.7

Seq5 531 Caenorhabditis elegans Seq5 protein. 42 0.9

############################################################################

En 2009, on a refait la recherche de similarit´

e avec BLASTP sur la derni`

ere

version de la banque de donn´

ees SwissProt. On a obtenu le r´

esultat suivant :

############################################################################

(5)

Query= MaProt Database: SwissProt

6,8102,836 sequences; 191,518,738,896 total letters

Score E

Sequences producing significant alignments: (bits) Value

Seq1 264 Human Seq1 protein. 1851 0

Seq2 193 Chicken Seq2 protein 138 1e-54

Seq3 351 Zebrafish Seq3 protein. 92 0.01

Seq4 558 Drosophila Seq4 protein. 31 7

Seq5 531 Caenorhabditis elegans Seq5 protein. 42 9

############################################################################

1. Donnez la liste des homologues identifi´

es par BLAST en 2009 et ceux

identifi´

es en 1998 (vos choix doivent ˆ

etre justifi´

es).

2. Donnez la d´

efinition de la ”E-value”.

3. Pourquoi la ”E-value” est-elle diff´

erente en 2009 par rapport `

a 1998 ?

4. Quelle m´

ethode de recherche de similarit´

e pourrait-on utiliser pour gagner

en sensibilit´

e ?

2.2

Fragment du g´

enome du poulet

Un fragment du g´

enome du poulet (Gallus gallus) a ´

et´

e s´

equenc´

e :

cat(readLines("http://pbil.univ-lyon1.fr/R/donnees/poulet4.fasta"), sep = "\n") >poulet4 GATAAAAGTTTAACGTGATTTTTCAGTGATATAATTTCCATACAGGAAAAGTGTATGATA GATTTGAAAAAGGAATTATGTAATTCTGATTCATTTTTTTTAAGGAGCAGATGATTTTAG GTAAGCTTCTAAGAGAGCTATTTGAATAATCTATACGTTATAGACATACAGAGATTGGTT TTAGATGTTATTTTTCTGGAAAGATATACTAATGTGTAATAGAATACTTACTATGGCAAC AGCATGTGAAATGTTTTTAAAACAAAAGTAATTTTTTTAATAGGTCTTACAAGAAGCCTA AGTATAACTTCAGCTGAATCAGCATTTGAAAAAGCTCAAGGAGAGAGAGTTACGTTGCCA TGTACCTTTGAACTCTCAGAAGAGGATGTAGGCACACTAGATATTGAGTGGGTTTTGATA CCAGCAGATATTCAGAAGAAGGAAGAAACAGTAAGTAAAAACTTCTTAATTTTTGGCAGC TGTAGTCAAGTCATTAGGGTAAGTCAATGTGTGAACTTTGGTAGTGACTCTTTTGACTTT CACCTTTTCAAGATGGTATGCGTGTGATCTTAAATTACTTTGAAGCACCAATGTGGAAGT TATGAAATAGTGAGAATGTTACAATATTTTGTGCTTAATCCTCTATTCACTGTGAACAAT TCTAAAATTAAAAAATGATTCAGAGAACAGACAACTCTGCTTTTGCAGACCTACACTATG TTTCTGATTGAAAGAAGTCGTTTATAAGAATTTGGTCTTAAATGTAGTATGTCTTTGTTA GTTATTAGCTCTTTCACTTATTCTGAAGTCTGAGAACTTCTTTAGCAGAGATTTTACAGA ATTAAGATTAGATAAATAGTTTTCTTTAAGACAGAAGACAGTGTTGACATTCTTTCACTT GAACAGGTATTGCATTGGAGTATTTGTTAGAGCGTTTTGTGTGGTGTTATTTTGAAAAAA GGTACGTCATGCCCTGGGATTACTTTAAACAGTAAAGGGAGGCTGCTAAAAATCTGAAGA TGCTTTTTATTTTTTCTTCAAATGTTCATATGTCAAGTAGATTCCTGAACCGTATTTCTT CTTTTACAGATAATTCTATATTCTGGAGATAGGATTTATAATCATTATCATCCTGCTCTG GCTGGGCGGCTGCAATTTACTAGTTCTGATCCCAAATCTGGTGATGGTTCAGTGGATATC CTGAATTTAAAGTCAGCAGATACTGGCACATACCAGTGCAAAGTGAAGAAGGCTCCTGGA GTTGAAAGCCTAAAAATACAGTTGAACGTACTTGGTAAGCAAGTTTTTTTTTTTTTCCCA TGAATTTCAGTGGCATGTTTGTGTTTATGCTATTTTTCATTTGATATATAAAATGAAAAC GAATGTAGGGCAAAGTCATACTGAATCTACAATAATGCATCCATTATTAAGTCTTCAGGA CAGGGGCAGGCAAAGTAAATAATAGAGTAATTGAGCACTTTTAAAAATTGTGCATCTGAT TCGTATTTCATAGTATTTTTTTCATGCTTACAAAGGCTTTGTTGTACAAAATTGCTATAG TAAAATGTGCTGATGAACTAAAATGTTACGATTTTGATTGTGACTTATTAATTCAATAAT ACTTTGTTTATCAGTAAAGCCAGCAAGCACTAAATGCTCCATTGAAGGATCACAGGAGAT TGGAAAGGACATTGTATTGAAGTGTGCATCACAAGAAGGAACCCCACTTTTGTATTATGA CTGGAGAAGAGTAGTAACTGGCACACAAGGACTTCCTGCCACTTCCGTACTAAGTATTGT CAAACTTTAAGTATTTCAGAATAATAAATAATACAGATTGTATTCATATTTTTGACATAT TTTGACTTGTTAGCAGCTTATGCGTGCTTTTAATATAGAGCAGTCTATAGAAGTGTCACT TCTATCCTTCCAGTGGATAGTAAAACTGACATTTAAACAAGCTACTCCGAGTTGAGAGAG ATTCTTACCATTAGGTTTGCAGAATCATGCTAATCTCTGCATACAAATGTTTTGACTGCT CTTGCTTGTTGATTCTTGGCTGCTTTTCTGTTCAGATGGATGGGGTGAAGAGTCAGAATA GAGTATAGACCAGTGGTTTGAACTGTATATTCAATTGGAAATGAAATTTAAATTTTAGTA TAGATTGAAGTGAGAGCTTCAGTTTCTGGTCAAGTGATGGAACTGCTTAGTTAAGGAGGG GAGAGAATACATGTCTATGGAAGAAAAATTGTCATGAGTAAAGGAAATGAGAAGGTTGTC TCTCTTCTTATGTGACACATCCAGGAAAGAATTTTCTTAAAAAAAACTGGCTTATAAATT GAGAATTGTTATTGTGGTGGTATTGGATTTTTTTTTTTTTTTTTTTTTGTGAAAACTTAA TTGCTGAAGTTTATTAGAGAAGTTGATTTTACTCATCAGTTTAGTTCATTGGTAGTTTGT GAGTTCTGACTTTGAAAGTTATCCTGGAATATTTTATGTAATTATGCTTTGCAGTACCAA TTCTTTTTTACTTTTGTAATTAAAAAAAAAAAAAAGCTTTAAAGCCTTGAAATGGTAGCC

(6)

CTTTAAGTGCAGGTATAGCTCTTTAAGTATTTGCTTAGAAGTGTTTTAACTCAGATTGCA AATTACATACAGGATGAAAACTATCATGATATGTTCAAGAGCAGCCATAGTCTTGGGAGA GAGATTAGGAACATGTGTGGATCTTCTTCATAATGATCTCCTGTCCTCCTGTCATTTATG CTTTTAGACCTTCCAGAGGGAGATACGGTTTCCATTCAATTGACCTAAACCAAACAAAAG TGACTATCTGAACTCTGCTTTGTACTTCTCCAGTCTACTTCAAACTGTAGTCCAGTAGTA TCTGCATGTCTTAGGGGACATAACTCCTAAAAATTAATTGCATCTGAAAAACCTTGTACT GTTCTTGAGCTTGCCTTGTGGTAGTGCTGTTTGATACATCCTATTTCTTGTTTTGACAAC AAGCAGTTAGTTACTAATGTCTCTGTGTATCATTCAAGACCTTAAGCTTCTATTGTTCTC TCTTTATCCACATTGCAAATTTGTTTCATAAATAAATTGATAGTTTTAGTGCTGGACAAG AATGAGGAAGTATACAGAAATGGTGTGTAGCATCATTAAGCTACTGTTGCTTTCGGCTTG TGATTGTAGGTTCATGGGCACTGAATGTGCTGTCAAGAACCTAGATGCTGCTTCACTTCA GCTGAAGGAGCTAGCTAGGTCTTTGTGTGATTCTTTAGTACTGAGATGTAGTCTCTTGAC AGCTTGGGATTTAAGTGCTGATGGCAAATCTATGAGCAATCTGAGTGTTCAAGCCATTTG AAGTTCAGATAGTAATATCTCAAAGGTAGCTACCAGTTGCTTTGGAAGCCTTAGGAAGAA ACTTTTTCTGTTTTCGCTCAGTCAGCCTATCTAGAGTTAAATGGTCACCTATTGGATCAG CCTTTTGTGTTGAACGTGAGTTCTGCAGACATCTGAGATGGTTGCATAGAATTACTTCAC ATACAGAAGAGAAGGAGATTCCTTTGGGATGCAGCTCATCCACTGTATTTTAAAACTCCA GGTTAGGGTGAGAGAACTTGCCATCTTAAGTATCCTTTTCTTTCCATTGGCAGAGCAATT TGAAAGCCTTGTTACTAAAGTCAATTTCTGTGGCATAAATTTCTACTGAAGTAAACGGTT TTTACAAATAGTAGTGTTCTGTGGTGGAGTAAACTTTTGGTTTTGAGTATTGTTTTCAAT ATGGCATTTTTAGTTAAGATTTCATGAATGTGCTTGATTAATAATTCTGTTGCGTGCTGG ATTGATAATTCTGTTGCATTGAATTAGAAATTAAACTTTGGTAAATGGTAAACCTTTTGC TTCTTATTCTTTGTAGACAAAAATACAGGGGAACTTCTCTTGAAAAATGCCTCTAAAGAC TATTCTGGTACATACAGTTGTGTTGCTTCAAACCGAGTTGGCACAGATGAATGTTCTGTT GAGCTGAATGTCACCCCTCGTAAGTGTTCACTGTGTAGTAGTCACATAGTGTTTTGTGTA TTTGAATAATCTTGTTTCTCTATATTCTTAAAAGTTTAAAAACAACAAACACTGTTTTGC AGCTGAGGGTTGCTGCTTTAAATTTGTACTTTGCCGAAGATTTGATTATTTTTTTTTAAT GTAGAAAGATACAATTCTCCTGTCATTCTCAATCACAGAATTGAAACATACCTCTACTTC AGTGATAAATTAAGTTTGATGCTTAAACACTATTGTAATTTATCTATTCTAGCTATAAAT ACAGCTGGTGTAATTGCTGGAGCTATTCTGGGAACTCTGTTGGGTCTTGCCTTGTTGGCT TTTCTTGTCATCTGTTGCTGTAAGAAGCATAGAGAGAAGAAATATGAGAAAGAAGTACAT CATGAAATCAGGTAATGACATGCCTAGCTTGAGAGGTTCTGCTTGAAAATTAGCTGCTAA ATGACTTTATGCAAGGAAGATGACTAGTAGTTGGGATTTCTGTTTTAATCTGGTAAATTT ATTAAAACACTAACAGTTCATCTGAGAACTTGTTTTGAGTATGGTGTAGGTAGTCATGTC TTCCTACTTTCAGTAAAAATCTTAAAGACAATGATAACTTCCTTTTTTTTTTAAGATTAA AAAAAAGCCTTTTTGTCTACTGAGTCAGAATGTGAAGAAACAAATGGAAACGTTATTATG CAAGCTGCTGCGTAGCAGTAACTGAACTCTTGTTGTGCAACTGTTCTTTCTTTTCTTTCA GAGAAGATGTTCTGCCTCCAAAAAGTCGCAGTTCAACAGCACGCAGCTACATAGGCAGCA ATCGTTCTTCTCTGGGTTCAATGTCTCCCTCAAATATGGAAGGATACTCCAAAACTCCAT ATAGCCAGGTTCCAAGTGAAGACTTTGAACGTACTTCTGGTCAAAACCAAACCATTGCAT CTTCAAAGGTAGCTGCACCTAATTTAAGTAGAATGGGAGCTGTCCCTGTGATGATTCCAG CACAAAGCAAAGATGGGTCCATAGTATGAAATATTAATTTAAGTCCTGGGTTTTTTAAGT GTTTGTTGTAAGTATTAGAGAAAACTACAGTATTCCAACCCTCATTTAAACAATGGCATG CAATTTTCCTTGAAGTAAATGAACATGTTAGTTTGAAAAGCCACCAATTCTCATTTTTAA TTTTAAACTTATTAGTGTGTAACAGTTGAACTATTGAAAGCGTGAGAGTTCCTAAATATC AGATACTGAAGGTGTTTGGATCTCTGGTGGCTTGCTGAAGAGATGCTATTAGCTGATGTG CAGTTCTCAGAATCTGAAAGAGCAACACAACTGAGAAGTAACAAAACCATTTCATATGTA GACAATGAAGTTCCTCAGAGTTCCTGAAGCTTTATTCTCAGTCTTGGAGTAAAGGGGTAT TTTAATTTGGCCACTGTCTGATGAACTTGCAGTGGGGCTGAGATACTGAGGAGAACTTTG AATTCTGCTCAAACTCAGAGGACTTATGCAGTTCTTGAAGTTGTCTGGAGTGTTTCCTGG GTTGTTATCTCAGGGGCTACCAGTCATTTGGTTGGTTCAGTTAATTTAATGAATCTGTTC TGAGTTTAAAATTACAATGAGTAAAAATGCAACAGGAGATTTTGCAAGCTCCTTGAAATC AGAATTTTACTGCATTAACTGGTTCTAGTAGTGTCAGATAGTTAAGTTATCCTATGTAAC ACGTCTTATCAGATTGTTACTAGTGGTATCTAGGTTCTAAAATCTATAGCTCAACTGTTA CATTGTCAAAGTTAGAGTGAACATGCATCTCTGCAGGTCTTAAGTTAGCTGTATCTCACA TTTTCCAAAGCCTCTTTAGATTCTAAGGCAGTGTTCTTTTTCTAAACCAACTACCTAGAA GTTTCACGGGGCTTGATTACAGCTGTTAAGAAACTGGTATTTAATAGTTGCTCTTGCTC

1. Recherchez le(s) g`

ene(s) contenu(s) dans ce fragment.

2. D´

ecrivez la structure (i.e. les positions des introns et des exons) du (ou

des) g`

ene(s).

3. D´

ecrivez et justifiez chacunes de vos ´

etapes (e.g. pourquoi doit-on

recher-cher et masquer les s´

equences r´

ep´

et´

ees ?).

Références

Documents relatifs

Le but principal de ce mémoire est d 'effectu er le lien entre deux méthodes de ré- duction de dimensionnalité, en l'occurrence l'ACP, qui est une méthode

Certes, Artaud, grâce à son hypersensibilité, perçoit bien qu’entre en scène dans ce qu’il voit et qu’il assimile à du théâtre quelque chose qui relève de

ABSTRACT In a prospective controlled study, we aimed to determine the prevalence of Chlamydia trachomatis infection in Jordanian women attending an infertility clinic and

The recommendations summarized in Table 1 apply to adults, adolescents Ş\HDUVRIDJHSHRSOHOLYLQJZLWK+,9DQG key populations, including sex workers, MSM and

Strong recommendation for the intervention • RecommendationFor people with uncomplicated genital chlamydia, the WHO STI guideline suggests one of the following options: •

Le th´ eor` eme de d´ erivation des s´ eries de fonctions permet de conclure que f est une fonction d´ erivable sur

• tous les effets indésirables graves inattendus (EIGI), c’est-à-dire tous les effets indésirables graves (EIG) dont la nature, la sévérité ou l’évolution ne concordent

Pour t 6= 0 fix´e, la suite converge vers 2t (quotient des termes de plus haut degr´e