Examen d’informatique (base de donn´ees) – L3 SV
Jean-Baptiste Lamy 14 Juin 2013 - 14h00 - 16h00
Rappel : les documents (cours, TP, notes personnelles) sont autoris´es lors de l’examen. Les t´el´ephones portables sont interdits !
Exercice 1 :
Nous avons r´ealis´e une base de donn´ees sur les s´equences promotrices d´eclenchant la transcription des g`enes. La base de donn´ees comprend quatre tables : Promoteur, Gene, Esp`ece et A pour promoteur. Les tableaux ci-dessous montrent des exemples de contenus pour chaque table.
La table Promoteur contient les attributs nom (le nom du promoteur), s´equence (la s´equence du promoteur), et position (la position de la s´equence promotrice par rapport `a l’extr´emit´e 5’ du g`ene, qui peut ˆetre n´egative si la s´equence promotrice recouvre en partie le g`ene).
La table Gene comprend les attributs nom (le nom du g`ene), sequence (la s´equence du g`ene) et id esp`ece (l’identifiant de l’esp`ece `a laquelle appartient ce g`ene).
La table Esp`ece comprend les attributs nom (le nom de l’esp`ece) et nom latin (le nom latin de l’esp`ece).
La table A pour promoteur est une table de liaison qui relie les g`enes aux promoteurs associ´ees.
Table Promoteur :
id nom s´equence position
(integer) (text) (text) (integer)
1 HS HIST1H2AB acctccagtcagt... 5
2 HS HIF1A gcctccgcccttg... -8
... (2 403 lignes en tout) Table G`ene :
id nom s´equence id esp`ece
(integer) (text) (text) (integer)
1 Histone 2A-like protein AUGGCTT... 1
2 Hypoxia-inducible factor 1, alpha subunit AUGTTCA... 1 ... (15 865 lignes en tout)
Table Esp`ece :
id nom nom latin
(integer) (integer) (text)
1 Homme Homo sapiens
2 Vache Bos taurus
... (5 853 lignes en tout)
Table A pour promoteur : id g`ene id promoteur (integer) (integer)
1 1
2 2
... (25 987 lignes en tout) NB : les diff´erentes questions sont ind´ependantes.
1. Dans quelle base d´ej`a existante sur Internet peut-on trouver des informations sur les s´equences promotrices ? (1 point) R´eponse :
EPD.
2. Quelles est le type de relations entre les tables Promoteur et G`ene ? Entre les tables G`ene et Esp`ece ? (1 point) R´eponse :
Promoteur - G`ene : * - * G`ene - Esp`ece : * - 1
3. Quelle est la position du promoteur HS HIST1H1T ? (NB pour cette question et les suivantes, on donnera la requˆete SQL permettant d’obtenir la r´eponse `a la question ; 1 point)
R´eponse :
SELECT position FROM Promoteur WHERE nom = ”HS HIST1H1T”;
1
4. Quelle sont les s´equences des insulines pr´esentes dans la base (NB il peut y avoir plusieurs insulines correspondant `a des esp`eces diff´erentes) ? (1 point)
R´eponse :
SELECT s´equence FROM G`ene WHERE nom = ”insuline”;
5. Quelle est la s´equence promotrice la plus courte de la base ? (2 points) R´eponse :
SELECT nom FROM Promoteur WHERE LENGTH(s´equence) = (SELECT MIN(LENGTH(s´equence)) FROM Pro- moteur) ;
6. Combien de g`enes appartenant `a l’esp`ece humaine sont pr´esents dans la base ? (2 points) R´eponse :
SELECT COUNT(G`ene.id) FROM G`ene, Esp`ece WHERE Esp`ece.nom = ”Homme” AND G`ene.id esp`ece = Esp`ece.id ; 7. Quelles sont les promoteurs de l’insuline humaine ? (3 points)
R´eponse :
SELECT Promoteur.nom FROM Gene, Promoteur, Esp`ece, A pour Promoteur WHERE G`ene.nom = ”Insuline” AND Esp`ece.nom = ”Homme” AND G`ene.id esp`ece = Esp`ece.id AND A pour Promoteur.id promoteur = Promoteur.id AND A pour Promoteur.id G`ene = G`ene.id ;
8. Nous souhaitons ajouter dans la base une table contenant les diff´erents facteurs de transcription, chaque facteur ´etant d´ecrit par son nom (par exemple NF-κB) et sa s´equence (s´equence prot´eique). Donner le code SQL pour cr´eer cette table. (2 points)
R´eponse :
CREATE TABLE FacteurDeTranscription(
id INTEGER NOT NULL AUTO INCREMENT PRIMARY KEY, nom TEXT,
s´equence TEXT, ) ;
9. Nous souhaitons ajouter dans la base la relation entre promoteur et facteurs de transcription. Chaque promoteur se lie `a un seul facteur de transcription, et chaque facteur de transcription peut se lier `a plusieurs promoteur. Donner le code SQL pour ajouter cette relation dans la base. (2 points)
R´eponse :
ALTER TABLE Promoteur ADD id facteur de transcription li´e INTEGER ;
Exercice 2 :
Le sch´ema suivant repr´esente l’´epissage d’un g`ene codant une prot´eine humaine `a doigt de zinc, issu de la base Ensembl.
2
1. Y a-t-il un ´epissage alternatif sur cette prot´eine ? Si oui, combien d’ARN messagers et de prot´eines ce g`ene code-t-il ? (1 point)
R´eponse :
Oui. 6 ARNm et 4 prot´eines.
2. Combien y a-t-il de codon start dans la s´equence du g`ene ? de codon stop ? O`u sont-ils situ´es ? (1 point) R´eponse :
6 exons. 2 codons start : `a la fin du premier et du quatri`eme, 2 stop : au d´ebut et au milieu du dernier.
3. Ce g`ene produit-il des ARN messagers qui ne codent aucune prot´eine ? Pourquoi ces ARN messagers ne sont pas traduits en prot´eine ? (1 point)
R´eponse :
Le 6`eme ARNm n’a pas de codon start.
Le 5`eme en a un... peut-ˆetre manque-t-il des sites promoteurs situ´es sur des r´egions ´eloign´es dans la s´equence mais proche dans l’espace apr`es repliement ?
4. Le domaine Prosite PS00142 correspond `a un site liant un atome de zinc. Parmi les prot´eines produite par ce g`ene, quelles sont celles qui seront li´ees `a un atome de zinc ? (1 point)
R´eponse :
La premi`ere, seconde et quatri`eme prot´eine.
5. Pensez-vous que la troisi`eme prot´eine soit fonctionnelle ou non-fonctionnelle ? (1 point) R´eponse :
Non-fonctionnelle : il lui manque le site liant le zinc.
3