• Aucun résultat trouvé

Rechercher les séquences de la lactate déshydrogénase

N/A
N/A
Protected

Academic year: 2022

Partager "Rechercher les séquences de la lactate déshydrogénase"

Copied!
18
0
0

Texte intégral

(1)

Bioinformatique et régulation du métabolisme : déshydrogénases et pli Rossmann / calmoduline et motif "EF-hand" / récepteur et insuline

Tweet

C. Déshydrogénase à NAD(P)+.

1. Aller au NCBI. Rechercher les séquences de la lactate déshydrogénase. Attention : anglais, abréviation, Booléens.

Avec l'option "Advanced" (lien en haut de la page), affiner la recherche avec EC 1.1.1.27 dans les résultats précédents :

"#1 AND in builder" puis taper "1.1.1.27" avec le champs "EC/RN Number" du menu déroulant.

"#2 AND in builder" puis taper "Arabidopsis thaliana" avec le champs "Organism" du menu déroulant.

44135 séquences de protéines (Novembre 2013)

1132 séquences de protéines (Novembre 2013)

GenPept : AAC02678

Remarques :

EC/RN Number : EC = Enzyme Commission - RN = Registry Number

Voir un descriptif des champs de recherche : aller à l'item "Search Field Descriptions and Tags"

Illustration de dépôt de fichier abusif : voir le fichier N° accession AAN87112.

(2)

2. Examiner le contenu "GenPept" du fichier AAC02678.

A quoi correspond EC 1.1.1.27 ?

Quelle est la réaction catalysée par cette enzyme ?

Chercher un fichier correspondant dans la base de données

Uniprot.

EC 1.1.1.27 : oxydo-réductases

Voir un cours sur les enzymes et la nomenclature E.C.

IntEnz ("Integrated relational Enzyme database" -

EBI)

Brenda ("The Comprehensive Enzyme Information System")

Expasy

Fichier : O49191 (O49191_ARATH)

3. Qu’est-ce que FASTA - séquence et FASTA - programme ? Récupérer le fichier "7SeqAformater.doc".

Formater les 2 séquences au format FASTA (en enlevant les "gap") avec l'outil proposé par l'EBI.

Quelle conclusion tire-t-on ?

Re-formater la 2ème séquence aux formats : "EMBL" , "Clustal/ALN", "Phylip4"

et "XML".

Voir algorithmes - programmes en bioinformatique.

"Readseq - biosequence conversion tool"

(3)

4. Faire une recherche de séquences homologues et/ou similaires de la lactate déshydrogénase de Arabidopsis thaliana avec BLAST.

Dans "Algorithm parameters", sélectionner "Max target sequences" = 10.

Dans la partie "Sequences producing significant alignments", récupérer les séquences des 50 protéines les plus similaires : "Dowload" puis "FASTA (complete sequence)" dans le menu qui s'ouvre.

Effectuer un alignement avec MULTALIN.

Refaire l'alignement en supprimant la ou les séquence(s) incomplète(s) jusqu'à faire apparaître le motif : GVGNVG

Voir un descriptif de Blast

5. Illustration : structure du domaine liant le NAD(P)+ - le pli Rossmann

Il est nécessaire de voir le cours sur les déshydrogénases à NAD(P)+ pour cette partie.

Récupérer la séquence de la lactate déshydrogénase de Squalus acanthias : Uniprot P00341.

Refaire l'alignement en y ajoutant cette séquence : repérer le motif spécifique de la lactate déshydrogénase de Squalus acanthias (GVGAVG)

Visualisation de la lactate déshydrogénase de Squalus acanthias à une résolution de 3 Å

Code PDB : 3LDH

(4)

Seuls les acides aminés 20 à 83 du pli Rossmann sont représentés.

Le pli Rossmann ("Rossmann fold" - en hommage à Michael Rossmann) est une structure super-secondaire (assemblage de plusieurs types de structures secondaires) : il est composé de 3 feuillets β liés à 2 hélices α de manière alternée (β-α-β-α-β).

Un pli Rossmann peut fixer 1 nucléotide.

Donc le domaine de fixation d'un dinucléotides (tel que NAD+ ou NADP+) contient 2 plis Rossmann appariés, chacun d'eux fixant l'un des nucléotides du co-facteur.

Pour faire apparaître de multiples fonctions du menu Jmol :

clic sur "Jmol" (Mac)

clic droit sur "Jmol" (PC)

You do not have the Java Runtime Environment installed for applet support.

Visit www.java.com

Rotation NAD

Helices

(5)

Le motif consensus GXGXXG : ce motif riche en glycine forme une boucle ("glycine-rich P-loop motif") qui effectue un tour serré entre la fin du premier feuillet β (β7) et le début de l'hélice de fixation du dinucléotide (α6) au sein du pli Rossmann.

Effectuer une prédiction de structures secondaires de la séquence de lactate déshydrogénase de Arabidopsis thaliana avec un outil approprié.

Exemples de logiciels de prédiction de structures secondaires : Jpred- CFSSP - GOR - Hhpred

6. Recherche d'une fonction de la lactate déshydrogénase chez les plantes via l'annotation et l'ontologie

Voir un cours sur l'annotation et l'ontologie.

Via le TAIR Via "Gene Ontology"

Aller au TAIR. En haut à droite, taper "L-lactate

dehydrogenase" avec le champs "Gene" puis cliquer sur

"Search".

Cliquer sur le lien AT4G17260.

Partie : "Annotations" / category "Biological Process" / keyword : cliquer sur "carbohydrate metabolic process".

Cliquer sur le lien "TreeView".

Ouvrir l'arborescence (signe "+") du dernier item :

"carbohydrate metabolic process". Que siginifient les symboles

"I" et "R" ?

Aller à "Gene Ontology". Taper "L-lactate dehydrogenase"

dans le champs "Search for genes, proteins or GO terms".

Trouve-t-on un résultat pour Arabidopsis thaliana ? Non

Pourquoi ne trouve-t-on pas de données concernant la "lactate dehydrogenase" de Arabidopsis thaliana ?

Voir : "Reference Species and Databases"

Revenir à la page de départ et taper "lactate dehydrogenase"

dans le champs "Search for genes, proteins or GO terms".

Trouve-t-on un résultat pour un autre végétal ? Oryza sativa Feuillets

Motif GVGAVG

(6)

Ouvrir l'arborescence "regulation of carbohydrate metabolic process".

Ouvrir l'arborescence "regulation of raffinose metabolic process".

Ouvrir l'arborescence "regulation of raffinose biosynthetic process".

Cliquer sur "negative regulation of raffinose

biosynthetic process".

Cliquer sur le lien "1 association".

De quel processus biologique s'agit-il ? Glycolyse

Quel est l'identifiant du mot clé ? GO:1900092

Cliquer sur le lien "GO Database". Quel est le résultat ?

Cliquer sur le lien "GO:0006096 : glycolysis".

Afficher les relations ontologiques avec l'onglet : "Graph View".

Que signifie "inferred" ?

Voir un développement des relations ontologiques.

Aller à "Gene Ontology".

Taper "1900092" dans le champs "Search for genes, proteins or GO terms", en sélectionnant "GO term or ID".

Dans la liste "object" , cliquer sur "carbohydrate metabolic process (GO:0005975)".

Dans la liste "subject" , cliquer sur "regulation of

carbohydrate metabolic process (GO: 0006109)".

Dans la liste "subject" , cliquer sur "regulation of raffinose metabolic process (GO: 0080091)".

Dans la liste "subject" , cliquer sur "regulation of raffinose biosynthetic process (GO: 1900091)".

Dans la liste "subject" , cliquer sur "negative regulation

of raffinose biosynthetic process (GO: 1900092)".

(7)

Revenir à la page : "regulation of raffinose metabolic process (GO: 0080091)".

Dans la liste "annotations" , cliquer sur "1". De quel organisme s'agit-il ?

Cliquer sur "AT3G18140". De quelle protéine s'agit-il ? Effectuer un Blast pour le savoir.

Revenir à la page précédente. Cliquer sur "8 associations".

Quels processus biologiques sont décrits ?

E. Calmoduline

1. Voici un exemple de syntaxe PROSITE : <A-x-[ST](2)-x(0,1)-{V}

Elle se lit : Ala en position N-terminale puis n'importe quel acide aminé puis 2 fois (Ser ou Thr) puis aucun acide aminé ou n'importe quel acide aminé puis n'importe quel acide aminé sauf Val.

a. Ecrire la séquence suivante dans cette syntaxe : 4 Ser puis (Asp ou Ser) puis (Asp ou Glu) puis n'importe quel acide aminé puis (Asp ou Glu) puis (Glu ou Gly ou Val) puis 1 à 7 fois n'importe quel acide aminé puis (Glu ou Gly) puis 1 à 2 fois n'importe quel acide aminé puis 4 fois (Arg ou Lys).

S(4)-[DS]-x-[DE]-[EGV]-x(0,7)-[EG]-x(1,2)- [KR](4)

Exemple : SSSSSDDEEEKRKR

(8)

Le motif de fixation du calcium (motif "EF-hand") est composé de 30 acides aminés et contient 2 hélices α (E et F - figurées respectivement par l'index et le pouce d'une main - figure ci-contre), reliées par une boucle.

Lors de la fixation du calcium, l'hélice F passe d'une conformation "fermée" (apo- CaM) à une conformation "ouverte" (holo-CaM).

Dans la CaM, les 4 boucles de liaison au calcium inclues dans ces motifs ont des séquences homologues :

D/N - x - D - G - D/N - G - T/Y/Q - x - x - x - x - E

Source : PFAM : PF00036

b. Ecrire la séquence consensus du motif EF-hand dans la syntaxe PROSITE. [DN]-x-D-G-[DN]-G-[QTY]-x(4)-E 7 atomes d'oxygène constitue le réseau de coordination du calcium :

5 proviennent de la chaîne latérale d'Asp et de Glu

le 6ème provient du groupement carbonyle de la liaison peptidique impliquant une Gln

le 7ème provient d'une molécule d'eau

(9)

Géomètrie des ligands du calcium dans un motif "EF - hand":

positions ligand

X et Y chaînes latérales des acides aminés Asp et Asn

Z chaînes latérales des acides aminés Asp, Asn et Ser

- Y oxygène du groupement carbonyle de la liaison peptidique

- X molécule d'eau

-Z bidentate ou chaînes latérales des acides aminés Asp et Glu

Source : Lewit-Bentley & Réty (2000)

Visualisation de la calmoduline de l'homme, non complexée au calcium, à une résolution de 1,7 Å

Code PDB : 1CLL

Acides aminés de l'un des 4 motifs "EF - hand" :

You do not have the Java Runtime Environment installed for applet support.

Visit www.java.com

(10)

EF1 : X = D20; Y = D22; Z = D24; -X = H2O; -Y = T26; -Z1

= E3; -Z2 = E31

Pour faire apparaître de multiples fonctions du menu Jmol :

clic sur "Jmol" (Mac)

clic droit sur "Jmol" (PC)

Rotation

Asp 20 / EF1 Asp 22 / EF1 Asp 24 / EF1 Thr 26 / EF1 Glu 31 / EF1

2. Effectuer une recherche de séquence de la calmoduline de l’homme au NCBI.

Repérer les acides aminés du motif "EF - hand".

Exemple : CaM humaine CAA36839

EIREAFRVFDKDGNGYISAAELRHVMTNLGE 3. Effectuer une recherche de séquences homologues ou similaires avec PHI-Blast à partir de cette séquence de calmoduline et du motif de fixation du calcium (format Prosite).

4. Effectuer une prédiction de structures secondaires avec un outil approprié.

5. Emettre une hypothèse pour expliquer que la calmoduline reconnait autant de cibles distinctes bien qu’il y ait une très forte homologie de séquence en acides aminés entre les calmodulines.

Calcium

(11)

J. Récepteurs et insuline

1. Aller à la base de données dédiées aux RCPG : "GPCRDB : Information system for G protein-coupled receptors".

Onglet "Search" => Onglet"Protein search" => champs "Description" => taper "serotonin".

Exercice d'alignement de séquences de la famille des récepteurs de la sérotonine de type 1A.

Cliquer sur le lien "Serotonin type 1a"

Cliquer sur le lien "Alignments & Analyses", puis "Download alignments (fasta)". Copier quelques séquences au format FASTA.

Aller à un logiciel d'alignement de séquences (exemple : Multalin).

Coller les séquences et lancer le programme.

Remarques :

l'onglet "MView alignment" permet de visualiser directement des alignements.

l'onglet "JalView multiple sequence alignment" nécessite l'activation de Java dans le navigateur.

Tirer des conclusions quant à la nature des acides aminés conservés.

2. Recherches de séquences de récepteurs.

a. Aller à Uniprot.

Taper : "ENSRNOP00000013618" dans la fenêtre "Query".

Cliquer sur le lien G3V7B9 dans la colonne "Entry".

Décripter les informations.

b. Récupérer le fichier : "FastaRecepMamm".

Effectuer un alignement multiple. Tirer des conclusions.

(12)

3. Insuline.

a. Aller au NCBI. Effectuer une recherche de récepteur de l'insuline de l'homme. Quels mots-clés faut-il employer ? Analyser le contenu résultat du fichier dont le N° d'accession est : AAA59452 ("insulin receptor - Homo sapiens").

b. Effectuer une recherche avec BLAST.

Il apparait une entête "Putative conserved domains have been detected, click on the image below for detailed results" : cliquer sur la figure.

Une nouvelle page s'ouvre. cette figure ("Putative conserved domains detected") à celle du cours sur le récepteur de l'insuline.

Cliquer sur un triangle rouge "ATP binding site". Retrouve-t-on la séquence "LGQGSFGMVY" dans celle du récepteur ?

c. Rechercher les fichiers dont les N° d'accession sont les suivants :

AAA59179

NP_000198

NP_001008996

Q8HXV2

P30407

AEG19452

ABB89743

ABB89749

ABI63346

Effectuer un alignement multiple. Tirer des conclusions.

(13)

F. Interférence ARN Voir le cours.

L'introduction d'ADN double brin ("double-strand DNA" - dsRNA) de plus de 30 nucléotides dans des cellules de mammifères induit la réponse interféron (activation de la protéine kinase R ("interferon-induced, double-stranded RNA-activated protein kinase") et de la 2',5'-oligoadénylate synthétase). Cette réponse entraîne la dégradation non spécifique des ARN messagers et une diminution du taux de traduction.

La conception de siRNA ("design" / "screening") nécessite que les ARN synthétisés contiennent moins de 30

nucléotides.

Les siRNA avec un débordement en 3’ constitué du dinucléotide UU sont les plus puissants.

(14)

Les règles de conception d’un siRNA à partir d’une séquence d’ARM messager sont :

siRNA targeted sequence is usually 21 nt in length.

Avoid regions within 50-100 bp of the start codon (ATG) and the termination codon. Targets should be located 50-100 nt downstream of the start codon.

Search for sequence motif AA(N19)TT or NA(N21), or NAR(N17)YNN, where : A = Adenine; T = Thymine; N = any nucleotide; R = purine (A, G); Y = pyrimidine (T, C, U).

Target sequences should have a [G+C] content between 30-60%.

Avoid stretches of 4 or more nucleotide repeats such as AAAA, CCCC.

Avoid intron regions, repeats and low complex sequences, single nucleotide polymorphism (SNP) sites.

Avoid 5'URT and 3'UTR, although siRNAs targeting UTRs have been shown to successfully induce gene silencing.

Avoid sequences that share a certain degree of homology with other related or unrelated genes : perform BLAST homology search to avoid off-target effects on other genes or sequences.

Always design negative controls by scrambling targeted siRNA sequence. The control RNA should have the same length and nucleotide composition as the siRNA but have at least 4-5 bases mismatched to the siRNA. Make sure the

scrambling will not create new homology to other genes.

Readseq : "biosequence conversion tool"

Trouver la séquence d’un siRNA dans la séquence de l’ARN messager codant la vimentine de l’homme : Homo sapiensvimentin mRNA, NM_003380.

> gi|240849334|ref|NM_003380.3| Homo sapiens vimentin mRNA

GGGCGCGCCAGAGACGCAGCCGCGCTCCCACCACCCACACCCACCGCGCCCTCGTTCGCC TCTTCTCCGGGAGCCAGTCCGCGCCACCGCCGCCGCCCAGGCCATCGCCACCCTCCGCAG CCATGTCCACCAGGTCCGTGTCCTCGTCCTCCTACCGCAGGATGTTCGGCGGCCCGGGCA CCGCGAGCCGGCCGAGCTCCAGCCGGAGCTACGTGACTACGTCCACCCGCACCTACAGCC TGGGCAGCGCGCTGCGCCCCAGCACCAGCCGCAGCCTCTACGCCTCGTCCCCGGGCGGCG TGTATGCCACGCGCTCCTCTGCCGTGCGCCTGCGGAGCAGCGTGCCCGGGGTGCGGCTCC TGCAGGACTCGGTGGACTTCTCGCTGGCCGACGCCATCAACACCGAGTTCAAGAACACCC GCACCAACGAGAAGGTGGAGCTGCAGGAGCTGAATGACCGCTTCGCCAACTACATCGACA AGGTGCGCTTCCTGGAGCAGCAGAATAAGATCCTGCTGGCCGAGCTCGAGCAGCTCAAGG GCCAAGGCAAGTCGCGCCTGGGGGACCTCTACGAGGAGGAGATGCGGGAGCTGCGCCGGC AGGTGGACCAGCTAACCAACGACAAAGCCCGCGTCGAGGTGGAGCGCGACAACCTGGCCG

Il faut donc trouver une séquence de 21 nucléotides dans l’ARNm cible qui commence par un dinucléotide AA.

(15)

On cherche le codon d'initiation de la transcription (AUG) : toutes séquences commençant par AA (et les 19 nucléotides suivants) constituent un site cible potentiel pour les siRNA.

Aller à : "AsiDesigner"

Vérifier la taxonomie (fenêtre de gauche) et le type d'information soumise.

Taper : NM_003380 dans la fenêtre "C. Target mRNA information".

Puis "Submit target mRNA information".

Reherche d'isoformes : cliquer sur le bouton "Find isoforms".

Cliquer sur le bouton "Design".

Paramètrage : modifier les valeurs en fonction de la séquence cible et des régles énoncées ci-dessus.

Cliquer sur le bouton "Submit design condition".

Voir le descriptif des colonnes en bas ("Column description").

Comparer les résultats avec la figure ci- contre. Modifier le paramètrage de

"AsiDesigner".

(16)

Résultat pour la vimentine

séquence ciblée - ADNc ("targeted region") 5' AACTACATCGACAAGGTGCGCTT

siRNA sens 5' CUACAUCGACAAGGUGCGCdTdT

siRNA antisens 5' GCGCACCUUGUCGAUGUAGdTdT

(17)

Autres exemples Lamine A/C

SC : 5'AACTGGACTTCCAGAAGAACATC sens :

5'CUGGACUUCCAGAAGAACAdTdT

antisens :

5'UGUUCUUCUGGAAGUCCAGdTdT

Lamine B1 SC :

5'AACGCGCTTGGTAGAGGTGGATT sens :

5'CGCGCUUGGUAGAGGUGGAdTdT

antisens :

5'UCCACCUCUACCAAGCGCGdTdT

GL2 Luciferase

SC : 5'AACGTACGCGGAATACTTCGATT sens : 5'CGUACGCGGAAUACUUCGAdTdT antisens :

5'UCGAAGUAUUCCGCGUACGdTdT

Source :Elbashir et al. (2001) / Tuschl Lab "The siRNA user guide"

Figure ci-contre : démarche pour la conception de siRNA ("siRNA design flowchart").

Source : AsiDesigner

(18)

Autres programmes

IDT - "Design siRNA following the rules of either Thomas Tuschl or Andrew Fire" : conception de dsRNA 27mers.

Entrer le nom de la séquence.

Coller la séquence cible.

Puis cliquer sur "Calculate".

Voir les différentes positions des siRNA sens trouvés.

TROD - "T7 RNAi Oligo Designer"

Liens Internet et références bibliographiques

The RNAi Web RNAi Web

1. Napoli et al. (1990) "Introduction of a chimeric chalcone synthase gene into petunia results in

reversible co-suppression of homologous genes in trans" Plant Cell 2, 279 - 289 Article 1

Références

Documents relatifs

du collège, la documentaliste reçoit 370 livres qu’elle doit ranger sur des étagères.. Elle ne peut transporter que 13 livres à

du collège, la documentaliste reçoit 370 livres qu’elle doit ranger sur des étagères.. Elle ne peut transporter que 13 livres à

14 Soit le programme de calcul suivant.. • Choisis

Donne le signe des

[r]

[r]

[r]

Utiliser le menu informations / sur la ligne pointée pour obtenir des informations sur la sélection : soit d’une ligne, soit de toutes les lignes en cliquant