• Aucun résultat trouvé

Modélisa)on en chimie: u)lisa)on de VMD pour l’analyse de sites enzyma)ques

N/A
N/A
Protected

Academic year: 2021

Partager "Modélisa)on en chimie: u)lisa)on de VMD pour l’analyse de sites enzyma)ques"

Copied!
12
0
0

Texte intégral

(1)

Modélisa)on en chimie:

u)lisa)on de VMD pour l’analyse de sites enzyma)ques

Cours de Master M1 Isabelle Navizet Isabelle.navizet@u-pem.fr

Laboratoire Modélisa)on et Simula)on Mul)-Echelle (MSME)

Les macromolécules du vivant:

les protéines

•  hJps://fr.wikipedia.org/wiki/Protéine

•  Une protéine est une macromolécule biologique formée d'une ou de plusieurs chaînes

polypep)diques. Chacune de ces chaînes est cons)tuée de résidus d'acides aminés liés entre eux par des liaisons pep)diques. On parle

généralement de protéine au-delà d'une

cinquantaine de résidus dans la molécule, et de

pep)de jusqu'à quelques dizaines de résidus.

(2)

Les macromolécules du vivant:

les protéines

20 acides

aminés de

propriétés

chimiques

spécifiques

(3)

Structure primaire

•  Exemple: Le lysozyme est une protéine formée de l'assemblage, dans un ordre bien précis, de 130 acides aminés. Chacun des mots de trois leBres de ceBe liste représente un acide aminé.

LYS VAL PHE GLU ARG CYS GLU LEU ALA ARG THR LEU LYS ARG LEU

GLY MET ASP GLY TYR ARG GLY ILE SER LEU ALA ASN TRP MET CYS LEU

ALA LYS TRP GLU SER GLY TYR ASN THR ARG ALA THR ASN TYR ASN

ALA GLY ASP ARG SER THR ASP TYR GLY ILE PHE GLN ILE ASN SER ARG

TYR TRP CYS ASN ASP GLY LYS THR PRO GLY ALA VAL ASN ALA CYS HIS

LEU SER CYS SER ALA LEU LEU GLN ASP ASN ILE ALA ASP ALA VAL ALA

CYS ALA LYS ARG VAL VAL ARG ASP PRO GLN GLY ILE ARG ALA TRP VAL

ALA TRP ARG ASN ARG CYS GLN ASN ARG ASP VAL ARG GLN TYR VAL

GLN GLY CYS GLY VAL

(4)

Structures secondaires et ter)aires

Structure quaternaire

Exemple: Crystallines Collagène

hBp://www.rcsb.org/pdb/101/motm.do?momID=127

hJp://www.rcsb.org/pdb/

101/motm.do?momID=4

(5)

Où trouver les structures 3D des protéines ?

• 

La protéine data Bank: hJp://www.rcsb.org

• 

Il y a plus de 155000 structures disponibles dans la PDB en 2019. Les sta)s)ques peuvent se trouver sur la page :

hJp://www.rcsb.org/pdb/sta)s)cs/contentGrowthChart.do?content=total&seqid=100

• 

Le format des fichiers .pdb peut se trouver en cliquant sur le menu Learn /guide to understanding pdb data ou en allant directement :

hJp://pdb101.rcsb.org/learn/guide-to-understanding-pdb-data/introduc)on

• 

Données expérimentales: RMN, cristallographiques : Coordonnées des atomes

• 

Visualisa)on des structures: logiciel VMD: hJp://www.ks.uiuc.edu/Research/vmd/

• 

Tutoriel de VMD :

hJps://www.sas.upenn.edu/~robertjo/html-physics/vmd/VMD%20User

%20Guide.pdf

•   Les structures cristallographiques sont répertoriées avec un code PDB, alphanumérique de 4 caractères. L’iden)fiant PDB est publié par les auteurs qui ont déterminé la structure. Pour chaque iden)fiant, une page web donne les informa)ons sur la structure et un fichier dit en format PDB donne l’ensemble des informa)ons lisibles par des logiciels de modélisa)on.

•  Une protéine peut avoir plusieurs entrées dans la banque

de données car elle peut être cristallisée par plusieurs

groupes, ou avec des muta)ons, ou dans des condi)ons

différentes (pH par ex), avec des ligands différents….Par

exemple l’hémoglobine a plus de 400 entrées. Lorsqu’on

u)lise un structure PDB, on donne le code référence et on

cite la publica)on origine de la structure.

(6)

Page d’accueil de la PDB

Recherche: ex hemoglobin

Code à 4 leJres de la structure

Si on clique sur le code 1FN3:

Lien pour récupérer le fichier .pdb

Organisme

Publica)on associée

(7)

4 chaines:

A et C iden)ques B et D iden)ques

Un ligand (pe)te molécule qui n’est pas une chaine protéique, qui peut être un ion, un médicament, un inhibiteur, une molécule organique, un chromophore,…)…

Ici il y a un ligand par chaine, de code à 3 leJre HNI, de nom Protophorphyrin IX containing NiII

De formule brute C

34

H

32

N

4

NiO

4

)

(8)

Format d’un fichier PDB

•  Les fichiers .pdb sont des fichiers de texte qui peuvent s’ouvrir avec un éditeur de texte (Wordpad, vi, textedit …). Chaque ligne commence par un mot clé et a un format spécifique.

•  Le format des fichiers .pdb peut se trouver en cliquant sur le menu Learn /Understanding pdb data ou en allant directement :

hthJp://pdb101.rcsb.org/learn/guide-to-understanding-pdb-data/

introduc)on

•  La première par)e du fichier donne des informa)ons générales et

importantes sur la structure. Elle commence par le mot clé HEADER et finit lorsque le mot clé ATOM commence. On peut vérifier dans les rubriques HEADER, TITLE, COMPND et SOURCE qu’on a bien la structure souhaitée.

•  La par)e commençant par ATOM/HETATM donne les coordonnées des atomes. ATOM est le mot clé devant les atomes d’une protéine ou d’un acide nucléique, le mot HETATM correspond aux autres molécules (ligand, ions, solvant ...).

•  Le mot clé TER permet de définir la fin d’une chaîne.

Fichier pdb

On retrouve toutes les informa)ons

du site écrites dans les premières lignes

(9)

Fichier pdb

Puis des info sur la séquence primaire des chaines protéique, Sur le ligand ligne commencant par HET et HETNAM et FORMUL Puis sur les structures

secondaires HELIX…

Enfin, les coordonnées xyz des atomes…

On remarque qu’il n’y a pas d’hydrogène !

Premier résidue:

Valine de la chaine A

(10)

Un peu plus loin…. HETATM: ce n’est pas de la protéine mais un ligand Ou le solvant

Solvant: c’est l’eau ! Code HOH ici

Peut-être un code différent:

SOL ou H2O ou WAT…

Suivant le fichier.

On n’a que les oxygènes du Solvant, car pas de H dans les pdb !

•  Exemple :

•  ATOM 1 N HIS A 6 49.668 24.248 10.436 1.00 25.00

•  CeJe ligne correspond à l’atome d’azote, qui est

l’atome 1 du résidu His)dine numéro 6 de la chaîne A avec les coordonnées x =49.668 Angström y=24.248 Angström z=10.436 Angström. Taux d’occupa)on

« Occupancy » 1 (il n’y a pas de conforma)ons autres

détectées, sinon ce nombre serait plus pe)t que 1),

facteur de température ou B-factor (plus l’atome

bouge, plus ce nombre est grand) de 25.0

(11)

•  Deuxième exemple:

ATOM 6667 CE2 PHE B 435 15.265 -30.142 -11.305 1.00 23.81 C

C’est l’atome numéro 6667 de la protéine, c’est un carbone (CE2 commence par un C et le dernier symbole est un C), c’est le carbone CE2 de la phénylalanine (PHE) numéro 435 de la chaine B. les coordonnées sont x=15.265 Angstrom, y= -30.142 Angstrom et z= -11.305 Angstrom. (Pour ce cours on oublie l’info des 1.00 et de 23.81).

HETATM 7278 O1D HEM B1497 4.392 -21.038 -14.978 1.00 32.49 O

C’est l’atome numéro 7278 qui n’appar)ent pas à la protéine (HETATM). C’est un oxygène (O1D commence par O et le dernier symbole de la ligne est O). C’est

l’oxygène de code à 3 leJre O1D du ligand hème de code à 3 leJre HEM de la chaine B. Le numéro du ligand dest 1497 et les coordonnées 4.392 -21.038 -14.978 en Ångstrom.

légende:

Nakatsu et al, PNAS, 2006, vol 440, 372-376

(12)

Nakatsu et al, PNAS, 2006, vol 440, 372-376

Avant de commencer, quelques recommanda)ons:

•  Créer un répertoire pour meJre tous vos fichiers pour chaque projet (pas de blanc, pas d’accent, car VMD n’aime pas)

Ex: MODELISATION

VMD1, VMD2, VMD3,….

•  Les PDB n’ont pas d’info sur les atomes hydrogène, donc si on veut parler de liaisons hydrogène, il faut au préalable rajouter les H avec le logiciel MOLprobity par exemple

•  Une liaison H n’existe qu’entre un H aJaché à un atome

électronéga)f A (A=N, O ou F) et l’orbitale non liante d’un atome électronéga)f B (B=N, O ou F), tels que A-H…B soient pra)quement alignés et que H et B ne soient pas trop éloigniez.

•  Les légendes des figures sont aussi importantes que les figures elles-mêmes. Se poser toujours la ques)on si quelqu’un qui regarde la légende+figure va comprendre le message qu’on veut faire

passer.

Références

Documents relatifs

sWmule  étudiants  et

[r]

Les effets de diffraction multiple, principal obstacle à une détermination précise des facteurs de structure en diffraction des électrons, ne sont donc plus un obstacle à

de grains avec une orientation Cube {100}<001>). Résultats de l’analyse quantitative de texture magnétique présentés sous la forme de figures de pôles directes mesurées

[r]

Les paramètres de QS énumérés dans les tableaux suivants sont moyennés sur les 160 premières secondes de la transmission. Lorsque le PDB BE

• Le spectre d’une espèce chimique dissoute dans un solvant donné contient une ou plusieurs bandes d’absorption.  ‘abscisse de son maximum λ max : Pour une bande

Toutes les pressions considérées dans cette partie sont des pressions relatives (voir la question 1.1 d). a) On considère le modèle de la chute d’eau présenté dans le document 5