• Aucun résultat trouvé

Algorithmes d'optimisation et d'analyse des problèmes multidimensionnels, non linéaires, en Biologie et Biophysique

N/A
N/A
Protected

Academic year: 2021

Partager "Algorithmes d'optimisation et d'analyse des problèmes multidimensionnels, non linéaires, en Biologie et Biophysique"

Copied!
381
0
0

Texte intégral

(1)

HAL Id: tel-00196740

https://tel.archives-ouvertes.fr/tel-00196740

Submitted on 13 Dec 2007

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

multidimensionnels, non linéaires, en Biologie et

Biophysique

Benjamin Parent

To cite this version:

Benjamin Parent. Algorithmes d’optimisation et d’analyse des problèmes multidimensionnels, non

linéaires, en Biologie et Biophysique. Biochimie [q-bio.BM]. Ecole Centrale de Lille, 2007. Français.

�tel-00196740�

(2)
(3)
(4)

En todo amar y servir  SaintIgna e de Loyola

(5)
(6)

Remer iements

À la n de ette thèse et de sa réda tion, for e m'est d'avouer que j'ai expéri-menté le sentiment de gratitude; e paragraphe se veut être un résumé des profus etprofonds remer iements queje souhaiteexprimer.

Je suis, tout d'abord, extrêmement honoré de ompter, parmi les membres du jury, les personnes suivantes : Madame A. Imberty et Messieurs A. Ri hard et T. Bastogne, qui ont a epté d'être rapporteurs pour ette thèse, ainsi que Messieurs A.Varnek etM. Davy.

Cette thèse interdis iplinaire n'a pu voir le jour et se on rétiser que grâ e à l'impli ationdepersonnesàl'espritparti ulièrementouvert,jetiensdon àremer ier touteslespersonnesquiontparti ipéaupilotagede etravail:B.Vandenbunder, J.-P.Ri hard,mesdire teurs,D. Horvath,G.Lippens etA.Kökösy, quim'onten adré aujour le jour. Votre sens humain et votre honnêteté remarquable ont modelé ma personne autant que mon travail. Pour avoir été habiles à diriger es re her hes et par eque votre passionest ontagieuse, je vous exprime haleureusement toute ma gratitude.

Demême,je tiensàremer ier mafamilled'a ueils ientiquequ'est l'équipede G.Lippens : Fanny, Isabelle, Laziza, Nathalie, Alain,Arnaud,Dries, Gérard, Jean-Mi heletXavier.Cetteformidableaventure,avanttouts ientique,s'esté ritedans un jour-après-jour ave des mots humains.

À l'équipede modélisationdes rythmes ir adiens, je voudraiségalement expri-mer toute ma re onnaissan e pour toutes les dis ussions et les groupes de travail passionnants. Je remer ie également l'équipe de F.-Y. Bouget qui nous a a ueillis haleureusement et nous a initiéspatiemmentau B.A.-bades rythmes ir adiens.

Mes remer iements vont également à l'ensemble des personnes du LAGIS qui m'ont apporté lesréponses oules pistes àpoursuivrequand j'enavaisbesoin.

Jeremer ie aussil'équipeOPACdu LIFL,eten parti ulierEmiliaetAlexandru pour leur disponibilitéet leur simpli ité.

Je voudrais enn exprimer ma gratitude au orps enseignant de l'é ole ISEN Lille qui a forgé en moi e goût de la re her he et m'a ensuite oert l'opportunité de harges d'enseignementspendant es trois années de thèse.

Je terminerai par les premières personnes qu'il faut remer ier : la famille.Vous avez misen moi ette graine de uriositéarrosée de passions... Elleest maintenant devenue grande et insatiable. C'est elle, ave votre soutien, qui me fait avan er,

(7)

mathèse seize heurespar joursans vous lasser de roireque j'aboutiraietlesmots, dé idément, ne seront jamaissusants pour vous dire toute mare onnaissan e. Je pense en premier lieu à mes parents et à ma femme : Anne; quant à toi, Joseph, mêmedu ventre de tamamanetdepuis quetuen essorti,tum'as bienaidé aussi à tafaçon.Tureprésentes tout e en quoije rois, etpuisque j'ailanaïveté de penser quetravailler, 'est roire en demain,je tedédie e travail.

(8)

Remer iements 5

Table des matières 7

Introdu tion 15

Liste des symboles utilisés 18

I Première partie : la modélisation molé ulaire 19

1 Introdu tion à la himie et bio himie 21

1.1 Introdu tion . . . 21

1.2 La molé ule . . . 22

1.2.1 Cas général . . . 22

1.2.2 Exemples biologiques . . . 24

1.3 La stru ture des molé ules . . . 29

1.3.1 Leur exibilité. . . 29

1.3.2 Les niveaux de stru turation . . . 31

1.3.3 L'interprétation énergétique . . . 33

1.3.3.1 Une des ription statique . . . 34

1.3.3.2 L'énergie libre. . . 35

1.3.3.3 L'hypothèse thermodynamique . . . 39

1.3.4 Le pro essus de repliement . . . 41

1.3.4.1 Le paradoxe de Lévinthal . . . 41

1.3.4.2 Représentations du paysage . . . 43

1.3.4.3 Dans quelles onditions la molé ulesereplie-t-elle? . 47 1.3.4.4 Inter onversions ettemps d'attente . . . 48

(9)

1.4 Les méthodes expérimentales. . . 51

2 La modélisation molé ulaire 55 2.1 Introdu tion . . . 55

2.2 Comment intégrer lamolé ulein sili o? . . . 56

2.2.1 Les appro hes topologiques. . . 56

2.2.2 Les oordonnées artésiennes. . . 57

2.2.3 La des ription ve torielle . . . 57

2.2.4 Distan e geometry . . . 57

2.2.5 La des ription résidus uniés . . . 59

2.2.6 Le modèle hydrophobe-polaire sur grilles 2D et 3D . . . . 60

2.3 Comment dé rirela exibilitédes molé ules? . . . 61

2.3.1 Codage absolu et relatifdes oordonnées artésiennes . . . 61

2.3.2 Les degrés de liberté torsionnels . . . 62

2.4 Le hamiltonienmolé ulaire . . . 65

2.4.1 Contributions dominantes . . . 66

2.4.1.1 Les énergies de valen e . . . 67

2.4.1.2 Les énergies non ovalentes . . . 70

2.4.2 Les autres ontributions . . . 72

2.4.2.1 Les termes de torsion. . . 73

2.4.2.2 Le solvant . . . 73

2.4.2.3 La désolvatation . . . 75

2.4.2.4 L'hydrophobie . . . 76

2.4.2.5 Le lissage des singularités . . . 77

2.4.2.6 La tron ature des intera tions à longuesdistan es . . 78

2.4.3 Résumé des ontributions et exemple . . . 78

2.4.4 Les hamps de for es . . . 79

2.5 La problématique etleshypothèses . . . 81

2.5.1 Quel algorithme her he-t-on? . . . 81

2.5.2 Une ouplusieurs molé ules? . . . 82

2.5.3 Appro hes dynamiques

VS

statiques . . . 83

2.5.4 Que serait l'algorithme idéal? . . . 85

(10)

3 É hantillonnage onformationnel d'une seule molé ule 89

3.1 Introdu tion . . . 89

3.2 Les stratégies existantes . . . 90

3.2.1 Algorithmes déterministes . . . 91

3.2.2 Algorithmes sto hastiques sans mé anisme de séle tion . . . . 92

3.2.3 Algorithmes sto hastiques ave mé anismes de séle tion sur solution unique . . . 94

3.2.4 Algorithmes sto hastiques ave mé anismes de séle tion sur un ensemblede solutions . . . 95

3.2.5 Les dynamiques molé ulaires. . . 98

3.2.6 Résumé des heuristiques . . . 99

3.3 Premières ara téristiques . . . 100

3.3.1 Résultats sur la omplexité. . . 100

3.3.2 Pré ision du al ul pour l'estimation de l'énergie. . . 101

3.3.3 Temps ara téristique . . . 102

3.4 Implémentation d'un algorithme génétique . . . 102

3.4.1 Prin ipegénéral . . . 102

3.4.2 Implémentation . . . 104

3.4.2.1 Le odage des données . . . 104

3.4.2.2 Fitness . . . 105

3.4.2.3 Gestion de la population . . . 105

3.4.2.4 Gestion de l'évolution . . . 105

3.4.2.5 Le mé anisme de séle tion naturelle. . . 106

3.4.2.6 Contrle de la onvergen e . . . 107

3.4.3 Les hybridations ave d'autres heuristiques . . . 108

3.4.3.1 Gradient onjugué . . . 108

3.4.3.2 Explorateurs indépendants . . . 109

3.4.3.3 Introdu tionde tabous . . . 111

3.4.3.4 Distributions de probabilités biaisées . . . 111

3.4.4 Méta-optimisation . . . 113

3.4.4.1 Les haînes de Markov . . . 114

3.4.4.2 Le tness d'un algorithme . . . 115

3.4.4.3 Méta-algorithme d'optimisation . . . 117

3.4.5 Résultats . . . 117

(11)

3.4.5.3 Analyse des résultats . . . 121

3.4.5.4 Comportementen fon tion des stratégies d'hybrida-tions . . . 123

3.4.5.5 Convergen e du

µG

A

etétude des paramètres internes127 3.5 Vers une validationà plus grandeé helle . . . 131

3.5.1 Les molé ules utilisées . . . 131

3.5.1.1 Détail des molé ules . . . 132

3.5.1.2 Un é hantillonnagepartiel . . . 134

3.5.2 Premiers onstats . . . 134

3.5.2.1 Un besoin d'intensi ation . . . 134

3.5.2.2 Interprétation des résultatsexpérimentaux . . . 136

3.5.3 Détails de l'é hantillonneurlo al . . . 137

3.5.4 La fragmentation . . . 138

3.5.4.1 Méthode de fragmentation . . . 138

3.5.4.2 Réunion des fragments . . . 141

3.5.4.3 Résultats . . . 141

3.6 Parallélisationde l'algorithme . . . 143

3.6.1 L'environnement de GRID5000 . . . 144

3.6.2 Une stratégiedédiée à lagrille: lemodèle planétaire . . . 146

3.6.2.1 Une optimisationasyn hrone des paramètres opéra-tionnels . . . 147

3.6.2.2 La panspermie . . . 147

3.6.2.3 Stratégie d'intensi ation . . . 147

3.6.2.4 Résultats . . . 148

3.6.3 Interprétation himique. . . 152

3.7 Des défauts dans le hamp de for es? . . . 154

3.7.1 La ulpabiblité du hamp de for es . . . 155

3.7.2 Un optimiseur de hamps de for es... . . 156

3.7.2.1 Dénition du s ore d'un hamp de for e . . . 157

3.7.2.2 Une stratégied'optimisation . . . 157

3.7.2.3 Résultats . . . 159

3.7.3 Derniers développements: omment gérer l'entropie . . . 163

3.7.3.1 Introdu tion . . . 163

3.7.3.2 Détail de la stratégie . . . 164

(12)

3.8.2 La y lophilline . . . 169

3.9 Con lusion . . . 170

4 Versdes stratégiesde prédi tion des anités entre ligandset ibles ma romolé ulaires 173 4.1 Introdu tion . . . 173

4.2 La omparaisondes stru tures . . . 174

4.2.1 La déviation standard moyenne . . . 175

4.2.1.1 Dénition du ritère . . . 175

4.2.1.2 Translation . . . 176

4.2.1.3 Rotation. . . 177

4.2.1.4 Résultats etperforman es. . . 180

4.2.2 Un s ore de superposition pharma ophorique ou . . . 181

4.2.2.1 Dénition du s ore . . . 183

4.2.2.2 Heuristiques de re her he . . . 186

4.2.3 Les des ripteurs de motifspharma ophoriques . . . 187

4.2.4 Résultats . . . 190

4.3 L'é hantillonnage onformationnelde deux molé ules . . . 191

4.3.1 Développements futurs . . . 192

4.3.2 Remarques sur la fon tion s ore . . . 193

4.4 Con lusion . . . 195

II Deuxième partie : les réseaux de régulation géniques 197 5 Modélisation des rythmes ir adiens 199 5.1 Introdu tion . . . 199

5.2 Élémentsde base pour la modélisationdes réseaux géniques . . . 201

5.2.1 Troismé anismes de base . . . 202

5.2.1.1 La trans ription . . . 202

5.2.1.2 La tradu tion . . . 203

5.2.1.3 La dégradation . . . 204

5.2.2 Les rythmes ir adiens . . . 206

5.3 Étude omplète de larépression autogène . . . 206

5.3.1 Con eption d'un modèle . . . 207

(13)

5.3.1.3 Équations du système . . . 210

5.3.2 Analyse du système . . . 210

5.3.2.1 Domaine invariant . . . 210

5.3.2.2 Étude des pointsd'équilibre . . . 210

5.3.2.3 Adimensionnement . . . 212

5.3.2.4 Étude lo ale autourdu pointd'équilibre . . . 213

5.3.3 Étude du ritèrede Routh . . . 217

5.3.3.1 Première on lusion . . . 217

5.3.3.2 Interprétation . . . 217

5.3.4 Cas parti ulier :les dégradationsenzymatiques . . . 219

5.3.4.1 Équation de Mi haëlis-Menten. . . 219

5.3.4.2 Analyse des résultats . . . 220

5.3.4.3 Con lusion . . . 221

5.3.5 Remarques sur nos hoixpour la modélisation . . . 221

5.3.5.1 Les régulations . . . 222

5.3.5.2 Les aspe ts spatiaux . . . 222

5.3.5.3 Les aspe ts sto hastiques . . . 223

5.3.5.4 Des mesures sur populationsentières . . . 223

5.4 Dis ussion . . . 223

5.4.1 Les réseaux . . . 224

5.4.2 Re her he de fon tions parti ulières . . . 224

5.4.3 Appro hes envisageables . . . 225

5.4.4 Littérature on ernant lamodélisationdes rythmes biologiques226 5.5 Con lusion . . . 228

Con lusion et perspe tives 229 III Annexes 1 : ompléments 235 Liste des abbréviations 237 A Introdu tion et résultats utiles on ernant les quaternions 239 A.1 Dénition . . . 239

A.2 Interprétationgéométrique dans

R

3

. . . 241

(14)

B Revue des prin ipaux arti les on ernant 1LE1 247

B.1 Muñoz et al.1997, Nature . . . 247

B.2 Co hran et al.2001, PNAS . . . 248

B.3 Yang et al. 2004, Journalof Mole ular Biology . . . 249

B.4 Snow et al.2004, PNAS . . . 251

B.5 Guven h et al. 2005, Journalof the Ameri anChemi al So iety . . . 251

B.6 Wenzel et al. 2006,Europhysi sLetters . . . 253

IV Annexes 2 : publi ations personnelles, onféren es et

posters 255

C Arti le 1 : Journal of Soft Computing, 2007 257

D Arti le 2 : Journal of Chemi al Informati Models, 2006 259

E Arti le 3 : Future Generation Computer Systems, 2007 261

F Arti le 4 : Journal of Biologi al Chemistry 263

G Conféren e 1: Congress on EvolutionaryComputation,Singapour,

2007 265

H A he 1 : Gordon Conferen e, Suisse, 2006 267

I A he 2 : Computational Biology, Lille, 2006 269

J Arti le relatif à l'a he 3 : Ren ontres du Non-Linéaire, Paris,

2007 271

Bibliographie 273

(15)
(16)

Introdu tion

Ce i est une thèse sur la omplexité du vivant!

Cette omplexitéapparaîtdéjà à l'é helle molé ulaire, pour laquellela détermi-nation de la forme tridimensionnelle des molé ules est en ore un hallenge majeur pour labio himie. C'est pourquoiune grande partiede lathèse est dédiéeà l'étude de méthodes omputationnelles permettant d'a élérer et/ou de ompléter les ap-pro hes expérimentales destinées à mieux omprendre la fon tion des molé ules et leurs intera tions.

Car la fon tion d'une molé ule repose sur ses intera tions. Par ailleurs, tout le fon tionnement de la ellule, brique de base des organismes vivants, repose sur es intera tions. La omplexité, déjà présente auniveau de la molé uleunique, explose alors lorsqu'il s'agit d'intégrer plusieurs molé ules (quels sites de xation? quels modes d'intera tions? quelles anités? ombien d'a teurs? lesquels?). En e sens, lesujetprin ipalde ettethèseauraitpu être: ommentaborderin sili o l'étudede l'intera tome, 'est-à-dire de l'ensemble des intera tions qui se jouent sur la s ène ellulaire.

Entrelesintera tionsmolé ulairesetl'organisationgénéraledela ellule,ilexiste (aumoins)unniveaufon tionneldehiérar hisationintermédiaire: eluidesmodules fon tionnels. Depuis l'ère de la génomique où de nombreux génomes ont été entiè-rement séquen és, on saiten eet que le graphe des intera tions molé ulaires n'est pas purement aléatoireave des intera tions tous azimuts, maisqu'au ontraire, les molé ulestravaillentparfamillesàl'a omplissementdetâ hes spé iquesquileurs sont dédiées; 'est e que nous avons appelé les modules fon tionnels. Inutile de souligneren oreunefoisleniveaude omplexitéqui ara térise es modulesetleurs interfaçages...

Pour modéliserde telsréseaux,extrêmement omplexes, ons'expose immédiate-ment à la di ulté de la mesure des quantités au sein d'organismes vivants, étant donnés,d'une part,leuraspe t mi ros opiqueet, d'autrepart,leurfragilité. L'arme de hoixest alors labiologie,quiattaque lesmodules fon tionnelspar uneappro he des endantedetypeboîteblan he.Cependant,l'avènementdelagénomique,depair ave la bioinformatique, a permis de réaliser des avan ées remarquables. De plus, lesdéveloppements,depuis un siè le,de laphysiqueet de labio himie ontdonné le jour àde nouveaux outils permettant d'a éder à une masse de plus en plus onsi-dérable de données, qui inonde dorénavant la ommunauté s ientique. Le

(17)

traite-reprodu tibles, posent maintenant de nouveaux dilemmes. C'est pourquoi on voit apparaîtresur las ène,des s ientiquesissus des mathématiques,de l'informatique ( al uls ientique et al ul formel),de laphysiquethéorique,de l'automatique des systèmes,et .

Le but de ette thèse fut de tirer sur e voiledes modules fon tionnels.

Ladi ulté de l'interdis iplinaritéde e travails'est aussi ressentie dans l'exer- i e de réda tion, pour lequel les outumes et exigen es dièrent parfois. Ce ma-nus rit peut paraître long... il a été rédigé dans le but de pouvoir être repris par une autre personne dans le même ontexte interdis iplinaire. Par ailleurs, ertains hapitres voire ertaines se tions  sont plus adressés àtel outel orps de spé- ialistes.C'est pourquoi la stru ture est maintenant détaillée.

Ande pouvoir seratta her à des éléments onnus, nous avons entamé la ques-tion par l'appro he as endante, 'est-à-dire par la modélisation des molé ules qui obéissent toujours aux lois de la mé anique (quantique et/ou newtonienne). Une grande partie de notre travail a alors été d'intégrer les bases de himie né essaires à la problématique; pour que e travail puisse être a essible par d'autres  non-spé ialistes, nous avons don souhaité onsa rer le premier hapitre à un mini-exposé de es quelques rudiments. Certainement, e hapitre paraîtra super iel aux himistes, ependant, ilfonde lemodèlemathématique permettantde reformu-lerleproblèmephysiqueenunequestiond'optimisation.Ysontrapidementdé rits: e qu'est une molé ule, lesprin ipauxtermes de vo abulaire utilisés ultérieurement etquelques prin ipesdu repliementdes molé ules.Enparti ulier,nousavonsinsisté sur lefait que, ontrairementaux problèmes lassiquesde re her he opérationnelle, nousne her hons pasune solutionsatisfaisanteàunproblème,mais bientoutes les solutionsminimisantle ritèreénergétique.

Après ette première présentation, purement himique, de la molé ule, le deuxième hapitre présente les diérentes étapes d'intégration de la molé ule dans l'ordinateur : il faut en oder l'information sur les atomes, la géométrie de la mo-lé ule, il faut pouvoir dé rire sa exibilité; et puisque ette exibilité dépend de la forme du paysage énergétique, il faut pouvoir estimer ette énergie interne. Ce hapitre permet de donnerun aperçu des appro hes utiliséesdans lalittérature et de justier nos hoix. Il s'a hève sur la dénition du adre pré is des re her hes menées. Ces dernières font l'objet des hapitres 3et 4.

(18)

as parti ulier où  plusieurs

= 1

, 'est-à-dire prédire in sili o la géométrie des molé ules d'intérêt, véritable base de leurs fon tions. Cette étape est appelée d'é hantillonnage onformationnel . La phase de do king (an rage d'une petite molé uledans lesite a tif d'uneplus grande) apparaîtalors ommeune généralisa-tion naturelleoù, à la exibilitédes deux molé ules, on ajouteles degrés de liberté orrespondant aupositionnementde ha un des partenaires.

Letroisième hapitreestex lusivement onsa réànotretravail on ernant l'opti-misationde l'é hantillonnage onformationneld'une seule molé ule. Il détaille l'en-semble des algorithmes développés, les résultats et les avan ées, la parallélisation de la stratégie et deux appli ations. Le quatrième hapitre présente nos premiers développements en vue de la prédi tion des anités entre plusieurs molé ules. Il on erne essentiellement la gestion des degrés de liberté du positionnement relatif des molé ules ets'a hève sur lesdéveloppements envisagés pour lefutur.

Ainsi, bien que les hapitres 1 et 2 fassent partie intégrante de notre travail, dans le sens où ils traduisent une formationà un nouveau domaine, ilsne sont pas indispensables à la ompréhension des stratégies développées. Ces dernières ont été volontairement rassemblées dans les hapitres3 et4.

Dans une deuxième partie ( hapitre 5), nous nous sommes atta hés à une mo-délisationplus abstraite des modules fon tionnels (appro he des endante) et avons montré en parti ulier omment les dynamiques d'intera tions molé ulaires peuvent entraîner diérents omportements à l'é helle du module fon tionnel. Il existe plu-sieurs exemples typiques de omportements : bistabilité (mémoire, ommutateur), multi-stabilité(diérentiation ellulaire), os illations(horloges internes), arythmie, hystérèse,voire parfoisphénomènes haotiques. Pour notrepart, nousnous sommes on entrés sur la modélisation d'un module d'horloge qui permet aux organismes de syn hroniser leur métabolisme sur le rythme du jour et, ainsi, d'anti iper les périodes de lumière et elles de pénombre.

NB:pourfa iliterlale ture(éventuellementnon linéaire)de emanus rit,nous avons ajoutéen annexe une listedes abréviations employées, page 237.

(19)

Liste des symboles utilisés

symbole signi ation

,

égal, par dénition

♯A

ardinal de l'ensembleA

B(a, r)

boule de entre

a

et de rayon

r

A

⊥B

A

est orthogonal à

B

pour leproduit s alaire onsidéré

n

p



oe ient binomialde Newton égal à

n!

p!(n−p)

Re

(z)

, Im

(z)

respe tivement, parties réelle et imaginaire du omplexe ou du quaternion

z

hu|vi

produit s alaire dans l'espa eve toriel onsidéré

δ(x = x

0

)

mesure oudistribution (selon le ontexte) de Dira en

x

0

L

2

(R

n

)

espa e des fon tions de arréintégrablesur

R

n

d(A, B)

distan e entre les points

A

et

B

dans l'espa e onsidéré et

selon ladistan e onsidérée. Parfois,lanotation

d

1,2

est utili-sée pour dénoter la distan e eu lidienne entre les entres des atomes numéros 1et 2.

V,

X

transposé du ve teur

V

oude lamatri e

X

tr

(X)

tra e de lamatri e

X

(20)
(21)
(22)

Introdu tion à la himie et bio himie

1.1 Introdu tion

La ompréhension des mé anismesdu repliementtridimensionneletdes intera -tionsdes molé ules est, d'une part,parti ulièrementprometteuse, ar eux- i inter-viennent dans de nombreux pro essus biologiqueset leurs dysfon tionnementssont in riminés dire tement dans le développement de ertaines maladies (Alzheimer, va he folle,et .).D'autre part,elle ontinue de déerless ientiquesdepuisplus de inqdé énnies.

En her hant à modéliser l'arrimageentre molé ules, nous avons développé une suite de programmes qui se distinguent par deux points très importants. Tout d'abord, ontrairementàde nombreuses autresappro hes

1

,nous onsidéronstoutes les molé ules, sans restri tion, de manière générique. Nous pensons que, s'il existe un hamp de for e pour dé rireles intera tions à l'é helleatomique, ildoit pouvoir s'appliqueraussibien auxprotéines qu'aux petites molé ules organiques, ouqu'aux bases d'ADN. Aussi nous rappelons, dans e premier hapitre, lesquelques notions élémentaires de himie dont nous avons besoin.

Notre travail sediéren ieaussi par l'appro he multimodaleet l'enviede ara -tériser,mêmede façonsommaire,tous lesétatsprobables. Ainsi,nous ne her hons pas la stru ture laplus stable, mais tentons de dé rirela molé uleen solution ave sa exibilité, tout en restant dans une des ription statique. Nous présentons don su in tement les bases théoriques qui di tent la onformation des molé ules.

Cette présentation àl'usage du le teur étranger à la himie peut être omise par 1

ertainsne onsidèrentqu'unseultypedemolé ules,d'autres,qu'uneseulemolé ule(Jinetal., 1999).

(23)

le himiste qui trouvera, au besoin, des référen es aux paragraphes orrespondants dans lasuite des hapitres.

Cette partie s'arti ule autour de la se tion prin ipale 1.3 qui, après un rapide aperçu de e qu'est une molé ule dans la se tion 1.2, présente la ou les stru tures des molé ules (1.3.1 et 1.3.2), le pourquoi (1.3.3) et le omment (1.3.4) physiques de ette stru turation.

1.2 Qu'est- e qu'une molé ule?

1.2.1 Cas général

La molé ule se présente omme un système d'atomes reliés entre eux par des liaisonsdites de ovalen e (gure1.1).

Fig. 1.1: premierexempledemolé ule:l'éthanolqui su èderapeut-êtreaux ar-burantsa tuels.

Ces liaisons sont le fait de la mise en ommun d'orbitales éle troniques : les noyauxatomiquessonten eetentourésde unouplusieursnuageséle troniquesqui o upentdesorbitalesditesliantesounon-liantes,selonqu'ellessontrespe tivement partiellementremplies(un seuléle tron her hantàselier)ouentièrementremplies (par un doublet d'éle trons omplémentaires). Ces liaisons ovalentes peuvent se rompreetse former, 'est le as des réa tions himiques (gure1.2).

(24)

un graphe où les atomes sont les sommets et les liaisons ovalentes, les arêtes. Ce graphepeut omporter des y les (gures1.3).

Fig. 1.3: exemplesdemolé ules y liques:la aféineet lamolé uledefullerene.

Dans ette représentation, haque type atomique se distingue par ertaines a-ra téristiques (voir tableau 1.1) omme son nombre de voisins  appelés substi-tuants  son rayon de ovalen e, son éle tronégativité, et . Conventionnellement, onattribueune ouleur auxprin ipaux types atomiques.

Atome symbole nombre de liaison(s) rayon de ovalen e (en Å) ouleur Carbone C

4

0, 77

vert ounoir

Azote N

3

0, 75

bleu

Phosphate P

3

1, 06

marron

Oxygène O

2

0, 73

rouge

Soufre S

2

1, 02

jaune

Hydrogène H

1

0, 37

blan

Fluor F

1

0, 71

bleu iel

Chlore Cl

1

1, 00

vert

Brome Br

1

1, 14

bordeau

Iode I

1

1, 33

violet

Tab. 1.1: ara téristiquesdesprin ipauxatomesren ontrés.

Cependant la molé ule reste un objet tri-dimensionnel et tous les voisins d'un atomedonnénesontpasfor émentéquivalents.Ainsi,parexemple,silesquatre sub-stituants d'un arbone tétrahédrique sont diérents, la molé uleet son image dans un miroir ne seront pas superposables et auront des propriétés physi o- himiques diérentes. L'atome responsable est alors ditasymétrique, lamolé ule hirale et les deux molé ules images l'une de l'autre sont des stéréoisomères. C'est le as, par exemple, de la arvone, dont une molé ule est à l'origine de l'odeur de fenouil de l'aneth,tandisque son stéréoisomèredonneune odeur de menthe. La hiralité peut aussi apparaître lorsqu'il n'y a que trois substituants, mais qu'il existe un nuage éle tronique forçant une géométrie tétrahédrique; un exemple de telles molé ules

(25)

Fig. 1.4: (gau he) le arbone indiqué par une ê he, est asymétrique, les deux stéréoisomères sont himiquement diérents. (droite) De même, l'azote, qui a une stru ture tétraédrique due àses trois substituantset sondoublet éle tronique non-liant,estasymétrique.

1.2.2 Exemples biologiques

En himie, on partitionne généralement l'étude des molé ules en deux grandes se tions que sont la himie organique et la himie inorganique ou minérale. La première on erne l'étude des omposés dits organiques ou arbonés, ar ils sont prin ipalement onstitués de arbone et d'hydrogène. La deuxième étudie tous les omposés non-organiques (minéraux,métaux, omplexesmétalliques,et .).

Enn,labio himie eninterse tionnonnulleave esdeuxdomaines s'inté-resse auxréa tions qui ontlieu dans etau voisinage des ellules (et éventuellement auniveaude leursparois).Silabio himieest engrandepartieorganique,on ompte toutefois de nombreux éléments métalliques intervenant dans des pro essus biolo-giques.

Ilfautégalementnoterun élémentqui distinguela himie lassiquede la bio hi-mie:dans lapremière,lesréa tionssous-entendent desmodi ations ovalentes de la molé ule, tandis que la deuxième répertorie également des intera tions beau- oup plus faiblesetréversibles(repliement,arrimagede molé ules, et .).

Parmi les molé ules du vivant, on peut répertorier les suivantes (liste non-exhaustive) :

L'ADN oua ide désoxyribonu léique onstituele supportdu génome; ilest, non pas une, mais deux molé ules enroulées en forme de double héli e (première stru -ture proposée par Watson et Cri k en 1953). Cha une des deux molé ules est une su ession de motifsappelés nu léotides. Il en existe quatre (gure 1.5) :

 GouGuanine  CouCytosine

(26)

 TouThymine

Ces nu léotides s'apparient ave les nu léotides du deuxième brin selon le s héma A

· · ·

Tet G

· · ·

C, formantainsi une sorte de négatif.

Fig. 1.5: stru ture de l'ADN : répétition des paires appariées de nu léotides en doublehéli e.

Les études théoriques on ernant la modélisation de la stru ture tridimension-nelle de l'ADN(Rus io et Onufriev,2006; Sun et al.,2005; Lauria et al.,2004; Cui et Simmerling, 2002; Pa ker et Hunter, 2001; Hobza et al., 1998) sont assez om-plètes, prenant en ompte de nombreux paramètres, mais ren ontrent la di ulté des grandeslongueurs de brinsd'ADN (de

50

à

250

millions de bases pour les hro-mosomeshumains) ainsi que elle de l'enroulementde la doublehéli e sur d'autres stru tures ( omme lesprotéines histones). En revan he, les divers niveaux de om-pa tagepermettent d'aborderlaquestion àdiérentes é helles :pour unaperçu des référen es, voirLavelleet Bene ke (2006).

Par ailleurs, la grande quantité de données disponibles dans e domaine, grâ e essentiellement auxtravaux de la génomique, adonné lieuà des études statistiques sur des hromosomes entiersqui ontmis en éviden edes auto orrélationsà longues distan es entre les séquen es ainsi que l'existen e de stru tures parti ulières etqui ontpermis d'expliquer leurs impli ations (Audit et al.,2002; Vaillantet al., 2005).

L'ARN oua ide ribonu léique est semblableà l'ADN (su ession de nu léotides, ex eptélathyminequiestrempla éeparde l'ura iledesymboleU),maisdièrepar

(27)

moindre(de

50

à

5000

nu léotides).

L'ARN dière aussi de l'ADN par ses fon tions étendues; on le retrouve ainsi dans le ytoplasme. Par sa stabilité limitée, l'ARN a plutt un rle temporaire de transport d'information tandis que l'ADN sto ke  le matériel génétique. Mais il peutégalementremplir ertainesfon tionsee tives desbiomolé ulesaumêmetitre queles protéines etles enzymes.

Enguise d'exemple, itons

 l'ARN messager, qui est une opie (on parle de trans ription) d'un gène de l'ADN : son rle est d'a heminer l'information génétique du noyau vers les ribosomesdu ytoplasme;

 au niveau des ribosomes (eux-même onstitués d'ARN et de protéines) qui permettent de traduire  l'ARNmessager en protéine, haque tripletde nu- léotides (appelé odon) est lu; un autre ARN  l'ARNt ou ARN de trans-fert  est alors re ruté, ee tue la onversion nu léotide vers a ide aminé et dé len he lapolymérisationdu nouvela ide aminésur laprotéine en ours de fabri ation.

 l'ARN de transfert est lui-même un ARN très ourt (

70

à

100

nu léotides) omportantun a ide aminé.

L'exer i e de prédi tion des géométries de l'ARN (Mathews et Turner, 2006) béné ie de latendan e des nu léotides à s'apparier :A ave U etG ave C.

Les protéines sont des assemblages séquentiels 2

d'a ides aminés, formant une haîne et reliés entre eux par des liaisons dites peptidiques

3

. Il existe vingt a ides aminés très ourants (et d'autres plus exotiques) tous bâtis sur le même modèle s hématisésur la gure 1.6 (ex eption faite de la proline,gure 1.7) et représentés par une lettre majus ule de l'alphabetlatin.

La partie qui varie d'un a ide aminé à l'autre est appelée haîne latérale de l'a ide aminé (side hain), tandis que l'en haînement des motifs répétés  nh- h- o formele squelette (ba kbone). De plus, le arbone au point d'embran hement dela haînelatéraleest généralementdénommé arbonealphaouC

α

;lesautres arbonesdela haînesontensuite omptabilisésC

β

,C

γ

(ouC

1,2

γ

s'ilyenaplusieurs), et . Notons aussi que la haîne prin ipale des a ides aminés n'est pas symétrique,

2

ex eptéle asdesliaisons ystéine- ystéine 3

e sont les liaisons entre azote et arbone d'un groupement o

=

n-h; lors de la mise en ommundesorbitaleséle troniques,deséle tronssedélo alisent,stabilisantparrésonan elaliaison qui a quiertun ara tère dedouble liaison et qui ne peut plussubir delibre rotationautour de

(28)

Fig. 1.6: stru ture d'un a ideaminé; la haîneprin ipale est représentée ave les ouleurshabituellesdesatomes,la haînelatéraleestenmagenta(i i,uneisoleu ine), enbeige:lesa idesaminéssuivantetpré édent.

Fig. 1.7: laprolinedière desdix-neufautresa idesaminés.

de sorte que la séquen e l-i-v-e, par exemple, n'a pas le même sens (biologique) que e-v-i-l : il y a un sens de le ture. L'extrémité initiale

4

, dans la biosynthèse de la séquen e, est dite N-terminal (par opposition au brin C-terminal

5

) et dénote le début de la haîne d'a ides aminés (respe tivement la n). C'est aussi le sens onventionnel pour l'é riture de laséquen e.

Enn,laprolineest onstruitesurlemêmeprin ipequelesdix-neufautresa ides aminés,mais sonazoteest ovalemmentliéaudernier arbonede sa haînelatérale, e qui en fait un a ide aminé y lique et don beau oup plus rigide (gure 1.7). De plus, les deux états stables de la liaison peptidique sont moins déséquilibrés énergétiquement que dans le as des autres a ides aminés, de sorte que la proline existe sous deux formes dites is ettrans (gure1.8).

Par dénition, un peptide est une haîne d'a ides aminés reliés par des liaisons peptidiques; touteprotéine est don unpeptide.Cependant,les himistesréservent habituellement le terme peptide pour les ourtes séquen es de moins de 50 à 100 résidus n'ayant  en général  pas de fon tion biologique (gure 1.9), par oppositionauxplusgrandesprotéines(gure1.10,extraitede(Dobsonetal.,1998)). En ore une fois, la simulation de la onformation des protéines est très large-4

ave legroupementnh

2

libre 5

(29)

Fig. 1.8: laprolinepossèdedeuxétatsstablesdits is ettrans.

Fig. 1.9: deux représentations d'un peptide d'une longueur de 20 a ides aminés; dansladeuxièmereprésentation,lesquelette,formantdeuxhéli eset unbrin re ou-vrantl'ensemble,estmis enéviden e.

Fig.1.10:diérentesreprésentationsdulysozyme:a)miseenéviden edeséléments destru turesousformederubans(héli esenrouge,feuilletsenbleu),lesliaisonsentre résidus ystéinessontreprésentéesenjaune.b)S hématisationenboulesetbâtonnets, lesrésidus parti ipantausitea tifsontenjaune. ) Représentationpardessphères poursoulignerl'o upationspatialedelamolé ule.

(30)

ment étudiée et tire prot de ette apparente séparation entre lesdegrés de liberté appartenant à la haîne prin ipale et eux des haînes latérales (voir hapitre 2, Ÿ2.2.5).

Les enzymes sont des molé ules (protéines ou ARN) qui atalysent, 'est-à-dire quia élèrent, (jusqu'à des millions de fois), ertaines réa tions himiques.

Chaqueenzyme est extrêmementspé ique à sa ible(appelée substrat) grâ e à sonsitea tif.Celui- ipeut êtreprésentde manièrestatiqueàlasurfa ede l'enzyme, oubien apparaîtredynamiquementlorsde l'assemblagedes a teurs( omplexes mo-lé ulairesoua tivation par un ligand).

L'a tivité des enzymes etleur dépendan e aux onditions environnementales en font des outils lefs dans les bou les de régulation génique, omme nous le verrons au hapitre 5.

Leskinases sont un exempled'enzymes qui atalysentlaphosphorylation (ajout d'un groupementphosphate) de ertainsa ides aminés, elles appartiennent à la fa-milledes transférases qui servent à lier des groupements fon tionnels sur ertaines molé ules de transport. Il existe également des polymérases, qui atalysent la syn-thèse des séquen es d'ADN ou d'ARN, des protéases qui fa ilitent la dégradation des protéines, des isomérases qui a élèrent la transitiondes molé ules entre leurs diérents stéréoisomères, et .

1.3 La stru ture des molé ules

1.3.1 La exibilité des molé ules... un fait

Contrairement à e que suggèrent les diérentes guresen amont, ilest faux de on evoirune molé ule ommeun solide indéformable,ave une stru ture gée. En réalité,une ertaine exibilité apparaîtà diérents niveaux :

La molé ule os ille autour de sa onformation d'équilibre sous l'eet des ho s subis par son environnement (prin ipalement des molé ules d'eau, mais également des autres molé ules). La for e et la fréquen e de es ho s sto hastiques entrent danslanotionde température, 'estpourquoinotre orpsfon tionnediéremmentà 35

C, à37

C età39

C. Latempératuredétermine lesvitesses de réa tions (nous en reparlerons lors de l'étude des rythmes ir adiens, hapitre 5), mais, lorsqu'elle

(31)

(on parle de dénaturation). Les os illations autour du point d'équilibre sont trop importantes pour quela protéine garde safon tion physiologique.

La molé ule interagit ave son environnement (sinon elle ne sert à rien...) et es intera tions reposent sur sa exibilité (Karplus et Kuriyan, 2005), il y a alors déformation des stru tures pour obtenir le omplexe nal. C'est le as lorsque les deux a teurs s'adaptent géométriquement l'un à l'autre, ou quand les mouvements de la molé ule mettent à jour un site a tif (Hornak et Simmerling, 2007), mais ela peut aussi survenir quand un ligand for e l'ouverture du site dans lequel il vient se lier. Enn, il faut également iter le as de l'allostérie où l'intera tion de deux partenaires molé ulaires au niveau d'un site de xation hange la stru ture en d'autres sites, modiant ainsi l'a tivité du omplexe (la gure 1.11 fournit un exempleave l'AspartateTransCarbamylase ou ATCase).

Fig.1.11:exempledemodi ationallostériquedel'ATCase:lavitessederéa tion, qui est fon tion de la on entration en aspartate, est modiée par la présen e des diérentsligands,tousen ompétition poursexerdanslesitea tif(gure extraite dehttp://www.unine. h/bota/bio h/ ours/enzyme2.html, onsultéenaoût2007).

La molé ule se dénature et agrège. Ci-dessus, a été introduite la notion de onformation d'équilibre; ependant, le pro essus de repliement des molé ules est omplexe(démarrage immédiatpendant la synthèse, modi ations ultérieures pos-sibles, existen e de haperones qui en apsulent la molé ule le temps de son replie-ment).Labalan eentre lesdiérentes onformationsstablesd'unemolé uleest très dépendantede latempératureetde l'environnement himique.Ainsi,l'albuminedu blan d'÷uf hange omplètement d'aspe t après uisson ( oagulation) par e que

(32)

natives (latempérature dénature les stru tures et la on entration induit l'agréga-tion). La gure 1.12 i-dessous présente un autre exemple qui est l'agrégation de laprotéine humaineTauen longs laments,dé ouverts dans le erveau de patients dé édés des suites de la maladie d'Alzheimer. Les ré entes études laissent présu-merune stru turationpathologique en agrégatsalors quela protéine nativen'a pas de stru ture; ependant, ni les mé anismes, ni les auses et onséquen es de tels omportements molé ulairesne sont en ore bien ompris.

Fig. 1.12: lamentsdeprotéinestauagrégée.

1.3.2 Les niveaux de stru turation

Ledegré de détail adoptépour dé rirelastru ture d'une molé ulepermet dié-rents niveaux de ara térisation.

On entend par stru ture primaire,la donnée de la formulebrute de lamolé ule, 'est-à-dire, uniquement e qui on erne les types atomiques entrant dans la om-position et leur graphe de liaison. Ainsi, pour une protéine (ou un brin d'ARN ou d'ADN), toute la stru ture primaire est ontenue dans la séquen e de ses a ides aminés(respe tivement de ses nu léotides), sans au une autre formed'information. Attention, la stru ture primaire pré ise également les éventuelles asymétries que omporte la molé ule.

Laformegéométriqueglobaled'unemolé ule,qu'onappelleégalement onforma-tion dénitsastru ture tertiaire, alorsque,pour lesprotéines,ondénit également la stru ture se ondaire qui désigne seulement des sous-unités de stru tures qui la omposent(gure1.13).C'estle as parexempledeshéli esoudesfeuilletsquel'on trouve dans les protéines et dont la géométrie est stabilisée par des intera tions à moyennes oulongues distan es. La stru ture tertiaire orrespond don à l'arrange-ment des sous-stru tures se ondaires entre-elles.

Lorsqu'il s'agit de omplexes ou de très grandes molé ules partitionnées en do-maines,lastru ture quaternaire faitréféren e àl'organisationde tous es domaines

(33)

Fig.1.13: stru turesprimaire(séquen edesa idesaminés)etse ondaire(éléments de stru turation indiqués en rouge) de la protéine humaine PIN1. Les è hes indiquentlesfeuillets

β

, lesressorts représententleshéli eset les réneaux s hé-matisentlestournants.

Fig. 1.14: stru tures tertiaire et/ou quaternaire; (gau he) PIN1, la partie bleue orrespond audomaineWWdit deliaison,leresteétantle domaine atalytique (ee tif).(droite)Cy lophilineB,intervenantdanslesystèmeimmunitaire.

(34)

1.3.3 L'interprétation énergétique

Physi s is mathemati al not be ause we know so mu h aboutthe physi alworld,but be auseweknowsolittle;it is onlyits mathemati alproperties that we an dis over.

Bertrand Russell

Formellement, la stru ture tridimensionnelle de la molé ule, lorsqu'elle est au repos, devraitpouvoirsedéduiredes étatspropres de l'hamiltonienquantiquedans l'équationdeS hrödinger.Cependant,mêmesousl'hypothèsesimpli atri edeBorn et Oppenheimer qui tirent parti du très grand rapport de masse entre noyaux et éle trons (

> 10

3

) pour supposer es derniers inniment plus rapides, l'équation de S hrödinger ne reste numériquement envisageable que pour quelques entaines d'atomes.

Pourtant,unensemblederèglesétabliesplusoumoinsempiriquementfaitunpeu de lumière sur les mé anismes sous-ja ents et un ertain nombre d'approximations et de modèles vont nous permettre de formaliser toutes les intera tions; 'est e qui fait de la modélisation molé ulaire un pont entre les dis iplines de la physique statistique,de la mé anique quantique etnewtonienne.

Plutt que de raisonner en termes de for es, qui est un modèle typiquement newtonien,onparleplusgénéralement d'intera tions eton onsidère dorénavant les potentiels desquels dérivent les for es

6

(équation (1.1)).

dV

=

−F.dℓ,

F =

grad

(V ),

(1.1)

F

est la for e,

dℓ

un dépla ement élémentaire et

V

le potentiel.

La somme de toutes les ontributions (for es éle tromagnétiques, eets quan-tiques et modèles empiriques des phénomènes supplémentaires) onstitue l'énergie potentielle du système. À ette énergies'ajoutelapartie inétique :

(newtonien)

E

c

=

X

i∈P

1

2

m

i

V

2

i

=

X

i∈P

p

2

i

2m

i

,

(quantique)

E

c

=

X

i∈P

~

2

2m

i

△,

6

(35)

P

est l'ensemble des parti ules de lamolé ule,

m

i

est la massede laparti ule

i

,

V

i

,sa vitesse et

p

i

son impulsion 7

.

Cependant, il est illusoire de vouloir dé rire individuellement toutes les parti- ules d'une solution (une mole d'un omposé himique  'est-à-dire le nombre d'atomesdans12grammesde

12

C

 ontient

N

A

= 6

×10

23

molé ules,où

N

A

est le nombre d'Avogadro...),de plus, lesinnombrables ho ssto hastiquesquesubissent lesmolé ulesrendentlesétudesdynamiquesdi iles:seulsdesrésultatsstatistiques sur de multiples et longues traje toires peuvent être extraits de telles simulations. C'estpourquoi nousallons voirque nous pouvons nous restreindreà la seule partie potentielle de l'énergieinterne (Bryngelson et al., 2004).

1.3.3.1 Une des ription statique

Mathemati s are welland goodbut naturekeeps dragging usaround by the nose.

Albert Einstein Cenombreastronomiquede600millemilliardsdemilliardsdemolé ulesparmole a permis le développement d'outils spé iques, apanage de laphysique statistique. Enparti ulier, L. Boltzmann a proposé une interprétationprobabiliste de l'énergie internerésumée dans l'équation(1.2).

Pr(

état d'énergie

E) =

1

Z

exp



E

k

B

T



.

(1.2) Le préfa teur

1

Z

étant un fa teur de normalisation, al ulé de sorte à avoir une densité de probabilité qui s'intègre à

1

sur l'ensemble des états a essibles

;

T

est la température absolue en Kelvins,

E

est l'énergie exprimée en Joules et

k

B

est la onstante de Boltzmann (

≈ 1, 38 × 10

−23

). Cette équation est fondamentale pour la suite de et exposé et onstitue la base de la ompréhension a tuelle de la stéréo himie.

Remarque : on note parfois

β

la température inverse égale à

1/RT

R =

k

B

N

A

≈ 8, 3

J.mol

−1

.K

−1

est la onstante des gaz parfaits.Si onutilise une énergie expriméeen k al.mol

−1

, onobtient

β

503,5

T

.

Ainsi, ertains états sont plus souvent visités que d'autres  ils sont dits pré-férentiels  et la prépondéran e de es états est quantiée par l'équation (1.2). Éventuellement, seule une fra tion des molé ules peut se trouver dans l'état a tif,

7

~

estla onstantedePlan kréduite(

≈ 1, 05.10

−34

(36)

e qui réduirait son a tivité. Un système qui ne possèderait que deux états

A

et

B

( ongurations isettransd'unedoubleliaison parexemple,oubien onformations repliéeet dépliée d'une molé ule) d'énergies respe tives

E

A

et

E

B

serait représenté par des sous-populations de ha un des deux états, proportionnellesaux ratios sui-vants :

Pr(A) =

e

−βE

A

e

−βE

A

+ e

−βE

B

=

1

1 + e

−β(E

B

−E

A

)

,

(1.3)

Pr(B) = 1

− Pr(A) =

e

−β(E

B

−E

A

)

1 + e

−β(E

B

−E

A

)

.

(1.4)

Remarque :onvoitsur et exemple,quelesniveaux depopulationde haque état ne dépendent que de la diéren e énergétique, e qui était prévisible, puisque tout potentiel est déni à une onstanteadditionnelle

8

près : équation(1.1).

Dans un espa e de phase ontinu,

, dé rit par des degrés de liberté ontinus

Θ

, oninterprète l'équationde Boltzmannen termede densité de probabilité

(équa-tions (1.5) et(1.6)) :

Pr (Θ

∈ [θ; θ + dθ[) = p(θ)dθ

=

1

Z

exp [

−βE(θ)] dθ,

(1.5)

Pr (Θ

∈ D) =

1

Z

Z

D

e

−βθ

dθ.

(1.6) 1.3.3.2 L'énergie libre

En prin ipe, l'énergie qui apparaît dans l'équation de Boltzmann (1.2) et (1.6) n'est pas l'énergiepotentielle, mais plutt l'énergie libre. Reprenons l'exemple pré- édent, d'unemolé ule quipeut être soit dans son état replié natif

N

, soit dans un étatdénaturé

D

(paysage d'énergieenunedimension,gure1.15);l'étatnatifreplié seragénéralementd'énergie inférieureàn'importe quelétatdéplié,mais iln'yapas un seul état déplié, de sorte que e qu'on a appelé état déplié

D

 est en fait un ensemble(souvent énorme) d'états

D

D

⊂ Ω

(gure1.16).

8

(37)

Fig. 1.15: unsystème àdeux états, l'état natif

N

(puits de gau he)est énergéti-quementfavorableparrapportàl'étatdénaturé

D

(puitsdedroite).

Fig.1.16:bienquel'étatnatifsoitmeilleurenénergie,lalargeurdupuitsde poten-tielpeutfavoriserd'autresétatssous-optimaux(dépendammentdelatempérature).

(38)

Lavéritable probabilitéde l'état dépliéest don

Pr(D) =

Z

D

D

1

Z

e

−βE(θ)

dθ,

(1.7) où

Z =

Z

e

−βE(θ)

dθ.

(1.8)

Bienquel'étatnatifsoiténergétiquementfavorable,lalargeurdupuitsde poten-tielpeutfavoriserl'état dénaturé et e d'autantplus quelatempératuresera élevée (paramètre

β

des équations). C'est e que représente l'entropie d'un état (mesure du désordre, généralement noté

S

).

Si on souhaite rassembler tous les états dénaturés en un superétat, on ne peut plus utiliserl'énergieinterne,mais on dénitl'énergie libre d'un domaine

D

par :

G(

D) , −

1

β

ln

Z

D

e

−βE(Θ)



,

(1.9) de sorte que

Pr(

D) =

1

Z

e

−βG(D)

.

(1.10)

Dansnotreexemple,sionnote

V

N

et

V

D

lesvolumes respe tifsdesdomaines

D

N

et

D

D

,alors, lesprobabilitésdes états

N

et

D

sontdonnées par l'équation(1.11) et (1.12):

Pr(N) =

Z

D

N

1

Z

e

−βE(θ)

Pr(N)

1

Z

V

N

e

−βE

N

,

(1.11) de même

Pr(D)

1

Z

V

D

e

−βE

D

,

(1.12) et

Z

∝ V

N

e

−βE

N

+ V

D

e

−βE

D

,

(1.13)

où le oe ient de proportionnalité (que l'on notera

α

) est le même dans les trois équations(1.11), (1.12)et (1.13).

Il vient alors lesénergies libres suivantes :

G(

D

N

) =

1

β

ln



Z. Pr(N)



= E

N

− T k

B

ln(V

N

)

β

1

ln(α),

G(

D

D

) =

E

D

| {z }

énergieinterne

−T × k

B

ln(V

D

)

|

{z

}

entropie

1

β

ln(α)

|

{z

}

onstante

.

(1.14)

(39)

une onstante près, de sorte que le fa teur en

ln(α)

peut être retran hé des deux équations(1.14).

On retrouve alors la formule, plus ourante, de l'énergie libre, où

S

désigne l'entropie du domaine :

G = E

− T.S.

(1.15)

À titre d'exemple, dans son ours 9

, Levitt propose l'étude du taux de onfor-mationshéli oïdalesd'une protéine lorsde simulationsde dynamiques molé ulaires à diérentes températures. Plus elle- i est élevée, plus les géométries dénaturées prennent le pas sur les onformations natives(gure 1.17).

Fig. 1.17: taux de onformations héli oïdales en fon tion de la tempéra-ture lors de dynamiques molé ulaires (extrait du ours en ligne de Levitt : http:// sb.stanford.edu/levitt/, onsulté enjuillet2007).

Notons égalementun autre fa teur important,qui est la dimension

N

ddl

de l'es-pa ede phase, puisquelevolume

V

évolue en

L

N

ddl

,où

L

est latailledu puitsdans ha une des dimensions.

Voi il'exempled'un système à deux états ayant les ara téristiquessuivantes :

∆E = 10

k al.mol

−1

,

L

2

/L

1

= 10,

T = 300

K

,

ρ

N

ddl

= Pr(

Etat

E

1

)/ Pr(

Etat

E

2

).

9

(40)

N

ddl

ρ

N

ddl

1

50

× 10

−6

5

5

× 10

−3

10

500

20

5

× 10

12

Enn, pour illustrer l'eet de l'entropie, lagure 1.18 présente, pour diérentes températures, la position moyenne de la molé ule dans son espa e de phase (espé-ran e mathématique). À mesure que la température augmente, tous les états de-viennent équiprobables dans laformulede Boltzmann(1.2).

Fig. 1.18: paysageénergétiqueetpositionmoyennepourdiérentes températures. Plus latempératureest élevée,pluslessolutionssous-optimalessontfavorisées.

1.3.3.3 L'hypothèse thermodynamique

LesloisdelaNaturenesontquelespenséesmathématiques de Dieu.

Eu lide Les expérien es de dénaturation et de repliement de molé ules ont onduit la ommunautés ientique àa epter l'hypothèse thermodynamique miseen avantpar Annsen (1973)(voir égalementGovindarajan,1998) et initialementénon ée de la

(41)

lesmolé ules adoptent, dans leur milieu physiologique normal, la stru -ture tridimensionnelle qui minimise leur énergie libre. [...℄ Autrement dit, la géométrie d'une molé ule est entièrement déterminée par les in-tera tions qu'elle abrite.

Cette reformulation su inte de e qui a été présenté au paragraphe pré édent (sous réserve que les notions d'énergie libre et d'entropie soient orre tement assi-milées,voiréquations (1.9) et(1.14)) soulève ependant un nouveau problème.

L'interprétationdeAnnsen obligeen eetàredénir lanotiond'état .Alors qu'un état représentait pré édemment une géométrie possible ou un point (sans dimension) dans l'espa e de phase, il s'agit maintenant d'un sous-domaine ara -téristique de l'espa e de phase (voir gure 1.19). Cependant, la façon dont sont réuniesles onformationsou,équivalemment,lapartitiondel'espa ede phaseen domaines ara téristiques est laissée aulibre arbitre du himiste.

Fig.1.19:unétatreprésentemaintenantunensemblede onformationspossibles.

D'unpointde vue himique,deux onformations orrespondantàdes ara téris-tiques himiquessimilairesdoivent lairementêtrerassembléesen unseul état.Mais en himie stru turale, deux géométries qui divergent nettement, même si les ara -téristiques himiques sont onservées, seront diérentiées par deux états distin ts.

Ce problème n'est pas minimeet pèse sur la modélisation; de plus, on ne peut pas le ontourner à moindre frais par une dénition mathématique du type parti-tionnement en lasses d'équivalen e oùla relationd'équivalen e serait par exemple donnée par une des équations(1.16) et (1.17).

θ

1

∼ θ

2

⇐⇒ arg min

θ∈B(θ

1

,R)

E(θ) = arg

min

θ∈B(θ

2

,R)

E(θ),

(1.16)

(42)

B(θ

i

, R)

étantla boule de entre

θ

i

etde rayon

R

.

Danslepremier as(1.16),ladénitionde

R

restelepointsensible:unminimum très étroit peut être ou ne pas être physiquement pertinent. Néanmoins, l'idée aété réutiliséedans ertainsalgorithmesqui n'utilisentplus l'énergiepotentielle de haque onformation, mais al ulent elle de l'optimum lo al le plus pro he (dans un domainepermis, voir S hug et al., 2005a).Dans le deuxième as, l'hypersurfa e d'énergiepotentielleextrêmementa identéemultiplielenombredeminimalo aux; mêmeaufonddespuitslesplusprofonds,denombreuxminimarestentprésents(voir gures1.20et1.21tiréedu hapitredeKarplusetShakhnovit h1992).Gfelleretal. dénissent un état omme un bassin telqu'ilpeut être misen éviden e par une dynamiquemolé ulaire.

Fig. 1.20: gure tirée de Given et Gilson (1998) présentant un prol hiérar hisé d'énergiepotentielle(voirlégende).

1.3.4 Le pro essus de repliement

Après avoirrappeléles quelques résultatsimportantsde l'appro he statique, où lesystème est supposé avoiratteint un ertain équilibre statistique (i.e. thermody-namique), nous présentons brièvement les ontraintes mé aniques dues à l'aspe t dynamiquedes molé ules.

1.3.4.1 Le paradoxe de Lévinthal

(43)

Fig. 1.21: à haqueé helleapparaissentdenouveaux minima.

En mars 1969 a eu lieu une onféren e à l'université de l'Illinois ayant omme sujet Mössbauer Spe tros opy in Biologi al Systems. À ette époque, il était ommunément a epté queles protéines se repliaientprogressivement,formant peu à peu les motifs stru turaux de leurs géométries nales à mesure qu'elles é han-tillonnaientleurs espa es de phase omme une billequi roulerait sur une nappe (la gure1.22 est d'origine).

Fig. 1.22: lesystème (bille ouprotéine)évoluesur l'hypersurfa e,explorant dié-rentesvalléesettombantéventuellementdansunminimumquipeutêtreleminimum global.

La métaphore est esthétique, mais une re her he aléatoire du minimum absolu n'est pas on evable. C'est l'objet du séminaire de Levinthal (Levinthal, 1969) qui présente l'analyse grossière suivante : si une petite protéine omporte une entaine d'a ides aminés où ha un possède trois états stables, alors, la protéine omplète doitavoir

3

100

≈ 10

48

minima!Même silaprotéineévoluetrès rapidementd'unétat àun autre (au moins supérieurà lafemtose onde),il fautplus de

10

25

(44)

tout explorer(par omparaison, l'univers a seulement

15

milliardsd'années...). Cet événement reste toutefois plus probable que de voir un des singes de Borel taperune piè e de Shakespeare sur une ma hine à é rire (Borel,1913)... même en 15milliardsd'années.

Fig. 1.23:unmilliondesingesda tylographestapantsurunmilliondema hinesà é rirepeuvent-ilsréinventerHamlet,parhasard?

En réalité, il n'y a pas de paradoxe dans le sens où l'expérien e s'a orde ave es probabilités très faibles, mais à très très hautes températures. À température ambiante,lamoindre

∆E

bouleverselesniveauxdepopulation.Lepaysaged'énergie est don né essairement  onçude manièreà attirerrapidement lamolé ulevers sagéométrie native (Zwanzig et al., 1992).

1.3.4.2 Représentations du paysage

L'arti lede Dill (1997)propose un ertainnombrede gures(voir gures1.24 à 1.27)faisant ollerl'interprétationen termesde paysagesd'énergie auxphénomènes expérimentalement onnus.

Fig. 1.24: (gau he)lepaysaged'énergievuparLevinthal:

N

représentela onfor-mationnativequelaprotéinere her healéatoirement.(droite)L'existen ede hemin de repliement permetdeguiderlesmolé ulesd'une onformationdénaturée(

A

)vers leurétatnatif.

(45)

Fig. 1.25: un paysageen forme d'entonnoir permet d'a élérer le repliement des molé ule;touslesdegrésdelibertéévoluentdemanière on ertéeversl'étatnatif.

Fig. 1.26: des modèles d'entonnoirs non-parfaits permettent d'expliquer les dif-férentes dynamiques observées (relaxations multi-exponentielles, dynamiques lentes ou rapides), ainsi quel'existen e de stru tures métastables intermédiaires (globules fondus).

Fig.1.27: epaysaged'énergieprésenteunétatnatifénergétiquementfavorableen ompétition ave unensemble d'étatsentropiquementfavorisés.

(46)

bien supérieures (10, 100, 1000, 10000).Pour aborder leproblème de la représenta-tionettenterdereproduiredèlementunpaysageréel,plusieursauteursontproposé des solutions.

Sauf à hoisir un nombre restreint (une ou deux) de variables représentatives (S huget al.,2005b),la solutionretenue onsisteàrassembler lesétats an d'obte-nirun ensembledis ret (Ÿ1.3.3page37) permettantune représentationoùlesétats sont reliés selon les barrières énergétiques qui les séparent (gure 1.28 reprises de Frauenfelder et Leeson, 1998). Les gures 1.29 et 1.30 (extraites de Krivov et Kar-plus,2004)exposentleprin ipeave trois bassinsprin ipaux(

A

,

B

et

C

)eux-même omposésde lustersde onformationspréférentielles(pointsnoirs),puisun asréel ave une protéine formant deux feuillets

β

en épingle.

Fig. 1.28: prin ipedereprésentationdesétatslesplusé hantillonnés.

Fig. 1.29: exempleave troisétats,présentant ha unplusieursminima.

Ce type de graphes a été amélioré an de prendre en ompte l'importan e de ha undes puits (énergie etentropie), e qui permetune ompréhension a ruedes heminsderepliementetmeten éviden elespointsd'embran hementdes diérents minima(Rylan e et al.,2006).

Enn,Gfelleretal.(2007)proposentd'illustrerlepaysageparungraphepondéré des états(les poids orrespondant auxprobabilités de Boltzmann), lusterisés selon un ritère de similarité et dont les ar s sont établis en fon tion des transitions qui

(47)

Fig.1.30: asréelave l'épingle

β

delaprotéineG(l'abs issen'apassensphysique), gureextraitedeKrivovetKarplus(2004).

Fig.1.31: heminsderepliementetlargeurdesbassinsd'attra tiond'uneprotéine; en rouge, violet, bleu et vert sont respe tivement représentés les quatre premiers minima(tiréedeRylan eetal.,2006).

(48)

Fig. 1.32:représentationdesétatsvisitéset destransitionsparungraphepondéré (extraitdeGfelleretal., 2007).

1.3.4.3 Dans quelles onditions la molé ule se replie-t-elle?

Lasantéestunétat d'équilibreinstable,qui omportebien des os illations.

Mauri e Halbwa hs, Les auses du sui ide

Tout d'abord, omme nous l'avons évoqué à la se tion 1.3.1, l'environnement himique est déterminant pour le repliement des stru tures. Ainsi, in vivo, les mo-lé ules sont généralement dans l'eau, mais se replient au ours de leur synhèse et sont parfois aidées par des haperones. In vitro, la molé ulepeut être étudiée dans diérentssolvantsetàdiérentestempératures,and'observersadénaturation. En-n, lorsqu'elles sont en très forte on entration, nous avons vu que la dénaturation n'étaitpas toujours réversible.

Autrementdit,lesmolé ulesbiologiquementa tivessontdansunétatd'équilibre qui n'est en général que lo alement stable; e qui nous fait adhérer à l'armation de Halbwa hs.

Cependant, même si ertaines protéines ne se replient pas dans le même état selonl'environnement,on ontinueà roirequelespetitssous-élémentsdestru tures (se ondaires) restent, eux, relativement bien onservés malgré les onditions par e que relativement stables. De même, jusqu'à une ertaine taille (plusieurs milliers d'atomes),la dénaturationdes petites molé ules reste réversible.

Deplus,mêmesi,d'aprèsBoltzmann(équation(1.2)),touslespuitsdepotentiel serontpeuplésselonleursénergies etentropies,lestempsde ommutationd'unétat

(49)

Fig.1.33: ertainsphénomènesquantiques, ommelesfran hissementsdebarrières de potentiel, sediéren ient omplètement des omportementsprédits parla mé a-nique lassique.

1.3.4.4 Inter onversions et temps d'attente

Même sile tempsné essaire à latransitionentre deux états est en réalité extrê-mement ourt(quelquesfemtose ondes), 'estletempsmoyend'attentedans ha un des états qui ae te ladynamique (voir gure 1.34).

Alors que la formule de Boltzmann (équation (1.2), page 34) détermine les ni-veaux de population asymptotiques de ha un des puits selon leurs énergies libres, ilexiste des estimateurspour lestemps moyens de transitiond'un état

A

à un état

B

(

τ

A→B

), basés sur des modèlesprobabilistes (équation(1.18)).

τ

A→B

= βh

× exp (β∆G) ,

(1.18) où

∆G

est la hauteur de la barrière :

∆G = G

max

− G

A

et

h

est la onstante de Plan k (

βh

≈ 16

fs à

T = 300

K).

(50)

Enn, notonsque, dans les as plus omplexes, larugositédu paysage d'énergie inuen e lestemps de repliement des molé ules (Chavez et al., 2004).

1.3.4.5 Un repliement hiérar hisé

Dans e paragraphe, nous tentons de donner des éléments de réponse àla ques-tion : Qu'est- e qui asse l'apparente omplexité (Ÿ 1.3.4.1) du repliement des molé ules?.Cettequestionest primordiale,autantpourla ompréhension du pro- essusderepliementlui-mêmequepourpouvoiranti iperourépondreauxdi ultés queposera l'étape de modélisation.

1)Les heminspréférentiels. Lanotionde heminspréférentiels(gure1.24 droite)subodorel'existen e,non seulement d'unétatprépondérant, maiségalement d'itinéraires énergétiquement favorables qui permettent de drainer e a ement  telun entonnoir lamolé ule vers sa onformation native.Toutefois, étantdonné lenombrede degrésde liberté,ilfaut réinterpréterla gure1.25 : ertaines grappes de variables évoluent rapidement et de manière on ertée vers des sous-éléments stru turaux.

Une idée qui a été introduite dernièrement et qui étaye ette hypothèse, est elle des onta ts non-natifs  'est-à-dire non-dénitifs et absents de la stru ture nale  qui apparaissent au ours du repliement et qui pourraient a élérer la onvergen e vers la géométrie native. Dans le prin ipe, la molé ule (ou bien un motif)ne diuse plusdanssonespa ede phaseen dimension

N

ddl

,mais évoluedans un sous-espa e (ou une sous-variété)de dimension inférieure.

Cependant, la faiblesse des intera tions entrant en jeu dans les pro essus de repliementfaitqu'ilexistede multiples heminsmenantd'unegéométriequel onque àlagéométrienative(ZhouetKarplus,1999).Notonségalementquelaprésen e de esfaux- onta tsa roîtladi ulté de laprédi tionin sili o des onformations molé ulaires(Pa i et al.,2002).

2) La hiérar hie des stru tures (primairejusquequaternaire)reète peut-être une hiérar hie du repliement qui permet ette fois une rédu tion drastique de la omplexité. Les éléments de stru ture se ondaire (héli es, tournants) se forment relativement rapidement et simultanément, tandis que, sur une é helle de temps pluslongue,seformelastru turetertiaireoùlesélémentslo auxsepositionnentles unspar rapportauxautres.Enn,l'ensemblea hèveson repliementpourformer les

(51)

oumoins indépendants lorsqu'ils sont topologiquementéloignés (au moins dans les premières phasesdu repliement).

Supputons ela parun al ulinno ent:s'ilfautun temps

τ (N)

pour replierune petitemolé ulede taille

N

,ilestpossiblequ'ilnefaillepasun temps

τ (N)

pourune grandemolé uledetaille

N

,maispluttuntempsquiévolueraiten

ατ (M)+βτ

N

M



M

est la taille moyenne d'un motif et

N

M

, le nombre attendu de es motifs; le fa teur

α

traduit l'é art autour de la valeur moyenne (

α < M

) et

β

représente un fa teur d'é helle traduisant le rapport des temps ara téristiques entre les é helles auniveau des atomes et au niveau des stru tures se ondaires (évoluant omme

M

ou

M

γ

ave

1

≤ γ < 2

). Le repliement des motifs se faisant en parallèle, on peut don s'attendreà des repliements en oreplus ourts.

Lagure1.35donnel'évolutiondutempsderepliementenfon tiondunombre

N

dedegrésdeliberté(

τ

,supposéeexponentielle,estenrouge).Le as vert orrespond à des motifs d'une dizaine de degrés de liberté, le as bleu orrespond à un niveau hiérar hiquesupplémentaireoùlesmotifss'arrangentensuper-motifsdetaille10

×

10 avant de se ompa ter dans lagéométrie nale.

Fig.1.35:enhiérar hisantlepro essusderepliement,onpeutréduiredrastiquement la omplexité.

Les appro hes dites divide and onquer  exploitent lairement ette idée an de on evoir de nouvelles stratégies de re her he opérationnelle. Citons Takahashi (1999) dans le domaine de l'é hantillonnage onformationnel, où un premier algo-rithmeesten hargededéte terlesrégionsprometteusesdel'espa edephase,tandis qu'un se ondalgorithme optimiselo alementles géométries ainsi proposées.

(52)

1999)puisquel'unepré onisel'existen ed'intera tionsnon-nativesquidisparaissent par la suite tandis que l'autre suppose la formation immédiate des motifs stru tu-rauxprésents dans la onformationnale. La questionn'est pas vraiment résolue à l'heurea tuelle (Baldwin et Rose, 1999) etdes expérien es sur des molé ules dié-rentes montrentdes résultatsdiérents.Ainsi,ilasouvent été faitréféren edans la littérature sur le repliement des protéines, à un  ollapsus hydrophobe  au ours duquel les résidus hydrophobes s'eondreraient sur eux-même, formant un noyau ompa t (Mok et al., 2007). Dans ette on eption, la stru ture tertiaire devan e la formation des stru tures se ondaires, qui n'apparaissent qu'ultérieurement au ollapsus. Au ontraire, de nombreuses expérien es et simulations ont pu montrer l'existen e d'intermédiaires de repliement et d'états de transition(globules fondus) qui étayent plutt la thèse du repliement hiérar hique (Honey utt et Thirumalai, 1990;Mu et al., 2006).

3)Desséquen es pastout àfaitaléatoires... Enn,notonsquel'élaboration d'une séquen e protéique (ou d'ARN ou d'ADN), qui est le fruit d'une évolution darwinienne omptant des milliers d'essais et d'é he s, a subi une double pression de séle tion, puisque d'une part, la fon tion himique est importantepour assurer la pérennité, mais d'autre part, que le temps de repliement peut aussi devenir un fa teur pénalisant (Dobson, 2003). Ainsi, les séquen es de la Nature ne sont pas omplètement aléatoires, mais vérient le ritère de posséder une fon tion et de pouvoirl'a quérirdansuntempsbiologiquementa eptable(millise onde-se onde). Parfois,lafon tionprimesur letempsde repliement.Ainsi,ilaété faitréféren e à une protéine dont les temps de repliement et la stabilité auraient été a rus en mutant ertainsa idesaminés,maisqui,dans e as,perdentleurfon tionbiologique (Jägeret al.,2006).

1.4 Quelles méthodes existe-t-il pour l'observer? The humanobserver, whomwe have been atpainstokeep out of the pi ture, seems irresistiblyto intrude intoit

Rosenfeld, 1965

Références

Documents relatifs

vaux suggérant le rôle joué par les papi llomavirus humains dans le développement et la progression des cancers du col de l'utérus et l'impor-.. tance de leur détection

Montrer qu’une partie est mince si et seulement si son compl´ ementaire dans E est

permet aux intera tions ation- π de se développer sans interférer ave les molé ules d'eau. La distribution radiale du entre de masse du alixarène semble indiquer la présen e

Initialement chaque ensemble d’actions contient toutes les actions de A, les variables de proposition sont toutes indéfinies, et les valeurs qui ne sont pas dans l’état initial

©a des fonctions continues du point correspondant de S, c'est-à-dire de t^ ^,. Première formule de Green.. SUE CERTAINS PROBLÈMES NON LINÉAIRES DE NETJMANN. On suppose aussi que

La fonction ^ répond donc à la question*.. SUR CERTAINS PTÎGBLÊMES NON LINÉAIRES DE NEUMANN. Unicité de la solution. CÛÀ' où t nest pas arbitrairement voisin de ^». — Si

MÉMOIRE DE M, GEORGES GIRÂUD : Sur certains problèmes non linéaires de Neumann et sur certains problèmes non linéaires mixtes {Annales scienti' ficfues de FÉcole Normale

L’accès aux archives de la revue « Annali della Scuola Normale Superiore di Pisa, Classe di Scienze » ( http://www.sns.it/it/edizioni/riviste/annaliscienze/ ) implique l’accord