• Aucun résultat trouvé

Chapitre III : Caractérisation fonctionnelle et structurale de polysaccharidases de R. baltica

IV. B.5 - Cristallographie

Les expériences de cristallographie par diffraction aux rayons X ont été réalisées sur les cristaux de RB5312. Deux sources de rayons X ont été utilisées : une source classique (anode tournante) au laboratoire et une source synchrotron en partenariat avec le laboratoire européen de rayonnement synchrotron (European Synchrotron Radiation Facility, ESRF).

IV.B.5.1 Résultats de cristallographie

Les résultats de cristallogénèse ainsi que les résultats préliminaires de cristallographie sur les cristaux de RB5312 ont fait l’objet d’un article au cours de ma thèse dans Acta Crystallographica Section F (Dabin et al., 2008).

Du fait que les conditions de cristallisation contenaient 40 % de MPD, il n’a pas été nécessaire de tremper les cristaux dans une solution de cryoprotectant avant congélation à l’azote liquide.

Les premières mesures de clichés de diffraction sur les cristaux natifs de RB5312 ont montré que le pouvoir diffractant des cristaux était souvent limité à une résolution autour de 2,5-3,0 Ǻ. En revanche, les statistiques d’analyse des données de diffraction ont toujours été correctes. Cependant, parmi la dizaine de cristaux testés, l’un d’entre eux (dimensions 0,3 x 0,05 x 0,05 mm) a donné des résultats avec une diffraction allant jusqu’à 1,8 Ǻ. En conséquence, un jeu de données complet a été collecté sur ce cristal dont les statistiques de collecte sont résumées dans le Tableau III-25. La collection des données a été réalisée à 100 K sur la ligne ESRF ID14-eh2 (longueur d’onde des rayons X fixée à 0,933 Ǻ). Le groupe d’espace a été déterminé comme étant de système de Bravais orthorhombique primitif, P212121, avec pour paramètres de maille a = 39,05 Ǻ, b = 144,05 Ǻ, c = 153,97 Ǻ. L’analyse

du coefficient de Matthews nous a permis de prédire la présence de deux molécules dans l’unité asymétrique, pour un volume de maille par masse moléculaire de protéine VM = 2,17 Ǻ3.Da-1 et une proportion de solvant dans le cristal de 43 % du volume (Matthews, 1968).

Première image du jeu de données

Tableau III-25 : Statistiques de la collection de données des cristaux natifs de RB5312.

Les données brutes ont été intégrées et mises à l’échelle respectivement par les logiciels MOSFLM (Leslie, 1992) et SCALA, qui font partie de la suite intégrée de logiciels CCP4 (Collaborative Computational Project Number 4, 1994).

IV.B.5.2 Phasage des jeux de données

Plusieurs tentatives de phasage des données ont été réalisées. Nous avons tout d'abord utilisé le remplacement moléculaire, qui consiste à exploiter l'information structurale de protéines similaires et permet un phasage rapide en cas de succès. Nous nous sommes également tournés vers des techniques expérimentales d'incorporation d'atomes lourds. Nous avons ainsi pu tester la méthode MIR, en profitant de la présence probable de calcium dans la structure de RB5312 pour le remplacer par de l'erbium et de l'ytterbium. Enfin, nous avons testé la méthode MAD, en réalisant des productions de protéines sélénométhionylées. Les différents résultats obtenus avec ces techniques sont exposés dans cette section.

Avec un jeu de données natif à haute résolution et devant le nombre raisonnable de structures disponibles dans la famille PL1, une tentative de phasage par remplacement moléculaire a l’aide du logiciel AMoRe (Navaza, 2001) a semblé une première méthode à essayer. Nous nous attendions cependant à rencontrer quelques écueils, ne serait-ce que du fait que RB5312 présente une réelle divergence par rapport aux séquences de sa famille, y compris au sein de régions pourtant très conservées. Un autre écueil dont nous avions conscience est la structure même des hélices β, qui ont grossièrement la forme d’une spirale droite de section triangulaire. Dans ce type de structures, il est possible de générer de nombreuses solutions similaires à une fraction de tour d’hélice près, bruitant les solutions de la fonction de rotation.

RB5312 s’est avérée présenter de très faibles similitudes avec toutes les séquences de la banque PDB. Le meilleur score par BLAST, avec seulement 14% de similitude, s’est trouvé être la protéine non fonctionnelle Juna1 de J. ashei (code PDB 1PXZ), présentée dans l’introduction sur la famille PL1. La zone alignable est essentiellement localisée dans les parties N-terminales des deux protéines. Les alignements générés entre ces protéines intègrent de plus de nombreuses zones d’insertions chez RB5312.

Aucune solution avec contraste n’ayant été obtenue avec les premiers tests utilisant la structure 1PXZ de Juna1, une série de structures chimériques a été réalisée à partir des différentes structures connues. En effet, il s’avère que si le cœur des hélices β est très conservé, en revanche de larges insertions très divergentes (tant en taille qu’en structure) apparaissent dans l’ensemble de la famille, typiquement au niveau de la région N-terminale du feuillet PB1 des protéines. Quelques exemples de ces zones divergentes sont donnés dans la Figure

III-103

.

Juna1 - 1PXZ Pl47 - 1VBL Pel - 1BN8 PelC - 2EWE

J. ashei Bacillus sp. B. subtilis E. chrysanthemi

Figure III-103 : Extensions dans les structures de la famille PL1. Présentation des extensions du feuillet PB1 de quatre structures de la famille PL1, leur hélice β étant alignée.

Avec les différentes chimères générées, j’ai essayé de couvrir l’ensemble de ces extensions, sachant qu’il n’est pas possible de prédire laquelle est la plus probable, étant donnée encore une fois la forte divergence de RB5312. Trois versions des hélices β ont été également générées : une plus courte d’un tour d’hélice et deux plus longues respectivement d’un et de deux tours d’hélices. Je ne vais pas présenter exhaustivement l’ensemble de ces chimères structurales, la Figure

III-104

se propose d’en donner deux exemples.

Figure III-104 : Chimères de structures de la famille PL1.

Présentation de deux chimères structurales basées sur l’hélice β de 1PXZ et possédant des insertions provenant de plusieurs structures de la famille PL1. a) Chimère reprenant le repliement de 1PXZ avec son extension mais privée de ses extrémités C- et N-terminales. Une insertion de deux tours d’hélice dans l’hélice β est visible (en rouge) ; b) Chimère reprenant le repliement de 1PXZ, avec une partie de ses extrémités C- et N-terminales avec trois modifications : une insertion de deux tours dans l’hélice (en rouge), une hélice α commune à de nombreuses structures, se repliant traditionnellement sur la face opposée au site actif (jaune) et enfin, une des extensions de 1VBL (en orange).

Ces chimères n’ont malheureusement pas non plus abouti à la génération de solutions exploitables. Nous sommes donc rapidement passés à la détermination de la phase par des méthodes expérimentales.

IV.B.5.2.2 Phasage expérimental par la méthode MIR

Afin de produire des phases par la technique MIR, un trempage des cristaux de RB5312 native dans des solutions contenant 5 mM de nitrate d’ytterbium et de nitrate d’erbium a été réalisé.

Ces terres rares ont été choisies d’une part pour leur facilité à échanger les ions calcium, que nous savions être fixés dans le site actif de la protéine (Pickersgill et al., 1994), et d’autre part car elles possèdent une bande très intense d’absorption à des longueurs d’onde accessible en routine sur les lignes de lumière de l’ESRF. Il était donc envisageable

métaux lourds ont été estimées grâce à l’intensité des spectres de fluorescence X réalisés sur les cristaux trempés. Il est ainsi apparu que seul l’ytterbium avait été incorporé dans les cristaux, cependant en faible quantité.

Ne possédant qu’un unique dérivé lourd, nous avons choisi de tirer parti du signal anomal de l’ytterbium. Trois jeux complets de données ont donc été collectés sur le cristal ayant incorporé le plus de métal aux longueurs d’onde correspondant respectivement au maximum de la composante imaginaire du coefficient d’absorption de l’ytterbium, au point d’inflexion de sa composante réelle et loin du seuil d’absorption soit respectivement à 1,18 Ǻ, 1,19 Ǻ et 1,21 Ǻ.

Il est apparu dès l’intégration des tâches de diffraction que ces cristaux supportaient bien plus difficilement l’irradiation que les cristaux natifs. Sur les cinq cristaux présentant une incorporation suffisante d’ytterbium, seulement deux ont pu produire des jeux de données de bonne qualité. De plus, seule la première collecte de ces cristaux (au pic d’absorption à 1,18 Ǻ) a été exploitable. En effet, la qualité des données s’est malheureusement détériorée au fil des irradiations et les collectes aux autres longueurs d’ondes ont révélé une forte dégradation des données. La sélection d’images correspondant à des sections angulaires des collectes présentant de meilleures statistiques n’a pas permis d’amélioration notable de la qualité de ces données.

L’analyse des données a révélé que le signal anomal était très faible. Le Rano s’est ainsi trouvé systématiquement inférieur au Rmerge du jeu de données, ce qui signifie que l’intensité du signal anomal est inférieure au bruit de fond moyen du jeu de données. Il semble en particulier que soit apparue une dérive des statistiques au cours des collectes successives des jeux de données, en particulier au niveau de la mosaicité des clichés de diffraction, signe que le rayonnement X a particulièrement affaibli le cristal au cours des collectes.

L’expérience de remplacement du calcium par une terre rare n’ayant pas abouti, nous avons abandonné la recherche de dérivés par trempage dans des solutions de sels d’atomes lourds, cette méthode pouvant être parfois assez hasardeuse. Nous avons entrepris de marquer de manière covalente la protéine avec un diffuseur anomal, technique qui présente l’avantage d’être moins aléatoire. Je suis donc passé à la production de la protéine RB5312 avec incorporation de sélénométhionine, pour résoudre la phase par mesures de MAD sur le sélénium.

IV.B.5.2.3 Tentative de phasage expérimental par la méthode MAD au sélénium

Une production de la protéine RB5312 avec incorporation de sélénométhionine a été réalisée. L’efficacité du remplacement a été mesurée par estimation de la masse des protéines par spectrométrie de masse. En réalité, trois protocoles de marquage ont été utilisés au cours de ma thèse.

Le premier a utilisé le milieu de culture PASM-5052 (Studier, 2005). Ce protocole, basé sur celui en ZYP-5052 déjà utilisé pour les productions régulières des protéines, nous a séduit par sa très grande simplicité : il était compatible avec l’utilisation d’une souche non auxotrophe à la méthionine et permettait d’obtenir de grandes quantités d’enzymes marquées, ce qui n’est pas toujours évident avec d’autres milieux. Il n’a cependant pas donné les résultats escomptés en produisant notamment des protéines dont le remplacement des méthionines n’a pas été systématique. En particulier deux populations ont été produites : une avec trois remplacements sur les huit méthionines de la protéine native, et l’autre avec quatre remplacements.

Un second protocole a donc été utilisé, cette fois-ci plus traditionnel. Il a tout d’abord fallu retransformer une souche bactérienne auxotrophe à la méthionine, pour nous assurer que le remplacement serait total. La souche B834(DE3) a été utilisée. Il s’agit d’une souche mutée de la souche BL21, utilisée pour la production de la protéine native, et également lysogénisée par le bactériophage λ(DE3). La production de la protéine séléniée a consisté à cultiver cette souche en milieu LB jusqu’à atteindre une absorbance de la solution d’environ 1 unité, puis à transférer les bactéries dans un milieu frais (après centrifugation), contenant de la sélénométhionine à la place de la méthionine. La production a été alors induite par ajout d’IPTG au milieu. Les résultats ont été analysés par spectrométrie de masse (figure X).

Une production avec un troisième protocole a été tentée pendant que les mesures de spectrométries de masse étaient en cours en utilisant cette fois le protocole décrit par Doublié et collaborateurs en 1997 (Doublié, 1997). Il s’agit d’une autre philosophie : cette fois-ci, une souche non auxotrophe est envisageable. La culture se réalise dans un milieu M9, supplémenté avec de la sélénométhionine à la place de la méthionine. L’ajout d’acides aminés connus pour inhiber la voie de biosynthèse de la méthionine quand ils sont en excès nous assure que la bactérie ne va pas produire de méthionine endogène. Ces deux dernières méthodes ont en réalité donné un remplacement uniforme de tous les sites. Les résultats suivants ne concerneront donc que la production réalisée par le second protocole.

Figure III-105 : Diagramme de spectrométrie de masse.

Le diagramme de gauche présente la protéine native (pic à 48 554 Da). Le diagramme de droite présente la protéine séléniée (pic à 48 997 Da). La masse de la protéine séléniée correspond à un écart de 433 Da, soit, aux incertitudes de mesures près à 8 incorporations de sélénium.

Les rendements de la production de cette protéine ont été beaucoup plus faibles que ceux de RB5312 native, autour de 1 mg de protéine purifiée, par litre de culture. La concentration a été amenée à 4,4 mg/mL pour les tests de cristallisation. En utilisant le robot de cristallisation, 192 conditions ont été testées à 20°C en utilisant les kits commerciaux Wizard I & II (Emerald BioStructures, Inc.) et JCSG+ Suite (Qiagen). Des gouttes assises ont été réalisées en mélangeant 300 nL de protéine à 100 nL de solution réservoir. La protéine séléniée n’a pas présenté les mêmes conditions de cristallisation que la protéine native, avec une préférence pour les conditions en sels. Elles ont été optimisées manuellement par la technique des gouttes suspendues en mélangeant 2 µl de protéine pure et 2 µl de solution réservoir. La condition optimisée a permis de produire des cristaux en 1 M LiCl, 18% PEG 6000, 0,1 M Citrate de sodium pH 6,0. Elle a présenté un profil cristallin également différent : des petits oursins de plaquettes, qui ont poussé en quelques jours.

Trois jeux de données ont été collectés à trois longueurs d’onde autour du pic d’absorption du sélénium, à l’ESRF, sur la ligne ID23-EH1. Le spectre de fluorescence X mesuré sur le cristal est présenté Figure III-106. Les statistiques des jeux de données sont montrées dans le Tableau III-26.

Figure III-106 : Spectre d’absorption mesuré sur un cristal de protéine séléniée.

Spectre mesuré à la longueur d’onde d’absorption de la raie Kα du Se. Le

trait matérialise le pic d’absorption.

Tableau III-26 : Statistiques de collecte de données avec RB5312 séléniée

Les données ont été intégrées et mises à l’échelle entre elles, par rapport au jeu sur le pic d’absorption. L’intensité du signal anomal a été estimée grâce au logiciel XPREP. Un extrait des résultats de ce logiciel est montré dans le Tableau III-27 suivant.

Tableau III-27 : Résultats de XPREP

Il apparaît à la lecture du Tableau III-27 que l’intensité du signal anomal est faible. Le rapport <d’’/sig> traduit la moyenne de l’amplitude du signal anomal, calculé par la différence d’intensité moyenne sur les taches de Friedel séparée par de la diffraction anomale, par rapport à la différence d’intensité des taches sans signal anomal. En dessous d’une valeur de 1,2, les variations sont considérées comme aléatoires. Il apparaît que seules les données supérieures à 5,6 Ǻ de résolution (colonne jaune du Tableau III-27) portent un signal anomal, relativement faible.

Des tentatives de phasage à partir de ces données, et à la résolution maximum de 5,6 Ǻ ont été tentées en utilisant plusieurs logiciels : Solve/Resolve et Sharp. Aucun n’a convergé vers une solution. Sur les différentes cartes de densité électronique calculées quelques zones sont apparues, correspondant probablement d’après leur nombre (six), aux sites des séléniums. Il apparaît que ces sites se situeraient dans des zones adjacentes, et il n’a pas été possible d’aller plus loin dans l’utilisation des données.

J’ai tenté une déconvolution à la main des cartes de Patterson de différence anomale, qui traduisent l’information anomale brute des jeux de données. Elles sont calculées pour chaque longueur d’onde et pour chaque section de Harker. Ces sections représentent des positions spéciales de la maille cristalline dans lesquelles toute l’information de diffraction du cristal apparaît. L’exercice consiste à repérer les intensités de diffraction à la fois communes aux cartes de différence anomales, et non représentées dans les cartes natives. Le groupe d’espace des cristaux (P212121) génère trois sections de Harker : x = 0,5 ; y = 0,5 ; z = 0,5. Les intensités observables sur ces diagrammes correspondent à des zones de la maille présentant un signal de diffraction fort, et en l’occurrence, à une diffraction anomale forte. La Figure III-107 présente l’un de ces diagrammes, comparé au même diagramme, cette fois sans tenir compte du signal anomal. La différence des deux est sensée refléter ce signal.

Figure III-107 : Cartes de Patterson des section de Harker z=0,5. Carte de gauche : carte de différence anomale ; carte de droite : carte native. Les dimensions sont exprimées en pourcentage des dimensions atomiques de la maille. Un pic de la carte anomale, non présent dans la carte native est matérialisé par un cercle rouge.

Il suffit, pour faire correspondre les différentes cartes entre elles, de regénérer « à la main » les positions symétriques de chaque intensité intéressante. Ces positions équivalentes générées par la symétrie du cristal sont accessibles dans les tables de cristallographie. Si les données sont cohérentes, les taches, après application des symétries, doivent se superposer.

Il apparaît que le signal anomal est réellement faible et que les données ne sont pas exploitables, même en cherchant les signaux les plus faibles…