• Aucun résultat trouvé

3 Practical aspects of PKS genetic engineering

IV. C. Les domaines de docking

Les PKS sont composées de plusieurs sous-unités et les organismes synthétisant des polycétides présentent bien souvent plusieurs clusters de PKS différents au sein de leur génome (Katz et Baltz, 2016), or l’intermédiaire polycétidique ne doit pas être transféré à une sous-unité portant des modules antérieurs déjà intervenus dans la synthèse, ni à une sous-unité appartenant à un autre système PKS. Cette spécificité d’interaction est garantie par des petits éléments structuraux situés aux extrémités N-terminales (Nter) et C-terminales (Cter)des sous-unités et nommés domaines de docking (DD).

IV.C.1. Mise en évidence

Les DD ont été mis en évidence de manière indirecte dès 1992 par alignement des séquences des sous-unités de l’érythromycine synthase. Les auteurs ont découvert, sur DEBS 2 et DEBS 3, des séquences en Nter des sous-unités qui n’étaient pas assignables aux domaines KS et en Cter de DEBS 1 et DEBS 2, des séquences qui n’étaient pas attribuables aux ACP. Il a été alors émis comme hypothèse que ces séquences jouent un rôle dans l’assemblement et l’ordonnancement des sous-unités (Donadio et Katz, 1992). Plus tard, des alignements de séquences entre plusieurs PKS cis-AT : l’érythromycine, la rapamycine et l’oléomycine synthase, ont confirmé la présence répandue de ces séquences en Nter alors baptisées linker (Aparicio et al., 1996). Elles présentent la particularité de contenir des répétitions en heptades d’acides aminés aliphatiques et ont été prédites comme se structurant en hélices α. Il a été supposé que ces séquences puissent s’homodimériser en formant un coiled-coil et permettent d’initier la dimérisation des sous-unités multi-enzymatiques en partant de leur extrémité Nter

(Aparicio et al., 1996). D’ailleurs des constructions comprenant le module 2 et le domaine TE (M2-TE) ou le module 6 et le domaine TE (M6-TE) de DEBS, modules situés à l’extrémité Cter

de leur sous-unité, sont incapables de prendre en charge un substrat dicétidique. Au contraire, les constructions M3-TE et M5-TE sont capables de produire le tricétide à partir du même dicétide ; ce sont des modules situés en Nter de leurs sous-unités respectives qui comprennent donc la séquence d’homodimérisation supposée. En effet, l’activité d’extension du M2-TE et du M6-TE a été restaurée en insérant la séquence de trente-neuf acides aminés situés en Nter du module 5 (Gokhale, 1999).

Il a été très vite montré que ces linkers, rebaptisés DD par la suite, naturellement présents entre sous-unités sont d’un grand intérêt pour les expériences d’ingénierie. Par exemple, une PKS hybride a été créée par génie génétique, qui comprenait les trois sous-unités

de DEBS, mais le module 2 de DEBS 1 a été remplacé par le module 5 de la rifamycine synthase tout en conservant le DD en Cter de DEBS 1. Le polycétide attendu a bien été synthétisé sans perte de rendements (Figure 33 page 57).

Figure 33 : Représentation schématique de la PKS hybride dans laquelle le module 2 de DEBS a été remplacé par le module 5 de la rifamycine synthase (adaptée de Gokhale, et al. 1999).

Le module 5 de la rifamycine synthase (en orange) a été inséré à la place du module 2, de manière à préserver les linkers entre modules d’une même sous-unité (en rouge), ainsi que les DD entre modules situés sur des sous-unités distinctes (en jaune, en Cter du module 5 nouvellement inséré).

Par la suite, il a été démontré que ces DD facilitent en partie le transfert de la chaine polycétidique en croissance d’une sous-unité à l’autre (Tsuji, Cane, et Khosla, 2001). En prenant DEBS pour modèle, le transfert de l’intermédiaire entre les modules 2 et 3, donc entre DEBS 1 et DEBS 2, a été suivi. Des paires non natives de DD ont été testées : celui en Cter de DEBS 1 avec celui en Nter de DEBS 3 ou celui en Cter de DEBS 2 avec celui en Nter de DEBS 2. Des transferts d’intermédiaires ont été observés, mais extrêmement ralentis par rapport aux constructions présentant des paires natives. En effet, lorsque les DD natifs présents entre DEBS 2 et DEBS 3 ont été utilisés entre DEBS 1 et DEBS 2, le transfert de l’intermédiaire a été réalisé à une vitesse comparable à celle de la construction sauvage.

Une étude similaire a été menée afin d’évaluer la contribution des domaines ACPn-1 et KSn dans l’efficacité de transfert de l’intermédiaire (Wu, Cane, et Khosla, 2002). Les données obtenues au cours de cette étude ont montré que bien que les DD ne soient pas appariés, si l’ACPn-1 et la KSn le sont, le transfert de l’intermédiaire est possible. Ces résultats sont confirmés par d’autres études qui tendent à prouver que l’ACP et la KS interagissent bien ensemble et que les DD ne sont pas les seuls domaines impliqués dans la reconnaissance entre sous-unités (Weissman, 2006a ; Buchholz et al., 2009 ; Whicher et al., 2014).

Ces expériences démontrent que même si les DD ne sont pas les seuls déterminants du bon transfert de l’intermédiaire, ils jouent un rôle capital dans les interactions spécifiques entre sous-unités. De plus ce sont des éléments très intéressants pour l’ingénierie puisqu’ils sont portatifs, c’est-à-dire qu’ils peuvent fonctionner de manière indépendante de leur sous-unité, et

58

l’insertion d’une paire native peut permettre la communication entre des sous-unités de différents systèmes (Tang, Fu, et McDaniel, 2000 ; Menzella, Carney, et Santi, 2007 ; Kim et al., 2017).

La caractérisation biophysique d’un couple de DD s’est révélée délicate du fait de la faible interaction entre ces domaines. En effet, la constante de dissociation rendant compte de l’affinité de ces domaines est de l’ordre de la dizaine de micro molaires (Whicher et al., 2013). Ces interactions seraient aussi transitoires au sein de la cellule, ce qui faciliterait le renouvellement de sous-unités défectueuses en évitant une néo-synthèse totale d’une nouvelle PKS entière, ce qui, au vu de la taille totale de ces systèmes, serait extrêmement couteux à la cellule d’un point de vue énergétique.

IV.C.2. Différentes classes de domaines de docking

La caractérisation structurale ainsi que des alignements de séquences plus poussés permettent de distinguer clairement plusieurs classes de DD.

IV.C.2.a. Domaines de docking de classe 1

IV.C.2.a.i. Classe 1a

La première classe mise en évidence chez les PKS cis-AT et plus particulièrement entre les sous-unités DEBS 2 et DEBS 3 (Broadhurst et al., 2003), a été la classe 1a. La structure des deux partenaires en complexe a été résolue par RMN. Pour faciliter l’étude et favoriser l’interaction plutôt faible entre les deux partenaires, les extrémités Cter de DEBS 2 et Nter de DEBS 3 ont été fusionnées par l’intermédiaire d’un linker artificiel de deux acides aminés. Il a été montré qu’une telle fusion de sous-unité n’altérait en rien l’activité de la PKS in vivo et au contraire favorisait son repliement et sa stabilité (Liang, Sandberg, et Terwilliger, 1993 ; Squire et al., 2003).

La structure RMN présente un complexe homodimérique qui peut être divisé en deux domaines distincts, A et B, connectés entre eux par des boucles d’environ dix résidus, comprenant le linker artificiel (Figure 34 page 59). Le domaine A correspond aux hélices a1 et 2 du DD situé en Cter de DEBS2 (CDD) ; en s’homodimérisant par des interactions hydrophobes, un fagot de quatre hélices a est formé.

Le domaine B comprend l’interface de docking. Comme prédit par des études précédentes, le DD situé en Nter de DEBS 3 (NDD), se replie en hélice a et s’homodimérise par des interactions hydrophobes formant ainsi un coiled-coil. Au niveau de ce coiled-coil, les

hélices a3 du CDD viennent s’insérer dans le sillon. L’ensemble forme un fagot de quatre hélices a, les DD interagissent ensemble via des interactions hydrophobes mais aussi des interactions électrostatiques.

Figure 34 : Structures RMN des domaines de docking situés entre les sous-unités DEBS 2 et DEBS 3 (PDB : 1PZR et 1PZQ).

Le CDD, situé en aval du dernier ACP de la sous-unité DEBS 2 (en rouge et en rose), comprend trois hélices

α. Les deux premières assurent l’homodimérisation du domaine A et la troisième interagit avec le coiled-coil formé par le NDD homodiémrique (en bleu clair et en bleu foncé), situé en amont de la première KS de la sous-unité DEBS 3. Le linker artificiel permettant la fusion des deux partenaires est présenté en gris et les boucles reliant des domaines A et B en pointillés. Ces deux domaines ne semblent pas interagir ensemble, c’est pourquoi deux fichiers PDB ont été déposés (domaines A et B), ils sont ici reliés par les lignes en pointillés.

Cette classe de DD est largement répandue au sein des PKS cis-AT, et peut être présente plusieurs fois au sein du même système. C’est le cas, par exemple, chez DEBS : les DD de l’interface DEBS 1/DEBS 2 en feraient aussi partie, mais aussi chez l’amphotéricine synthase qui est composée de six sous-unités, où des DD de cette classe seraient présents à chaque interface. Des études ont donc été menées afin de préciser les déterminants de la spécificité d’interaction au sein des DD de classe 1a. Par alignements de séquences, des résidus hydrophobes et chargés situés à des positions précises de l’hélice a3 du CDD et de l’hélice a

du NDD, ont été mis en évidence. Ces résidus seraient à la base d’un « code de spécificité » : les résidus chargés, grâce à des interactions charge-charge compatibles, et les résidus

KS KS ACP ACP Domaine A Domaine B Linker Linker

60

hydrophobes via une surface d’interaction compatible (Weissman, 2006b). Des études bio-informatiques plus poussées ont même permis de distinguer des classes phylogéniques mutuellement exclusives (Thattai, Burak, et Shraiman, 2007).

IV.C.2.a.ii. Classe 1b

Cette classe a été identifiée pour la première fois par des études des DD situés entre les sous-unités 3 et 4 de la pikromycine synthase (Buchholz et al., 2009). Dans un premier temps, les auteurs ont tenté d’obtenir des cristaux d’une protéine de fusion comprenant les trois hélices

a prédites du CDD et l’hélice a du NDD. Cependant, aucun cristal n’a été obtenu, ceci étant certainement dû à la présence de la boucle flexible entre les hélices a2 et 3 du CDD. Une construction tronquée a été donc produite, qui ne comprenait que les hélices a impliquées dans le docking proprement dit, fusionnées directement sans linker. La structure cristallographique obtenue à 1,75 Å de résolution est très proche de celle des DD de classe 1a (Figure 35 page 60). L’absence de linker ne semble pas fournir une flexibilité suffisante pour que les DD d’une même chaine polypeptidique interagissent ensemble ; la structure obtenue est telle que le CDD d’une protéine de fusion interagit avec le NDD d’une seconde protéine de fusion.

Figure 35 : Structure cristallographique à 1,75 Å de résolution de l’interface de docking entre les sous-unités PikAIII et PikAIV (PDB : 3F5H).

KS KS

Tout comme dans la classe 1a, le NDD comporte une hélice a unique qui s’homodimérise en formant un coiled-coil, et l’hélice a terminale du CDD s’insère dans son sillon. Quelques détails permettent cependant de les différencier de la classe 1a et rendent ces deux classes mutuellement exclusives : tout d’abord l’hélice a3 du CDD est bien plus courte dans la classe 1b (neuf résidus contre quinze), et ensuite, une courte hélice a supplémentaire est présente, qui se place dans la jonction du coiled-coil. De plus, la position des résidus chargés et des résidus hydrophobes intervenant dans l’interaction et sa spécificité ne sont pas les mêmes.

IV.C.2.b. Domaines de docking de classe 2

Les domaines de docking de classe 1 ont été mis en évidence chez les actinobactéries : Saccharopolyspora erythraea pour DEBS et Streptomyces venezuelae pour Pik. L’alignement de séquences de DD de systèmes PKS trouvés d’une part chez des Actinobactéries, et d’autre part chez des cyanobactéries et des myxobactéries, montre que ces deux clades se distinguent dans leur organisation structurale (Whicher et al., 2013): les CDD sont plus courts de quarante résidus par rapport à la classe 1 et ne contiendraient donc pas la région d’homodimérisation ; quant aux NDD, ils sont de taille similaire à la classe 1 mais des résidus polaires sont présents en Nter du domaine, et ne pourraient donc pas former un seul long

coiled-coil. Les auteurs se sont intéressés à deux interfaces de la curacine A synthase, trouvée

chez une cyanobactérie, Moorea producens. Les structures de paires de DD à ces deux interfaces ont été résolues par cristallographie sur des protéines de fusion : les deux partenaires ont été liés par un linker de huit résidus (Gly3Ser)2. (Figure 36 page 62).

62

Figure 36 : Structures cristallographiques de deux interfaces de docking trouvées chez la curacine A synthase (PDB : 4MYY, 4MYZ).

La structure des DD de l’interface CurG/CurH a été résolue à 1,7 Å de résolution. Les CDD (en rouge et en rose) sont monomériques et constitués de deux hélices a. Les NDD, en bleu (foncé et clair), sont homodimériques, et comprennent aussi deux hélices a. Un coiled-coil est formé par les deux hélices en amont des KS. La structure des DD de l’interface CurK/CurL a été résolue à 1,5 Å de résolution. Les CDD (en rouge) sont aussi monomériques et constitués d’une hélice a, connectée par une boucle flexible à un tour d’hélice. Les NDD (en bleu) sont homodimériques en formant un coiled-coil et comprennent une hélice a unique.

Le couple de DD trouvé à l’interface CurG/CurH forme un fagot de huit hélices a. Chaque domaine est constitué de deux hélices a reliées par une boucle flexible. Au contraire des DD de classe 1, les CDD ne disposent pas du fagot de dimérisation et sont monomériques. Les NDD sont homodimériques, car les hélice a (bleues) en amont des KS forment un

coiled-coil. La première hélice a (rouge foncé) des CDD interagit avec les deux hélice a (bleu clair) d’un monomère de NDD, tandis que la seconde (rouge foncé) contacte le coiled-coil (bleu clair

et foncé).

L’interface entre les sous-unités CurK et CurL présente la même topologie. Il faut cependant noter que les NDD ne comportent qu’une seule hélice a et que le CDD est constitué d’une hélice a suivie d’un tour d’hélice, mais l’angle formé entre ces deux structures est le même que celui trouvé chez le CDD de CurG. De la même manière, la boucle entre les hélices

a des monomères de NDD de CurH et celle trouvée en amont des monomères de NDD de CurL adoptent la même conformation.

La topologie de ces deux complexes permet de positionner directement les ACP aux côtés des KS alors que chez les DD de classe 1, les boucles reliant les CDD à l’ACP sont à

KS KS

ACP ACP KS KS

ACP

ACP

Interface CurG/CurH Interface CurK/CurL

Linker

l’opposé. De manière intéressante, la spécificité d’interaction chez les DD de classe 2 semble aussi dictée par la présence d’une large surface hydrophobe complémentaire ainsi que des interactions charge-charge entre résidus clés. Une simple mutation d’un résidu glutamate en arginine sur le CDD de CurK a permis d’abolir son interaction avec son partenaire natif, mais a créé une communication avec le NDD de CurH, qui est impossible avec la protéine sauvage. L’affinité d’interactions entre DD sauvages est de l’ordre de la dizaine de micro molaires (Whicher et al., 2013).

IV.C.2.c. Domaines de docking particuliers chez les PKS

trans-AT

Les DD de classes 1 et 2 ont été mis en évidence chez les PKS de type cis-AT. Jusqu’à récemment, peu d’informations structurales étaient disponibles quant aux DD des PKS trans-AT. Une différence importante chez ces systèmes réside dans la présence de modules « splités », où des domaines d’un même module sont localisés sur deux sous-unités distinctes. Plusieurs jonctions de ce type sont trouvées : KS/KR, KS/DH, KR/MT et DH/KR, entre autres.

Un mécanisme d’interaction entre des domaines KS et DH situés aux extrémités Cter et Nter de leur sous-unité respective a été mis en évidence (Jenner et al., 2018). Des alignements de séquences des extrémités Cter de KS et Nter de DH impliquées dans de telles interfaces montrent que ces dernières ne présentent pas de séquence supplémentaire non assignée, alors qu’il existe une séquence de longueur variable non annotée en aval des KS. Les auteurs se sont penchés plus particulièrement sur l’interface située entre les sous-unités 4 et 5 de la gladioline synthase (GbnD4 et GbnD5). Une analyse bio-informatique indique que les séquences en Cter

des KS présentent un haut degré de désordre avec une propension à se structurer en brin β. Le caractère désordonné de cette séquence située en Cter de GbnD4, baptisée DH docking (DHD), a été confirmé par RMN et par dichroïsme circulaire (CD). En assignant les spectres RMN, les auteurs ont mis en évidence que ce domaine peut adopter plusieurs conformations en solution et que certaines régions ont tendance à se structurer en hélice a ou en brin b, mais le DHD n’adopte pas de structure tertiaire stable. Des expériences de titration RMN du DHD marqué

13C,15N avec son partenaire DH-ACP non marqué, ont démontré que deux régions du DHD, d’une dizaine de résidus chacun, seraient impliquées dans l’interaction et se fixeraient en surface du domaine DH (Figure 37 page 64), avec une constante de dissociation (Kd) de 40 μM.

64

Figure 37 : Modèle de l'interaction entre le DHD et le domaine DH situés à l'interface des sous-unités 4 et 5 de la gladioline synthase (tirée de Kosol et al., 2018).

Le DHD déstructuré (à gauche), situé en aval de la KS, présente deux zones distinctes (en jaune) qui assurent son interaction avec des résidus en surface du domaine DH (en bleu).

Ces interactions sont spécifiques, car le DHD de GbnD4 ne forme pas de complexes stables avec d’autres DH de modules « splités » testés (Jenner et al., 2018), mais aucun code de spécificité n’est déterminé pour le moment. Cette étude a montré pour la première fois une interaction médiée directement entre un DD et un domaine catalytique.

IV.C.2.d. Domaines de docking de classe 3

Une autre classe de DD a été caractérisée chez le système hybride PKS/NRPS responsable de la synthèse de la tubulysine (Richter et al., 2008). Ce couple est situé à l’interface entre les sous-unités TubB et TubC, et plus spécifiquement, entre deux modules NRPS. Par alignement de séquences, les auteurs ont mis en évidence que cette classe est largement répandue chez les hybrides, résultats confirmés par des travaux récents (Hacker et al., 2018 ; Kosol et al., 2019).

La structure du DD en Nter de TubC, nommé TubCdd, a été résolue par RMN. Ce DD de soixante-dix résidus se structure en trois hélices aet deux brins b qui adoptent une topologie

abbaa. Ce DD s’homodimérise par l’intermédiaire des deux brins b, mais également par la boucle reliant le deuxième brin à l’hélice a2 (Figure 38 page 65).

Figure 38 : Structure RMN de TubCdd (PDB : 2JUG).

Au centre, les feuillet β (en bleu) et la boucle (en gris) assurant la formation de l’homodimère. Chaque monomère comporte aussi trois hélices α (en vert).

Pour résoudre la structure des deux DD en interaction, les deux partenaires ont été fusionnés par l’intermédiaire d’un linker de deux acides aminés. Malheureusement, une analyse de la protéine par spectrométrie de masse a mis en évidence une protéolyse en Nter de la construction, au niveau de TubBdd. Cette dernière, constituée de vingt-cinq résidus, est par la suite produite par synthèse chimique, et se révèle non structurée par RMN et CD. Elle permet tout de même de tester l’implication dans l’interaction de résidus chargés à la surface de TubCdd. De la même manière que chez les DD de classes 1 et 2, ces résidus chargés constitueraient un code de spécificité au sein de la classe 3.

Plus tard, la structure d’une protéine de fusion de DD de type 3 a été résolue par RMN (Hacker et al., 2018). L’interface est située entre les deux dernières sous-unités d’une NRPS : une rhabdopeptide synthase. A la différence de TubCdd, issue d’une hybride PKS/NRPS, le

NDD de Kj12C est monomérique, mais la même conformation abbaaest adoptée. Il s’avère

que le CDD de Kj12B est largement déstructuré en l’absence de son partenaire. Il présente cependant une hélice a et un brin b qui s’insère dans le feuillet formé par les deux brins du

NDD dans la structure du complexe (Figure 39 page 66).

N

N

66

Figure 39 : Structure RMN d’une protéine de fusion de DD de type 3 trouvée chez une NRPS (PDB : 5EWV). Le CDD de la sous-unité Kj12B (en rouge) situé en aval d’un PCP, est composé d’une hélice a et d’un brin b

qui se structure en s’insérant au niveau du feuillet b du NDD de Kj12C (en bleu). Ce dernier est situé en amont