• Aucun résultat trouvé

Architecture et évolution des réseaux d'interactions protéines-protéines : exploration de la carte génotype-phénotype

N/A
N/A
Protected

Academic year: 2021

Partager "Architecture et évolution des réseaux d'interactions protéines-protéines : exploration de la carte génotype-phénotype"

Copied!
305
0
0

Texte intégral

(1)

Architecture et évolution des réseaux d’interactions

protéines-protéines

Exploration de la carte génotype-phénotype

Thèse

Guillaume Diss

Doctorat en biologie

Philosophiae doctor (Ph.D.)

Québec, Canada

© Guillaume Diss, 2014

(2)
(3)

iii

Résumé

La question des bases structurales du phénotype et de sa variation est une des questions les plus anciennes de la biologie. Le paradigme actuel stipule que le phénotype est exprimé à partir du génotype au travers de réseaux moléculaires dont l’architecture structure l’information génétique. Cette description mécanistique de la carte génotype-phénotype implique que c’est par la perturbation de l’architecture de ces réseaux que des variations génotypiques mènent à des modifications du phénotype. Les protéines constituant le principal vecteur de l’information génétique, comprendre la carte génotype-phénotype requiert de comprendre comment les variations génotypiques perturbent l’architecture du réseau d’interactions protéines-protéines. Au cours de cette thèse, nous avons développé une méthode permettant d’étudier chez la levure Saccharomyces cerevisiae l’impact de la délétion des gènes sur les interactions entre protéines. Nous avons appliqué cette méthode à l’étude des mécanismes moléculaires de la robustesse par lesquels le réseau d’interactions protéines-protéines filtre les variations génotypiques pour préserver le phénotype. Nous avons mis au jour un mécanisme de compensation fonctionnelle entre gènes paralogues basé sur la compensation des interactions protéines-protéines et expliquant un lien entre génotype et phénotype qui était mal compris jusqu’alors. En outre, en appliquant notre méthode à l’identification des régulateurs de la Protéine Kinase A, nous avons approfondi les connaissances sur la façon dont les maîtres régulateurs coordonnent les processus cellulaires et maintiennent l’homéostasie, une propriété distribuée de la robustesse. Ces résultats, et ceux qui seront produits à l’avenir par l’application de cette méthode, promettent une meilleure compréhension des mécanismes moléculaires par lesquels l’information génétique est transmise du génotype au phénotype, condition essentielle à la compréhension du vivant et de son évolution.

(4)
(5)

v

Abstract

The question of the structural bases of the phenotype and of its evolution is one of the oldest questions in biology. The present paradigm states that the phenotype is expressed from the genotype through molecular networks, the architecture from which structures genetic information. This mechanistic description of the genotype-phenotype map implies that it is through by perturbing of the architecture of these networks that genotypic variations lead to phenotypic modifications. Since proteins are the main vector of genetic information, understanding the genotype-phenotype map requires the understanding of how genotypic variations perturb the architecture of the protein interaction network. In the course of this thesis, we developped a methodology that allows to study the impact of gene deletions on the interactions between proteins in the yeast Saccharomyces cerevisiae. We applied this method to the study of the molecular mechanisms of robustness by which the protein interaction network filters genotypic variations to preserve the phenotype. We uncovered un mechanism of functional compensation between paralogous genes that is based on protein-protein interaction compensation and that explains the poorly understood link between genotype and phenotype. Moreover, we applied our method to the identification of regulators of Protein Kinase A and deepened our knowledge of how master regulators coordinate cellular processes and maintain homeostasis, a distributed property of robustness. These results, and the ones that will be produced in the future by applying this method, promise a better understanding of the molecular mechanisms through which genetic information is transmitted from the genotype to the phenotype, an essential condition for the understanding of life and its evolution

(6)
(7)

vii

Table des matières

Résumé de la thèse ... iii

Abstract….. ... v

Table des matières ... vii

Liste des tableaux ... xi

Liste des figures ... xiii

Liste des abréviations et des sigles ... xvii

Remerciements ... xxiii

Avant-propos ... xxvii

Chapitre I) Introduction ... 1

I.1) Le phénotype des espèces n’est pas figé dans le temps ... 2

I.2) Découverte des bases organiques de la variation du phénotype ... 2

I.3) Premières descriptions moléculaires de la carte génotype-phénotype ... 3

I.4) L’approche réductionniste ... 4

I.5) L’approche systémique ... 5

I.6) Réseaux moléculaires, carte génotype-phénotype et cadre théorique de la thèse ... 6

Chapitre II) Integrative avenues for exploring the dynamics and evolution of protein interaction networks ... 9

II.1) Résumé ... 10

II.2) Abstract ... 11

II.3) Introduction ... 12

II.4) Perturbing PINs: mapping in 3D ... 13

II.5) Interaction of interactomes among species ... 15

II.6) Evolution of PINs ... 17

II.7) Conclusion ... 19

II.8) Acknowledgements ... 20

II.9) Figures ... 22

Chapitre III) Molecular mechanisms of paralogous compensation and the robustness of cellular networks ... 31

(8)

viii

III.1) Résumé ... 32

III.2) Abstract ... 33

III.3) Introduction ... 34

III.4) Mechanisms of genetic and environmental robustness ... 35

III.5) Gene duplication and functional compensation by paralogous genes ... 36

III.6) Towards a mechanistic understanding of paralogous compensation... 39

III.7) Active paralogous compensation by transcriptional reprogramming ... 41

III.8) Active paralogous compensation by protein interaction rewiring ... 44

III.9) Active paralogous compensation by protein relocalization ... 47

III.10) Perspectives ... 48

III.11) Acknowledgements ... 50

III.12) Figures ... 54

Chapitre IV) Combining DHFR PCA with gene deletions to establish genotype-to-phenotype maps of protein complexes and interaction networks ... 63 IV.1) Résumé ... 64 IV.2) Abstract ... 65 IV.3) Reagents ... 66 IV.4) Equipment ... 68 IV.5) Method ... 68 IV.6) Troubleshooting ... 73 IV.7) Discussion ... 73 IV.8) Figure ... 76

Chapitre V) A systematic approach for the genetic dissection of protein complexes in living cells ... 79

V.1) Résumé ... 80

V.2) Abstract ... 81

V.3) Introduction ... 82

(9)

ix V.5) Discussion ... 94 V.6) Experimental procedures ... 97 V.7) Acknowledgements ... 100 V.8) Figures ... 102 V.9) Supplementary Figures ... 116 V.10) Supplementary Tables ... 125

Chapitre VI) Functional compensation between duplicated genes by protein-protein interaction rewiring ... 127

VI.1) Résumé ... 128

VI.2) Abstract ... 129

VI.3) Main text ... 130

VI.4) Methods ... 135

VI.5) Acknowledgements ... 145

VI.6) Author contribution... 145

VI.7) Figures ... 146

VI.8) Supplementary Figures ... 152

VI.9) Supplementary Tables ... 158

Chapitre VII) Systematic identification of signal integration by Protein Kinase A ... 159

VII.1) Résumé ... 160

VII.2) Abstract ... 161

VII.3) Introduction ... 162

VII.4) Results and Discussion ... 164

VII.5) Conclusion ... 169

VII.6) Methods ... 170

VII.7) Acknowledgements ... 174

VII.8) Author contributions ... 174

VII.9) Figures ... 176

VII.10) Supplementary Figures ... 188

VII.11) Supplementary Tables and Datasets ... 202

Chapitre VIII) Conclusions générales ... 203

(10)

x

VIII.2) Limitations et extensions de la méthode ... 206

VIII.3) Perspectives et réflexions personnelles ... 210

Bibliographie... 217

Annexes….. ... 251

Annexe I) Extended Experimental Procedures of Chapter V ... 251

(11)

xi

Liste des tableaux

Table V.S1) List of baits, preys and deletions used for each complex,

related to Figure V.1. ... 125

Table V.S3) Results of the wild-type NPC screen, related to Figure V.4. ... 126

Table V.S5) Media composition, related to Figure V.1. ... 126

Table V.S6) Strains used in this study, related to Figure V.1. ... 126

Table V.S7) Oligonucleotides used in this study, related to Figure V.1. ... 126

Table VI.S1) Pairs of duplicated genes used in this study. ... 158

Table VI.S2) Data from the standard PCA screen... 158

Table VI.S3) Data from the PPI compensation screen. ... 158

Table VII.S1) List of candidates with a previously reported relationship to PKA. ... 202

Table VII.S2) Plasmid used in this study. ... 202

Table VII.S3) Culture media and antibiotic concentration used in this study. ... 202

Dataset VII.S1) Compilation of PKA assay results with physical interaction evidence. ... 202

Dataset VII.S2) Kinase-substrate pairs involving PKA subunits... 202

Dataset VII.S3) Data from the Tandem Affinity Purification followed by mass spectrometry experiment. ... 202

Dataset VII.S4) Data from the co-immunoprecipitation followed by mass spectrometry experiments. ... 202

Dataset VII.S5) Detailed gene ontology enrichment analysis for each subset list. ... 202

(12)

xii

Dataset VII.S6) Protein complex analysis. Interquartile mean and p-values of each protein complex computed with COMPLEAT are

reported for each PKA assay. ... 202 Dataset VII.S7) Protein interactions tested by DHFR-PCA with and without

methionine and rapamycin. ... 202 Dataset VII.S8) Description of strains used in this study. ... 202 Dataset VII.S9) Oligonucleotides used in this study. ... 202

(13)

xiii

Liste des figures

Figure II.1) PINs lay at the interface between the genotype and the

phenotype of a cell. ... 23

Figure II.2) Species interactions at the interactome level represent important perturbations. ... 25

Figure II.3) Mechanisms that shape PINs during evolution. ... 27

Figure II.4) PINs occupy a central position in the genotype–phenotype maps. ... 29

Figure III.1) Functional overlap and the concepts of compensation. ... 55

Figure III.2) General mechanisms of active and passive paralogous compensation. ... 57

Figure III.3) Experiments showing that some duplicate genes are up-regulated in response to deletion of their paralogs. ... 59

Figure III.4) Paralogous compensation at the protein interaction level in the nuclear pore complex ... 61

Figure IV.1) Overview of the approach that combines the DHFR-PCA with Synthetic Genetic Arrays (SGA) to identify regulators of protein-protein interactions. ... 77

Figure V.1) Genetic dissection of protein interactomes. ... 103

Figure V.2) Dissection of the Retromer complex. ... 105

Figure V.3) Genetic dissection of the Retromer interactome. ... 107

Figure V.4) NPC structural organization. ... 109

Figure V.5) NPC perturbation. ... 111

Figure V.6) The robustness of the NPC to genetic perturbations. ... 113

Figure V.7) Genetic robustness of protein complexes at the cellular and molecular levels. ... 115

(14)

xiv

Figure V.S1) Detailed experimental design, related to Figure V.1... 117

Figure V.S2) Hit identification and confirmation for the Retromer, related to Figure V.2. ... 119

Figure V.S3) Full heatmap of Retromer perturbation screen, related to Figure V.3. ... 121

Figure V.S4) Correlation between contact frequency and I-score in the NPC wild-type screen, related to Figure V.4. ... 123

Figure V.S5) NPC hit determination and confirmation, related to Figure V.5. ... 125

Figure VI.1) PPI compensation screen. ... 147

Figure VI.2) Representative examples of PPI compensation profiles. ... 149

Figure VI.3) Mechanistic model of the genotype-phenotype map of duplicated genes. ... 151

Figure VI.S1) Distribution of interaction and perturbation scores. ... 153

Figure VI.S2) Comparison of the fitness effect of deleting the compensating or the compensated duplicate. ... 155

Figure VI.S3) Boxplot of expression correlation coefficients between duplicates capable of functional compensation or not. ... 157

Figure VII.1) Systematic PKA assay in yeast. ... 177

Figure VII.2) Validation of the PKA assay results. ... 179

Figure VII.3) Inbound PKA signals come from specific processes. ... 181

Figure VII.4) Regulation of PKA by autophagy, methionine, TOR and EGO. . 183

Figure VII.5) Acetylation regulates PKA in yeast and humans. ... 185

Figure VII.6) Bcy1 acetylated lysine mutant phenotypes. ... 187

Figure VII.S1) PKA assay screening method. ... 189

Figure VII.S2) Results of the four PKA assays. ... 191

(15)

xv Figure VII.S4) Deletion of candidate regulator genes can aggravate or

compensate for PKA hyperactivation (RAS2Val19) effect on fitness. ... 195 Figure VII.S5) Intersection of PKA scores with other datasets. ... 197 Figure VII.S6) Follow-up experiments on the interplay between autophagy,

methionine and PKA. ... 199 Figure VII.S7) Follow-up experiments on protein acetylation of the PKA

(16)
(17)

xvii

Liste des abréviations et des sigles

AC: Allelic Competitor

AKAP: A-Kinase Anchoring Protein AMP: Adenosine Monophosphate AMPK: AMP-activated kinase

AP-MS: Affinity Purification – Mass Spectrometry cAMP: cyclic Adenosine Monophosphate

CFP: Cyan Fluorescent Protein DHFR: Dihydrofolate Reductase DMSO: Dimethyl sulfoxide DNA: DeoxyriboNucleic Acid FDR: False Discovery Rate GI: Genetic Interaction

GFP: Green Fluorescent Protein GPCR: G-Protein Coupled Receptor GTP: Guanosine Triphosphate GTPase: Guanosine Triphosphatase HDAC: Histone Deacetylase

HIV: Human Immunodeficiency Virus Hyg: Hygromycin B

I-score: Interaction score

L-DHFR: Linker-Dihydrofolate Reductase mRNA: messenger Ribonucleic Acid MTX: Methotrexate

(18)

xviii

NADPH: Nicotinamide Adenine Dinucleotide Phosphate NADH: Nicotinamide Adenine Dinucleotide

Nat: Nourseothricin

NPC: Nuclear Pore Complex NO: Nitric Oxide

OD600nm: Optical Density at 600nm PCA: Protein Complementation Assay P-score: Perturbation score

PINs: Protein Interaction Networks PKA: Protein Kinase A

PPI: Protein-Protein Interaction PTM: Posttranslational Modification RFP: Red Fluorescent Protein RLuc: Renilla Luciferase RNA: Ribonucleic Acid SC: Synthetic Complete

SC/MSG: Synthetic Complete / Monosodium Glutamamte SGA: Synthetic Genetic Array

S. cerevisiae: Saccharomyces cerevisiae

SNX: Sorting Nexin

TAP: Tandem Affinity Purification TOR: Target of Rapamycine TSA: Trichostatin A

V-ATPase: Vacuolar Adenosine Triphosphatase WT: Wild-Type

(19)

xix Y2H: Yeast two-Hybrid

YPD: Yeast extract Peptone Dextrose ZL: Zipper-Linker-DHFR

(20)
(21)

À ma grand-mère,

Erna

(22)
(23)

xxiii

Remerciements

Bien que signée par un seul auteur, cette thèse est le fruit d’un travail collectif ayant impliqué, en plus des personnes qui ont participé à la réalisation des recherches, toutes les personnes qui ont, de près ou de loin, influencé mon développement scientifique et participé à mon éducation. C’est donc naturellement que je les en remercie chaleureusement. La plupart ne liront probablement pas cette thèse, mais les remercier pour leur contribution à la construction de ma personne est quelque chose d’important à mes yeux.

Je tiens à remercier en premier lieu mon directeur de recherche, Christian Landry, qui m’a donné l’opportunité de réaliser ces recherches. Plus qu’un directeur, tu as été un exemple pour moi. Nous nous intéressons aux mêmes questions, et pas seulement scientifiques. J’ai énormément appris de toi, de ta façon de penser, d’interpréter les données, de m’organiser et de planifier une expérience, de l’importance de l’implication à l’organisation d’évènements. J’ai eu la chance de participer aux premiers pas de ton laboratoire, et cette expérience me sera grandement utile le jour où, si j’en ai la chance, j’ouvrirai le mien. J’ai tellement appris pendant quatre ans que je ne saurais tout énumérer. Ta direction laissera une empreinte dans mon développement scientifique, « l’école Landry », et extrascientifique. J’estime avoir eu une chance énorme de réaliser mon doctorat sous ta direction. Plus qu’un directeur, un ami.

Je tiens ensuite à remercier les membres du jury, Yves Bourbonnais, Adnane Sellam, Ben Lehner et bien sûr Christian Landry, qui vont avoir à évaluer les quelques 300 pages de cette thèse. Merci à l’avance pour vos commentaires qui en amélioreront indiscutablement la qualité. Et surtout, merci pour le temps et les quelques tasses de café que vous allez y consacrer.

Merci également aux membres de mon comité de suivi, Jacques Côté et Jacques Corbeil, qui ont également investit de leur temps pour me rencontrer à deux reprises et discuter de l’avancement de mes travaux.

(24)

xxiv

Merci à tous les membres du Labo Landry, présents et passés, pour les discussion stimulantes et les commentaires et suggestions sur mes résultats. Merci également pour la bonne humeur et l’ambiance extraordinaire qui ont accompagné chaque journée. Merci pour tous ces fous-rires, uniquement durant les « coffe break » bien sur, le reste du temps on était concentré !

Merci à tous les coauteurs qui ont énormément contribué au travail présenté dans cette thèse. Je n’aurais jamais été capable d’accomplir tout ça sans vous. Et désolé pour ceux qui ont du rédiger des articles avec moi et ont subi mon pinaillage.

Une pensée particulière pour les enseignants qui m’ont suivi, et subit !, de l’école maternelle jusqu’à mon doctorat.

Merci à tous mes amis, de France et du Québec. Ceux avec qui j’ai gardé le contact, mais aussi ceux avec qui le contact à été moins intense. Vous savez tous que je ne suis pas un grand donneur de nouvelles, mais que quand nos chemins se recroiseront, rien n’aura changé.

Merci enfin aux membres de famille, qui m’ont soutenus à tous points de vu. L’éloignement aura été la chose la plus dure à surmonter au cours de ce doctorat, vous m’avez beaucoup manqué. J’ai raté beaucoup d’évènements, heureux et malheureux, auxquels j’aurai voulu assister, mais je savais en venant ici que j’aurai à faire ce genre de sacrifices. Nous avons une famille très soudée, un modèle. Si j’en suis arrivé là où j’en suis, c’est en grande partie grâce à vous, tous les membres de ma famille.

Merci à mes grands-parents, Joseph, Clémence et Erna. Je vous dois une grande partie de mon éducation. Ma réussite, c’est la vôtre, c’est celle que vous avez bâtit en inculquant à tous les membres de notre famille la détermination, la ténacité, l’ambition et la solidarité. Vous pouvez être fière de la famille que vous avez créé – tous vos petits-enfants sont sur le chemin de la réussite. Vous avez été des figures importantes pour moi, pour mon développement. Des modèles. J’ai une pensée particulière pour ma grand-mère maternelle, Erna, à qui j’ai dédié cette thèse. Je n’oublierai jamais ces balades en voitures à regarder les illuminations de Noël, ses îles flottantes, ses

(25)

xxv beignets aux pommes, les soirées passées dans son lit à écouter ses histoires sur la guerre. Je sais qu’elle aurait été tellement fière de son petit-fils. Je sais qu’elle l’était déjà.

Merci à François, mon beau père, qui est apparu relativement tard dans ma vie mais qui aura néanmoins réussit à être un de ceux qui aura eu le plus d’influence sur ma transition de l’adolescence à l’âge adulte, et en qui en aura encore, à n’en pas douter, pour le reste de ma vie.

Merci à mon frère, Romain, qui est une des personnes à qui je tiens le plus. J’estime avoir beaucoup de chance d’avoir une telle complicité avec mon frère, des centres d’intérêts très proches qui font que l’on puisse passer des heures entières à discuter, de sciences, de société, de politique, d’amour. Malgré le fait que tu sois plus jeune que moi, tu m’as donné quelques leçons de vie. J’admire ta maturité, ta bonne humeur constante et ta droiture. Tu es quelqu’un de bien, avec un grand cœur, quelqu’un d’intelligent, à qui s’offre un bel avenir, et je suis fier de l’homme que tu es en train de devenir.

Bien évidemment, mes parents sont ceux qui ont contribués sur le plus long terme à ma réussite. Toute ma pensée scientifique, je la dois aux heures passées dans la cuisine à multiplier des noix et des oranges avec mon père, dans ma chambre à jouer à « Compter » et « Lire » avec ma mère. J’ai énormément de chances d’avoir des parents qui m’ont toujours soutenus, dans toutes les situations, et ne m’ont jamais imposé quoi que ce soit. Quand on vante notre réussite à Romain et à moi, c’est en réalité de votre réussite en tant que parent qu’on parle. Vous êtes des parents extraordinaires.

Enfin, la dernière que je remercie est la plus importante, ma femme Eriola. Depuis que je t’ai rencontré j’ai complètement changé (passé les premiers mois d’euphories !). Plus sérieux, plus appliqué, plus productif, j’ai grandi grâce à toi, grâce à tous tes sacrifices et grâce à l’amour que tu me donnes. Tu fais de moi un être meilleur. Le soutient dont tu as fait preuve pendant ces derniers mois, morale mais aussi technique !, a été inestimable dans la réussite de mon doctorat. Sans toi je l’aurai sans doute obtenu, mais pas avec la mention d’excellence. Mis à part ta contribution à cette réussite,

(26)

xxvi

depuis que je te connais j’ai eu la chance de découvrir énormément de choses, de voyager, d’aller au théâtre, au musée. Tu m’as fait sortir de l’ennui, apprécier les choses de la vie. On a les mêmes centres d’intérêts, on aime les mêmes choses. On est complices ! Je ne te remercierai jamais assez pour tout ça. Je t’aime du plus profond de mon cœur.

(27)

xxvii

Avant-propos

Une des questions biologiques les plus anciennes, qui a agitée les esprits de générations de scientifiques depuis le XVIIIème siècle, et qui n’est toujours pas complètement résolue, est la suivante : Sur quelles bases repose le phénotype d’un organisme vivant, c'est-à-dire l’ensemble de ses caractères, qu’ils soient morphologiques, développementaux, comportementaux, ou autres ? On sait bien sûr aujourd’hui que ce sont les gènes qui portent l’information génétique, dont l’expression est en grande mesure responsable de l’établissement du phénotype (on ne parlera pas ici, par souci de simplicité, de l’information épigénétique ni de l’information qui peut-être encodée dans des régions dites intergéniques). Cependant, après près d’un siècle d’études des mécanismes moléculaires qui décryptent l’information génétique, la structure et la traduise en phénotype, notre compréhension des bases structurales et organiques du phénotype reste toujours très limitée.

Le lien entre variations génotypiques et modifications du phénotype, que l’on appelle « carte génotype-phénotype », est pourtant central à un grand nombre de disciplines de la biologie, des sciences de la santé, où le phénotype malade d’un patient atteint de cancer ou de maladies génétiques est la conséquence de mutations au niveau du génotype, à la biologie synthétique, où la création d’un organisme exprimant un phénotype d’intérêt socio-économique se fait par le design d’un génotype approprié. C’est plutôt dans un cadre de biologie évolutive que la carte génotype-phénotype sera interprétée au cours de cette thèse. La sélection naturelle agit au niveau du phénotype mais les variations apparaissent et sont transmises au niveau du génotype. Comprendre les forces évolutives qui ont façonnées le monde vivant nécessite donc de comprendre par quels mécanismes moléculaires ces deux niveaux indissociables sont reliés, comment l’information génétique est exprimée et forme le phénotype. Qui plus est, les génomes évoluent principalement de façon neutre et accumulent de la variation génétique qui n’atteint pas le phénotype. Cette variation génotypique dite « cryptique » peut notamment

(28)

xxviii

être révélée lorsque les conditions environnementales changent et permettre ainsi à une population de s’adapter plus rapidement. Il y a donc entre le génotype et le phénotype des mécanismes de robustesse qui, en filtrant la variation génotypique et en maintenant le phénotype, augmentent le potentiel évolutif, c’est-à-dire l’évolvabilité, des organismes vivants. Il va de soi que la compréhension de ces mécanismes est d’un intérêt fondamental en biologie évolutive.

Comme nous le verrons au cours des trois courts chapitres d’introduction de cette thèse, ce sont les réseaux d’interactions entre les molécules au sein des cellules qui sont responsables de l’expression du phénotype et qui sont structurés selon l’information contenu dans le génotype. C’est donc en affectant l’architecture de ces réseaux que des mutations au niveau du génotype vont modifier le phénotype. C’est aussi par la réorganisation de ces réseaux que la robustesse filtre les variations génotypiques. L’objectif de cette thèse découle de ce cadre théorique et consiste en l’étude des mécanismes par lesquels des variations génotypiques modifient l’architecture d’un des principaux réseaux moléculaires, le réseau d’interactions protéines-protéines, et plus particulièrement des mécanismes de robustesse qui permettent à ce réseau de filtrer la variation génotypique afin de préserver l’état du phénotype. L’essentiel du volet expérimental de cette thèse à été réalisé chez la levure Saccharomyces cerevisiae, qui constitue l’organisme modèle par excellence en biologie des systèmes.

Cette thèse s’articule autour de sept chapitres. Le premier, l’introduction, consiste en une remise en contexte de l’étude de la carte génotype-phénotype et permettra de comprendre les bases historiques ayant menées au paradigme actuel. Ce chapitre a été rédigé spécifiquement pour cette thèse par son auteur et a été gardé court puisque les deux chapitres suivant introduisent plus spécifiquement la problématique.

Le deuxième chapitre est composé d’une revue bibliographique publiée dans la revue Current Opinion in Biotechnology. Ce chapitre consiste en quelques sortes en une extension de l’introduction décrivant comment le

(29)

xxix réseau d’interactions protéines-protéines permet de faire le lien entre génotype et phénotype et proposant de futurs axes de recherche afin d’approfondir la question. Chaque auteur de cet article a rédigé une partie et a édité les parties rédigées par les autres auteurs. Pour ma part, j’ai rédigé l’introduction et la partie sur la perturbation des réseaux d’interactions protéines-protéines et ai participé activement à la réflexion sur le concept d’intégration des différents niveaux de la carte génotype-phénotype discuté en conclusion. J’ai également intégré toutes les parties des autres auteurs et corrigé le manuscrit avec Luca Freschi et Christian Landry, mon directeur, en fonction des commentaires du comité de révision.

La troisième chapitre est composé d’une revue bibliographique publiée dans la revue Journal of Experimental Zoology Part B: Molecular and

Developmental Evolution. Il constitue une suite logique aux deux premiers

chapitres en décrivant l’état des connaissances sur les mécanismes permettant aux réseaux moléculaires, et notamment le réseau d’interactions protéines-protéines, de filtrer les variations génotypiques. Ce chapitre introduit spécifiquement une des problématiques principales de cette thèse, c’est-à-dire la détermination des bases moléculaires de la compensation fonctionnelle entre paralogues, comportement contribuant à la robustesse génétique des organismes. Ma contribution à ce chapitre a consisté en la rédaction d’une première version de toutes les parties, excepté celle sur la compensation par reprogrammation transcriptionelle, et en l’édition et l’intégration de cette dernière partie dans le manuscrit. Mon directeur de thèse et moi-même avons alors retravaillé le manuscrit ensemble, avec édition et commentaires des deux autres auteurs. J’ai également réalisé les figures III.1, III.2 et III.4 avec suggestions et édition de mon directeur de thèse. J’ai aussi corrigé les points soulevés par le comité de révision, toujours avec les suggestions de mon directeur.

Le quatrième chapitre est composé d’un manuscrit en cours de préparation et prêt à être soumis à la revue Methods in Enzymology. Ce chapitre détaille le protocole de la méthode développée au cours de ce doctorat et présentée au chapitre suivant. Ma contribution à ce chapitre a consisté en la

(30)

xxx

rédaction de tout le manuscrit avec édition de mon directeur Christian Landry et en la réalisation de la figure IV.1 (qui est en fait une adaptation de la figure VII.S1 réalisée par Francisco Torres-Quiroz et utilisée avec sa permission).

Le cinquième chapitre est composé d’un manuscrit publié dans la revue

Cell Reports. Ce chapitre présente une preuve de concept de la méthode

développée au cours de ce doctorat, démontre la puissance de l’approche pour étudier comment des variations génotypiques, en l’occurrence des délétions de gènes, affectent l’architecture des réseaux d’interactions protéines-protéines, et procure des premiers éléments de réponse à la question des bases moléculaires de la compensation fonctionnelle entre paralogues. Ma contribution à ce chapitre a consisté au design expérimental avec l’aide et les conseils de mon directeur, au développement et à l’optimisation de la méthode, à la réalisation de toutes les expériences, excepté les deux criblages pour le Pore Nucléaire et les Western Blot pour le Rétromère, réalisés par Alexandre Dubé, et à l’analyse et l’interprétation de toutes les données avec l’aide de mon directeur de thèse. Finalement, j’ai rédigé la première version du manuscrit et ai préparé l’ensemble des figures puis ai retravaillé le tout avec l’aide de mon directeur. Les autres auteurs ont apporté leurs commentaires et ont édité le manuscrit.

Le sixième chapitre est composé d’un manuscrit en cours de préparation écrit au format Letters de la revue Nature (format court). Ce chapitre consiste en l’étude des mécanismes moléculaires de la compensation fonctionnelle entre paralogues et en la généralisation des principes entrevus au chapitre précédent. L’analyse des données et la rédaction de ce manuscrit ont été réalisées dans les deux mois précédent le dépôt initial de cette thèse, et ce chapitre constitue donc une présentation de nos résultats préliminaires. En l’état actuel, ce manuscrit reste quand bien même complet, forme un ensemble cohérent et pourrait peut-être même être soumis en l’état à une revue scientifique. Mon directeur de thèse et moi-même avons donc considéré qu’il pouvait constituer un chapitre de thèse à part entière. Cependant, des analyses plus poussées ainsi que d’autres expériences de confirmation et d’approfondissement seront effectuées et ajoutées au manuscrit entre le dépôt

(31)

xxxi initial de cette thèse et la soumission de ce manuscrit à une revue scientifique afin d’en améliorer sa qualité et sa portée. Ma contribution à ce manuscrit a consisté au design expérimental avec l’aide de mon directeur, à toute la partie expérimentale, avec l’aide de Diana Ascencio pour la construction et la confirmation de certaines souches et la préparation de milieux de culture. J’ai également rédigé toute la partie d’analyse et d’interprétation des résultats avec conseils et suggestions de mon directeur. J’ai rédigé la première version du manuscrit puis l‘ai retravaillé avec l’aide de mon directeur et les commentaires et suggestions de Diana Ascencio, Samuel Rochette, Marie Filteau et Alexande Dubé, que je remercie chaleureusement. J’ai également préparé les figures.

Le septième chapitre est composé d’un manuscrit soumis à la revue

Proceedings of the National Academy of Sciences of the United States of America et en cours de révision par le comité de lecture au moment du dépôt

initial de cette thèse. Ce chapitre consiste en l’identification à l’échelle du génome des mécanismes de régulation d’une enzyme centrale au maintien de l’homéostasie cellulaire, la Protéine Kinase A, à l’aide de la méthode développée au chapitres IV et V. Ce chapitre contribue à comprendre les mécanismes moléculaires de coordination des processus biologiques et donc, bien que non explicité dans le chapitre, comment l’organisation fonctionnelle de la cellule permet l’émergence d’une robustesse distribuée, propriété définit au Chapitre III. Ma contribution à ce chapitre a consisté en la réalisation d’une partie des expériences d’approfondissement, en l’interprétation des résultats du criblage et des expériences d’approfondissement avec les autres auteurs, en l’analyse bioinformatique et statistique de certains résultats et en la rédaction du manuscrit en collaboration avec Marie Filteau et mon directeur Christian Landry après une première version rédigée par Marie Filteau.

Finalement, j’ai rédigé la conclusion spécifiquement pour cette thèse. Cette conclusion revient sur les principaux résultats, les intègre dans les contextes généraux de la robustesse et de l’évolution et ouvre des perspectives sur des niveaux d’intégration plus élevés.

(32)
(33)

1

Chapitre I) Introduction

Guillaume Diss

Institut de Biologie Intégrative et des Systèmes, Département de Biologie, PROTEO, Pavillon Charles-Eugène-Marchand, 1030 avenue de la Médecine - Université Laval - Québec (QC) G1V 0A6, Canada

(34)

2

I.1) Le phénotype des espèces n’est pas figé dans le temps

L’observation de la nature et des caractères qui différencient les espèces remonte à la nuit des temps, bien avant Aristote, qui fut cependant le premier à classifier de façon informelle les espèces selon leurs caractères (Aristote, ~ 343 av. J.C.). On a pendant très longtemps pensé que le phénotype des espèces était figé depuis une légendaire « Création » et il fallut attendre la redécouverte de textes datant de la Grèce pré-Socratique et la remise en cause du dogme de l’Église pour que l’on commence à se rendre compte que les caractères qui définissent les espèces peuvent varier d’une génération à l’autre. Les pionniers de cette révolution scientifique que furent Maupertuis, Buffon ou Darwin (Erasmus, le grand-père de Charles), proposèrent même que, de génération en génération, l’accumulation de modifications du phénotype de façon naturelle pouvait créer de nouvelles espèces (Bowler, 1989). Lamarck fut le premier à proposer une théorie expliquant les mécanismes de cette évolution (de Lamarck, 1809), mais son concept d’acquisition des caractères sous l’effet de forces environnementales s’avéra erroné. Il fallut attendre Darwin et sa fameuse théorie de l’évolution par sélection naturelle (Darwin, 1859) pour que la communauté scientifique d’abord, puis le grand public ensuite, acceptent que le phénotype des espèces ne soit pas figé mais évolue par sélection, génération après génération, de légères variations apparaissant de façon aléatoire.

I.2) Découverte des bases organiques de la variation du phénotype

La question des mécanismes organiques menant aux variations phénotypiques se posa alors naturellement. Darwin lui-même se posait déjà cette question et pensait que des structures hypothétiques qu’il appelait « gemmules » et localisées au sein des cellules étaient responsables de ces variations et de leur hérédité (Darwin, 1868). À peine six ans après la première publication de De l’origine des espèces, Mendel, en observant les patrons de ségrégation des caractères de plants de petits pois, proposait que des éléments discrets, qu’il appelait alors « facteurs invisibles », étaient

(35)

3 responsables de l’expression des caractères et de leur hérédité (Bateson, 1901; Mendel, 1866). Même s’il ne connaissait pas encore la structure portant cette information, Mendel fut le premier à faire la distinction entre ce que l’on appelle génotype et phénotype, et étudiait de fait la première carte génotype-phénotype. Une vingtaine d’années après sa mort, Sutton (Sutton, 1903) et Boveri (Boveri, 1904) démontrèrent indépendamment que ce sont les chromosomes qui constituent les bases physiques des lois de l’hérédité de Mendel. Morgan proposa dès 1911 que les traits étaient déterminés par des gènes placés sur les chromosomes (Morgan, 1911), et un de ses étudiants, Sturtevant, fut capable de les placer de façon linéaire à des positions spécifiques, appelées loci, sur les chromosomes (Sturtevant, 1913), établissant ainsi le premier lien direct entre un caractère et la structure physique qui porte l’information pour son expression.

I.3) Premières descriptions moléculaires de la carte génotype-phénotype

Cependant, plusieurs questions se posaient encore. Comment l’information qui sert à l’expression du phénotype est encodée dans les gènes ? Comment cette information est-elle transmise du génotype jusqu’au phénotype ? Par quels mécanismes les modifications de cette information mènent-elles à des variations du phénotype ?

Plusieurs décennies après les premières cartes chromosomiques de Morgan, Beadle, un de ses anciens étudiants, et Tatum découvrirent que la mutation d’un gène pouvait mener à la perte d’une fonction métabolique (Beadle and Tatum, 1941). Ils proposèrent la théorie « un gène, une enzyme » selon laquelle un gène donné code pour une protéine donnée exerçant une fonction métabolique donnée et menant donc à l’expression d’un caractère donné. Beadle et Tatum proposaient ainsi la première description mécanistique de la carte génotype-phénotype. Cependant, à cet époque, le débat sur laquelle des deux substances contenues dans les chromosomes, les protéines et l’acide nucléique, encodait l’information nécessaire à l’expression du

(36)

4

phénotype battait son plein. Alors que les protéines eurent dans un premier temps les faveurs de la communauté scientifique du fait de leur plus grande complexité, Avery, MacLeod et McCarty démontrèrent que c’est bien l’acide désoxyribonucléique, ou ADN, qui est responsable de la transmission des caractères entre individus (Avery et al., 1944). La détermination de la structure de l’ADN par Watson, Crick et Franklin permit alors de comprendre les bases structurales de l’encodage de l’information génétique (Watson and Crick, 1953). Avec le dogme central de la biologie moléculaire proposé peu de temps après par Crick, les différentes étapes du transfert de l’information génétique de l’ADN aux protéines en passant par l’ARN messager vinrent détailler les mécanismes moléculaires du transfert de l’information du génotype au phénotype (Crick, 1970; Crick, 1958). L’élucidation du code génétique permit alors de comprendre comment l’information génétique est structurée au niveau des gènes et comment elle est traduite en protéines.

I.4) L’approche réductionniste

Le dogme central et l’hypothèse « un gène, une enzyme » offraient une description mécanistique satisfaisante de la carte génotype-phénotype, en expliquant graduellement comment un caractère est exprimé à partir d’un gène et comment une variation de la séquence de ce gène peut mener à une variation du caractère qui lui est associé. Le courant de pensées qui prévalait alors en biologie était le réductionnisme; l’on croyait qu’il existait un gène pour chaque caractère, du plus simple au plus complexe, et qu’un organisme et son phénotype n’étaient rien de plus que la somme de ces paires gène/caractère. Comprendre comment le phénotype d’un organisme est exprimé à partir du génotype, comment il varie avec lui, et donc comprendre le fonctionnement d’un organisme, cette « machine organique », comme l’on comprend le fonctionnement d’une machine industrielle, reviendrait donc à déterminer la fonction spécifique et le caractère associé à chacun des gènes qui le constituent (comme la définition du terme fonction est encore très débattue, le terme « fonction spécifique » est employé ici pour déterminer l’ensemble des

(37)

5 fonctions d’un gène qu’il peut accomplir seul, c'est-à-dire sans l’intervention d’un autre gène). À l’ère du séquençage des génomes, la liste des gènes d’un grand nombre d’organismes est connue et, pour certains organismes modèles tels que la levure Saccharomyces cerevisiae, la fonction spécifique d’une majorité de ces gènes est également connue. Cependant, plus on se rapproche de la complétion de cet objectif, plus on se rend compte que l’on est encore bien loin de comprendre le fonctionnement d’un organisme de façon détaillée. Bien que ce modèle réductionniste de la carte génotype-phénotype soit capable d’expliquer les mécanismes moléculaires de l’expression de caractères simples et de leur variation, tels que la couleur blanche des fleurs de Mendel ou l’anémie falciforme, il échoue en ce qui concerne des caractères plus complexes mais néanmoins héréditaires, donc basés sur le génotype, tels que la morphologie ou les maladies génétiques complexes. Une des principales raisons de cet échec vient du fait que les caractères complexes ne sont pas exprimés à partir d’un seul gène, mais résulte de l’expression combiné et de l’interaction entre plusieurs gènes. Waddington, en grand précurseur qu’il était, avait déjà compris il y a plus de 60 ans qu’un organisme était plus que la somme des fonctions spécifiques à chacun de ses gènes et que son phénotype résultait d’interactions complexes entre ses gènes et des propriétés qui en émergeaient (Waddington, 1952).

I.5) L’approche systémique

Devant l’échec apparent de l’approche réductionniste, la communauté scientifique a commencé à adopter depuis une quinzaine d’années une approche plus systémique. Cette approche considère qu’il faut considérer les interactions entre tous les éléments d’un système biologique pour comprendre les propriétés qui en émergent et donc comprendre son fonctionnement de manière à la fois globale et détaillée. Une cellule est composée de milliers de molécules différentes. Ces molécules ne sont pas isolées, mais interagissent les unes avec les autres, interactions qui modifient leur structure et donc leur fonction. Les protéines, qui sont les principales molécules effectrices de la

(38)

6

cellule et le principal vecteur de l’information génétique entre le génotype et le phénotype, en sont l’exemple parfait. Les protéines interagissent ensemble et forment des complexes macromoléculaires capables d’accomplir des fonctions qu’aucune de leurs sous-unités constituantes ne sont capables d’accomplir individuellement. Depuis une quinzaine d’années maintenant, la biologie des systèmes, fruit de cette approche intégrative, s’attache à cartographier comment les gènes, les protéines qui en sont produites et les autres molécules interagissent ensemble pour former un tout cohérent, une cellule vivante (Tucker et al., 2001) (Vidal et al., 2011). Les réseaux d’interactions moléculaires qui en sont issus nous dévoilent l’organisation fonctionnelle de la cellule et forment un squelette permettant d’intégrer les données biochimiques et fonctionnelles produites par un demi-siècle d’approche réductionniste.

I.6) Réseaux moléculaires, carte génotype-phénotype et cadre théorique de la thèse

La biologie des systèmes n’a pas encore réussi à donner une description détaillée de la carte génotype-phénotype, mais grâce à ce nouveau type de données qu’elle produit, un nouveau paradigme est en train de s’installer. Selon ce paradigme, et comme nous le verrons au prochain chapitre, les différents types de réseaux moléculaires - réseaux de régulation de l’expression des gènes, réseaux d’interactions protéines-protéines et autres réseaux métaboliques - forment autant de couches intermédiaires entre le génotype et le phénotype (Diss et al., 2013c; Tucker et al., 2001; Vidal et al., 2011). Ces différentes couches structurent l’information génétique, de façon hiérarchique, en modules, voie et processus biologiques (Ravasz et al., 2002; Robinson et al., 2007; Ryan et al., 2012a). Ces processus biologiques sont interconnectés par les interactions entre les molécules qui les constituent au sein d’un réseau hautement complexe et dynamique qui leur permet de coordonner leur activité, et l’état de cet équilibre définit le phénotype. C’est donc en perturbant les interactions entre protéines, et donc l’architecture du réseau et l’équilibre des processus biologiques qui en dépend, que les

(39)

7 variations génotypiques mènent à des variations phénotypiques (Tucker et al., 2001; Vidal et al., 2011). Ce postulat constitue le cadre théorique de cette thèse.

Le principal objectif de cette thèse a été d’étudier comment les variations génotypiques affectent le phénotype aux travers du réseau d’interactions protéines-protéines et, notamment, par quels mécanismes moléculaires la robustesse génétique permet de filtrer les variations génotypiques pour maintenir le phénotype. Les deux prochains chapitres, extensions de cette introduction, approfondissent respectivement i) comment le réseau d’interactions protéines-protéines forme l’interface entre le génotype et le phénotype et ii) l’état des connaissances sur les bases moléculaires de la robustesse génétique.

(40)
(41)

9

Chapitre II) Integrative avenues for exploring the

dynamics and evolution of protein interaction

networks

Guillaume Diss*, Marie Filteau*, Luca Freschi*, Jean-Baptiste Leducq*, Samuel Rochette*, Francisco Torres-Quiroz*, Christian R Landry

*Contributed equally to this work

Institut de Biologie Intégrative et des Systèmes, Département de Biologie, PROTEO, Pavillon Charles-Eugène-Marchand, 1030 avenue de la Médecine - Université Laval - Québec (QC) G1V 0A6, Canada

Current Opinion in Biotechonology 2013 - 24(4):775-83

(42)

10

II.1) Résumé

Au cours de la dernière décennie, l’étude des réseaux d’interactions protéines-protéines (PINs) à mis à jour les principes d’organisation des cellules vivantes. Cependant, les PINs ont principalement été cartographiés dans une condition unique. Nous esquissons trois des axes de recherche les plus prometteurs dans cette discipline, c'est-à-dire l’étude de, premièrement, comment les PINs sont recâblés par mutations et perturbations environnementales; deuxièmement, comment les interactions inter-espèces affectent l’architecture des PINs; et troisièmement, quels forces et mécanismes sont responsables de l’évolution des PINs. Ces études promettent de révéler la dynamique et l’aspect conditions-dépendant des PINs et mèneront donc à une meilleure annotation de l’architecture du réseau. Un des défis majeurs à relever pour atteindre ce but est l’intégration des PINs avec d’autres réseaux de régulation cellulaire dans le contexte de phénotypes cellulaires complexes.

(43)

11

II.2) Abstract

Over the past decade, the study of protein interaction networks (PINs) has shed light on the organizing principles of living cells. However, PINs have been mostly mapped in one single condition. We outline three of the most promising avenues of investigation in this field, namely the study of first, how PINs are rewired by mutations and environmental perturbations; secondly, how inter-species interactions affect PIN achitectures; thirdly, what mechanisms and forces drive PIN evolution. These investigations will unravel the dynamics and condition dependence of PINs and will thus lead to a better functional annotation of network architecture. One major challenge to reach these goals is the integration of PINs with other cellular regulatory networks in the context of complex cellular phenotypes.

(44)

12

II.3) Introduction

Proteins associate with each other to perform most functions encoded in the genome and to relay information between the environment, the genome and the cell (Scott and Pawson, 2009). Protein interaction networks (PINs) therefore play a key role in connecting genotypes to phenotypes (Strohman, 2002). For this reason, many human diseases result from, or lead to the dysfunction of protein–protein interactions (PPIs) (

Serra-Musach

et al.,

2012;

Sóler-Lopez

et al.,

2011; Wang

et al.,

2012

) (Figure II.1a). The last decade has witnessed substantial progress in the implementation of large-scale approaches to study eukaryotic PINs in several organisms, including fruit flies (Giot et al., 2003), nematodes (Li et al., 2004), yeasts (Gavin et al., 2006; Krogan et al., 2006; Tarassov et al., 2008; Yu et al., 2008), the model plant

Arabidopsis (

Consortium

,

2011

) and humans (Havugimana et al., 2012; Rual et al., 2005; Stelzl et al., 2005). These maps describe how cellular processes are connected with one another and are thus of fundamental and applied interests (e.g. study of the evolution of cellular functions and development of disease treatments). For instance, it is now clear that targeting PPIs rather than inhibiting all functions of a protein has a great potential for disease diagnosis (Taylor et al., 2009), drug discovery (Mullard, 2012) and treatment. This approach increases the target space and allows a more precise control of the disease causes by targeting specific functions, hence potentially decreasing side effects (

Brehme

et al.,

2009; Christ

et al.,

2010;

Filippakopoulos et al., 2010; Mullard, 2012).

The majority of diseases and phenotypic traits are complex and involve dynamic PPIs, while most of the current interactome maps are static representations of the cellular architecture. Therefore, there is a requirement for improved models of PINs, which means that we need to annotate connections (edges) of the network in terms of the genetic, environmental or developmental context in which they take place. This implies that PINs should be mapped in several dimensions, that is, in different conditions, cell types, developmental stages and sets of genetic backgrounds as well as at different time scales, both short and evolutionary (Figure II.1b). Here we discuss

(45)

13 current and forthcoming empirical avenues this research is leading to and how these investigations will enable a better understanding of biological functions that emerge from the regulated association of proteins in the cell and the evolution of these networks.

II.4) Perturbing PINs: mapping in 3D

Several studies have shown how standard tools for analysing PPIs can be used to study PINs along diverse gradients of regulation and perturbations, either at the level of binary interactions or at the level of protein complex assembly. One of the first systematic studies of this type was that of Matsumoto et al. (Matsumoto et al., 2003), which investigated the capacity of nitric oxide (NO), an important ubiquitous signalling molecule, to regulate interactions between proteins. This was done using a yeast two-hybrid (Y2H) screen where procaspase-3 interactions were tested against thousands of different proteins. The authors found that the inducible NO synthase interacts with procaspase-3 and the apoptosis-related enzyme acid sphingomyelinase, and that these PPIs were NO-dependent, suggesting a mechanism by which PPIs could be regulated by this signaling molecule. The Y2H approach has also been applied to genetic perturbation of PINs in order to examine how mutations affect network connections. When a gene is mutated, amino acid changes can modify PPIs with only some or many of a protein's partners (‘edgetic perturbation’) (Dreze et al., 2009), thereby changing PIN architecture. Zhong et al. (

Zhong

et al.,

2009

) investigated mutations associated with human diseases and identified interaction profiles of mutant proteins. They showed that distinct mutations in one gene could generate different phenotypes according to the PPIs that were perturbed. In the case of the transcription factor TP63, a key developmental regulator, they showed that mutations could cause two clinically distinct developmental disorders (

Zhong

et al.,

2009

). These results illustrate the fact that discrete mutations on the same protein can have distinct effects on PINs, which opens the possibility for developing edge-specific disease treatments.

(46)

14

Other approaches that aimed at understanding how PPIs respond to perturbations using binary interactions are on the basis of protein-fragment complementation assays (PCAs). In one of the first investigations of this type, MacDonald et al. (

MacDonald

et al.,

2006

) measured 49 PPIs across the human PIN using a fluorescent PCA to show that related drugs have similar profiles of effects on PPIs, suggesting that with sufficient data, drug effects on PINs could be predicted from the properties of the compounds. PCAs on the basis of survival assays in model systems such as yeast (Tarassov et al., 2008) also provide a quantifiable PPI signal (Freschi et al., 2013), which allows to estimate and compare the impact of PIN perturbations on a larger scale. Recently, Schlecht et al. (

Schlecht

et al.,

2012

) developed a multiplex survival assay to show how PPIs are modulated by chemicals and screened 238 PPIs in the presence of 80 compounds. The results led to the identification of a chemotherapeutic drug that can disrupt a PPI between Dst1, a transcription elongation factor for RNA Pol II, and Rpb9, a subunit of RNA Pol II required for transcription start site selection (

Schlecht

et al.,

2012

).

Other approaches used mass-spectrometry to quantify specific PPIs in different genetic backgrounds (

Lee

et al.,

2011

) or through time. Bisson et al. (

Bisson

et al.,

2011

) provided a clear example of these approaches in a study of the interactome of the adaptor protein GRB2 in a temporal and receptor-specific fashion. The authors identified proteins constitutively associated with GRB2 and proteins whose interactions increased or decreased upon stimulation. Their work illustrates how the interaction dynamics of a key protein helps explaining its pleiotropic effects in cell regulation (

Bisson

et al.,

2011

). These new techniques allow a deeper and more quantitative analysis of the perturbation dynamics of specific pathways, but they may miss how these perturbations affect the rest of the PIN as only a specific list of proteins can be followed through time. Therefore, the different approaches (specific and global) described above are complementary. The former is suitable for detailed studies while the latter provides the backbone to integrate the results. Ideally, one would want to combine both approaches in order to be able to study how perturbations in one pathway percolate through PINs and affect their

(47)

15 architecture and ultimately cell physiology. This would allow to identify global effects and indirect connections that may have been missed before by studies focusing on canonical members of these pathways (Levy et al., 2010).

Altogether, these recent studies show how powerful the perturbation of PINs is for understanding the regulation of PPIs and dynamic cellular functions. The next challenge is to expand these approaches to the level of entire PINs. Large-scale perturbation of PINs could include for instance the measurement of all PPIs in a cell in the presence or absence of other proteins, which has only been done on a small scale so far (

Lee

et al.,

2011; Manderson

et al.,

2008

). This would enable the identification of PPI regulators, such as protein kinases and phosphatases (

Friedman

et al.,

2011

) and proteins acting as hubs in protein complexes (

Lee

et al.,

2011

) in a systematic manner. Because the size of this genetic perturbation space is immense (Figure II.1c), further technological developments are required to explore these new PIN dimensions along with new computational approaches that will help prioritize relevant parts of this multidimensional space.

II.5) Interaction of interactomes among species

Another avenue by which we can learn how PINs respond to perturbations and how we can manipulate them is by studying how ecological interactions and evolution shape PINs in the short and long terms (Figure

II.2). This opportunity occurs for instance when two organisms come into

contact at the molecular level and have their PINs interacting. Good examples are host–pathogen interactions, such as those between viruses or bacteria and their host cells (

Jäger

et al.,

2012;

Mukhtar et al., 2011; Rozenblatt-Rosen et al., 2012). The long-term co-evolution of pathogens and hosts is expected to favour pathogens that successfully manipulate their host by targeting key proteins in the host PIN. Accordingly, these PPIs become potential targets for the development of therapeutic solutions to treat infectious diseases, and dissecting this evolutionary tug of war can also indirectly reveal how a PIN can be manipulated for specific purposes.

(48)

16

Recent studies have indeed led to the identification of nodes with biological functions that are specifically targeted by parasites, such as those that occupy putative strategic regulatory positions in the host PIN (Calderwood et al., 2007;

Jäger

et al.,

2012;

Mukhtar et al., 2011; Pichlmair et al., 2012). For instance, Mukhtar et al. (Mukhtar et al., 2011) analysed pairwise PPIs between effector proteins of two unrelated plant pathogenic bacteria and Arabidopsis proteins using a Y2H approach. They showed that effectors converge onto highly connected proteins more often than expected by chance alone. Similar results have been found with Epstein-Barr virus proteins (Calderwood et al., 2007) and for a large ensemble of viral proteins from different virus families with a similar approach (Pichlmair et al., 2012). In a recent study, a PPI screen between HIV proteins and the human proteome showed that EIF3D, a member of the eukaryotic translation initiation complex, interacts with the HIV protease protein (

Jäger

et al.,

2012

). A remaining challenge in this field is to study these inter-species PPIs in their biological context. This is particularly important in cases where pathogen effector proteins are modified in the cellular context of their hosts (Selbach et al., 2009). Another promising avenue will be to understand the role of inter-species interactomes in non-pathogenic situations to test whether similar node-targeting strategies are used by viruses and bacteria, in mutualistic or endosymbiotic interactions.

Other cases of extreme PIN perturbations by inter-species interactions are found in inter-specific hybrids in which PINs of different species are completely mixed (Figure II.2). Natural selection favours the maintenance of PPIs over time, promoting the co-evolution of interacting proteins and preventing unwanted interactions (Lovell and Robertson, 2010). This co-evolution could lead to a breakdown of PPIs or to the formation of spurious interactions in cells where two proteomes co-exist. Theoretical work by Livingston and collaborators suggests that mutations arising independently in parental species could result in the formation of deleterious PPIs when combined in hybrids. This effect could be compensated by a high connectivity of the protein network (Livingstone et al., 2012). Hybrid systems thus provide

(49)

17 unique opportunities for the identification of critical protein residues responsible for PPIs and for understanding how PPI perturbations affect essential cellular processes. However, few studies have identified such incompatibilities at the interactome level. Zamir et al. (Zamir et al., 2012) recently showed how amino acid divergence between species can cause the breakdown of PPIs using very distantly related yeast species. More recently, Leducq et al. (Leducq et al., 2012) directly tested whether hybridization would perturb protein complexes in hybrids between two closely related yeast species. Their work indicates that PINs may be robust to hybridization, suggesting that orthologous proteins of divergent but similarly structured PINs could be permutated without affecting PIN structure (Leducq et al., 2012). Taken together, these reports suggest that it will be soon feasible to interrogate entire inter-species interactomes and to use hybridization as a fundamental model to identify the mechanisms by which PINs could be disrupted or could withstand massive genetic perturbations.

II.6) Evolution of PINs

Another major challenge in the study of PINs is to understand what mechanisms and evolutionary forces are driving the evolution of PINs over time. PINs evolve either by changes in the edges that connect existing proteins (network rewiring) or by the addition or removal of nodes through diverse types of mutational changes (Figure II.3). One key mechanism involved in network rewiring is thought to be amino acid substitution at the interaction interface (

Freschi

et al.,

2011;

Sun et al., 2012). A striking example of rewiring is given by the two duplicated yeast deacetylases Sir2 and Hst1 that subfunctionalized by acquiring complementary inactivating mutations in distinct interaction domains (Froyd and Rusche, 2011).

Other mechanisms of rewiring have recently been identified. For instance, changes involving non-coding sequences could play a role. Gagnon-Arsenault et al. (Gagnon-Gagnon-Arsenault et al., 2013) experimentally showed that genome-wide PPI profiles of paralogous proteins can be rewired by placing the

(50)

18

coding sequence of a paralog under the control of the regulatory elements of the other, showing the potential for transcriptional divergence in PIN rewiring. Other groups experimentally and computationally showed that splicing isoforms have different PPIs (

Buljan

et al.,

2012;

Ellis et al., 2012), highlighting again the potential for transcriptional programs to modify PINs among species.

A central mechanism that leads to the addition of nodes in PINs is gene duplication (Amoutzias and Van de Peer, 2010), such as in the case of Sir2 and Hst1. However, other mechanisms have been hypothesized to play a role, including horizontal gene transfer (

Treangen

and

Rocha

,

2011

) and de novo gene birth (

Tautz

and

Domazet-Loso

,

2011

) (Figure II.3). A foremost challenge will be to determine the relative importance of each of these mechanisms and to examine whether they are dependent on the existing architecture of PINs and/or on the proteins themselves. For instance, some protein features, such as disordered regions, have been linked to accelerated rates of PPI evolution (Landry et al., 2009;

Mosca

et al.,

2012

) and could ultimately have a significant impact in shaping PPI profiles. Further, Papp et al. (Papp et al., 2003) provide evidence that the architecture of protein networks may itself affect the fate of duplicated genes. They suggest that gene duplication of a single subunit of a protein complex could be harmful because it impairs the stoichiometric balance of complexes. They provide evidence for this by showing that dosage-sensitive genes are twice as likely to be part of protein complexes than genes with low dosage-sensitivity. Further, they show that ribosomal proteins, which are known to be harmful when imbalanced, are enriched in whole-genome duplicated genes (Papp et al., 2003). This suggests that subunits of protein complexes that are dosage-sensitive can undergo duplication if all subunits are duplicated at the same time. More experimental studies and new theoretical and bioinformatics approaches are needed to estimate the relative contribution and the rate at which each one of these mechanisms shapes PINs.

The respective role of natural selection and random genetic drift on the evolution of PINs is another subject of critical importance in our understanding of the functional meaning of PPIs. A recent study suggested that the

Références

Documents relatifs

Le médecin s’appuie sur le tableau clinique de la maladie : les symptômes caractérisent le phénotype à l’échelle de l’organisme (macroscopique).. Remplissez la ligne 1

La conséquence de cette hypothèse, en termes de pro­ gramme de recherche, est que le déchiffrage du « langage génétique >> ne peut être abordé que dans

ous avons alors fait l'hypo­ thèse que le gène PLP, déjà respon­ sable d'une affection neurologique, la maladie de Pelizaeus-Merzbacher, pouvait également être

immunoprecipitates from 300 µg starting whole extracts were subjected to immunoblot analysis using antibodies directed against α-SMA, HDAC8, HDAC3, HDAC1, and β-actin.

Besides these editors for the daily routine work of importing, checking, editing and exporting data, AMAPstudio software can host simulators for plant growth models, at the

Sur les 2 .070.500 pannes pour lesquelles les agents du service d'assistance routière ADAC sont intervenus en 1997, la plupart n'ont pas eu de conséquences aussi dramatiques et,

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

This paper also presents simulations of a few phrase-level utterances copied from the simultaneous recordings of natural speech and X- ray films of the VT (Sec. The method for