• Aucun résultat trouvé

Modularité, plasticité des protéines

1.7.1 Modularité des protéines multidomaines

Si les acides aminés sont les briques du vivant, les domaines structuraux sont les briques des protéines. Une protéine est constituée d’un ou de plusieurs domaines structu- raux, ré-arrangeables. Ce concept de modularité au sein des protéines est très important pour les évolutionnistes pour qui les domaines sont des séquences qui peuvent apparaître à différents endroits et plusieurs fois dans les génomes. Ainsi un domaine peut apparaître au sein de différentes protéines et une protéine peut être multidomaines. L’origine de cette modularité s’explique au niveau des génomes par les recombinaisons, les translo- cations, inversions, duplications et autres délétions de séquences [15]. Les erreurs lors de la duplication et les répétitions internes [14]sont aussi une explication de la modularité des protéines sans oublier les transferts horizontaux (entre espèces) de gènes.

Ainsi observer ces domaines qui sont considérées comme des unités modulaires des protéines, permet une étude phylogénétique et une compréhension au niveau évolutif du vivant.

1.7.2 Plasticité des protéines

La plasticité des génomes est leur capacité à supporter des modifications telles que les duplications, les translocations et autres évènements évolutifs. Ainsi les gènes codant pour les protéines évoluent plus ou moins au cours du temps, subissant des modifica- tions ou réarrangements neutres ou altérants. Au niveau structural ces évènements sont également à l’origine de permutations circulaires, qui correspondent à une modification de l’ordre des résidus dans la séquence protéique d’une structure à l’autre, mais aussi de

l’apparition de charnières, c’est à dire d’un coude présent dans une structure et non dans une structure homologue, ou encore à la constitution de protéines composées uniquement d’un motif structural répété.

Ces trois cas sont des défis pour les outils de comparaisons de structures (discuté dans les chapitres 4 et 7).

1.7.3 Permutations Circulaires

Définition 1.4 (Permutation circulaire). Une permutation circulaire est un changement d’ordre des résidus d’une protéine à l’autre. L’extrémité N-terminale de l’une correspond à l’entrémité C-terminale de l’autre.

Le premier cas fut observé en 1979 [31] puis de nombreux autres cas sont apparus dans la littérature [72][114]. Ces modifications dans la séquence n’entraînent que peu de modifications dans la structure. Ainsi les structures sont similaires alors que linéairement les séquences divergent.

Des bases de données comme BALIBase [12] ou encore SISYPHUS [7] recensent une partie des cas de permutations circulaires.

Figure 1.35 – Représentation schématique de permutation circulaire issue de [17]

Les permutations circulaires ne sont pas automatiquement détectées par les algo- rithmes de comparaisons de structures. Cela car les protéines étaient initialement suppo- sées linéaires, les duplications, insertions et autres réarrangements n’étaient pas connus. Une autre raison est la complexité du problème dû à la suppression de la contrainte de linéarité.

1.7.4 Charnières

Les protéines sont des objets flexibles, de la vibration atomique aux larges mouve- ments de domaines en passant par les rotations de chaînes latérales. Ces mouvements ont un rôle important dans la fonction de la protéine, notamment dans le cas des enzymes avec des changements de conformations selon la présence/absence du ligand. Certaines portions de la protéine bougent autour d’un ou plusieurs points d’inflexion nommés charnières [36], [117].

Définition 1.5 (Charnières). Les charnières sont des points de rotations desquels des portions de protéines se meuvent de manière plus ou moins large.

La figure 1.36 présente deux structures identiques au niveau de la séquence comme le montre la matrice de points résultant de l’alignement des séquences avec BLASTp mais dont la structure globale est très différente à cause d’une charnière. De fait, comme le montrerons des analyses ultérieures, certains outils d’alignements ne réussissent pas à détecter la similarité entre ces deux structures.

Figure 1.36 – Superposition de4CLN,A et2BBM,A et alignement issu de BLASTp (matrice de points)

Il existe des outils dédiés à la recherche de ces charnières comme HingeProt [34] ou FATCAT [119]. Nous nous sommes intéressés à ces charnières afin d’observer les capacités de nos outils à détecter ces cas de figures.

1.7.5 Répétitions structurales internes

La proportion de répétitions au sein des protéines est estimée à 25 % [76]. Ces répé- titions, allant de quelques segments d’acides aminés à de larges domaines sont issues de duplications et de recombinaisons de portions de gènes [5]. Le nombre de ces répétitions et leur arrangement jouent un rôle important dans la fonction des protéines, ces pro- téines assurant des rôles de transport, d’assemblage de complexes protéine-protéine et de régulation. Si certaines protéines contiennent des répétitions, d’autres en sont presque exclusivement constituées, c’est notamment le cas des protéines solénoïdes. Une protéine solénoïde est une protéine comprenant des motifs structuraux répétés arrangés de ma- nière à former une super-hélice continue [60]. Plusieurs types de domaines protéiques sont regroupés sous le terme solénoïde : domaines avec répétitions riches en leucine (LRR), les répétitions armadillo, les domaines à répétitions ankyrine (ANK) ou encore les domaines à répétition HEAT. Les solénoïdes étant des répétitions du même motif structural, on s’attend à une identité de séquence assez forte ce qui est vrai pour la plupart des cas. Cela s’explique par la conservation corrélée de la structure primaire (séquence) et de la structure tertiaire des protéines, ce même si les contraintes de conservation sont plus importantes au niveau de la structure tertiaire [103].

Figure 1.37 – Exemple de protéine solénoïde :3TV0

1.8

Une famille d’enzymes : les glycosides hydrolases, fa-