• Aucun résultat trouvé

P. vivax et P. yoelii. Ces deux espèces plasmodiales sont entièrement séquencées et disposent d’un assemblage de bonne qualité. P. vivax est le deuxième plus virulent des Plasmodium infectant l’Homme (Carlton et al.,2008a). Quand à P. yoelii, ce parasite de rongeur (RMP) sert notamment de modèle lors d’expérimentations préliminaires de traitement potentiels (Carlton et al.,2005). Ces deux espèces exhibent des séquences très divergentes et possèdent un nombre de domaines connus plus faible que celui de P. falciparum (bien que chez P. vivax il n’y ait pas de biais en A+T). Elles nous offrent donc un point de comparaison important pour les résultats obtenus chez P. falciparum.

Les tableaux 4.6 et4.7 présentent les statistiques concernant, respectivement, le nombre de domaines certifiés et les annotations GO déduites chez P. vivax et P. yoelii (correspondant aux tableaux 4.3 et 4.5 chez P. falciparum). De plus, pour chaque ensemble de domaines validants, la figure 4.7 permet de comparer le nombre de domaines certifiés dans ces trois espèces en fonction du FDR associé aux certifications. Le nombre de domaines certifiés semble être légèrement plus élevé chez P. falciparum, particulièrement par rapport à P. yoelii. Cela peut s’expliquer par le fait que l’on dispose d’un plus grand nombre de domaines connus et potentiels chez P. falciparum. Cette limitation provient vraisemblablement pour P. yoelii d’erreurs d’assemblage (7 724 protéines recensées, contre à peine plus de 5 000 chez P. falciparum et P. vivax).

F DR ≤ 10% ≤ 20%

Dom. validants Pfam Interp. Pot. All Pfam Interp. Pot. All

P. vivax Dom. certifiés 279 76 65 348 343 253 101 517 Nvlles entrées 227 46 56 274 290 274 89 417 Familles inédites 77 26 22 94 106 101 32 150 P. yoelii Dom. certifiés 233 140 42 298 289 329 123 485 Nvlles entrées 195 98 32 236 249 267 106 406 Familles inédites 66 35 10 77 87 103 35 144

Table4.6 – Nouveaux domaines certifiés dans les protéines de P. vivax et P. yoe-

lii. “Dom. validants” indique l’ensemble de domaines validants utilisé pour les certifications :

“Pfam”, les domaines Pfam connus d’après InterProScan ; “Interp.”, les domaines InterPro (non-Pfam) connus d’après InterProScan ; “Pot.”, les domaines potentiels eux-mêmes ; “All” indique les résultats obtenus en cumulant les trois types de domaines validants. “Dom. certi- fiés” dénote le nombre de nouveaux domaines certifiés, “Nvlles entrées” le nombre de domaines certifiés appartenant à une entrée InterPro inédite dans la protéine, et “Familles inédites” in- dique le nombre de familles de domaines qui n’avaient jamais été observées auparavant dans aucune protéine de l’organisme concerné.

4.6. CONSISTANCE AVEC LES ORTHOLOGUES DE P. VIVAX ET P. YOELII 115

F DR Domaines Combin. avec Protéines seuls dom. certifié non-annotées

P. vivax ≤ 10% 144 119 37

≤ 20% 230 142 55

P. yoelii

≤ 10% 122 99 28

≤ 20% 248 111 44

Table 4.7 – Nouvelles annotations GO des protéines chez P. vivax et P. yoelii. “Domaines seuls” est le nombre d’annotations GO inédites distinctes que l’on peut transfé- rer à la protéine d’après les termes GO associés par Interpro (cf. section 1.4.4 page45) aux familles de domaines certifié ; “Combin. avec dom. certifié” est le nombre d’annotations GO supplémentaires (différentes de la précédente colonne) qui peuvent être déduites des combi- naisons impliquant un nouveau domaine certifié. “Protéines non-annotées” est le nombre de protéines sans aucune annotation GO pour lesquelles nous proposons une annotation par au moins un terme GO.

Un point intéressant vient de la comparaison des domaines certifiés dans les protéines orthologues aux protéines de P. falciparum chez P. vivax et P. yoelii (orthologies extraites de PlasmoDB 5.5). Les tableaux 4.8 et4.9 révèlent qu’une grande partie des domaines certifiés dans une protéine de P. falciparum sont aussi certifiées dans une protéine orthologue dans ces espèces. De plus, une partie des domaines certifiés chez P. falciparum correspondent à des domaines déjà connus dans leurs protéines orthologues. Par exemple, parmi les nouveaux domaines certifiés avec un F DR ≤ 10% dans les protéines de P. falciparum ayant une or- thologue chez P. vivax, 14% sont des domaines déjà connus dans une protéine orthologue de P. vivax, et 63% ont été certifiés avec un F DR équivalent dans les protéines orthologues. Ce qui signifie que 77% des nouveaux domaines certifiés chez P. falciparum, sont aussi présents dans des protéines orthologues. De plus, l’observation d’autres paramètres tels que l’éloigne- ment aux extrémités N- et C- terminales ainsi que la taille des domaines certifiés se révèle également congruente (données non-montrées). Tous ces résultats supportent fortement notre méthode et les résultats obtenus sur les protéines des espèces plasmodiales. Ils peuvent égale- ment être vus comme un troisième indicateur concernant la conservation de la fonctionnalité des domaines divergents.

P. vivax

Dom. connus Dom. certif.≤10% Dom. certif.≤20% Dom. connus 2 985/3 143 (95%) 34/3 143 (1%) 55/3 143 (2%) P. falciparum Dom. certif.≤10% 46/323 (14%) 205/323 (63%) 222/323 (69%)

Dom. certif.≤20% 54/548 (10%) 233/548 (43%) 277/548 (51%)

Table 4.8 – Proportion de domaines connus et certifiés chez P. falciparum que l’on retrouve dans des protéines orthologues de P. vivax. Ce tableau rapporte le nombre de domaines Pfam — connus et certifiés dans une protéine de P. falciparum — pour lesquels le même domaine Pfam est connu/certifié dans une protéine orthologue chez P. vivax. Ce nombre est comparé au nombre total de domaines dans les protéines P. falciparum qui possède une protéine orthologue chez P. vivax. Par exemple, 3 143 domaines Pfam sont connus dans les protéines de P. falciparum ayant un orthologue chez P. vivax. Parmi ces domaines, 2 985 sont connus et 34 sont certifiés avec un F DR inférieur à 10% dans la protéine orthologue de P. vivax. De plus, parmi les 323 nouveaux domaines certifiés chez P. falciparum avec un F DR ≤ 10% (dans une protéine ayant un orthologue chez P. vivax), 46 sont connus et 205 sont certifiés avec un F DR ≤ 10% dans l’orthologue de P. vivax.

P. yoelii

Dom. connus Dom. certif.≤10% Dom. certif.≤20% Dom. connus 2 700/2 998 (90%) 42/2 998 (1%) 50/2 998 (2%) P. falciparum Dom. certif.≤10% 41/314 (13%) 158/314 (50%) 169/314 (54%)

Dom. certif.≤20% 47/538 (9%) 185/538 (34%) 228/538 (42%)

Table4.9 – Proportion de domaines connus et certifiés chez P. falciparum que l’on retrouve dans des protéines orthologues de P. yoelii. Voir tableau4.8pour légende.

4.6. CONSISTANCE AVEC LES ORTHOLOGUES DE P. VIVAX ET P. YOELII 117

(a)

(c)

Figure 4.7 – Nombre de certifications réalisées par les trois types de domaines validants pour P. falciparum, P. vivax et P. yoelii. Nombre de domaines certifiés (en ordonnée) en fonction du F DR associé à ces certifications (en abscisse) La méthode a été appliquée en utilisant les domaines Pfam connus (a), les domaines InterPro connus (b), et les domaines potentiels Pfam eux-mêmes (c).