• Aucun résultat trouvé

4. Etudes expérimentales

4.1 Chapitre I : Analyse du gène IrSPI et de sa structure

4.1.4 Résultats

4.1.4.1 Analyses in silico de la séquence du gène IrSPI

Identification de gènes homologues

La banque de données dédiée aux vecteurs d’agents pathogènes, Vectorbase (Vectorbase.org) regroupe beaucoup de séquences appartenant aux arthropodes vecteurs tels que les moustiques, les glossines, les tiques ou les phlébotomes. Parmi les espèces de tiques on retrouve I.

scapularis, I. ricinus et R. microplus, mais seul le génome de I. scapularis a été entièrement

séquencé [239].

Des recherches par Blast dans cette banque de données, nous ont permis d’identifier seize séquences de I. ricinus présentant une forte identité (comprise entre 76,9% et 98,9%) avec l’ADNc d’IrSPI (Tableau 4). Dix de ces séquences sont issues d’une première étude réalisée en

2013 par Schwarz et al [240] qui avait pour but de comparer l’expression de gènes dans les

glandes salivaires au cours du gorgement, chez des femelles et des nymphes. Deux temps de gorgement pour chacune des stases ont été étudiés et comparés entre eux grâce à la technologie Illumina après qu’ait été réalisée une banque de référence des transcrits par pyroséquençage 454. Les 6 autres séquences émanent d’une seconde étude parue en 2015 ayant pour but de décrire les modifications transcriptomiques chez les nymphes et les femelles dans les glandes salivaires et l’intestin en réponse à l’attachement et au gorgement des tiques [241]. Les pourcentages d’identité identifiés montrent que IrSPI pourrait ainsi, chez I. ricinus, appartenir à une famille de gènes relativement proches les uns des autres.

92

Tableau 4: Tableau récapitulatif des séquences d’ADNc homologues d’IrSPI retrouvées chez I. ricinus.

Nom Longueur de l'alignement avec IrSPI (en pb) % De recouvrement % d'identité d'accession Schwarz et al., 2013 Ir2-23207 255 89% 82% GADI01001709.1 Ir2-1529 255 89% 81,20% GADI01007489.1 Ir2-5915 253 89% 80,80% GADI01002565.1 Ir2-8388 234 82% 79,70% GADI01000784.1 Ir2-5577 255 89% 79,60% GADI01001735.1 Ir2-5772 255 89% 79,60% GADI01007495.1 Ir2-5976 255 89% 78,80% GADI01001733.1 Ir2-8909 246 86% 78% GADI01001733.1 Ir2-5114 285 100% 77,20% GADI01004575.1 Ir2-54664 285 100% 76,90% GADI01004576.1 Kotsyfakis et al., 2015 Irsgmg-150466 267 94% 98,90% GANP01007846.1 Irmgsg-168635 271 95% 81,20% GANP01001011.1 Irmgsg-169124 271 95% 81,20% GANP01001111.1 Irsgmg-161164 252 88% 81,30% GANP01009421.1 Irmgsg-176862 252 88% 80,80% GANP01002050.1 SigP-177097 240 84% 81,70% GANP01014341.1

Neuf gènes orthologues chez I. scapularis ont également été identifiés dans Vectorbase avec des pourcentages d’identité (entre 75,3% et 93,7%) et de recouvrement similaires à ceux observés chez I. ricinus (tableau 5). Trois de ces gènes (AF483693.1, AF483686.1, AF483681.1) ont été identifiés par Valenzuela et al. [242], lors d’un inventaire à la fois transcriptomique et protéique des glandes salivaires après 3-4 jours de gorgement, ayant conduit à l’identification de 735 ADNc. Trois ADNc (DQ066178.1, DQ066150.1, DQ066087.1) ont été découverts par Ribeiro et al. [243] dans une autre étude transcriptomique visant elle aussi à réaliser un catalogue des transcrits à différents temps au cours du gorgement chez des femelles entière (non gorgées, gorgées 6-12h, ou 18–24h) et chez des nymphes pré-gorgées (24-48h), représentant un total de 8150 ADNc répertoriés. Enfin, trois derniers gènes (DN970511.1,

DN970337.1 etDN970313.1) ont aussi été découverts par Ribeiro et sont répertoriés dans un

93

Tableau 5: Tableau récapitulatif des séquences d’ADNc orthologues d’IrSPI retrouvées chez I. scapularis

N° d'accession Longueur de l'alignement avec IrSPI

(en pb) % de recouvrement % d'identité Valenzuela et al., 2002 AF483693.1 282 98,9% 76,20% AF483686.1 242 84,9% 77,30% AF483681.1 282 98,9% 75,30% Ribeiro et al., 2006 et unpublished DQ066178.1 285 100,0% 93,70% DQ066150.1 270 94,7% 78,10% DQ066087.1 282 98,9% 75,50% DN970511.1 285 100,0% 93,30% DN970237.1 285 100,0% 93,30% DN970313.1 270 94,7% 93%

Des analyses ont aussi été effectuées à l’aide de la fonction tBlastX de Vectorbase permettant la comparaison de la séquence traduite en protéine de l’ADNc d’IrSPI avec la traduction des ADNc contenus dans les banques de données chez I. ricinus et I. scapularis, ce qui explique que les résultats de la longueur de l’alignement soient donnés en pb (tableau 6). Les noms des gènes et non des protéines ont été conservés ici.

Tableau 6: Tableau récapitulatif des protéines homologues d’IrSPI retrouvées dans les banques de données de Vectorbase

Nom du gène Longueur de

l'alignement avec IrSPI (en pb)

% de recouvrement % d'identité N° d'accession

Ixodes ricinus Schwarz et al. 2013 Ir2-23207 261 91,6% 70,10% JAA72099.1 Ir2-1529 174 61,1% 75,90% JAA66319.1 Ir2-5915 174 61,1% 74,10% JAA71243.1 Ir2-8388 150 52,6% 68% JAA73024.1 Ir2-5577 174 61,1% 69% JAA72073.1 Ir2-5772 162 56,8% 72,20% JAA66313.1 Ir2-5976 162 56,8% 72,20% JAA72075.1 Ir2-8909 171 60,0% 68,40% JAA66563.1 Ir2-5114 285 100,0% 67,40% JAA69233.1 Ir2-54664 174 61,1% 68,40% JAA69232.1 Kotsyfakis et al.2015 Irsgmg-150466 267 93,7% 100% JAB76622.1 Irmgsg-168635 285 100,0% 70,50% JAB83457.1

94 Irmgsg-169124 285 100,0% 70,50% JAB83357.1 Irsgmg-161164 261 91,6% 74,70% JAB75047.1 Irmgsg-176862 171 60,0% 71,90% JAB82418.1 SigP-177097 174 61,1% 75 ,90% JAB70127.1 Ixodes scapularis Valenzuela et al.2002 AF483693.1 285 100,0% 68,40% AAM93615.1 AF483686.1 150 52,6% 64% AAM93608.1 AF483681.1 207 72,6% 72,50% AAM93603.1 Ribeiro et al.2006 et unpublished DQ066178.1 285 100,0% 91,60% AAY66815.1 DQ066150.1 150 52,6% 66% AAY66787.1 DQ066087.1 285 100,0% 67,40% AAY66724.1 DN970511.1 285 100,0% 90,50% DN970511.1 DN970237.1 285 100,0% 90,50% DN970237.1 DN970313.1 270 94,7% 91 ,10% DN970313.1

Suite à ces analyses, nous avons retrouvé chez I. ricinus une protéine identique à IrSPI (Irsgmg-150466), bien que le pourcentage de recouvrement ne soit pas total (93,7%). Il semble cependant que le peptide signal de cette dernière soit plus court que celui d’IrSPI, ce qui pourrait être dû à des erreurs de séquençage compte tenu de l’homologie parfaite du reste de la séquence. Cette protéine est également un membre de la famille des inhibiteurs de sérine protéases de type Kunitz et son gène est exprimé à la fois chez les nymphes et chez les femelles, au début du gorgement, dans les glandes salivaires (12h-24h chez les nymphes et 12h-36h chez les femelles). Seules les femelles présentent également une expression de l’ARNm correspondant à cette protéine dans l’intestin au cours du gorgement (12h-36h) [241].

Les autres protéines identifiées présentaient des pourcentages d’identité relativement faibles avec IrSPI (entre 68% et 75,9%). De plus, ces pourcentages d’identité sont à mettre en rapport avec des pourcentages de recouvrement, qui eux aussi sont faibles (52,8% et 56,8% respectivement pour Ir2-8388, et Ir2-5772, Ir2-5976), ce qui laisserait plutôt penser à des homologies de séquence correspondant à des domaines retrouvés chez d’autres protéines de la famille des inhibiteurs de serine protéases de type Kunitz chez cette tique. Tout comme pour Irsgmg150466, les ARNm correspondant à ces protéines sont synthétisés chez les nymphes et les femelles au cours du gorgement, avec chez les nymphes une augmentation de leur expression entre le début et la fin du gorgement quand une diminution est observée au cours du gorgement chez les femelles [240].

95

Chez I. scapularis, le pourcentage d’identité avec IrSPI des séquences traduites oscille entre 64% et 91,6% et les pourcentages de recouvrement sont compris entre 52,6% et 100%. DQ066178.1, identifié ici comme le gène le plus proche d’IrSPI avec 91,6% d’identité possède un pourcentage de recouvrement de 100%. Chez I. scapularis les pourcentages d’identité importants relevés pour 4 des protéines identifiées (DQ066178.1, DN970511.1, DN970237.1 et DN970313.1) montrent qu’IrSPI possèdent des orthologues proches chez cette autre espèce. Par ailleurs, ces protéines identifiées dans les glandes salivaires de nymphes de I. scapularis, font probablement partie du groupe des Monolaris (protéine à un seul domaine Kunitz) à cause de leur petit nombre d’acides aminés et de l’homologie avec la protéine AAY66815 qui appartient à ce groupe de protéines à domaine Kunitz [244].

Prédiction de la structure du gène IrSPI

Le serveur Genscan (http://genes.mit.edu/GENSCAN.html) a été utilisé pour prédire la présence d’exons et d’introns dans la séquence de IrSPI. L’analyse réalisée à partir de la portion connue du gène IrSPI, a montré la prédiction de deux exons un premier de 66 pb entre les positions 1 et 66 et un second de 218 pb entre les positions 1696 et 1914, et une séquence de poly adénylation signifiant la fin du gène entre les positions 1982 et 1987pb. Ainsi une structure similaire à celle obtenue précédemment par séquençage (Figure 13) avec 2 exons séparés par un intron de 1630 pb est donc retrouvée ici.

Les exons définis par Genscan et identifiés par séquençage ont alors été alignés sur le génome d’I. scapularis dans Vectorbase. Le premier exon de 66 pb matche à deux positions, sur le supercontig DS965545 du génome de scapularis entre 47060 et 47125 pb (89,39% d’identité), et entre 29788 et 29859 pb (85,5%). Le second exon de 177 pb, matche en deux positions sur ce même supercontig : sur 180 pb à la position 45169 (76,8% d’identité) et sur 176 pb à la position 27986 (74,3% d’identité). Néanmoins 43 pb de la séquence codante ne matchent en aucune position sur ce supercontig. En revanche, 82 pb en aval du codon stop (3’UTR) matchent en deux positions sur ce supercontig à 39590 et 21688 pb. Ce résultat suggèrerait la présence d’au moins un autre exon contenant les 43 pb manquantes, ce qui porterait à au moins 3 le nombre d’exons composant le gène IrSPI et impliquerait la présence, a minima, d’un second intron dans la séquence encore inconnue en 3’. Or la traduction en protéine de IrSPI et l’utilisation de tblastn a permis de mettre en évidence que les 6 derniers acides aminés présents juste avant le codon stop étaient identiques à ceux retrouvés sur la séquence traduite du supercontig DS965545 en position 21773 à 21789. IrSPI matche donc aussi sur ce supercontig

96

entre les positions 21689 et 21790, incluant les 6 derniers acides aminés, le codon stop et le début du 3’UTR. L’existence de cet exon en amont du codon stop serait donc en faveur d’un nombre total de 4 exons. Le même résultat est obtenu au niveau de la seconde position où matche IrSPI (entre les positions 39591 et 39692).

Ainsi, si on considère que le supercontig DS965545 du génome de I. scapularis correspond à l’horthologue de IrSPI chez cette autre espèce de tique, et que la structure de ce dernier peut être extrapolée à partir de ce gène, IrSPI serait constitué de 4 exons de 66 pb, 177 pb, 25 pb et 18 pb, d’un intron de 1630 pb et de deux autres introns de tailles encore inconnues (Figure 17). Il est à présent indispensable de valider une telle structure par séquençage. Malgré des matchs identifiés sur les premières données du génome de I. ricinus dans Vectorbase, en l’absence d’assemblage de ce génome, aucune conclusion n’est encore possible à l’heure actuelle.