• Aucun résultat trouvé

Détermination du profil de mutations dans le proto-espaceur et le PAM

Comme indiqué précédemment, il a déjà été démontré que les bactériophages infectant S. thermophilus peuvent contourner le système CRISPR-Cas de type II-A grâce à des mutations ponctuelles dans la région du proto-espaceur (incluant le proto-espaceur ainsi que le PAM) (Deveau et al., 2008). Cela laisse croire que le locus endogène CRISPR1-Cas de la souche S. thermophilus DGCC7710 (DGCC7710) peut être directement utilisé afin de sélectionner pour des mutations aléatoires dans la région du proto-espaceur ciblé dans le génome du phage 2972. Pour le locus CRISPR1 les proto-espaceurs (espaceurs potentiels) ont une longueur constante de 30 nucléotides et le PAM est de sept nucléotides (NNAGAAW) pour une zone cible de 37 nucléotides pouvant contenir des mutations échappatoires (Barrangou et al., 2007). Par contre, des analyses de type Northern ont démontré que les 10 premiers nucléotides de l’espaceur (à l’extrémité 5’) sont, entre autres, supprimés lors de la maturation de l’ARNcr (Deltcheva et al., 2011; Carte et al., 2014). La longueur de la cible potentielle peut être encore diminuée suite à la détermination d’une séquence particulière de complémentarité essentielle, nommée seed sequence, de huit nucléotides à l’extrémité 3’ de l’espaceur afin d’obtenir la coupure de l’ADN cible pour CRISPR-Cas de type I-E chez E. coli (Semenova et al., 2011). Une séquence seed de longueur similaire (7 nucléotides) a été aussi déterminée pour le système du locus CRISPR3-Cas de DGCC7710 (Sapranauskas et al., 2011). Cependant, la séquence seed pour le système CRISPR1-Cas de type II-A DGCC7710 n’est pas connue. Un modèle in silico de l’appariement entre le complexe d’interférence (ARNcr::ARNtracr) et le proto-espaceur (ADN cible) a été déterminé pour le système CRISPR1-Cas9 de DGCC7710, ce qui a mené à une cible théorique de 27 nucléotides (Deltcheva et al., 2011; Jinek et al., 2012). Cette séquence comprend les 20 nucléotides en 3’ du proto-espaceur et les sept nucléotides du PAM (voir la figure 3.1).

Figure 3.1. Modèle in silico d’appariement entre le proto-espaceur PS91 dans le génome du phage 2972 (ADN

envahisseur) et le duplex ARNcrS91::ARNtracr mature lorsqu’en complexe avec Cas9 (absente). La couleur verte

Cinq BIMs (BIM S90 à S95) dérivés de la souche sauvage S. thermophilus DGCC7710, résistants au phage 2972 suite à l’acquisition d’un nouvel espaceur dans le locus CRISPR1 (tableau 2.2) (Barrangou et al., 2007; Deveau et al., 2008; Magadán et al., 2012; Dupuis et al., 2013), ont été sélectionnés afin de déterminer la séquence seed de la protéine Cas9 du locus CRISPR1-Cas. Ces BIMs ont acquis des espaceurs ciblant des gènes du phage 2972 dont la transcription est dite précoce, médiane ou tardive avec ou sans fonction connue (figure 2.2). Par la suite, les BIMs de S. thermophilus sélectionnés ont été mis en contact avec le phage sauvage 2972 par la méthode d’ensemencement dans la gélose molle. De nombreux phages résistants au CRISPR (CRISPR Escape Mutant, CEM) ont été isolés à des fréquences variant de 10-5 à 10-7 (tableau 3.1).

Tableau 3.1. Efficacité à former des plages de lyse (EOP) du phage 2972 sur différentes souches de S.

thermophilus. Souches EOPs BIM S90 1,8± 0,4 x 10-6 BIM S91 3,2 ± 0,3 x 10-5 BIM S92 5,2 ± 0,6 x 10-7 BIM S93 7,7 ± 0,4 x 10-5 BIM S94 2,8 ± 0,0 x 10-6 BIM S95 2,4 ± 0,2 x 10-6

Un total de 400 plages de lyse isolées obtenues lors de ces essais ont été purifiées et les régions des proto- espaceurs ciblés ont été amplifiées par PCR et les produits ont été séquencées. Dix-huit plages de lyse ne contenaient que des phages sauvages et donc les phages issus de ces plages ont été supprimés des données obtenues. Des 382 phages restants, 380 contenaient des mutations ponctuelles uniques dans le proto-espaceur ou PAM (figure 3.2). Les deux autres phages contenaient des mutations ponctuelles doubles dans le proto-espaceur ou le PAM. La fréquence des sites mutés dans ces régions du proto-espaceur a été calculée. Fait à noter, deux positions situées dans le PAM (NNAGAAW) représentent 40 % des mutations des phages résistants. L’absence de phages résistants avec des mutations aux autres sites que la séquence cœur AGAA du PAM laisse supposer que ces positions (NNAGAAW) seraient importantes lors de l’acquisition de nouveaux espaceurs et non pour l’interférence. Par ailleurs, la séquence seed a été déterminée à neuf paires de bases pour la protéine Cas9 du locus CRISPR1-Cas de S. thermophilus DGCC7710, soit de la position 22 à 30 du proto-espaceur. Il y a eu trois CEMs avec une mutation ponctuelle unique à la position 13 du proto- espaceur, hors de la région seed, qui semblent aussi inhiber l’activité du système CRISPR1-Cas de S.

thermophilus pour des raisons encore inconnues.

Le patron des fréquences de mutations obtenues dans le proto-espaceur et le PAM nous offre maintenant des informations cruciales sur les positions importantes afin d’isoler à de plus hautes fréquences des CEMs ayant une mutation spécifique. Par exemple, le nucléotide G présent dans le PAM du système CRISPR1-Cas

(AGAA) est la position la plus fréquemment mutée chez les CEMs. Par conséquent, il serait facile d’isoler une mutation non sens dans un gène de phage suite à une substitution du G pour un T dans le PAM du proto- espaceur ciblé menant à un codon ocre (UAA) si le codon est dans le même cadre de lecture que le gène en question.

Figure 3.2. Fréquence des mutations ponctuelles retrouvées dans la séquence du proto-espaceur et du PAM de phages

échappant au CRISPR-Cas. La région du proto-espaceur et le PAM de 400 CEMs ont été amplifiés par PCR et séquencés. Le graphique ne tient compte que de la compilation des 380 CEMs avec des mutations ponctuelles uniques. Les CEMS isolés ont été obtenus sur différents BIMs qui possèdent séparément des espaceurs ciblant les régions de l’orf9 (BIM S95), l’orf18 (BIM S94), l’orf32 (BIM S92), l’orf33 (BIM S90), l’orf36 (BIM S93) et l’orf39 (BIM S91) du phage 2972.