• Aucun résultat trouvé

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 77

Bien que les techniques de séquençage à haut débit sont restreintes principalement aux études de recherche, l’étude du génome bactérien d’isolats cliniques devient, actuellement, de plus en plus réalisé, car le coût de séquençage de l'ADN continue à diminuer, et ce grâce à la possibilité de séquencer un grand nombre d’échantillon dans un seul run de séquençage (Koser et al., 2012 ; Salipante et al., 2014 ; Roach et al., 2015). En outre, le séquençage du génome de ces isolats bactériens a mis en lumière divers aspects d'un certain nombre d'agents pathogènes, y compris la transmission de la souche globale et intra-hôpital, l'évolution de la résistance aux antibiotiques, l'échange horizontal des éléments mobiles, la distribution du matériel génomique à travers une espèce bactérienne et l'identification de nouveaux agents pathogènes bactériens (Farhat et al., 2013 ; Conlan et al ., 2014; Tong et al., 2015).

Les staphylocoques représentent une proportion importante parmi les bactéries responsables d’infections graves. Ils sont observés dans de multiples situations cliniques, aussi bien en pathologie communautaire qu’en pathologie nosocomiale (Zahlane, Haouach et Zouhdi, 2007).

Les staphylocoques à coagulase négative, appelés aussi staphylocoques blancs, représentent les pathogènes les plus souvent identifiés dans les bactériémies en unités de réanimation néonatale. L’espèce Staphylococcus epidermidis est la plus prévalente, représentant classiquement plus de 70 % des staphylocoques blancs isolés dans ce contexte (Klingenberg

et al., 2007). Parmi les autres espèces, Staphylococcus capitis est rarement rapporté dans les

bactériémies et chez l’adulte, il est le plus souvent considéré comme un contaminant en cas d’isolement dans les hémocultures (Ruhe et al., 2004). Les résultats de l’électrophorèse à champ pulsé (PFGE) ont permis de mettre en évidence la présence endémique d’un clone particulier de S. capitis multirésistant aux antibiotiques dans les services de réanimation néonatale à Lyon, en France et plus généralement dans plusieurs pays d’Europe et en Australie (Rasigade et al., 2012). La fréquence inhabituellement élevée des bactériémies à S.

capitis, en réanimation néonatale au sein des hospices civils de Lyon et dans plusieurs NICU

dans le monde, a motivé une étude détaillée de ce pathogène en collaboration avec le Centre Nationale de Référence des staphylocoques (CNRS), Lyon, le Laboratoire de Recherche et d’analyse Médicale de la Fraternelle de la gendarmerie Royal (LRAM), Rabat et le Laboratoire de Biotechnologie Médicale (Medbiotech), Rabat.

Dans le chapitre précédent, nous avons décrit une nouvelle séquence génomique de S. capitis CR01, appartenant au clone NRCS-A, comme une première étape nécessaire afin d’avoir un

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 78

génome de référence. Ce dernier sera une base de comparaison avec d'autres génomes séquencés de S. capitis, associées à une septicémie tardive, ainsi qu’avec des génomes CoNS et ce dans le but d'élucider les mécanismes moléculaires de la propagation de ces souches de

S. capitis NRCS-A dans les NICU en France et dans le monde.

Le choix méthodologique de notre étude s’est porté sur l’usage de la technologie de pyroséquençage du GFLX+ titanium, qui est un outil puissant pour la découverte d’agents pathogènes. Cette technologie produit des séquences de 400 à 700 pb, facilitant les travaux d’assemblage des séquences dans une approche de séquençage de novo de génomes complets. Nous avons séquencé huit souches de S. capitis : CR02, CR03, CR04, CR05, CR06, CR07, CR08 et CR09. Ces souches ont été isolées de quatre pays (France, Australie, Belgique et Angleterre) entre les périodes 2002 et 2009. Il s’agit de six isolats cliniques (5 Pulsotypes NRCS-A et 1 NRCS-C) et de deux souches de laboratoire (souches obtenues après 15 repiquages en présence de la vancomicyne et puis 9 repiquages en son absence « CMI haute stable »).

La préparation de la librairie est une étape primordiale. En effet, de la qualité de la librairie dépend la qualité de la PCR en émulsion et par la suite le séquençage. Vu la faisabilité de séquencé plusieurs génomes dans un seul run de séquençage, nous avons utilisé dans cette étude des séquences MID (Multiplex Identifier : amorces universelles couplées à un identifiant) de 6 à 10 pb, spécifique à un échantillon, permettant l’identification d’un génome lorsque plusieurs isolats sont séquencés et analysés simultanément (Multiplexage).

L’analyse bioinformatique est réalisée à l’aide des logiciels fournis avec le séquenceur GFLX+ titanium. Les images acquises par la camera au cours du pyroséquencage ont été converties en signal exploitable pour l’analyse bioinformatique des données par le logiciel GS Run Processor (Roche Diagnostics). Deux étapes ont été nécessaires : analyse des images (identification des puits et mesure de la quantité de lumière émise à chaque cycle pour chaque puits) et analyse des signaux (détermination de la séquence des fragments d’ADN localisés dans chaque puits à partir des informations précédentes). La qualité du séquençage a été vérifiée sur le module GS run browser (Roche Diagnostics).

Après démultiplexage des séquences MID (8 fichier), les lectures « read » issues de séquençage de chaque génome de S. capitis ont été assemblées avec l’assembleur Newbler version 2.7 par l’approche de novo. Une séquence contiguée a été crée avec une taille et couverture varie selon chaque génome donnant des draft génomes pour les huit souches. Ces

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 79

derniers ont été annotés par la suite avec la plateforme d’annotation MicroScope (Mage). Les séquences obtenues des six isolats cliniques ont été déposées dans la base de données Genbank sous les numéros d’accès : CTEB01000000 pour CR03, CTEM01000000 pour CR04, CTEO01000000 pour CR05, CTEL01000000 pour CR09, CZWI00000000 pour CR02, CZWH00000000 pour CR07. En revanche, les données des deux souches de laboratoire (CR06 et CR08) ne sont pas encore publiées et sont toujours en cours d’étude par des collègues du CNR, Lyon, France.

Ce chapitre est présenté sous forme de deux articles publié dans Genome Annoucement (Lemriss et al., 2015, Lemriss et al., 2016 ). Les références de ces articles sont les suivantes :

 Genome Anounc 3(4):e00501-15. doi:10.1128/genomeA.00501-15.  Genome Announc 4(3):e00541-16. doi:10.1128/genomeA.00541-16.

Dans ces deux publications (partie III.1 et partie III.2 ci-dessous), j’ai réalisé tout le travail de paillasse, d’analyse bioinformatique et de rédaction des manuscrits.

III.1 Genome Sequences of Four Staphylococcus capitis NRCS-A Isolates from Geographically Distant Neonatal Intensive Care Units

Abstract

Staphylococcus capitis pulsotype NRCS-A was previously reported as a frequent cause of late-onset sepsis in neonatal intensive care units (NICUs) worldwide. Here, we report the whole-genome shotgun sequences of four S. capitis pulsotype NCRS-A strains, CR03, CR04, CR05, and CR09, isolated from Belgium, Australia, the United Kingdom, and France, respectively.

Coagulase-negative staphylococci (CoNS) are the most frequently encountered pathogens in neonatal intensive care units (NICUs) (1). However, in the NICU setting, recent studies have indicated that methicillin-resistant Staphylococcus capitis might emerge as a significant pathogen, causing late-onset sepsis (LOS) in several neonatal intensive care units in France, the Netherlands, and Australia (2, 4).

A study in French NICUs demonstrated the spread of a single clonal population of methicillin-resistant S. capitis (pulsotype NRCS-A) associated with reduced susceptibility to vancomycin, which is the first line of antibiotics used in cases of LOS. Moreover, this clone

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 80

has also been recently identified in NICUs in Belgium, the United Kingdom, and Australia, suggesting a worldwide distribution (5, 6).

In this report, we present the draft genome sequences of four S. capitis (pulsotype NRCS-A) strains (CR03, CR04, CR05, and CR09) isolated from blood cultures from four neonates hospitalized in NICUs in Belgium, Australia, the United Kingdom, and France, respectively. All S. capitis strains were grown in blood agar at 37°C, and genomic DNA was extracted using the PureLink genomic DNAkit (Invitrogen), according to the manufacturer’s recommended protocol. The quantity of DNA was determined using a NanoVue Plus (HVD Lifesciences), and 1 _g of DNA was used to sequence the whole genome of each strain. The 454-shotgun libraries were prepared from the extracted genomic DNA following GS rapid library protocol (Roche 454; Roche).

The genome sequence of each S. capitis strain was determined by high-throughput sequencing performed on a Genome Sequencer FLX_ system (454 Life Sciences/Roche) using FLX Titanium reagents, according to the manufacturer’s protocols and instructions. De novo assemblies were performed using the Roche Newbler (version 2.9) software package, and the sequencing results are summarized in Table III.1.

Table III.1 Summary of genome sequencing in the present study

Strain Country source Reads (MB) Fold Covrage N°of contigs Genome size (bp) G+C content % Assession no

S.captis CR03 Belgium 141,728 30 31 2,508,352 32 81 CTEB01000000

S.capitis CR04 Australia 132,280 30 38 2,512,289 32.80 CTEM01000000

S.capitis CR05 United Kingdom

139,569 31 39 2,543,917 32.84 CTEO01000000

S.capitis CR09 France 132,205 30 34 2,490,458 32.82 CTEL01000000

An automatic syntactic and functional annotation of the draft genome was performed using the MicroScope platform pipeline (7, 8). The syntactic analysis combines a set of programs, including AMIGene (9), tRNAscan-SE (10), RNAmmer (11), Rfam scan (12), and Prodigal software (13) to predict genomic objects that are mainly coding sequences (CDSs) and RNA genes. More than 20 bioinformatics methods were used for functional and relational analyses. The homology search was performed in the generalist databank UniProt (14) and in more specialized databases, such as COG (15), InterPro (16), PRIAM profiles for enzymatic

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 81

classification (17), prediction of protein localization using TMHMM (18), SignalP (19), and PSORTb (20) tools.

The chromosome of strain CR03 (ENA accession no. CTEB01000000) contains 2,575 genes, 2,466 coding sequences (CDSs), 4 rRNAs, and 61 tRNAs; the chromosome of strain CR04 (accession no. CTEM01000000) contains 2,566 genes, 2,457 CDSs, 4 rRNAs, and 60 tRNAs; the chromosome of strain CR05 (accession no. CTEO01000000) contains 2,624 genes, 2,508 CDSs, 4 rRNAs, and 60 tRNAs; and the chromosome of strain CR09 (accession no. CTEL01000000) contains 2,540 genes, 2,432 CDSs, 4 rRNAs, and 59 tRNAs.

Nucleotide sequence accession numbers. This whole-genome shotgun project has been deposited at the ENA database under the accession numbers listed in Table 1. The versions described in this paper are in the first versions, under BioProject designation no. PRJEB8618. Acknowledgments

This work was supported by a grant from the Fondation pour la Recherche Médicale (FRM, grant 75 ING20111223510) and by the Institut National de la Recherche Médicale (INSERM) and the French 76 Ministry of Health. This work was also supported by a grant from the NIH for H3Africa BioNet.

References

1. Klingenberg C, Rønnestad A, Anderson AS, Abrahamsen TG, Zorman J, Villaruz A, Flægstad T, Otto M, Sollid, Ericson J. 2007. Persistent strains of coagulase negative staphylococci in neonatal 80 intensive care unit: virulence factors and invasiveness. Clin Microbiol Infec. 13(11):1100-11.

2. Rasigade J-P, Raulin O, Picaud J-C, Tellini C, Bes M, Grando J, Ben Saïd M, Claris O, Etienne J, Tigaud S, Laurent F. 2012. Methicillin-Resistant Staphylococcus capitis with Reduced Vancomycin Susceptibility Causes Late-Onset Sepsis in Intensive Care Neonates. PLoS ONE. 7(2):e31548.

3. Wil C. Van Der Zwet, Yvette J. Debets-Ossenkopp, Erik Reinders, Maria Kapi, Paul H. M. Savelkoul, Ruurd M. Van Elburg, Keiichi Hiramatsu and Christina M. J. E. Vandenbroucke Grauls. 2002. Nosocomial Spread of a Staphylococcus capitis Strain with Heteroresistance to Vancomycin in a Neonatal Intensive Care Unit. J Clin Microbiol. 40(7):2520-2525.

4. D'mello D, J. Daley A, Shihab Rahman M, Qu Y, Garland S , Pearce C and A. Deighton M. 2008. Vancomycin Heteroresistance in Bloodstream Isolates of

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 82

5. Cui B, Smooker PM, Rouch DA, Daley AJ, Deighton MA. 2013. Differences between two clinical Staphylococcus capitis subspecies as revealed by biofilm, antibiotic resistance, and pulsed-field gel electrophoresis profiling. J Clin Microbiol. 51: 9–14. 6. Butin M, Martins Simoes P, Lemriss H, Lemriss S, Vandenesch F, Claris O, Picaud

JC, Rasigade JP and Laurent F. 2014. Staphylococcus capitis in neonatal late-onset sepsis: unexpected worldwide dissemination of an endemic multi-resistant clone. In: European Academy of Pediatric Societies - Poster symposium - Session Neonatal Sepsis - Poster No: 011. Barcelona, Spain.

7. Vallenet D, Belda E, Calteau A, Cruveiller S, Engelen S, Lajus A, Le Fèvre F, Longin C, Mornico D, Roche D, Rouy Z, Salvignol G, Scarpelli C, Thil Smith A A,Weima, M, and Médigue C. 2013. MicroScope an integrated microbial resource for the curation and comparative analysis of genomic and metabolic data. Nucleic Acids Res 41:D636-D647.

8. Vallenet D, Labarre L, Rouy Z, Barbe V, Bocs S, Cruveiller S, Lajus A, Pascal G, Scarpelli C, Médigue C. 2006. MaGe: amicrobial genome annotation system supported by synteny results. Nucleic Acids Res 34:53-65.

9. Bocs S, Cruveiller S, Vallenet D, Nuel G, Médigue C. 2003. AMIGene: Annotation of Microbial Genes. Nucleic Acids Res 31:3723-3726.

10. Lowe TM, Eddy SR. 1997. tRNA scan-SE: a program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Res 25:955-964.

11. Lagesen K, Hallin P, Rødland EA, Staerfeldt HH, Rognes T, Ussery DW. 2007. RNAmmer: consistent and rapid annotation of ribosomal RNA genes. Nucleic Acids Res 35:3100-3108.

12. Gardner PP, Daub J, Tate JG, Nawrocki EP, Kolbe DL, Lindgreen S, Wilkinson AC, Finn RD, Grif-fiths-Jones S, Eddy SR, Bateman A. 2009. Rfam: updates to the RNA families database. Nucleic Acids Res 37:D136-D140.

13. Hyatt D, Chen GL, Locascio PF, Land ML, Larimer FW, Hauser LJ. 2010. Prodigal: prokaryotic gene recognition and translation initiation site identification. BMC Bioinformatics.11:119.14. UnitProt Consortium. The Universal Protein Re-source (UniProt) 2009. Nucleic Acids Res 2009; 117 37:D169-D174.

14. UnitProt Consortium. The Universal Protein Re-source (UniProt) 2009. Nucleic Acids Res 2009; 117 37:D169-D174.

15. Tatusov RL, Fedorova ND, Jackson JD, Jacobs AR, Kiryutin B, Koonin EV, Krylov DM, Mazumder R, Mekhedov SL, Nikolskaya AN, Rao BS, Smirnov S, Sverdlov AV,

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 83

Vasudevan S, Wolf YI, Yin JJ, and Darren AN. 2003. The COG database: an updated version includes eukaryotes. 121 BMC Bioinformatics. 4:41.

16. Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, Bork P, Das U, Daugherty L, Duquenne L, Finn RD, Gough J, Haft D, Hulo N, Kahn D, Kelly E, Laugraud A, Letunic I, Lonsdale D, Lopez R, Madera M, Maslen J, McAnulla C, McDowall J, Mistry J, Mitchell A, Mulder N, Natale D, Orengo C, Quinn AF, Selengut JD, Sigrist CJ, Thimma M, Thomas PD, Valentin F, Wilson D, Wu CH and Yeats C. 2009. InterPro: the integrative protein signature database. Nucleic Acids Res 37:D211-D215.

17. Claudel-Renard C, Chevalet C, Faraut T, Kahn D. 2003. Enzyme-specific profiles for genome annotation: PRIAM. Nucleic Acids Res 31:6633-6639.

18. Sonnhammer EL, von Heijne G, Krogh A. 1998. A hid-den Markov model for predicting transmembrane helices in protein sequences. Proc Int ConfIntellSyst Mol Biol. 6:175-182.

19. Bendtsen JD, Nielsen H, von Heijne G, Brunak S. 2004. Improved prediction of signal peptides:SignalP 3.0. J Mol Biol. 340:783-795.

20. Gardy JL, Laird MR, Chen F, Rey S, Walsh CJ, Es-ter M, Brinkman FS. 2005. PSORTb v.2.0: 8 expanded prediction of bacterial protein subcellular localization and insights gained from comparative 136 proteome analysis. Bioinformatics. 21:617-623. 21. European Nucleotide Archive. http://www.ebi.ac.uk/ena/data/view.

III.2 Genome Sequences of multiresistant Staphylococcus capitis pulsotype NRCS-A and methicillin- 2 susceptible Staphylococcus capitis pulsotype NRCS-C

Abstract

Here, we report the draft genome sequences of methicillin-susceptible Staphylococcus captis pulsotype C (CR02 strain) and multiresistant Staphylococcus captis pulsotype NCRS-A (CR07 strain).

Staphylococcus capitis is a Gram-positive coccus belonging to the coagulase-negative

staphylococcus group (CoNS) that is frequently found on the human skin and mucosa (1). Recently, a few studies have reported the emergence of S. capitis, which was found to be a major cause of late-onset sepsis (LOS) in several neonatal intensive care units (NICUs) (2, 3).

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 84

A clonal population of methicillin-resistant S. capitis NRCS-A strains has spread into several geographically distant NICUs (4). These isolates exhibit reduced susceptibility to vancomycin, which is the most widely used antimicrobial agent in the NICU setting (5, 6). In order to elucidate the molecular mechanisms behind the wide-spreading of methicillin-resistant S. capitis and methicillin susceptible S. capitis in NICUs in France, we sequenced two different pulsotypes (NRCS-A and NRCS-C) of S. capitis strains (CR07 and CR02). In this report, we present the draft genome sequences of multiresistant S. capitis pulsotype NRCS-A and methicillin susceptible S. capitis pulsotype NRCS-C isolated from blood cultures from NICUs in Lyon, France.

These two pulsotype strains were grown in blood agar at 37°C, and genomic DNA was extracted using the PureLink genomic DNA kit (Invitrogen), according to the manufacturer’s recommended protocol. The DNA libraries were prepared from 1µg DNA genomic extracted following GS rapid library protocol (Roche 454; Roche).

The genome sequence of each S. capitis strain was determined by high-throughput sequencing performed on a Genome Sequencer FLX_system (454 Life Sciences/Roche) using FLX Titanium reagents, according to the manufacturer’s protocols and instructions. De novo assemblies were performed using Roche Newbler assembly software (version 2.9).

An automatic syntactic and functional annotation of the draft genome was performed using the MicroScope platform pipeline (7). The syntactic analysis combines a set of programs including AMIGene (8), tRNAscan-SE (9), RNAmmer (10), Rfam scan (11), and Prodigal software (12) to predict genomic objects that are mainly coding sequences (CDSs) and RNA genes. More than 20 bioinformatics methods were used for functional and relational analyses. The homology search was performed in the generalist databank UniProt (13) and in more specialized databases such as COG (14), InterPro (15), PRIAM profiles for enzymatic classification (16), prediction of protein localization using TMHMM (17), SignalP (18), and PsortB (19) tools.

The draft genome sequence of methicillin-susceptible S. capitis NRCS-C (CR02 strain) has 33.05% G_C content, is 2,344,750 bp in length which is distributed in 320 contigs (average coverage, 7.0_) with 2,415 genes, 2,476 CDSs, 42 pseudo genes, 4 rRNAs (5S,16S, 23S), and 59 tRNAs.

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 85

The draft genome sequence of methicillin-resistant S. capitis NRCS-A (CR07 strain) has 32.83% G_C content, is 2,477,101 bp in length which is distributed in 26 contigs (average coverage, 31x) with 2,411 CDSs, 4 rRNAs (5S,16S, 23S), and 61 tRNAs.

Nucleotide sequence accession numbers. These whole genome sequences were deposited at

GenBank under the accession numbers CZWI00000000 and CZWH00000000 for a

methicillin-susceptible S. capitis NRCS-C strain (CR02) and a multiresistant S. capitis NRCS-A strain (CR07), respectively. The versions described in this paper are the first versions.

Acknowledgments

This work was supported by a grant from the Fondation pour la Recherche Médicale (FRM, grant ING20111223510) and by the Institut National de la Recherche Médicale (INSERM) and the French Ministry of Health. This work was also supported by a grant from the NIH for H3Africa BioNet.

References

1. Li X, Lei M, Song Y, Gong K, Li L, Liang H, Jiang X. 2014. Whole genome sequence and comparative genomic analysis of multidrug-resistant Staphylococcus capitis

subsp. urealyticus strain LNZR-1. Gut Pathogens. 6:45.

2. Klingenberg C, Rønnestad A, Anderson AS, Abrahamsen TG, Zorman J, Villaruz A, Flægstad T, Otto M, Sollid, Ericson J. 2007. Persistent strains of coagulase negative staphylococci in neonatal intensive care unit: virulence factors and invasiveness. Clin Microbiol Infec. 13(11):1100-11.

3. Rasigade J-P, Raulin O, Picaud J-C, Tellini C, Bes M, Grando J, Ben Saïd M, Claris O, Etienne J, Tigaud S, Laurent F. 2012. Methicillin-Resistant Staphylococcus capitis with Reduced Vancomycin Susceptibility Causes Late-Onset Sepsis in Intensive Care Neonates. PLoS ONE. 7(2):e31548.

4. Butin M, Rasigade JP , Martins-Simões P, Meugnier H, Lemriss H, Goering R.V, Kearns A, Deighton M.A, Denis O, Ibrahimi A, Claris O, Vandenesch F, Picaud JC, Laurent F. 2016. Wide geographical dissemination of the multiresistant

Staphylococcus capitis NRCS-A clone in neonatal 84 intensive-care units. Clin

Microbiol Infec. 22(1):46-52.

5. . Cui B, Smooker PM, Rouch DA, Daley AJ, Deighton MA. 2013. Differences between two clinical Staphylococcus capitis subspecies as revealed by biofilm,

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 86

antibiotic resistance, and pulsed-field gel 87 electrophoresis profiling. J Clin

Microbiol. 51: 9–14.

6. Vallenet D, Belda E, Calteau A, Cruveiller S, Engelen S, Lajus A, Le Fèvre F, Longin C, Mornico D, Roche D, Rouy Z, Salvignol G, Scarpelli C, Thil Smith A A,Weima, M, and Médiguel C. 2013. MicroScope an integrated microbial resource for the curation and comparative analysis of 91 genomic and metabolic data. Nucleic Acids Res 41:D636-D647.

7. Vallenet D, Labarre L, Rouy Z, Barbe V, Bocs S, Cruveiller S, Lajus A, Pascal G, Scarpelli C, Médigue C. 2006. MaGe: amicrobial genome annotation system supported by synteny results. Nucleic Acids Res 34:53-65.

8. Bocs S, Cruveiller S, Vallenet D, Nuel G, Médigue C. 2003. AMIGene: Annotation of Microbial Genes. Nucleic Acids Res 31:3723-3726.

9. Lowe TM, Eddy SR. 1997. tRNA scan-SE: a program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Res 25:955-964.

10. Lagesen K, Hallin P, Rødland EA, Staerfeldt HH, Rognes T, Ussery DW. 2007. RNAmmer: consistent and rapid annotation of ribosomal RNA genes. Nucleic Acids Res 35:3100-3108.

11. Gardner PP, Daub J, Tate JG, Nawrocki EP, Kolbe DL, Lindgreen S, Wilkinson AC, Finn RD, Grif-fiths-Jones S, Eddy SR, Bateman A. 2009. Rfam: updates to the RNA families database. Nucleic Acids Res 37:D136-D140.

12. Hyatt D, Chen GL, Locascio PF, Land ML, Larimer FW, Hauser LJ. 2010. Prodigal: prokaryotic gene recognition and translation initiation site identification. BMC Bioinformatics.11:119.13.

13. UnitProt Consortium. The Universal Protein Re-source (UniProt) 2009. Nucleic Acids Res 2009; 37:D169-D174.

14. Tatusov RL, Fedorova ND, Jackson JD, Jacobs AR, Kiryutin B, Koonin EV, Krylov DM, Mazumder R, Mekhedov SL, Nikolskaya AN, Rao BS, Smirnov S, Sverdlov AV, Vasudevan S, Wolf YI, Yin JJ, and Darren AN. 2003. The COG database: an updated version includes eukaryotes. BMC Bioinformatics. 4:41

15. Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, Bork P, Das U, Daugherty L, Duquenne L, Finn RD, Gough J, Haft D, Hulo N, Kahn D, Kelly E, Laugraud A, Letunic I, Lonsdale D, Lopez R, Madera M, Maslen J, McAnulla C, McDowall J, Mistry J, Mitchell A, Mulder N, Natale D, Orengo C, Quinn AF, Selengut JD, Sigrist CJ, Thimma M, Thomas PD, Valentin F, Wilson D, Wu CH and

H. Lemriss⎹ Thèse de doctorat Université Mohammed V-Rabat 87

Yeats C. 2009. InterPro: the integrative protein signature database. Nucleic Acids Res 37:D211-D215.

16. Claudel-Renard C, Chevalet C, Faraut T, Kahn D. 2003. Enzyme-specific profiles for genome annotation: PRIAM. Nucleic Acids Res 31:6633-6639.

17. Sonnhammer EL, von Heijne G, Krogh A. 1998. A hid-den Markov model for predicting transmembrane helices in protein sequences. Proc Int ConfIntellSyst Mol Biol. 6:175-182.

18. Bendtsen JD, Nielsen H, von Heijne G, Brunak S. 2004. Improved prediction of signal peptides: SignalP 3.0. J Mol Biol. 340:783-795.

19. Gardy JL, Laird MR, Chen F, Rey S, Walsh CJ, Es-ter M, Brinkman FS. 2005.

Documents relatifs