• Aucun résultat trouvé

MLST ou (Multilocus Sequencing Typing) 13.1. Principe

14.1.2. Clustering par MALDIBiotyper

14.1.2.2. Analyse des Principaux Composants (PCA)

L'analyse des composants principaux (PCA) est unproc‘d‘ pour r‘duirele nombre decharges variables àdes d‘pendancesprincipalespar le biais dela comparaison desdiff‘rents ‘chantillons, par exemple les spectres de masse. Dans le casdes spectres de masseles variablessont repr‘sent‘espar l'intensit‘à des massesd‘finies. Selonla r‘solution, le nombre deces variablespeut ’tre très ‘lev‘.

Dans le cadredes caract‘ristiques d'analyse des principaux composants pseudo-spectres(= principal component, PC) sont produitesà partir d'unensemble dediff‘rents spectresuniques. LesPCssont orthogonauxles uns aux autres, n'ont aucune corr‘lationinverse et repr‘sententles vecteurs propres dela matrice de corr‘lationdes spectres. La partiede vecteurs propresde la matrice de corr‘lationest d‘termin‘ par lesvaleurs propres, qui sont ‘galement utilis‘s pour le tri. Leur proportiondiminuerapidement, ce quipeut ’treobserv‘à partir du trac‘des valeurs propres. L'informationprincipaleest contenue dans lespremiers PC, la PCseffectuentl'organisationd‘taill‘e de l'information des spectres etles hauts PCscontiennent le bruit de fonddes spectres. Comme critèrepour la s‘lection du PCs, il est utile de ne choisir quecelui-ci aveclesplus hautesvaleurs propres, de sorte que leur sommedevrait atteindre 95% de la somme totale. LeBiotyperutilisece principepour d‘terminer le nombre de PCsautomatiquement.

Chaquespectre uniquepeut ’trereconstruit à partir desPCscomme la superpositionpond‘r‘e. Ces poidssont appel‘sscores,ils peuvent ’tre visualis‘spar leBiotyperen2Det 3D Plots. Dansle Plot, tous les points(score) repr‘sententun spectre.

Les scoressont affich‘sdispers‘s dansle Plot (

Figure 20:Repr‘sentation de la distribution

des diff‘rents spectres de masse en 2D et 3D par Biotyper1.1

TM). Souvent, elles sont regroup‘es dans des nuages, qui peuvent repr‘senter diff‘rentes espèces. Encela,une analyse typologiquepeut ’treutilis‘e pour diviser lesespècesen diff‘rents clusters[116] .

Figure :Repr‘sentation de la distribution des diff‘rents spectres de masse en 2D et 3D par Biotyper1.1TM

Les m‘thodes phylog‘n‘tiques sont utilis‘es pour pouvoir comparer les organismes entre eux et ‘tablir leur lien de parent‘. Sur la base des donn‘es obtenues avec les diff‘rents marqueurs g‘n‘tiques, elles permettent de visualiser par les arbres phylog‘n‘tiques appel‘s dendrogrammes, les relations existant entre les isolats.

14.3. M‘thodes ph‘n‘tiques

A partir des matrices de distances calcul‘es sur les bases des donn‘es obtenues avec les diff‘rents marqueurs mol‘culaires, un dendrogramme a pu ’tre construit par classification hi‘rarchique ascendante selon la m‘thode ≥PGMA (≥nweighted Pair-Group Method with aritmetic Average) (Sneath, Sokal, 1962[117] ) ou par la m‘thode NJ (Neighbor-Joining) (Saitou, Nei, 1987[118]). La m‘thode ≥PGMA fait l hypothèse d une ‘volution ind‘pendante des diff‘rentes lign‘es à une vitesse constante. La m‘thode NJ est une m‘thode agglom‘rative, qui ne fait pas l hypothèse d un taux ‘volutif constant dans les arbres. Elle produit un arbre non enracin‘. La racine peut cependant ’tre localis‘e par l utilisation d un groupe externe. Pour cette ‘tude, l espèce S. epidermidis a ‘t‘ choisie comme groupe externe.

14.4. Identification des Spectres par le Logiciel Biotyper

(Calcul du matching score)

Sur la base des spectres de r‘f‘rences (Base de donn‘es) des spectres inconnus peuvent ’tre identifi‘s. Le processus d'identification compare et aligne les listes de pics de spectres inconnus avec des listes de pics de spectres de r‘f‘rences. Dans la première ‘tape les spectres inconnus sont calibr‘s avec les spectres de r‘f‘rences. Pour la calibration, une erreur initiale de masse peut ’tre s‘lectionn‘e. Le Biotyper tente de s‘lectionner et d'aligner les plus hauts pics de chaque spectre tout en ‘tant proche de l'erreur initiale de masse. L'objectif est d'atteindre une homologie très ‘lev‘e. Dans la deuxième ‘tape, le matching des spectres inconnus avec les spectres de r‘f‘rence sera ‘valu‘ en se basant sur une valeur de score d‘di‘e. Pour cela, l'information des pics du spectre de r‘f‘rence est transform‘e en une valeur de score maximal accessible. Chaque pic dans les spectres de r‘f‘rence avec une fr‘quence de 100% obtient 100 points. Cette fr‘quence de pics correspond à la reproductibilit‘ du pic respectif au sein des spectres qui ont ‘t‘ utilis‘s pour la g‘n‘ration de la gamme principale ayant servi à la cr‘ation de la base de donn‘es. Les pics avec des fr‘quences plus faibles obtiennent des scores appropri‘s, par exemple un pic de fr‘quence de 20% obtient 20 points. L'addition de l'ensemble des r‘sultats de points dans un score de points accessibles au maximum. À titre d'exemple un spectre de r‘f‘rence avec : 10 pics de

fr‘quence de 100%, 5 pics de fr‘quence de 50%, et 3 pics de fr‘quence de 10% atteint un score maximum de 1000 (10 * 100) + 250 (5 * 50) + 30 (3 * 10) = 1280.

Après la calibration chaque pic correspondant du spectre inconnu reçoit une valeur de point d‘di‘ aussi. Pour le matching des pics inconnus aux correspondants pics dans le spectre de r‘f‘rence, des fen’tres de masse ajustables sont cr‘es (fen’tre de la masse interne et externe). La fen’tre de masse interne est affect‘e comme point de pointage complet et la fen’tre ext‘rieure est assign‘e en corr‘lation avec la distance de la fen’tre int‘rieure comme parties de la totalit‘ des points. ≥n pointage complet signifie que le pic du spectre inconnu recevra le m’me score, comme le pic correspondant du spectre de r‘f‘rence. Dans le graphique les pics sortant correspondant dans la fen’tre interne (par exemple 200 ppm) sont verts, au sein de la fen’tre ext‘rieure (par exemple 500 ppm) sont jaunes et les pics non-correspondants sont rouges (

Figure 21 :Les r‘sultats Graphique d'identification. La partie

sup‘rieuremontre le spectrecontenant des picsinconnus, les pics similaires au sein

dela fen’treint‘rieure(verte), au sein dela fen’treext‘rieure(jaune) et les picsnon

similaires(rouge).La partie inf‘rieuremontre le spectrede r‘f‘rence d‘di‘.

). De la valeur du score cumul‘ du spectre inconnu et le score maximal du spectre de r‘f‘rence, la valeur du score final pour le spectre inconnu sera calcul‘e.

Figure :Les r‘sultats Graphique d'identification. La partie sup‘rieuremontre le spectrecontenant des picsinconnus, les pics similaires au sein dela fen’treint‘rieure(verte), au sein dela fen’treext‘rieure(jaune) et les picsnon similaires(rouge).La partie inf‘rieuremontre le spectrede r‘f‘rence d‘di‘.

Le log score final est calcul‘ de cette façon:

Log score: Rel Score x Rel P-Num. x I-Corr. x 1000 (maximum = 1000). ActSc: La valeur atteint de l'‘chelleinconnue(r‘elle score).

Max : La valeurmaximale de pointdu spectrede r‘f‘rence d‘di‘ (score maximum). ScoreRel : Calcul‘ par«Act Sc'/'MaxSc '(maximum =1).

:Nombre de pics similairesau sein dela fen’treint‘rieure. :Nombre depics similairesau sein dela fen’treext‘rieure.

:Num‘ro de laLe total desdespicscueilliesdu spectreinconnu. Rel P-Num : Calcul‘ par PN k + (0.5 * PN b ) / PN m (maximum = 1). I-Corr : la valeur effective de correlation I = 0.3 (Figure 22)

Figure : Description graphiquede la fonctionde correction d'intensit‘. Surl'axe des Xla valeur-I-corr‘lation sont donn‘s et d‘termin‘es à partir dela valeur-I-corr‘lationentre l'intensit‘r‘elle d'un spectreinconnueet le spectrede r‘f‘rence. Surl'axe des Y la valeur effective de I-corr‘lation qui est corrig‘epar le paramètrerajust‘.

La valeurScoreReldonne une impressiondu pourcentage despicsd'un spectrede r‘f‘rencequi sont comparables aux picsdu spectreinconnu.La valeurne doit pas ’treinf‘rieure à0,3. Parce qu'ilpeut arriverqu'un spectrede r‘f‘rencene contienne quequelques pics de r‘f‘rence(par

exemple 5pics), il est possible quedes pics coincidenthasardeusementavec des pics duspectre inconnu. En raison dece fait,le paramètreRelPnum v‘rifie le pourcentagede pics qui sont inconnus ou sont couvertsà partir d'unspectrede r‘f‘rence. Le seuil normal pourRelPnumest d'environ0,2. Le. I-Correst un paramètre qui donne uneimpression surl'intensit‘ et la sym‘trie des picsidentiques (

Figure 22

). Le r‘sultat finalLog scoredonne uneid‘e de larelation despectres inconnus.

Quand on qualifie un fait nouveau de découverte, ce n'est pas le fait lui-même qui constitue la découverte, mais bien l'idée nouvelle qui en dérive; de même, quand un fait prouve, ce n'est point le fait lui-même qui donne la preuve, mais seulement le rapport rationnel qu'il établit entre le phénomène et sa cause.

IV. RESULTATS