Perspectives
Améliorer la vitesse de calcul
Étudier les cohérences/incohérences
taxonomiques morphologie/moléculaire Modèle statistique d'assignation
Étudier la structure de la base (image euclidienne)
MetaMatch: un algorithme fiable et précis pour l'assignation taxonomique au niveau de l'espèce
Jean-Marc Frigerio (1) Philippe Chaumeil (1), Pierre Gay (2), Lenaïg Kermarrec (3,4), Frédéric Rimet (4), Agnès Bouchez (4), and Alain Franc (1)
1INRA, UMR BioGeCo, 33610 Cestas, France, 2Université de Bordeaux 1, 33400 Talence, France.3Asconit Consultants, 66350 Toulouges, France 4INRA, UMR CARRTEL, 74200 Thonon-les-Bains,
Obtenir l'inventaire des espèces d'une communauté
MetaMatch:
Test d’assignation de chaque read sur une Base de RéférencemetaMatch parfait: 0/1 Assignation si correspon-
-dance parfaite entre le read et une partie de la séquence de référence.
metaMatch imparfait
distance reliée au score de l'algorithme de Smith &
Waterman (alignement local)
Assignation si distance < seuil
Dendogramme de classification ascendante hiérarchique sur des distances de Jaccard. Réel: inventaire assemblé à partir de lignées de diatomées connues. M(1-3)_BLAST_11: inventaire obtenu avec Blast (paramètres par défaut, -W 11), M(1-3)_BLAST_130, avec Blast paramètre -W 130. M(1-3)_MetaMatch: distances produites par metaMatch. M(1-3) sont des mélanges en proportions connues de lignées de diatomées.
01,22,43,64,867,28,49,610,8 0,4 0,48 0,56 0,64 0,72 0,8 0,88 0,96
Similarity
M1_BLAST_11 M3_BLAST_11 M2_BLAST_11 M1_MetaMatch M2_MetaMatch
Réel
M3_MetaMatch M3_BLAST_130 M1_BLAST_130 M2_BLAST_130
Spécimens de référence
(Atlas, algothèque, herbier, etc.) Méta-échantillon
(prélèvement environnemental)
Base de références Séquençage massif
1500 entrées 1500 pbs
106 reads
450 pbs
Utilisation des infrastructures
Algorithme très facilement distribuable Implémenté sur :
cluster Avakas du Mésocentre de Bordeaux
(3168 cœurs Intel Xeon X5675) - Ordonnanceur TORQUE+MAUI
Et sur grille EGI, VO France-Grille via l'interface web Dirac et les commandes en ligne Dirac