• Aucun résultat trouvé

MetaMatch: un algorithme fiable et précis pour l'assignation taxonomique au niveau de l'espèce

N/A
N/A
Protected

Academic year: 2022

Partager "MetaMatch: un algorithme fiable et précis pour l'assignation taxonomique au niveau de l'espèce"

Copied!
1
0
0

Texte intégral

(1)

Perspectives

Améliorer la vitesse de calcul

Étudier les cohérences/incohérences

taxonomiques morphologie/moléculaire Modèle statistique d'assignation

Étudier la structure de la base (image euclidienne)

MetaMatch: un algorithme fiable et précis pour l'assignation taxonomique au niveau de l'espèce

Jean-Marc Frigerio (1) Philippe Chaumeil (1), Pierre Gay (2), Lenaïg Kermarrec (3,4), Frédéric Rimet (4), Agnès Bouchez (4), and Alain Franc (1)

1INRA, UMR BioGeCo, 33610 Cestas, France, 2Université de Bordeaux 1, 33400 Talence, France.3Asconit Consultants, 66350 Toulouges, France 4INRA, UMR CARRTEL, 74200 Thonon-les-Bains,

Obtenir l'inventaire des espèces d'une communauté

MetaMatch:

Test d’assignation de chaque read sur une Base de Référence

metaMatch parfait: 0/1 Assignation si correspon-

-dance parfaite entre le read et une partie de la séquence de référence.

metaMatch imparfait

distance reliée au score de l'algorithme de Smith &

Waterman (alignement local)

Assignation si distance < seuil

Dendogramme de classification ascendante hiérarchique sur des distances de Jaccard. Réel: inventaire assemblé à partir de lignées de diatomées connues. M(1-3)_BLAST_11: inventaire obtenu avec Blast (paramètres par défaut, -W 11), M(1-3)_BLAST_130, avec Blast paramètre -W 130. M(1-3)_MetaMatch: distances produites par metaMatch. M(1-3) sont des mélanges en proportions connues de lignées de diatomées.

01,22,43,64,867,28,49,610,8 0,4 0,48 0,56 0,64 0,72 0,8 0,88 0,96

Similarity

M1_BLAST_11 M3_BLAST_11 M2_BLAST_11 M1_MetaMatch M2_MetaMatch

Réel

M3_MetaMatch M3_BLAST_130 M1_BLAST_130 M2_BLAST_130

Spécimens de référence

(Atlas, algothèque, herbier, etc.) Méta-échantillon

(prélèvement environnemental)

Base de références Séquençage massif

1500 entrées 1500 pbs

106 reads

450 pbs

Utilisation des infrastructures

Algorithme très facilement distribuable Implémenté sur :

cluster Avakas du Mésocentre de Bordeaux

(3168 cœurs Intel Xeon X5675) - Ordonnanceur TORQUE+MAUI

Et sur grille EGI, VO France-Grille via l'interface web Dirac et les commandes en ligne Dirac

Références

Documents relatifs

1 IFIP, breeding techniques, France, 2 INRA, UMR Pegase, France, 3 ANSES, Animal Health and Welfare, France, 4 ISA Lille, Grecat, France;

1 UMR BDR, INRA, ENVA, Université Paris Saclay, 78350 Jouy en Josas, France 2 Present address: Laboratoire de Physiologie Cellulaire et Végétale (LPCV), UMR 1417 INRA / UMR

Dans notre cas c’est la masse volumique qui influe sur l’onde, puisque les études sur les dispositifs à ondes acoustiques montrent que les caractéristiques de

Indeed, Raman microscopy analysis, performed to characterize the properties of these MLG, evidence that this folded graphene behaves as weakly interacting MLG

La parallélisation ou distribution d'outils tels que BLAST ou metaMatch est naturelle et, pour BLAST notamment, a été largement étudiée (Carvalho &amp; al., 2005, Missaoui,

Lagarri- gue 1 , 1 UMR PEGASE INRA, Agrocampus Ouest UMR PEGASE, Rennes, France; 2 UMR GenPhySE, INRA, INPT, ENVT, Universi- té de Toulouse, Castanet-Tolosan, France; 3

La parallélisation ou distribution d'outils tels que BLAST ou metaMatch est naturelle et, pour BLAST notamment, a été largement étudiée (Carvalho &amp; al., 2005, Missaoui,

Hocevar, “A reduced complexity decoder architecture via layered decoding of LDPC codes,” in IEEE Workshop on Signal Processing Systems, SIPS 2004, Oct.. Veidenbaum, “Guest