• Aucun résultat trouvé

Read indexing

N/A
N/A
Protected

Academic year: 2021

Partager "Read indexing"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: lirmm-00757983

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00757983

Submitted on 27 Nov 2012

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Read indexing

Nicolas Philippe, Mikael Salson, Thierry Lecroq, Martine Léonard, Thérèse Commes, Eric Rivals

To cite this version:

Nicolas Philippe, Mikael Salson, Thierry Lecroq, Martine Léonard, Thérèse Commes, et al.. Read indexing. EMBnet.journal, EMBnet, 2011, 17 (Supplement B), pp.1. �10.14806/ej.17.B.289�. �lirmm- 00757983�

(2)

EMBnet.journal 17.B

p

ostErs 45

Read indexing

Nicolas Philippe, Mikael Salson, Thierry Lecroq, Martine Leonard, Therese Commes, Eric Rivals

Laboratoire d’Informatique, de Robotique et de Microélectronique, UMR 5506 CNRS, équipe MAB, Université de Montpellier II, Montpellier, France,

LITIS, Univ. Rouen, Mont Saint Aignen, France CRBM, UMR 5237 CNRS, Montpellier, France http://www.lirmm.fr/~rivals

The question of read indexing remains broadly unexplored. However, the increase in sequence throughput urges for new algorithmic solutions to query large read collections efficiently. We pro- pose a solution, named Gk arrays, to index large collections of reads, an algorithm to build the structure, and procedures to query it. Once constructed, the index structure is kept in main memory and is repeatedly accessed to answer various types of queries. We compare our data structure to other possible solutions to investigate its scalability and computational efficiency. Gk arrays are im- plemented in a general purpose library, which may prove useful for assembly purposes, for evaluat- ing the expression level in RNA-seq, and others high throughput sequencing applications.

References

1. Querying large read collections in main memory: a versatile data structure. N. Philippe, M. Salson, T. Lecroq, M. Leonard, T. Commes and E. Rivals. BMC Bioinformatics, Vol. 12, p. 42, doi:10.1186/1471-2105-12-242, 2011.

Relevant Web sites

2. http://crac.gforge.inria.fr/gkarrays/

3. http://www.atgc-montpellier.fr/ngs/

Références

Documents relatifs

Constatant que les analyses sociologiques menées sur les campagnes de communication ne permettent pas d’en extraire toutes les caractéristiques, nous proposons un

Quelle est la situation en matière d'approvisionnement en bois des industries ? Les scieurs de Midi-Pyrénées se plaignent de difficultés d'approvisionnement et souhaitent

Il faut dire que Nicolas Rivals, (né en 1983 et formé à l’école photo ETPA de Toulouse) ne se contente pas d’éclairer un arbre ou de dessiner dans l’espace avec une

Le spectromètre à haute énergie est doté d’un aimant d’analyse à 90°, auquel est appliqué un champ magnétique dont l’intensité optimise pour la masse du

Ces tendances se retrouvent chez le chien, pour lesquels les antiparasitaires représentent également à eux seuls plus de la moitié des cas déclarés d’usages hors AMM, avec des

This study aimed to identify DPs according to generation and sex using reduced-rank regression (RRR) with metabolic syndrome components as intermediate markers and assess

Le procédé de polymérisation en émulsion, rationnalisé théoriquement dans les années 1948 par Smith et Ewart, est le procédé le plus largement utilisé industriellement pour

L’objectif principal de notre étude était d’étudier la CRP à l’admission comme facteur pronostique chez les patients admis dans les services de médecine interne via les