• Aucun résultat trouvé

Une modélisation par Contrainte de graphe pour résoudre l’échafaudage de génome

N/A
N/A
Protected

Academic year: 2021

Partager "Une modélisation par Contrainte de graphe pour résoudre l’échafaudage de génome"

Copied!
3
0
0

Texte intégral

(1)

HAL Id: lirmm-01875591

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01875591

Submitted on 4 Jun 2019

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Une modélisation par Contrainte de graphe pour résoudre l’échafaudage de génome

Eric Bourreau, Annie Chateau, Rodolphe Giroudeau, Clément Dallard

To cite this version:

Eric Bourreau, Annie Chateau, Rodolphe Giroudeau, Clément Dallard. Une modélisation par Con-

trainte de graphe pour résoudre l’échafaudage de génome. ROADEF: Recherche Opérationnelle et

Aide à la Décision, Feb 2017, Metz, France. �lirmm-01875591�

(2)

Une modélisation par Contrainte de graphe pour résoudre l’échafaudage de génome.

Éric Bourreau

1

, Annie Chateau

1;2

, Clément Dallard

3

, Rodolphe Giroudeau

1

1 LIRMM - CNRS UMR 5506 - Montpellier, France

2 IBC - Montpellier, France

3 University of Portsmouth, UK

{eric.bourreau,annie.chateau,rodolphe.giroudeau}@lirmm.fr clement.dallard@port.ac.uk

Depuis le séquençage complet du génome humain, les dernières années ont été marquées par la production de plus en plus rapide de données de séquençage (projet HTS High Throughput Sequencing ou NGS Next Generation Sequencing). Les techniques de production de séquences complètes des organismes nouvellement séquencés se décomposent en plusieurs parties, dont l’échafaudage de génome [1]. Après le séquençage et l’assemblage, nous nous retrouvons avec un ensemble de contigs (assemblage de paired-end reads), ainsi qu’un ensemble d’informations, pas forcément cohérent, sur les relations entre ces contigs.

Trouver un ensemble cohérent de telles relations parmi celles qui sont disponibles permet la reconstruction pas à pas des chromosomes cibles.

Ce problème, démontré NP-difficile [2], possède de nombreuses heuristiques [3] mais peu d’approches complètes existent malheureusement [4]. Nous proposons lors de cette présentation de résoudre celui-ci par la Programmation Par Contraintes avec le solveur Choco [5], et plus spécifiquement par l’utilisation judicieuse de variables de graphes [6]. Des expérimentations sont réalisées à la fois sur des données réelles (voir figure 1) ou artificielles [7] afin de valider la performance de l’outil proposé et des différentes stratégies de résolution possibles.

Bibliographie :

[1] Daniel H. Huson, Knut Reinert, and Eugene W. Myers. The greedy path-merging algorithm for contig scaffolding. Journal of the ACM (JACM), 49(5):603–615, 2002.

[2] Annie Chateau and Rodolphe Giroudeau. A complexity and approximation framework for the maximization scaffolding problem. Theor. Comput. Sci., 595:92–106, 2015.

[3] Song Gao, Wing-Kin Sung, and Niranjan Nagarajan. Opera: reconstructing optima genomic scaffolds with high-throughput paired-end sequences. Journal of Computational Biology, 18(11):1681–1691, 2011.

[4] Nicolas Briot, Annie Chateau, Rémi Coletta, Simon De Givry, Philippe Leleux, and Thomas Schiex. An Integer Linear Programming Approach for Genome Scaffolding. In Workshop Constraints in Bioinformatics, 2014.

[5] Jean-Guillaume Fages, Narendra Jussien, and Xavier Lorca and Charles Prud’homme. Choco3: an open source java constraint programming library, 2013.

[6] Grégoire Dooms, Yves Deville, and Pierre Dupont. CP (graph): Introducing a graph computation domain in constraint programming. In Principles and Practice of Constraint Programming-CP 2005, pages 211–

225. Springer, 2005.

[7] Annie Chateau Adel Ferdjoukh, Éric Bourreau and Clémentine Nebut. A ModelDriven Approach to Generate Relevant and Realistic Datasets. In Software Engineering and Knowledge Engineering (SEKE), Jul 2016.

(3)

Figure 1 : Graphe d’échafaudage avec 17 contigs (en gras) et 26 liens potentiels pondérés

les connectant, correspondant au jeu de données issu d’EBOLA.

Références

Documents relatifs

Devant ce challenge et après analyse des compromis à faire entre la robustesse, le fait que le modèle doit être capable de trouver une solution pour toutes les configurations de

Cet exposé présente une approche de numérisation et modélisation par scanner 3D qui supprime toute contrainte de positionnement lors de la mesure et permet ainsi une grande

Seules deux heures on t permis de ra ssem bler les trois classes pour préparer le séjour ; les emplois du temps, non prévus pour la concertation rendent

Ajoutez une photo pour repérez les interrupteurs sur le dos de la carte Olimex puis les points de soudure Pour la carte Olimex : Ajouter un connecteur femelle sur le GPIO3

Pour les systèmes à base de Pentium l’ensemble des fonctionnalités d’une carte multi I/O est intégré sur la carte mère.. Relancer la machine et aller dans le

Afin de réduire cette complexité, une approche utilisant le tri de chromosomes et la construction de banques BAC ordonnées spécifiques de chacun des 21 chromosomes a

Ces particules virales synthétiques conservent la capside du virus natif et donc ses fonctionnalités d’assemblage et de désassemblage, mais elles sont dans l’incapacité de

Dans l’étude [1], Berot considère une simplification d’un rivet par un troisième corps cylindrique placé entre les deux plaques ; cette approche montre des