UNIVERSIT ´E DE MONTR ´EAL Automne 2014
D´epartement IRO Nadia El-Mabrouk
Cours IFT6291/BIN6000 Bio-Informatique G´ enomique
1 Description
Ce cours est destin´e `a des ´etudiants d´esireux de d´ecouvrir le domaine de la biologie com- putationnelle. Aucun pr´erequis en biologie n’est n´ecessaire. Le cours commencera par une introduction au code g´en´etique. Des connaissances biologiques suppl´ementaires seront intro- duites, au besoin, tout au long de la session. Cependant, des bases suffisantes en algorithmique et programmation sont souhaitables.
Les th`emes biologiques abord´es concernent l’analyse des s´equences biologiques (ADN, ARN, prot´eines), et l’´etude de leur ´evolution. Le cours sera orient´e vers les m´ethodes algo- rithmiques utilis´ees pour aborder les probl´ematiques biologiques soulev´ees.
2 Objectifs
Le premier objectif de ce cours est d’introduire l’´etudiant au domaine de la “biologie com- putationnelle”, qui consiste `a formaliser un probl`eme biologique, et `a d´evelopper les outils algorithmiques et math´ematiques permettant de le r´esoudre. `A l’issue de ce cours, l’´etudiant sera familiaris´e avec les probl´ematiques bio-informatiques li´ees `a l’analyse et au traitement des s´equences biologiques, ainsi qu’avec les m´ethodes algorithmiques les plus utilis´ees pour les r´esoudre.
Le deuxi`eme objectif de ce cours est d’initier l’´etudiant `a la recherche en bioinformatique.
Nous travaillerons sur la lecture et la compr´ehension approfondie d’articles scientifiques, ainsi que sur la r´ealisation d’un petit projet de recherche.
3 Programme
Les heures indiqu´ees sont des estimations d’heures de cours. Les heures manquantes cor- respondent `a la partie “recherche” du cours, aux pr´esentations d’articles scientifiques, aux projets, et aux examens.
1. Introduction au cours et `a la Bio-Informatique (2h)
2. Recherche et alignement de s´equences biologiques; m´ethodes exactes(3h)
3. Heuristiques pour la recherche dans les banques de donn´ees biologiques (FASTA, BLAST, etc) (3h)
1
4. Alignement multiple; m´ethodes exactes (3h) 5. Heuristiques pour l’alignement multiple (2h)
6. Recherche exacte; recherche de r´ep´etitions; arbres des suffixes (6h) 7. Phylog´enie: Mod`eles ´evolutifs, inf´erence(5h)
8. Phylog´enie: Consensus d’arbres(3h) 9. R´earrangements g´enomiques (3h) 10. Familles de g`enes et r´econciliation (3h)
4 Manuels de r´ ef´ erence
• Algorithms on Strings, Trees and Sequences - Computer Science and Computational Biology, Dan Gusfield, Cambridge University Press, 1997.
• An Introduction to Bioinformatics Algorithms, Neil C. Jones and Pavel A. Pevzner, The MIT Press, 2004.
• Bioinformatics Algorithms - Techniques and Applications, Ion I. Mandoiu and Alexan- der Zelikovsky eds., Wiley, 2008.
• Algorithms in Computational Molecular Biology - Techniques, Approaches and Appli- cations, Mourad Elloumi and Albert Y. Zomaya eds., Wiley Series in Bioinformatics, 2011.
• Introduction to Computational Molecular Biology, J. Setubal and J. Meidanis, PWS Publishing Company, 1997.
• Biological sequence analysis - Probabilistic models of proteins and nucleic acids, R.
Durbin, S. Eddy, A. Krogh and G. Mitchison, 1998.
5 Mode d’´ evaluation
1. Examen Intra 20%
2. Examen Final 30%
3. Pr´esentation d’un article scientifique: 20%. On notera la structure de la pr´esentation (context scientifique, objectif, m´ethode, r´esultats, discussion), la compr´ehension du con- text g´en´eral, la compr´ehension de la m´ethode pr´esent´ee, la discussion et la critique de l’article, la capacit´e de r´epondre aux questions, la qualit´e g´en´erale de la pr´esentation.
4. Petit projet de recherche 30%:
• R´esum´e et rapport d’´etape: 5%
• Rapport final, et pr´esentation: 25%
2
Pour r´eussir il faut une note finale sup´erieure `a 50 et une moyenne pond´er´ee des examens sup´erieure `a 50, c’est-`a-dire (0.20×Intra + 0.40×Final)/0.60 ≥ 50.
3