• Aucun résultat trouvé

Chapitre II la bioinformatique ,decovert de biomarqueurs etla sellection d’attributs

II. La bioinformatique

1. La bioinformatique, c'est quoi ?

La bioinformatique est l'analyse de la bioinformation.

La bioinformation est l'information liée aux molécules biologiques : leurs structures, leurs fonctions, leurs liens de "parenté", leurs interactions et leur intégration dans la cellule.

Divers domaines d'études permettent d'obtenir cette bioinformation : la génomique structurale, la génomique fonctionnelle, la protéomique, la détermination de la structure spatiale des molécules biologiques, la modélisation moléculaire ...etc .[16]

2. Comment ça marche ?

"La bioinformatique fournit des bases de données centrales, accessibles mondialement, qui permettent aux scientifiques de présenter, rechercher et analyser de l'information. Elle propose des logiciels d'analyse de données pour les études de données et les comparaisons et fournit des outils pour la modélisation, la visualisation, l'exploration et l'interprétation des données", selon une définition de l'Institut Suisse de Bioinformatique.[17]

Page 37 3. Ça sert à quoi ?

La bioinformatique sert donc à stocker, traiter et analyser de grandes quantités de données de biologie. Le but est de mieux comprendre et mieux connaître les phénomènes et processus biologiques. Grâce à ces nouvelles connaissances ainsi acquises, les chercheurs ont la possibilité de faire de nouvelles découvertes scientifiques. Des découvertes qui peuvent par exemple améliorer la qualité de vie de personnes malades grâce à la mise en place de nouveaux traitements médicaux plus efficaces.[17]

4. Les molécules supportées par la bioinformation :

Deux types de molécules support de la bioinformation : les acides nucléiques (ADN et ARN) et les protéines :

ADN : Acide Désoxyribonucléique ARN : Acide Ribonucléique Protéine -macromolécule : chaîne nucléotidique

-constituée par un enchaînement d'unités élémentaires : les désoxyribonucléotides - forme de stockage de l'information génétique. Cette information est

représentée par une suite linéaire de gènes. - formée de deux brins complémentaires enroulés en double hélice ce qui lui permet de se dupliquer en deux molécules

identiques entre elles et identiques à la molécule mère.

- On distingue :

l'ADN du génome du noyau

l'ADN du génome mitochondrial

l'ADN du génome chloroplastique

-macromolécule : chaîne nucléotidique

-constitué par un enchaînement d'unités élémentaires : les ribo nucléotides

-forme qui permet de transférer et de traiter l'information dans la cellule -le plus souvent formé d'un simple brin

-On distingue :

les ARN messagers : ils sont transcrits à partir d'un gène (ADN). Ils sont ensuite traduit en protéine les ARN de transfert

les ARN ribosomaux

les ARN nucléaires

-macromolécule : chaîne polypeptidique

-constitué par un enchaînement d'unités élémentaires : les acides aminés.

-l'ensemble des protéines assurent les principales fonctions cellulaires -se replie sur elle-même et adopte une conformation ou structure particulière dans l'espace. Cette structure tridimensionnelle est à l'origine de la fonction de la protéine et de la spécificité de cette fonction.

Page 38

Les ARN cytoplasmiques

Tableau 1 :Les molécules support par la bioinformation. [16]

Page 39 5. Les banques et les bases de données biologiques :

Les bases de données ont pour mission de rendre publiques la masse des données qui ont été déterminées. Par conséquent la quantité de données annotées qu’elles contiennent, le nombre de séquences, dont certaines ne sont plus disponibles ailleurs, leur grande diversité et la qualité des annotations en font des outils indispensables pour la communauté scientifique. Et leur utilisation se trouve au cœur des pratiques en matière de recherche. Voilà pourquoi leur utilisation est nécessaire au progrès scientifique. En biologie on distingue généralement deux types de bases de données biologiques :[18]

Les Bases généralistes :

Ce sont des Bases publiques internationales qui recensent des séquences d’ADN ou de protéines déterminées quelque soit l’organisme ou la méthode utilisée pour les acquérir. Elles présentent cependant quelques défauts qui ont conduit à la création de bases plus spécifiques : Les données qu’elles contiennent n’ont pas toujours été vérifiées, elles sont parfois trop diverses et nombreuses pour être exploitées efficacement et sont parfois mises à jour avec un certain retard.[18]

Les Bases spécialisées :

Devant la croissance quasi exponentielle des données et l'hétérogénéité des séquences contenues dans les principales bases de séquences généralistes, d'autres bases spécialisées sont apparues. Ce sont des bases dont les données ont été classées suivant une caractéristique biologique particulière comme les signaux de régulation, les régions promoteurs de gènes, les signatures peptidiques ou les gènes identiques issus d'espèces différentes.

L'utilisation des bases spécialisées comme les bases de motifs est devenue un outil essentiel dans l'analyse des séquences pour tenter de déterminer la fonction de protéines inconnues ou savoir à quelle famille appartient une séquence non encore caractérisée.[18]

6. La structuration de la bioinformation : fichiers et formats

Les séquences sont stockées en général sous forme de fichiers texte qui peuvent être soit des fichiers personnels (présents dans un espace personnel), soit des fichiers publics (séquences des banques) accessibles par des programmes interfaces (tels que SRS, GCG).

Le format correspond à l'ensemble des règles (contraintes) de présentation auxquelles sont soumises la ou les séquences dans un fichier donné.

Page 40 Le format permet :

- Une mise en forme automatisée

- Le stockage homogène de l'information

- Le traitement informatique ultérieur de l'information.

- Pour lire et traiter les séquences, les logiciels d'analyse autorisent un ou plusieurs format des données.[16]

7. applications actuelles de la bioinformatique :

On peut classer ces applications en différentes catégories compte-tenu de la diversité des domaines d'action de la bioinformatique.

- L'une des premières applications est bien sûr l'analyse de séquences qui peut aller de l'identification de gènes aux comparaisons de séquences en passant par la prédiction de motifs ou l'établissement de signatures.

- La structure des protéines nécessite l'usage de la bioinformatique, que ce soit pour la visualisation ou la prédiction de leur repliement.

- Un autre aspect de la bioinformatique réside dans son utilisation en phylogénie de façon à comparer les espèces à l'échelle moléculaire et obtenir ainsi un classement évolutif qui soit plus fiable.

- Des liaisons génétiques peuvent être établies grâce à la bio-informatique pour permettre de détecter des gènes candidats de maladies génétiques par exemple.

- Enfin, l'utilisation de la bio-informatique en génomique fonctionnelle permet de travailler sur le transcriptome, le protéome, l'intéractome...etc. [19]

Documents relatifs