• Aucun résultat trouvé

3.2 Le criblage virtuel basé sur la structure du ligand

3.2.2 Les méthodes globales

Les méthodes globales prennent en compte la structure moléculaire complète (car on ne sait pas où là-dedans se cachent les vrais points-clés déffinissant l’activité). Elles se basent sur le principe de la similitude : «des molécules similaires ont une plus forte chance de présenter des

activités similaires»(par rapport à n’importe qu’elle paire de composés choisie aléatoirement).

Les Hits, dans ce contexte-là, seront alors les molécules les plus similaires à la structure d’un actif connu, le composé-requête. Il reste à définir sur quelle base cette similitude sera évaluée : – Recherche basée sur les graphes : Dans cette méthode, les molécules sont représentées comme des graphes, c’est-à-dire des ensembles de sommets (les atomes) reliés entre eux

2.3 Le criblage virtuel

par des arêtes (les liaisons). La recherche peut ainsi se faire par sous-graphes, en utilisant des parties de la molécule comme requête ou par graphe complet. On va donc rechercher la meilleure correspondance entre les atomes et les liaisons de la requête par rapport aux atomes et aux liaisons des composés de la base de données (c’est-à-dire le sous-graphe connexe commun maximal, contenant le plus de noeuds). Cette méthode peut prendre ou non en compte les propriété physico-chimiques des atomes et des liaisons.

– Recherche basée sur la superposition : Cette technique essaye de superposer une molé- cule sur une autre. Pour les graphes moléculaires, cette superposition, improprement qualifiée de «2D» se fait en cherchant la correspondance entre les atomes de la molécule A et les atomes de la molécule B. En 3 dimensions, elle implique de trouver la meilleure superposition entre les deux objets tridimensionnels, en se basant soit sur les distances entre atomes, soit sur une distance par exemple entre les champs entourant les atomes. Il existe de nombreuses méthodes de superposition [11, 129, 182].

– Recherche basée sur des descripteurs : Cette méthode considère les molécules comme un ensemble de descripteurs (habituellement chiffrés), représentant des propriétés structu- rales ou physico-chimiques. Ainsi, une molécule est considérée comme étant un point dans un espace multidimensionnel de descripteurs : indices topologiques, propriétés physico-chimiques calculées, histogrammes de distribution des différentes propriétés locales(comptage de frag- ments, de multiplets d’atomes, etc). On détermine la similarité entre deux molécules grâce à des fonctions scoring [70].

Deuxième partie

Les méthodes de calcul de l’indice de

Wiener et ses extensions

Chapitre 3

L’indice de Wiener

Puisque la majorité des substances chimiques sont composées de molécules, et ces dernières pos- sèdent une structure, ce qui est connu depuis la moitié du dix-neuvième siècle, l’un des prin- cipaux objectifs de la chimie organique, est d’établir une relation entre des propriétés physico- chimiques des substances et leur structure moléculaire. En générale, ces propriétés (chimiques en particulier) connues comme nous avons vu au précédent chapitre et depuis la fin du 19ème siècle par les groupes fonctionnels, sont venues de la nature. L’évident exemple est, lorsque le composé possède la molécule −COOH ça explique automatiquement l’existence de l’acide dans la substance comportant cette molécule. L’ancienne tendance de la chimie organique est d’aller plus loin, des «méthodes de contribution des groupes», et d’essayer de quantifier, puis de classifier les molécules composant des composés plus complexes. Mais s’ai été toujours confronté par une problématique persistée dans les esprits de plusieurs scientifiques (informa- ticiens, chimistes, biologistes et même mathématiciens) depuis la fin des années quatre-vingts. Elle se base sur le fait qu’une structure moléculaire est une notion non numérique, par contre les propriétés physico-chimiques contenues dans les molécules sont des valeurs numériques. Plusieurs solutions ont été proposées. Mais, la seule sur laquelle, les modélateurs ont été d’ac- cord, est de quantifier tout d’abord l’information contenue dans la structure moléculaire, c’es-à- dire, on doit les transformer en des valeurs numériques qui les reflètent. Ce qui va les rendre plus ou mois équivalentes, et rendre aussi leur corrélation possible. Mais, jusqu’au début des années quatre-vingts, personne ne savait comment faire cette transformation, malgré les nombreuses tentatives qu’elles ont eues lieu dans ce sens. Mais il nous fallait attendre quelques chercheurs qui vont utiliser le soi-disant «l’indice topologique». Un indice topologique est un nombre réel qui est en quelque sorte calculé à partir de la molécule après l’avoir représentée en un graphe planaire, et pour lequel on croit qu’il reflète ses caractéristiques structurelles pertinentes. Le présent chapitre étudiera l’un des plus importants et anciens indices topologiques, l’indice

particuliers afin de savoir la complexité de cette définition, comme nous allons donner à travers ce chapitre quelques utilités des indices topologiques en prenant comme exemple l’indice de Wiener. Puis nous consacrons la deuxième section à nos premières contributions, qui portent sur la modification de la formule de définition de l’indice de Wiener et ses applications sur des graphes particuliers. Le troisième section dans ce chapitre va nous parler sur le type particulier des graphes le plus utilisé en théorie des graphe moléculaire, les arbres, en donnant quelques méthodes pour calculer leur indice de Wiener, afin de valoriser et voir l’importance de notre contribution. Ce chapitre terminera par une section traitant une notion très importante en graphe moléculaire en particulier et la théorie des graphes en générale, c’est la conjoncture

de Wiener.

1

La définition de base et ses applications