• Aucun résultat trouvé

Chapitre 4 : Développement d’un modèle de prédiction des MechoAs par

2) Matériels et Méthodes

Le set d’entraînement utilisé pour développer des alertes structurales et l'arbre de décision en découlant est composé de 301 molécules, qui proviennent du set de données (à la fois les sets d’entraînement et de validation) de notre première méthode. Notre set de validation pour la méthode présentée ici contient 491 molécules. Il se compose de nouvelles molécules non utilisées précédemment, issues de la base de données interne de KREATiS, et pour lesquelles nous avions des données de LC50 aiguë sur poisson. Le set a ensuite été complété par certaines substances avec des MechoAs spécifiques qui ne sont pas couverts par notre base de données. Les données du set d’entraînement peuvent être trouvées dans le fichier d'information de supplémentaire de notre publication, aussi placé en annexe A.1) Informations supplémentaires pour la publication « A New classification algorithm based on Mechanisms of Action. », et les données pour le set de validation sont présentées dans l’annexe A.2) Informations supplémentaires pour la méthode de prédiction des MechoAs par alertes structurales. Dans les sets d’entraînement et de validation, les informations sur les MechoAs ont été obtenues à partir de diverses sources dans la littérature publiée, dont (Enoch et

al., 2008; Fukuto, 1990; IARC, 2010; Kazius et al., 2005). Nous avons utilisé des données issues de tests

avec des mammifères (principalement des rats et des souris), des poissons, des invertébrés (principalement des daphnies), des algues, des plantes (principalement des herbes) et des protozoaires, mais la majorité des données sont sur les rats et souris et sur les poissons. Les références pour chaque attribution de MechoA sont données dans les tableaux des annexes A.1) et A.2).

Pour bien caractériser les relations entre la structure et le MechoA, nous avons la plupart du temps utilisé des alertes structurales uniquement basées sur la structure 2D et la connexion entre les atomes (règles topologiques), mais nous avons aussi eu recours à des alertes structurales basées sur la structure 3D pour évaluer la distance entre les groupes chimiques d’intérêt, pouvant conférer aux substances de bonnes capacités de liaison dans un site de liaison de protéine. À cette fin, les calculs de mécanique moléculaire avec le champ de force UFF sont suffisants, donc la méthode de calcul reste encore très rapide pour un calcul 3D. Plusieurs conformères stables existent souvent pour une molécule, mais il se peut que seulement un ou plusieurs d'entre eux satisfassent aux critères de la règle de décision et les autres non. Pour cette raison, l'étape d'optimisation 3D doit être effectuée avec soin pour s'assurer que la présence ou l'absence de ces conformères est bien identifiée. L'optimisation de la mécanique moléculaire et les mesures de distance ont été réalisées avec le logiciel Avogadro (Hanwell et al., 2013, 2012). Cette étape est importante pour les règles 19 et 20 qui détecteront respectivement les opioïdes et les ligands aux récepteurs de l’acétylcholine. Par exemple, prenons l'exemple de la règle 20 concernant les ligands aux récepteurs de l’acétylcholine pour montrer comment les alertes structurales ont été construites. En comparant les caractéristiques communes des ligands forts aux récepteurs de l'acétylcholine, on peut voir qu'un atome d'azote est toujours présent, et sera positivement chargé au pH physiologique. (Soit c'est un ammonium quaternaire, soit une amine protonée). De plus, il y a un fragment riche en électrons, capable d'accepter des liaisons H (par exemple un groupe ester ou alcool) et/ou participant à des interactions pi-pi (c’est-à-dire un cycle aromatique) pour améliorer la force de liaison. Selon les molécules, la distance entre l'azote et le fragment riche en électrons est comprise entre 4,3 et 5,3 Å. L'azote chargé positivement, le fragment riche en électrons et la distance entre les deux, ont alors été considérés comme les facteurs clés nécessaires à la liaison aux récepteurs de l'acétylcholine, et la détection de ces caractéristiques structurales sont utilisées dans la règle 20. Pour mesurer la distance avec des cycles aromatiques sans hétéroatome qui attire les

99

électrons, nous considérons le centre du cycle, car c'est là où une liaison H sera dirigée. Ces critères sont présentés avec la structure de certains ligands aux récepteurs de l’acétylcholine en Figure 40.

Figure 40 : ligands aux récepteurs de l’acétylcholine. A = acétylcholine. B = nicotine. C = muscarine. D = coniine. E =

atropine.

La Figure 40 montre que la coniine et l'atropine ont tous deux des écarts par rapport aux critères mentionnés ci-dessus (l'accepteur de liaison H manque dans le cas de la coniine ou est trop loin de l'azote dans le cas de l'atropine). Néanmoins, ces ligands ont encore une forte affinité de liaison pour les récepteurs d'acétylcholine, l'atropine pour les récepteurs muscariniques et la coniine pour les récepteurs nicotiniques, bien que contrairement aux autres exemples de la Figure 40, les effets sont antagonistes et non agonistes. Cette différence d'effet peut être due à une différence de capacité à former des liaisons H par rapport aux autres ligands. Une règle spécifique pour détecter des molécules comme l'atropine et la coniine a donc été formulée (règle n ° 17 dans l'arbre de décision).

Un autre cas où l’optimisation de la géométrie tridimensionnelle peut être cruciale est l’exemple théorique suivant :

Dans le cas de l’ester ci-dessous (Figure 41), une analyse par alerte structurelle qui ne tient pas compte de la géométrie de la molécule conclura que c’est un ester α,β-insaturé avec une délocalisation des électrons lui conférant une réactivité d’électrophile mou. Cependant, en calculant la géométrie

5.3 Å A 4.3 Å B 5.3 Å C 5.0 Å D 5.8 Å E 5.3 Å 4.3 Å 5.3 Å 5.0 Å 5.8 Å

100

optimale pour la molécule, on se rend compte qu’à cause des groupes encombrants du cycle, l’ester ne se tient pas dans le même plan que la double liaison du cycle, afin de minimiser les interactions de Van der Waals répulsives. En conséquence, les électrons ne sont pas délocalisés, et la molécule se comportera simplement comme un ester, qui exerce donc la pronarcose.

Figure 41 : Un ester α,β-insaturé dont les électrons ne sont pas délocalisés à cause de l’encombrement stérique. Pour appliquer certaines règles, il faut savoir si un cycle aromatique est pauvre ou riche en électrons. Cette propriété des cycles aromatiques joue un rôle crucial pour leur réactivité et apparemment également pour la facilité du métabolisme. Un cycle aromatique non substitué, comme le benzène, est considéré comme légèrement riche en électrons, car il comporte 6 électrons pi et aucun groupe attracteur d'électrons (GAE) pour les tirer hors du cycle. Cependant, si des GAEs sont présents sur le cycle, tels qu’un nitro, un chloro, un acide, un aldéhyde, un ester ou un amide, branchés du côté du carbonyle, etc., le cycle aromatique devient pauvre en électrons car les électrons sont principalement localisés vers les GAEs et une densité plus faible est présente sur le cycle. À l'inverse, les groupes donneurs d'électrons (GDE) donneront des électrons au cycle. Quelques exemples sont des groupes hydroxyle, alkoxyle, amino et alkyle (dans une moindre mesure). Certaines autres règles doivent prendre en compte le pKa des substances, car le pKa d'un éventuel groupe partant sera un facteur clé pour savoir s'il s'agit d'un bon ou mauvais groupe partant au pH physiologique. D'autre part, le découplage de la phosphorylation oxydative par les phénols dépend de leur capacité à transporter des protons à travers la membrane mitochondriale interne, qui est en partie contrôlée par leur pKa. Pour construire l'arbre de décision, nous avons dû trier les alertes structurales et les MechoAs correspondants, de sorte que le MechoA le plus toxique soit identifié d'abord et correctement attribué, avant que l'arbre de décision n'atteigne une autre règle qui utilise une autre sous-structure responsable d'un mécanisme moins toxique. Cet arbre de décision a été construit sous une forme linéaire, allant directement de la première question à la dernière question sans aucune ramification. Si une substance n’est caractérisée par aucune règle, elle sera non classée (Résultat de la réponse Non à la dernière question). En fait, deux facteurs importants sont en jeu pour discriminer quel MechoA entraîne la toxicité, lorsque plusieurs MechoA existent pour une même substance. Le premier paramètre est la puissance d'un MechoA donné. En effet, certains mécanismes perturbent des processus critiques au sein de l'organisme (comme la transmission du signal dans les synapses nerveuses), tandis que d'autres perturbent des processus moins essentiels ou nécessitent une plus grande quantité de molécules pour obtenir des effets observables (tels que la narcose). Le deuxième paramètre est la cinétique. Certains mécanismes sont très rapides, tandis que d'autres prennent du temps. Par exemple, certaines substances doivent d'abord être métabolisées pour exercer leur véritable effet toxique. C'est donc plus lent que lorsqu'une substance agit directement. C'est pourquoi les règles qui détectent des mécanismes impliquant le métabolisme sont placées après les règles pour

101

les mécanismes directs, mais avant les règles de détection de la narcose. La meilleure façon de juger si un mécanisme est plus puissant que l'autre est de prendre une substance qui présente des sous-structures permettant à plusieurs mécanismes de se produire. Mais de telles substances, on peut souvent observer que la toxicité est entraînée uniquement ou principalement par un seul de ces mécanismes. Par exemple, le pentachlorophénol, est un phénol acide et peut agir en tant que découpleur de la phosphorylation oxydative (Schultz, 1987). D'autre part, comme il s'agit d'un phénol, on peut s'attendre à ce qu'il exerce une narcose polaire. Les expériences et les modèles QSAR ont montré que l’ensemble des effets toxiques du pentachlorophénol est davantage dû à son mécanisme de découplage plutôt qu'à la narcose, car il a été démontré qu'il diminue fortement le taux de transfert d'électrons dans les membranes (Escher et al., 1999), tout en ayant un excès de toxicité par rapport à la toxicité qui serait prédite par les modèles de narcose polaire (Enoch et al., 2008; Schultz, 1987). De tels cas nous ont permis de trier les MechoAs et, par exemple, la règle de détection des découpleurs de la phosphorylation oxydative (règle n ° 31) a donc été placée avant la règle de détection des narcotiques polaires (règle n ° 57). Une autre méthode pour comprendre le MechoA critique d'une substance avec plusieurs MechoAs potentiels consiste à utiliser des expériences de toxicité de mélange, pour voir si la valeur de toxicité correspond à un modèle d'addition de concentration (fonctionnant uniquement pour des mélanges de substances avec le même MechoA) ou plutôt un modèle d’indépendance (Altenburger et al., 2000; Backhaus et al., 2000).

Cependant, lorsque plusieurs MechoAs sont identifiés comme jouant un rôle réel pour une même substance, tous les MechoAs sont donnés. Comme ces MechoAs peuvent jouer leur rôle dans différents délais (toxicité aigüe ou chronique) ou espèces, plusieurs règles de notation ont été mises en place pour décrire l'information complète de MechoA pour chaque substance : un 'C' avant le numéro d’un MechoA signifie qu'il est seulement observable dans les études chroniques, mais pas aigües. Par défaut, si aucun 'C' n'est présent, le MechoA s'applique à l’échelle d’un test de toxicité aigüe. Certaines abréviations sont également placées avant le numéro des MechoAs pour désigner des MechoAs spécifiques aux espèces. 'm' signifie pour les mammifères, 'h' pour les humains, 'f' pour les poissons, 'p' pour les plantes, 'u' pour les organismes unicellulaires, 'd' pour les daphnies. '#' Avant ces lettres signifie "pour toutes les espèces sauf celles-ci". Par exemple, #up5.2 signifie MechoA 5.2 pour toutes les espèces, sauf les unicellulaires et les plantes. '&' signifie que les deux MechoAs jouent un rôle. '/' signifie qu'il est incertain si un ou plusieurs des MechoAs sont présents et sont critiques pour la toxicité. Ils sont écrits dans l'ordre de la certitude décroissante, où le premier est le plus probable. Par exemple, 1.2 & m4.3 / 3.1 signifie que ce composé est censé exercer une narcose polaire (1.2), avec une métabolisation en composés réactifs pour les mammifères (m4.3), et pourrait être capable d'agir par un mécanisme réactif direct (3.1). Enfin, nous avons défini un ordre pour les différentes espèces : le MechoA pour les poissons et les mammifères est mis en premier, les informations sur les autres espèces arrivent ensuite. S'il existe une certitude équivalente pour les poissons et les mammifères, le MechoA pour les poissons est placé en premier. Ces règles ont déjà été utilisées dans notre publication précédente (voir chapitre 4).