• Aucun résultat trouvé

Analyse statistique pour les modèles de prédiction des temps de rétention prédiction des temps de rétention

Méthode acide

Dans l’idée d’obtenir un modèle acceptable, une étude systématique est réalisée. Pour commencer, on considère un modèle strictement linéaire impliquant l’ensemble des paramètres physico-chimiques disponibles, ainsi qu’une constante :

• Coefficient 1 : logP

• Coefficient 2 : logD à pH 3,5

• Coefficient 3 : charge nette positive à pH 3,5 • Coefficient 4 : charge nette négative à pH 3,5

• Coefficient 5 : nombre de liaisons autorisant une rotation • Coefficient 6 : masse exacte

• Coefficient 7 : nombre d’atomes acceptant des liaisons hydrogènes • Coefficient 8 : nombre d’atomes des donnant liaisons hydrogènes • Coefficient 9 : constante

Ce premier modèle, disponible en Figure 90, bien que démontrant une qualité de régression acceptable, présente un nombre important de paramètres ayant des probabilités (p) élevés, non-significatifs.

Figure 90 – Modèle linéaire à 8 coefficients et une constante pour la méthode acide.

Pour tenter de trouver le meilleur modèle, on retire le plus mauvais coefficient, i.e. le coefficient ayant le p le plus grand, et on itère jusqu’à obtenir un modèle dont tous les coefficients sont statistiquement significatifs. Cette itération, non présentée ici, nous conduit à un modèle à trois paramètres présentés en Figure 91 :

• Coefficient 1 : logD à pH 3,5

• Coefficient 2 : charge nette négative à pH 3,5 • Coefficient 3 : constante

Figure 91 – Modèle linéaire à 2 coefficients et une constante pour la méthode acide. Les p indiqués à 0 signifient que leur valeur est inférieure à 10-16, non qu’ils soient strictement nuls.

Le fait que le meilleur modèle soit basé sur le logD et la charge nette négative au pH de travail est révélateur des interactions majoritaires qui se produisent au niveau de la colonne. Ainsi, le coefficient de partage et les interactions ioniques semblent privilégiées sur cette colonne et à ce pH.

Même si ce modèle est satisfaisant d’un point de vue statistique, on se doit d’ajouter la connaissance de ce que l’on cherche à modéliser. Ainsi, on note qu’il manque un type d’interaction dans le modèle : les interactions de type liaisons hydrogènes. Il convient donc de les ajouter au modèle pour ne pas négliger des effets qui peuvent être important pour certaines molécules. Des tests sur des échantillons complexes indiquent également une distribution hyperbolique des temps de rétention avec la masse, pouvant indiquer que la masse est influente avec un terme de type hyperbolique. Ces ajouts nous conduisent à un modèle à 6 coefficients, montré en Figure 92 :

Figure 92 – Modèle à 5 coefficients dont un hyperbolique et une constante pour la méthode acide.

Les coefficients retenus pour ce modèle sont les suivants : • Coefficient 1 : logD à pH 3,5

• Coefficient 2 : charge nette négative à pH 3,5

• Coefficient 4 : nombre d’atomes acceptant des liaisons hydrogènes • Coefficient 5 : 1 ÷ masse exacte

• Coefficient 6 : constante

On notera également, entre ce dernier modèle et celui à trois coefficients, que la qualité de la régression a augmentée (R2 est passé de 0,89 à 0,91) tout en conservant une fenêtre de précision égale. Ce modèle possède également des coefficients que l’on pourrait considérer non-significatif, mais le sens physique du modèle a plus d’importance dans ce cas. Ce modèle est donc celui retenu comme représentant au mieux les interactions se déroulant au sein de la colonne, et est utilisé par la suite pour effectuer des prédictions de composés inconnus.

Méthode basique

De la même manière que pour la méthode acide, une étude statistique systématique est effectuée dans le but d’obtenir un modèle statistiquement acceptable. Pour commencer, on considère un modèle strictement linéaire impliquant l’ensemble des paramètres physico-chimiques disponibles, ainsi qu’une constante :

• Coefficient 1 : logP

• Coefficient 2 : logD à pH 9

• Coefficient 3 : charge nette positive à pH 9 • Coefficient 4 : charge nette négative à pH 9

• Coefficient 5 : nombre de liaisons autorisant une rotation • Coefficient 6 : masse exacte

• Coefficient 7 : nombre d’atomes donnant des liaisons hydrogènes • Coefficient 8 : nombre d’atomes acceptant des liaisons hydrogènes • Coefficient 9 : constante

Ce premier modèle, disponible en Figure 93, bien que démontrant une qualité de régression acceptable, présente un nombre important de paramètres ayant des p élevés, non-significatifs.

Figure 93 – Modèle linéaire à 8 coefficients et une constante pour la méthode basique.

Pour tenter de trouver le meilleur modèle, on retire le plus mauvais coefficient, i.e. le coefficient ayant le p le plus grand, et on itère jusqu’à obtenir un modèle dont tous les coefficients sont statistiquement significatifs. Cette itération, non présentée ici, nous conduit à un modèle à six paramètres présentés en Figure 94 :

• Coefficient 1 : logP

• Coefficient 2 : logD à pH 9

• Coefficient 4 : masse exacte

• Coefficient 5 : nombre d’atomes acceptant des liaisons hydrogènes • Coefficient 6 : constante

Figure 94 – Modèle linéaire à 5 coefficients et une constante pour la méthode basique.

La significativité de cinq paramètres physico-chimiques à pH basique comparé aux trois à pH acide révèle que les critères de séparation à pH basique sont plus complexes à interpréter qu’à pH acide. On notera également un manque de composés éluant entre 20 et 30 minutes, limitant la gamme de paramètres physico-chimiques pris en compte par ce modèle. Ceci explique également l’erreur plus importante de prédiction des quatre composés très retenus.

De la même manière que pour la méthode acide, on rajoute au modèle la seconde interaction hydrogène et on change la masse exacte en paramètre hyperbolique. Ces ajouts nous conduisent à un modèle à sept coefficients, montré en Figure 95 :

Figure 95 – Modèle à 6 coefficients dont un hyperbolique et une constante pour la méthode basique.

Les coefficients retenus pour ce modèle sont les suivants : • Coefficient 1 : logP

• Coefficient 2 : logD à pH 9

• Coefficient 3 : charge nette positive à pH 9 • Coefficient 4 : 1 ÷ masse exacte

• Coefficient 5 : nombre d’atomes donnant des liaisons hydrogènes • Coefficient 6 : nombre d’atomes acceptant des liaisons hydrogènes • Coefficient 7 : constante

Ce modèle possède également des coefficients que l’on pourrait considérer non-significatif, mais le sens physique du modèle a plus d’importance dans ce cas. Ce modèle est donc celui retenu comme représentant au mieux les interactions se déroulant au sein de la colonne, et est utilisé par la suite pour effectuer des prédictions de composés inconnus.

Annexe III. Résumé des méthodes techniques et