• Aucun résultat trouvé

Démarche analytique : matériels et méthodes associés

3.2.3 Acquisition des spectres MIR

Les produits lourds sont analysés en spectroscopie MIR en mode ATR. Le spectro-mètre utilisé est un ThermoOptek Nicolet équipé d’un détecteur DTGS. L’accessoire ATR fonctionne en mono-réflexion. Il est muni d’un cristal en diamant entouré d’une plaque chauffante (Golden Gate d’Eurolabo).

Le protocole expérimental consiste à homogénéiser l’échantillon à température am-biante et à déposer un petit volume sur le cristal. La plaque chauffante permet l’acquisition du spectre à 100 ± 1C. Du fait du faible volume déposé, l’échantillon est instantanément stabilisé en température. Le spectre MIR est alors enregistré entre 4000 et 500 cm-1 avec une résolution de 4 cm-1et 64 scans sont réalisés. Le cristal diamant coupe le signal à 650 cm-1. Les spectres seront donc présentés par la suite sur le domaine 4000-650 cm-1.

spectrale est jugée satisfaisante si la différence entre eux, calculée longueur d’onde par longueur d’onde, ne dépasse pas 6.10-3unités d’absorbance. Les spectres analysés sont très sensibles aux variations de la teneur en eau et en dioxyde de carbone dans l’atmosphère. Ainsi, un spectre de référence est réalisé avant chaque acquisition. Enfin, le cristal est nettoyé à l’acétone entre chaque acquisition. L’analyse d’un échantillon par spectroscopie MIR nécessite environ 10 minutes.

3.3 Les algorithmes génétiques (AG)

Nous avons abordé dans la Partie 3.1, la nécessité de sélectionner les domaines spec-traux d’intérêt et d’appliquer des prétraitements afin de réduire les interférences physico-chimiques. De plus, Spiegelman et al. ont justifié théoriquement l’apport de la sélection de variables et ont montré qu’elle permettait d’améliorer les performances et la robustesse des modèles. De nombreuses méthodes de sélection de variables ont été développées. Elles ne sont pas décrites dans le détail ici mais le lecteur peut se référer à la "review" de Xiabo

et al. [113]. Ces auteurs ont classé ces techniques de sélection de variables en cinq classes :

– les approches manuelles, basée sur les connaissances spectroscopiques (équivalent au choix des domaines spectraux d’intérêt) ;

– les méthodes de sélection univariées et séquentielles [97, 101] ;

– les méthodes "sophistiquées" : successive projections algorithm (SPA) [3] et

uninfor-mative Variable Elimination (UVE) [20] ;

– les algorithmes basés sur la sélection de variables par intervalle tels que l’Interval

Partial Least Squares (iPLS) [83], la windows PLS [33, 59, 115] et l’iterative PLS

[2, 22] ;

– les stratégies basées sur la recherche élaborée telles que le recuit simulé [58, 61, 98], les réseaux de neurones artificiels [16, 102] et les algorithmes génétiques (AG) [62, 64, 65].

Dans la littérature, ces méthodes de sélection de variables ont toutes montré leur efficacité pour l’amélioration du pouvoir prédictif d’étalonnage multivarié dans diverses applications. Lorsqu’une méthode de sélection de variables est appliquée, l’optimisation

3.3. LES ALGORITHMES GÉNÉTIQUES

du prétraitement et de la sélection de variables est généralement effectuée séparément. Nous avons abordé le fait qu’une démarche essai erreur peut-être longue et fastidieuse, en particulier lors de l’application d’une méthode de sélection de variables qui est chrono-phage. Un nombre restreint de prétraitements est alors testé. Cette démarche est justifiée car la méthode de prétraitement est généralement appliquée pour corriger des variations non-désirées, identifiables et souvent liées à des phénomènes physiques. La sélection de variables a ensuite pour objet d’identifier l’information spectrale qui est pertinente pour la description de la propriété considérée. Cependant, l’application d’un prétraitement peut, dans certains cas, également modifier l’information chimique. La sélection de variables est alors dépendante du choix du prétraitement appliqué en amont ce qui laisse penser qu’elle est potentiellement non-optimale.

Par conséquent, nous proposons d’évaluer le potentiel de l’application d’un algorithme pour l’optimisation simultanée du choix du (ou des) prétraitement(s) et de la sélection de variables. Il existe dans la littérature de nombreux algorithmes d’optimisation :

– les méthodes "Monte Carlo" [32, 48]

– les méthodes hybrides tels que la méthode des gradients [95] – le recuit simulé [55, 61, 99]

– les algorithmes évolutionnistes tels que les AG [53]

Ces algorithmes d’optimisation n’ont cependant pas les mêmes performances en termes d’exploration (recherche globale) et d’exploitation (recherche locale) dans l’espace des so-lutions potentielles. En effet, les méthodes Monte Carlo permettent une bonne exploration puisque tout point a une probabilité identique d’être atteint. Cependant, aucune exploita-tion des résultats déjà obtenus n’est effectuée. Avec la méthode des gradients, l’exploraexploita-tion est moindre mais l’exploitation des données précédentes par l’intermédiaire des gradients permet une bonne recherche locale. Enfin, les algorithmes évolutionnaires offrent un bon compromis entre l’exploration et l’exploitation [7, 8].

Les AG appartiennent à la famille des algorithmes évolutionnistes (ou évolutionnaires). Ils sont inspirés de la théorie de l’évolution des espèces par la sélection naturelle. Selon la théorie de l’évolution par la sélection naturelle, au cours des générations, les êtres les plus adaptés à leur environnement tendent à survivre plus longtemps et à se reproduire plus

aisément. Ainsi, les caractéristiques génétiques conservés au sein d’une population donnée sont ceux qui sont les plus adaptés aux besoins de l’espèce vis à vis de son environnement. Ainsi, les espèces ont tendance à évoluer ("se perfectionner") au cours du temps car le patrimoine génétique des individus qui la composent "s’améliore". Les AG vont reproduire ce modèle d’évolution dans le but de trouver des solutions à un problème d’optimisation. Le principe des AG est donc de simuler l’évolution d’une population d’individus auxquels différents opérateurs génétiques sont appliqués et que l’on soumet, à chaque génération, à une sélection en fonction de leur adaptation à leur environnement. Les AG ont été intro-duits par Holland en 1975 [53]. Cependant, leur utilisation est récente du fait des ressources informatiques qu’ils requièrent. Les AG sont utilisés dans de nombreux domaines tels que le traitement d’image [104], l’optimisation d’emplois du temps, l’optimisation de design ou de contrôle de systèmes industriels [7], en chimie pour la modélisation moléculaire [30] et en chimiométrie pour la sélection de variables [62, 64, 65].

Nous décrirons dans cette partie le principe général de la procédure d’optimisation par AG. Nous présenterons par la suite l’application des algorithmes génétiques à l’opti-misation simultanée des prétraitements et des variables à sélectionner.