• Aucun résultat trouvé

4.5 M´ ethode de quantification du fer

4.5.6 Courbe de calibration et incertitude du mod` ele

echantillon) obtenus sur deux jeux de donn´ees : les ´echantillons de m´elange entre le JSC-M dop´e en ilm´enite et les oxydes de fer (h´ematite, magn´etite et goethite) en rouge, et les cibles de calibration du rover en noir et bleu pour diff`erents instruments LIBS. Les barres d’erreurs correspondent `a l’´ecart type des facteurs de corr´elation obtenu par ´echantillons. Les trois plus importantes dispersions sont observ´ees pour les cibles de calibration s´edimentaires, connues pour leur plus importante taille de grain qui produit une h´et´erog´en´eit´e d’analyse (Clegget al., 2017).

Les moyennes absolues des diff´erences des coefficients de corr´elation pour l’ensemble des ´ echan-tillons sont relativement faibles puisqu’elles correspondent `a 0.026 pour les r´esultats IRAP et LANL, 0.042 pour les r´esultats LANL et ChemCam, et 0.027 pour les r´esultats IRAP et ChemCam (bien que pour ce dernier, le faible nombre d’´echantillons ne rende pas la conclusion statistiquement robuste).

Des tests statistiques permettent de comparer les distributions de plusieurs s´eries de donn´ees. Les distributions ne suivant pas des lois normales, un test non param´etrique de Kolmogorov-Smirnov est utilis´e. Le principe de ce test repose sur la comparaison des deux distributions empiriques au moyen des fonctions de r´epartition et de l’´ecart maximum qui existe entre elles. Les r´esultats des tests (au seuil

α=0.01) montrent que pour les 3 s´eries d’´echantillons, les distributions sont identiques, ce qui permet de supporter la validit´e de notre m´ethode pour s’affranchir des effets li´es `a chaque dispositif analytique.

4.5.6 Courbe de calibration et incertitude du mod`ele

La courbe de calibration repr´esentant les facteurs de corr´elation Fe en fonction des abondances r´eelles dans les ´echantillons est repr´esent´ee en Figure 4.12. Nous utilisons pour ´etablir cette courbe de calibration les donn´ees point `a point (et non pas une moyenne par ´echantillon) de mani`ere `a pouvoir pr´edire une abondance en fer sur des cibles martiennes pour un point d’analyse donn´e (et non pas une moyenne de 5 points d’analyse). Une r´egression polynomiale ajustant au mieux l’ensemble des points est retenue. L’´equation de cette r´egression permet de pr´edire une concentration en fer `a partir d’un coefficient de corr´elation donn´e. L’´equation correspondante est donn´ee ci-dessous :

y= a+c×X+e×X2+g×X3+i×X4

avec :

a= 6.528×102; b= -5.63×102; c= 2.811×102; d= -9.58×104; e= -3.73×10−3; f= 1.25×10−4; g= 1.59×10−4; h= -1.1087×10−6

et i= -1.2422×106

Plusieurs polynˆomes (jusqu’au degr´e 6) ont ´et´e test´es, et le choix d’utiliser ce polynˆome de degr´e 4 est fait car il donne le meilleur ajustement et le plus faible r´esidu (pr´esent´e en Annexe C.5). Cette courbe de calibration ne pr´esente pas une relation lin´eaire entre les facteurs de corr´elation et les abondances en fer dans les cibles (Figure 4.12). Un tel ph´enom`ene est inh´erent `a la m´ethode et est li´e `a la dynamique des raies du fer en LIBS. En effet, au-del`a d’une certaine abondance (∼30 wt.% FeOT), l’intensit´e des raies du fer ´evolue plus lentement avec l’augmentation de la concentration en fer, et les raies des autres ´el´ements deviennent n´egligeables. L’intensit´e n’´etant pas corr´el´ee lin´eairement avec la concentration, cela conduit `

a un changement dans la pente du mod`ele. Cette plus faible dynamique illustre la complexit´e d’´etablir une m´ethode de quantification robuste dans toutes les gammes de concentrations en fer. Cette plus faible dynamique va n´ecessairement impliquer une hausse de l’incertitude dans la pr´ediction d’´echantillons poss´edant des hautes teneurs en fer.

Figure 4.12 – Courbe de calibration repr´esentant les facteurs de corr´elation du fer obtenus avec les composantes fer en fonction de l’abondance r´eelle pour chaque ´echantillon. Les ´echantillons provenant des instruments IRAP et LANL sont repr´esent´es. La r´egression polynomiale ajustant au mieux l’ensemble des points est figur´ee par la ligne en tirets. Les intervalles de confiance et les intervalles de pr´ediction (95 %) sont repr´esent´es respectivement en rouge et bleu. Le spectre de l’´echantillon K1919 dop´e avec 50 wt.% d’h´ematite provient de l’´etude de Andersonet al.(2017a) avec l’instrument du LANL.

Parmi les cinq points d’analyse par ´echantillon, la dispersion des facteurs de corr´elation est relativement faible (une fois les points aberrants correspondant au probl`eme d’homog´en´eit´e retir´es). Cela traduit une bonne r´ep´etabilit´e des analyses LIBS. La dispersion observ´ee dans la Figure 4.12 (en parti-culier pour les faibles abondances de la droite de calibration) est ainsi plutˆot li´ee `a des effets de matrice entre ´echantillons (et non pas au sein d’un mˆeme ´echantillon), induits par l’importante gamme d’assem-blages min´eralogiques utilis´ee par le mod`ele. Cette observation est importante car elle montre que dans la gamme 15-30 wt.% FeOT, le mod`ele semble bon pour identifier des variations de concentration en fer dans une matrice similaire. En effet, on ne s’attend pas `a observer des changements drastiques de l’assemblage min´eralogique dans les roches s´edimentaires d’une unit´e stratigraphique donn´ee, telle que la ride de VRR.

Les r´esultats de quantification du mod`ele en fonction de la valeur r´eelle pour chaque ´echantillon sont repr´esent´es sur la Figure 4.13.a, et montrent une corr´elation relativement bonne (R2=0.93), malgr´e une certaine variabilit´e observ´ee pour les abondances FeOT >50 wt.%. Pour caract´eriser l’incertitude de notre mod`ele, nous d´eterminons l’erreur quadratique moyenne (RMSE : Root Mean Square Error) qui nous donne la taille des ´ecarts entre notre pr´ediction et les abondances r´eelles. Ce param`etre est fr´equemment utilis´e pour quantifier la robustesse des mod`eles de quantification ChemCam (e.g., Rapin, 2016; Clegget al., 2017; Payreet al., 2017).

Figure 4.13 – a) Abondance en fer (wt.%) pr´edite par le mod`ele en fonction de l’abondance r´eelle (wt.%) pour chaque point d’observation acquis sur nos standards g´eologiques. La droite noire correspond `

a une relation 1 :1, et la droite bleue (en pointill´e) correspond `a la r´egression lin´eaire de l’ensemble des points (R2=0.93). b) Racine de l’erreur moyenne quadratique (RMSE) du mod`ele en fonction de la concentration r´eelle en fer dans les ´echantillons. La RMSE est calcul´ee sur l’ensemble des ´echantillons qui ont une concentration en fer comprise dans une fenˆetre de±10 wt.% FeOT.

L’enrichissement de la base de calibration ChemCam d´ej`a existante porte `a 2350 le nombre de points d’observation LIBS servant au calcul des RMSE. Pour chaque abondance en fer, une RMSE est calcul´ee sur l’ensemble des ´echantillons qui ont une concentration en fer comprise dans une fenˆetre de

±10 wt.% FeOT. Une m´ethode similaire est utilis´ee pour estimer l’incertitude de la m´ethode de quan-tification MOC des donn´ees ChemCam (Clegget al., 2017). Les RMSE correspondantes sont pr´esent´ees dans la Figure 4.13.b. Le niveau de confiance dans la RMSE est directement d´ependant du nombre to-tal d’´echantillons pr´esents par gamme de composition. `A titre d’exemple, la RMSE de ce mod`ele pour des concentrations en fer typique des roches du crat`ere Gale (∼20 wt.% FeOT) est inf´erieure `a 3 wt.% FeOT. Pour une abondance similaire, le mod`ele MOC poss`ede une RMSE de l’ordre de 8.5 wt.% FeOT

(Clegg et al., 2017). En revanche, notre mod`ele semble assez inop´erant autour de 40-60 wt.% FeOT (Fi-gure 4.13.b), mais s’am´eliore de nouveau pour les concentrations en fer les plus importantes (>60 wt.% FeOT).

La pr´ecision d’un mod`ele est parfois quantifi´ee grˆace `a la RMSEP (Root Mean Square Error of Prediction) comme dans l’´etude de Wienset al.(2013) ou Lasueet al.(2016), qui revient `a calculer une RMSE `a partir d’´echantillons non pr´esents dans la base de calibration. Cependant, au vu du faible nombre d’´echantillons poss´edant des abondances sup´erieures `a 20 wt.% FeOT, nous estimons que le retrait d’un jeu al´eatoire pour le calcul de la RMSEP d´egraderait la r´egression pour les hautes abondances, et donc

le mod`ele.