• Aucun résultat trouvé

Application sur les données de la simulation

Chapitre IV : Modèles de régression multivariés pour la résolution du problème inverse

IV.4. Analyse par régression aux moindres carrés partiels

IV.4.2. Implémentation de la NLPLSR

IV.4.3.1. Application sur les données de la simulation

        N i N i i i i i N i i i i i y y y y y y y y R 1 1 2 2 2 1 2 ˆ ˆ ) ˆ ˆ )( ( (IV.30)

y est la valeur des propriétés du matériau, i yˆ est la valeur de la prédiction par le modèle i

NLPLSR, y et i i sont les moyennes des y et i yˆ respectivement, et N est le nombre i

d'exemples dans la base de données.

IV.4.3. Résultats et discussions

IV.4.3.1. Application sur les données de la simulation

Comme il a été mentionné précédemment, le nombre des composantes latentes a un rôle crucial sur la qualité de prédiction d'un modèle PLSR. La figure IV.8 montre les évolutions de la moyenne de CV-RMSE, sur les 10 bases de validation, en fonction du nombre de variables latentes. Ces évolutions ont été obtenues en utilisant deux bases de données : une construite pour les échantillons liquides et l’autre pour les échantillons solides. partir de ces courbes, on peut remarquer que pour fournir simultanément ε' et ε'' (R = 2) pour les échantillons solides et liquides, 6 et 9 composantes ont été retenues, respectivement. De plus, ça se voit clairement qu’au-delà de ces nombres de composantes principales, les deux modèles entrent dans le phénomène de sur-apprentissage (Over-fitting). En outre, on peut constater le haut niveau d'entrainement (Très faible

CV-RMSE) atteint avec un nombre réduit de variables latentes.

Chapitre IV Modèles de régression multivariés pour la résolution du problème inverse

- 98 -

Afin d'illustrer le choix du nombre de variables latentes, le rapport entre la variance de Y et la variance de son approximation par la PLSR (TQ') est calculé, c'est à dire Var (TQ') / Var (Y). La figure IV.9 présente la variation de ce rapport en fonction du nombre de variables latentes. Cette figure comporte deux courbes similaires : une correspond aux liquides et l’autre aux solides. Ces courbes montrent bien que le maximum de la variance dans Y (≈ 00%) est largement expliqué par les variables latentes retenues (29 pour les liquides et 26 pour les solides) en utilisant la procédure de la validation croisée. On remarque, clairement, que plus de 97% de la variance est expliquée par les cinq premières variables latentes. La figure IV.10 montre que la variance expliquée dans X (Var (TP') / Var (X)) par l'analyse PLSR a atteint son maximum (≈ 00%) en utilisant le nombre optimal de variables latentes. Au-delà de ce nombre, la contribution des composantes de rang supérieur est négligeable et elles pourraient être largement affectées par le bruit lors de l'inversion des mesures. Habituellement, ce type de figures donne une idée sur le nombre de variables latentes qui peuvent être, raisonnablement, extraits par la méthode PLSR, contrairement à la figure IV.9 qui indique le nombre approprié de variables latentes requis pour l'inversion des mesures.

- 99 -

Figure IV.10. Pourcentage de la variance de X exprimé par la PLSR.

Afin d'évaluer les performances des modèles NLPLSR, ils ont été appliqués pour prédire les valeurs de la permittivité inclus dans la base de test, pour les diélectriques liquides et solides. Dans les figures IV.11 et IV.12, les valeurs prédites de la permittivité (Sorties simultanées du modèle NLPLSR) sont tracées en fonction des valeurs souhaitées (Valeurs vraies), ceci pour les parties réelles et imaginaires. Les points tracés, dans chaque figure, forment une droite avec une pente de un, ce qui signifie qu'ils correspondent bien à une équation de forme yˆ y (Permittivité estimée = permittivité désirée).

D'après le tableau IV.6, qui résume les performances de chaque modèle, on peut dire que les

RMSEP et les R2pred calculés sur la base de test montrent bien la très bonne précision obtenue, et par conséquent la très bonne généralisation.

D'après certaines recherches, un modèle est qualifié de bon lorsque l'RMSEC et l'RMSEP sont proches, ce qui est le cas pour cette application [Rahm 16].

Tableau IV.6. Performances des deux modèles NLPLSR.

Sorties Base de calibration Base de test

RMSEC R2cal RMSEP R2pred

NLPLSR liquides et  7.6275×10-3 0.9999999 8.0919×10-2 0.9999920 NLPLSR solides et  5.0037×10-3 0.9999966 6.0690×10-3 0.9999953

Chapitre IV Modèles de régression multivariés pour la résolution du problème inverse

- 100 -

(a) (b)

Figure IV.11. Comparaison entre les permittivités fournies par la NLPLSR et celles contenue dans la base de test dédiée aux liquides, (a) partie réelle ε', (b) partie imaginaire ε".

(a) (b)

Figure IV.12. Comparaison entre les permittivités fournies par la NLPLSR et celles contenue dans la base de test dédiée aux solides, (a) partie réelle ε', (b) partie imaginaire ε".

IV.4.3.2. Application sur les données expérimentales

Une fois le modèle NLPLSR prouve son efficacité sur les données de simulation, il pourra également être utilisé pour l'inversion des données expérimentales. Comme précédemment, les mesures ont été effectuées en utilisant un analyseur d'impédance Agilent 4291A sur la cellule de mesure SuperMit (Figures III.20 et III.23).

Notons ici que la matrice des prédicteurs résultant des mesures (Xmes) a subi la même transformation que la matrice X (De même que pour le cas de la MLR) des données simulées. Par conséquent, le nombre de prédicteurs est passé de 3 à 44 prédicteurs centrés et normalisés xmes

- 101 -

xmes = fmesi * Gmesj * Bmesk, i = -2, ..., 2, j = 0, ..., 2 et k = 0, ..., 2 (IV.31) Ici encore, la combinaison lorsque i=j=k=0 est exclue.

Maintenant, la nouvelle matrice des prédicteurs expérimentaux Xmes a la forme suivante :

es=

( / mes) ( mes/ mes) . ( / mes) ( mes/ mes) .

. . .

. . .

. . .

( / mes)

mes ( mes/ mes)

mes . . ( mes) . . ( mes) . . . . . . . . . . . ( mes) mes .

. . ( mes mes mes) . . ( mes mes mes)

. . .

. . .

. . .

. . ( mes mes mes)

mes ( mes )

(IV.32)

où Nmes est le nombre de fréquences de mesure (201).

La raison pour laquelle les indices j et k commencent par 0, contrairement à l'indice i, est d'éviter, en phase de génération (Équations IV.9 et IV.31), les valeurs élevées des prédicteurs lors de la division par Gmes, Gmes2, Bmes et Bmes2. Ce raisonnement est surtout valable pour le cas du PEEK qui est connu comme un matériau sans perte (G très faible). Par conséquent, nous aurons des matrices de prédicteurs de tailles réduites et moins de variables latentes à calculer, donc le modèle NLPLSR devient plus simple et plus rapide. Notons que tous les 44 prédicteurs sont multipliés par BPLS pour obtenir l'inversion des mesures : Ymes = XmesBPLS + F, quel que soit le

nombre optimal de variables latentes retenues par la validation croisée.

La figure IV.13 montre les résultats de l'inversion des mesures expérimentales en utilisant le modèle NLPLSR pour l'Éthanol, l'eau et le PEEK ainsi que ceux issus de l'inversion itérative. Une bonne concordance entre les résultats obtenus par les deux procédures peut être observée. De plus, ces résultats s'accordent bien avec les études précédentes [Acik 07, 08 ; Haci 10, 11 ; Kupf 05 ; Buck 58 ; Wagn 14 ; Raje 08].

Chapitre IV Modèles de régression multivariés pour la résolution du problème inverse

- 102 - (a) Éthanol

(b) Eau

(c) PEEK

- 103 -