Régression PLS et applications.

(1)

HAL Id: hal-01604598

https://hal.archives-ouvertes.fr/hal-01604598

Submitted on 1 Jun 2020

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Distributed under a Creative Commons Attribution - ShareAlike| 4.0 International

License

Régression PLS et applications.

M. Tenenhaus, Jean-Pierre Gauchi, C. Ménardo

To cite this version:

(2)

R

EVUE DE STATISTIQUE APPLIQUÉE

M. T

ENENHAUS

J.-P. G

AUCHI

C. M

ÉNARDO

Régression PLS et applications

Revue de statistique appliquée, tome 43, n

o

_{1 (1995), p. 7-63}

<http://www.numdam.org/item?id=RSA_1995__43_1_7_0>

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi-tions générales d’utilisation (http://www.numdam.org/legal.php). Toute utili-sation commerciale ou impression systématique est constitutive d’une in-fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

(3)

RÉGRESSION

PLS ET

APPLICATIONS

M. Tenenhaus

(1),

J.-P. Gauchi

(2),

C. Ménardo

(3)

(1 )

Groupe

HEC,

Jouy-en-Josas

(2)

Rhône-Poulenc, CRA, Aubervilliers

(3)

Rhône-Poulenc, CRIT, Décines

_Charpieu

RÉSUMÉ

La

_régression

PLS permet de relier un ensemble de variables

_dépendantes

Y

-1 Y,, .... Yp }

à un ensemble de variables

_{indépendantes}

X =

{Xi,..., Xm 1 lorsque

le nombre de variables

_{indépendantes}

et/ou

_dépendantes

est élevé. La

_régression

PLS consiste à effectuer

une

_analyse

en _composantes

_principales

de l’ensemble de variables X sous la contrainte que les

(pseudo-)

composantes

principales

des

_Xj

soient aussi

«explicatives»

que

possible

de l’ensemble de variables Y. Il est alors

possible

de

_prédire

les

_Yk

à

_partir

des

_Xj

en

_séparant

mieux le

_signal

(ce

qui

est

_{synthétique,}

structuré, commun aux

_données)

du bruit (ce

qui

est

_plus

spécifique

à l’échantillon de données

_étudié).

Nous

_présentons

dans cet article la

régression

PLS d’un

_point

de vue

_{« analyse}

des données »,

puis

exposons deux

applications

industrielles,

l’une réalisée au Centre de Recherches d’Aubervilliers et l’autre au Centre d’Industrialisation de Décines de Rhône-Poulenc. Enfin nous montrons comment utiliser la

régression

PLS usuelle

lorsque

les données sont

_{qualitatives.}

Mots-clés :

_analyse

discriminante PLS,

régression

PLS,

régression

sur _composantes

princi-pales, régression qualitative

PLS.

SUMMARY

Partial

Least-Squares regression

makes it

_possible

to relate a set of

_dependent

variables

Y =

{Yl,..., Yp }

to a set of

_independent

variables X =

{Xi,..., XM

},

when there is a

_large

number of

independent

and/or

_dependent

variables. Partial

_{Least-Squares regression}

consists in

carrying

out a

_principal

_component

_analysis

of the set of variables X

_subject

to the constraint that the

_{(pseudo-) principal}

_componentsof the

_Xj

are as

_{"explanatory"}

as

_possible

of the

set of variables Y. It is then

_possible

to

_predict

the

_Yk

from the

_Xj

_by

better

_separating

the

signal (which

is

synthetic,

structured, common to the

data)

from the noise

(which

is more

specific

to the

_sample

under

_study).

We _present_{in this paper PLS}

_regression

with a "data

analysis" point-of-view,

and describe two industrial

_{applications,}

one carried out at the Centre de Recherches d’Aubervilliers, and the other at the Centre d’Industrialisation de Décines, both

at Rhône-Poulenc. At least we show how to use PLS

_regression

when the data are

_categorical.

Keywords :

PLS discriminant

_analysis,

PLS

_qualitative

_regression,PLS

_{regression, regression}

(4)

Introduction

La

_régression

PLS

(Partial

Least

_{Squares Regression)}

_permet

de relier un

ensemble de variables

_dépendantes

Y =

{Vi,..., Yp}

à _unensemble de variables

indépendantes

X =

{X1, ... , Xi 1

lorsque

le nombre de variables

indépendantes

et/ou

_dépendantes

est élevé. La

_régression

PLS consiste à effectuer une

_analyse

en

composantes

principales

de l’ensemble de variables X sous la contrainte que les

(pseudo-)composantes

principales

des

_Xj

soient aussi

_{«explicatives»}

_que

_possible

de l’ensemble de variables Y. Il est alors

_possible

de

_prédire

les

Yk

à

_partir

des

_Xj

en

_séparant

mieux le

_signal

_(ce

_qui

est

_{synthétique,}

_structuré,

commun aux

_données)

du bruit

_{(ce qui}

est

_{plus spécifique}

à l’échantillon de données

_{étudié). Après}

avoir détaillé la

_théorie,

nous illustrons l’utilisation de la méthode de

_régression

PLS à l’aide

de deux

_exemples

tirés de la littérature et traités à l’aide du

_logiciel

SIMCA. Dans

une deuxième

partie

nous

_présentons

deux

_applications

_{industrielles,}

l’une réalisée au Centre de Recherches d’Aubervilliers et l’autre au Centre d’Industrialisation de Décines de

Rhône-Poulenc,

et montrons comment utiliser la

_régression

PLS usuelle

lorsque

les données sont

_{qualitatives.}

Ce travail

_s’appuie

sur les références suivantes : Geladi et Kowalski

(1986),

Glen,

Dunn III et Scott

(1989),

Hôskuldsson

(1988),

Kvalheim

_(1988),

Martens et Naes

₍₁₉₈₉₎

et Wold

_(1989).

On trouvera une

_application

détaillée de la

_régression

PLS en chimie de formulation dans Gauchi

(1995).

1. La

_régression

PLS

1.1. Données et notations

Les notations de la

_régression

PLS sont relativement bien standardisées dans la littérature. Les voici :

N = Nombre d’individus

M = Nombre de variables

indépendantes

Xi

P = Nombre de variables

dépendantes

Yk

A = Nombre de

composantes

retenues

X = Matrice des données

(N

x

_M)

_{pour les variables}

_{indépendantes}

Y = Matrice des données

_(N

x

_P)

_{pour les variables}

_dépendantes

Eo

= Matrice des variables

Xj

centrées-réduites

Fo

= Matrice des variables

Yk

centrées-réduites

Eh

= Matrice des résidus de la

décomposition

de

Eo

en utilisant h

_composantes

Ehj

= j-ième

colonne de

Eh

Fh

= Matrice des résidus de la

décomposition

de

Fo

en utilisant h

_composantes

(5)

1.2. La méthode

Il

_s’agit

d’étudier les liaisons entre les variables

_dépendantes

Yk

et les variables

indépendantes

Xj

en

_prenant

en

_compte

les relations internes entre les variables de

chaque

groupe.

L’algorithme

de la

_régression

PLS est itératif. Nous allons en décrire le

_principe,

puis

étudier

_plus

en détail les

_propriétés

de la solution.

L’algorithme

de la

_régression

PLS

Etape

0 On

_part

des tableaux

Eo

et

_Fo.

Etape

1 On construit une combinaison linéaire ul des colonnes de

Fo

et une

combinaison linéaire

tl

des colonnes de

Eo

maximisant cov

_{(03BC1, t1) =}

cor

(u1, t1) ·

var

(UI) .

var

_{( t 1 ) .}

On obtient donc deux variables ul et

t 1

aussi corrélées que

possible

et résumant au mieux les tableaux

_Fo

et

_Eo.

On construit ensuite les

_{régressions :}

Etape

2 On

_{reprend l’étape}

1 en

_remplaçant

les tableaux

_Eo

et

Fo

par

El

et

Fl.

On obtient donc deux nouvelles

_{composantes :}

U2, combinaison linéaire

des colonnes de

_Fl,

t2,

combinaison linéaire des colonnes de

El.

D’où les

décompositions

obtenues par

régression :

On itère la

_procédure

_jusqu’à

ce _{que les}

_{composantes tl , ... , tA}

_expliquent

suffisamment

_Fo.

Les

_{composantes th}

sont des combinaisons linéaires des colonnes de

Eo,

et non corrélées entre elles. De la

_{décomposition}

Fo =

tlri

+ ... +

_thrh

+ Fh

on

_peut

donc déduire les

_équations

de

_régression

PLS :

1.3. Recherche

_{et propriétés}

des

composantes

PLS

Nous allons décrire dans cette section la recherche des deux

_premières

(6)

1.3.1. Recherche de

_tel

et _{u 1}

On recherche une

_{composante tl}

=

EOWI

_etune

_composante

_ul=

Focl,

avec

IlwI11

=

11 cl 11

=

1,

telles que la covariance _entre

tl

_{et u 1}soit maximum. On

adopte

ici la norme usuelle. Comme cov

_(tl,

_ul)

=

var

(ti)

var

(ui)

cor

(tl, ul )

on essaie ainsi de maximiser simultanément la variance

_expliquée

_par

tl,

la variance

_expliquée

par ul et la corrélation entre ces deux

composantes.

On cherche donc des vecteurs

normés uy et ci maximisant

_{t1, u1}

_{>= ~t1~ · IluI11 .}

cor

_{(t1, u1).}

Utilisons la méthode des

_{multiplicateurs}

de

_Lagrange.

_{On pose}

On annule les dérivées

_{partielles :}

Des

_{égalités (1)}

à

(4)

on déduit :

D’où les relations :

Ainsi wl est vecteur propre de

EôFoFôEo

associé à la

plus grande

valeur propre

9i,

et ci est vecteur propre de

FôEoEôFo

associé à la

plus grande

valeur propre

03B821.

On effectue ensuite deux

_{régressions :}

de

_Eo

sur

_tl,

_puis

de

_Fo

sur

_{tl :}

(7)

est le vecteur des coefficients de

_régression

des

_Eoj

sur

tl.

où

est le vecteur des coefficients de

_régression

des

Fok

sur

_tl.

On a les

_propriétés

suivantes :

(a)

p’1w1 = 1

(b)

n =

blcl

où

bl

_estle coefficient de

régression

de ul sur

tl.

Les vecteurs rI et ci sont donc colinéaires. Montrons

_{(a) :}

Montrons

_{(b) :}

où

bl

=

OI/lltll12

=

u’1t1/~t1~2 est

bien le coefficient de

régression

de ïzi sur

_tl.

La recherche de

tl

et ul est visualisée dans la

_figure

1,

et les

_régressions

de

_Eo

et

_Fo

sur

tl

dans la

_figure

2.

FIGURE 1

(8)

FIGURE 2

Régressions

de

Eo

et

_Fo

sur

_tl

1.3.2. Recherche de

t2

et U2

On

_remplace

dans la section

_précédente

Eo

et

_Fo

_{par les matrices résiduelles}

El

et

_Fi.

D’où :

où

b2

=

u’2t2/~

t2112

_estle coefficient de

régression

de _U2sur

_t2.

(9)

1.3.3. Résultats

généraux

Nous allons

_présenter

dans cette section les

_propriétés

des

_composantes

PLS. Ces résultats sont nécessaires à une

_{compréhension}

_approfondie

de la méthode.

On obtient les résultats suivants :

A

_{l’étape h}

les

_équations

₍₅₎

à

(8)

deviennent

Les

_équations

_{( 13)}

et

_{( 16)}

ou

( 14)

et

_{( 15)}

_permettent

d’obtenir Wh et Ch et les

composantes

PLS Uh =

Fh_ 1 ch

_et

_th

=

Eh_ 1 wh,

_avec

Oh

=

uhth .

Les

_équations

₍₉₎

à

_{( 12)}

deviennent

où

avec bh

coefficient de

_régression

de uh sur

_th.

On a aussi :

et

propriété

de la

_régression.

Relations

_cycliques

(10)

La relation

(24)

provient

de

₍₁₄₎

et

₍₂₅₎

de

(13).

On

_peut

schématiser

Relations

_{d’orthogonalité}

Il _ya de nombreuses relations

_{d’orthogonalité}

au niveau de

_l’analyse

des

variables

_Xj.

Ceci n’est

_plus

vrai au niveau de

l’analyse

des

Yk.

On a les relations

_{d’ orthogonalité}

suivantes :

Preuve :

1)

Démonstration de

_t’htl

=

0,

l _>h La _preuvese fait par récurrence.

-

t i t2 = t’1 E1 w2

=

0,

puisque

zen

= 0.

-

Supposons

tl, ... , th

orthogonaux,

alors :

_{tl, ... ,}

_th+l

sont

_orthogonaux.

(11)

puisque

et ainsi de

suite,

d’où le résultat.

2)

Démonstration de On a :

puisque

W’ h Ph

= 1.

Montrons maintenant que

w’hE’l

= 0,

1 > h,

implique

_{wh El+ 1}

= 0. On a :

3)

Démonstration de On a :

4)

Démonstration de ’ On a :

puisque 1j

5)

Démonstration de

(12)

Si l > h on a:

Formules de

_{décomposition}

Les matrices

_Eo

et

_Fo

_peuvent

se

_décomposer

_par

_régression

sur _les

compo-santes

_{tl, ... ,}

_tA,

où 4 est _{le rang de}

_{Eo :}

Les

vecteurs th

étant

_orthogonaux

entre eux on retrouve bien les mêmes coefficients de

_régression

dans les

_équations

(26)

et

₍₂₇₎

_{que dans la méthode itérative}

décrite

_plus

haut.

La matrice des résidus

_Eh

à

_{l’étape h}

_peut

_s’exprimer

en fonction de

_{Eo :}

Montrons ce résultat.

Supposons

la

_{décomposition}

₍₂₈₎

vraie

_{pour h = j.}

Montrons

_qu’elle

est vraie

pour h = j + 1 :

Ces

_{décompositions}

entraînent trois résultats

_importants

au niveau de

l’interpré-tation.

_{Notons Il Eo 112}

la somme des carrés des différents éléments de la matrice

Eo.

(13)

Cette formule _permetde mesurer le

_pouvoir

de

_{chaque th (ou}

des h

_premiers)

pour résumer

Eo.

On utilise

Montrons

_{(29) :}

Les

_{tl , ... , tA}

étant

_orthogonaux

on obtient pour

_chaque

colonne

_Eoj,

en

utilisant

_{(26) :}

et _par

_conséquent

On aura de même la

_{décomposition :}

On mesure le

_pouvoir

de

_{chaque th (ou}

des h

_premiers)

_pour

_{expliquer Fo à}

l’aide de

Enfin il est

_important

_{de remarquer que la}

_{composante th}

est combinaison linéaire des colonnes de

_{Eo :}

1

Le vecteur

_{wh =}

03A0(I -

_wlp’l)wh

des coefficients des variables

_E0j

n’est

l=1

cependant

pas normé à 1.

(14)

autant _que

_possible

_Fo.

Ces

_composantes

PLS sont donc

analogues

à des

_composantes

principales

des

_{Xl, ... ,}

_XM

_expliquant

au mieux les variables

Y1 , ... , Yp.

Les

_composantes

PLS _u1,...,_Uh_{n’ont pas}cette

_propriété.

La

_composante

ul est bien combinaison linéaire des colonnes de

Fo,

mais ce n’est

_plus

le cas des

autres

_composantes.

Les

_composantes

_U2,..., Uh sont des variables intermédiaires

plus

difficiles à

_{interpréter.}

Les

_graphiques

Le

_plan

_{(t1, t2)}

_permet

de visualiser les individus dans un

_plan

résumant au

mieux les

_Xj,

tout en étant orienté vers

l’explication

des

Yk.

Le

_plan

_(t1,u1)

_permet

de visualiser la liaison entre les

Yk

et les

_Xj

détectée par ces

_premières

_composantes

PLS.

Pour

_interpréter

les

composantes

PLS th

en fonction des

_Xj

et des

Yk

il est

naturel de calculer les corrélations entre

_Xj

et

_th,

_puis

entre

_Yk

et

_th.

On obtient :

Bien que la division par N - 1

_plutôt

_{que N}ne

_s’impose

_pas,nous l’avons

utilisée pour être cohérent avec les sorties du

_logiciel

SIMCA.

Notant

_Ah

la variance

_{de th on}

obtient :

Et de même

Pour

_interpréter

ti

et

t2,

on construit donc le cercle des corrélations en

visualisant dans un

_plan

les

_points

et

représentant

les corrélations de

_Xj

et

_Yk

avec

tl

et

t2.

Les

_produits

scalaires

_{Aj, Aj’}

>,

Bk,

Bk’

> et

_{Aj, Bk}

>

_{représentent}

des

_{approximations}

à l’ordre 2 des cor

_{(Xj, Xj’),}

cor

(Yk, Yk,)

et cor

_(Xj,

Yk)

(15)

En effet :

On démontre de même les autres

_{approximations.}

La norme de

_Aj

_représente

la corrélation

_multiple

entre

_Xj

et

_{(tl, t2)}

et celle de

_Bk

la corrélation

_multiple

entre

_Yk

et

_{(tl, t2).}

On a en effet

puisque

les variables

ti

et

_t2

sont non _{corrélées. D’où le résultat. Et de même pour}

Yk.

Ainsi le cercle des corrélations

_indique

les variables bien corrélées aux deux

premières

composantes

PLS. Pour les variables bien

_expliquées

_par

ti

et

_t2,

le cercle des corrélations traduit aussi bien les corrélations internes à

_chaque

_groupe de variables que les corrélations

inter-groupes.

1.4. Les

_équations

de

_régression

PLS

De la

_{décomposition}

de

Fo

sur

_{tel, ..}

_th

on déduit la

_régression

PLS de

_chaque

variable

_Yk

sur

_Xl,,...,

XM.

On

_part

de

Posons

On trouve dans _{les programmes de}

_régression

PLS trois

_types

de résultats :

(16)

(2)

On utilise les variables réduites

D’où :

Les coefficients de

_régression

_(3j

sont

_comparables

et donc

_{interprétables}

au

niveau de

_{l’explication}

de

Yk

par les

_Xj.

(3)

On utilise les variables

_d’origine.

D’où :

1.5. Le cas

_particulier

d’une seule variable

_dépendante

La

_régression

PLS est

_{particulièrement}

utile

_lorsqu’on

cherche à

_expliquer

une variable Y à l’aide de

_plusieurs

variables

_Xj

très corrélées entre

elles,

ou

même linéairement

_{dépendantes,}

et

_qu’on

ne souhaite pas abandonner des variables

explicatives.

Les formules des sections

_{précédentes}

se

_simplifient.

Nous allons donc

reprendre

les

_étapes

de la méthode de

_régression

_{PLS pour}ce cas

_particulier.

Etape

1

La matrice

_Fo

se réduit à une colonne

_{F -}

y* =

Y - y.

Par

_conséquent

Sy

cl = 1 et ul =

Fo.

On recherche une

_composante

_ti

_Eowl,

avec

~w1~

-

1,

telle que la covariance entre

_t,

et u 1 soit maximum. Comme cov

(t 1, u 1 )

=

Var (t1)

x cor

_{(ti, ul )}

on essaie de maximiser simultanément la variance

_expliquée

par

tl

et la corrélation entre Y et

_tl.

On réalise ainsi un

compromis

entre la

régression multiple

de Y sur

_Xi,...,

_XM

et

_l’analyse

en

_composantes

_principales

des

_Xi,...,

_XM.

_{L’équation}

(5)

permet

d’obtenir directement w1

_puisque

ci = 1 _et

(17)

on déduit :

et

Par

_conséquent

On obtient une

_{composante t 1}

qui

s’écrit

dont

l’interprétation

est tout-à-fait naturelle. On effectue ensuite les

régressions

de

Eoj

sur

_tl,

_puis

de

Fo

sur

tl :

où _{plj =}

_{E’0jt1/~t1~2}

est le coefficient de

régression

de

_Eoj

sur ti et ri =

(18)

D’où les

_{décompositions :}

Etape 2

On

_remplace

dans la

_première

_étape

_Eo

et

_Fo

_{par la matrice}résiduelle

_El

et le

vecteur résiduel

_Fi.

On obtient C2

= 1,

U2 =

t

_et

W2 =

E’1F1 E’1F1~.

et

combinaison linéaire des colonnes de

Eo.

On pose :

coefficient de

_régression

de

FI

sur

t2.

D’où les

_{décompositions :}

et _{ainsi de suite pour les}autres

_étapes.

Résultats

_généraux

(19)

Chaque

composante th

étant combinaison linéaire des

_{X*j =}

_Eoj,

on

_peut

écrire

_{l’équation}

de

_régression

PLS

1.6.

_Exemple

1

On trouve dans Kettaneh-Wold

_[1992]

_l’exemple

suivant tiré de Cornell

[1990] :

L’indice d’octane moteur de douze différents

_mélanges

a été

_enregistré

afin de

déterminer l’influence des

_{sept composants}

suivants :

Distillation directe Reformat

Naphta

de craquage

thermique

Naphta

de craquage

catalytique

Polymère

Alkylat

Essence naturelle

Les douze

_{mélanges (Tableau 1)}

ont été choisis selon un

_{plan d’expériences}

D-optimal,

en sélectionnant une

_partie

des sommets.

TABLEAU 1

(20)

On calcule la matrice des corrélations :

TAB LEAU 2

Matrice des corrélations

Les corrélations les

_{plus importantes}

sont en _gras.

La

_régression

PLS va nous

_permettre

de relier la variable y à l’ensemble des

variables

_explicatives

_{x1, ... ,}X7.

1.6.1. Etude de la

_première

dimension

De la formule

on déduit :

et

où

_Eoj

est la variable

_Xj

centrée-réduite.

La

_{composante tl}

calculée sur les douze

_expériences

de

_l’exemple

de Comell

(21)

Dans le

_logiciel

SIMCA le calcul de u 1 =

Fo cl

n’impose

pas au vecteur ci

d’être unitaire. La contrainte consiste à

imposer

au coefficient de

_régression

de ul sur

t,

d’être

_égal

à 1 :

D’où on _{déduit que :}

On obtient donc :

On trouve ul dans le tableau 3.

TABLEAU 3

Les _composantesde la

_régression

PLS

On effectue ensuite les

_régressions

des variables

_Eoj

et

_Fo

sur _{tl :}

(22)

On obtient :

et les huit colonnes de résidus

_{El l ,}

... ,

E17, F1.

Pour évaluer la

_qualité

de la

_première

_{composante tl}

on calcule :

2022 Part de variance de Y

_expliquée

_par

tl

2022 Part de variance de X

_expliquée

par

tl

La

_{décomposition}

_Eo

=

t1p’1

₊

_El

donne ~E0~2

=

~t1~2

X

~p1~2

+

~E1~2,

soit en _{divisant par N -}

1,

les variables

_Eoj

étant

centrées-réduites,

La

_part

de variance de X

_expliquée

_par

t,

vaut donc :

1.6.2. Etude de la deuxième dimension

On

_part

des résidus

El

et

_FI

de la

_{décomposition}

à une

_{composante :}

On obtient :

(23)

De la formule

on déduit :

et :

On trouve la

composante t2

dans le tableau 3. On

_{décompose (régresse)}

El

et

_FI

sur

_{t2 :}

On obtient

On calcule U2 =

Fl /r2

de manière à avoir une

_régression

de U2 sur

_{t2 ayant}

un coefficient de

_{régression égal}

à 1. La

_composante

U2 est donnée dans le tableau 3.

Qualité

de la

_{décomposition}

sur

_{tl, t2}

. Part de variance de Y

_expliquée

par

t2

(24)

. _{Part de variance de X}

_expliquée

_par

_t2

e Part de variance de X

_expliquée

_par

_{tl, t2}

1.6.3. Etude de la troisième dimension

On obtient comme

_{précédemment}

les

_composantes

_t3et u3 données dans le tableau 3.

Le vecteur W3 vaut :

Qualité

de la

_{décomposition}

sur

_{ti, t2, t3}

2022 Part de variance de Y

_expliquée

par

t3

a _{Part de variance de Y}

_expliquée

_par

_tl,

_t2,

_t3

e Part de variance de X

_expliquée

_par

_t3

. Part de variance de X

expliquée

_par

_{tl, t2, t3}

Bien que

l’apport

de la troisième

_composante

soit minime dans

_{l’explication}

de

(25)

1.6.4.

_{L’équation}

de

_régression

PLS

On étudie la

_{décomposition}

de

Fo

sur

_{tl, t2, t3 :}

En revenant aux variables de

_départ,

il vient

On

_peut

aussi écrire le modèle sur les variables réduites afin de mieux mettre

en évidence l’influence

_marginale

de

_chaque

variable :

où

_y’

=

y/sy

et

_xj

=

xj/sxj

représentent

les variables _yet _xiréduites.

L’examen de la matrice des corrélations montre la cohérence de

_{l’équation}

de

régression

sur les variables réduites.

(1) signes

cohérents des coefficients de

_régression

(2)

rôle

_négligeable

de X5 sur _y

(3)

forte influence de la variable X6 sur _y.

1.6.5. Les

_graphiques

Nous commentons dans cette section différents

_graphiques

_{fournis par le}

_logiciel

SIMCA et le cercle des corrélations non _{fourni par SIMCA.}

Le

_graphique

_{(tl, ul)}

_représenté

dans la

_figure

3 illustre la forte corrélation

entre Y et

_tl.

Il est

_possible

de

_prédire

les trois classes de valeurs de y à l’aide des xi

Le deuxième

_{graphique (figure}

4)

isole les

_objets

4 et 6

_qui

sont effectivement

en bas de la

_première

classe au niveau du _{y : Y4}= 92 _et

Y6 = 91.2.

Le

_graphique

de la

_figure

5 est moins intéressant :

toutefois,

5

_{apparaît séparé}

de 12.

Le

_graphique

_(tel,

_t2)

de la

_figure

6 est

_{l’équivalent}

d’un

_{premier plan principal}

orienté vers

_{l’explication}

de y. On retrouve clairement les différentes classes

_d’objets

identifiées ci dessus.

(26)

FIGURE 3

Graphique

(tl, ul)

FIGURE 4

(27)

FIGURE 5

Graphique

(t3,

Ul)

FIGURE 6

(28)

TABLEAU 4

De

Ai

= Var

(tl)

= 3.98 _et

À2

= Var

(t2)

= 0.71 on _{déduit que la}

_première

colonne du tableau 4 vaut

B/3.98

[p1 r1]

et la deuxième colonne

0.71 [p2 r2].

FIGURE 7

Le cercle des corrélations

Ce

_graphique

traduit à la fois les liaisons internes aux variables _xjet entre les

(29)

- corrélations

positives

entre Xl, X3, X4, X7

- corrélation

positive

entre _X5et X6

-

y est corrélée

_positivement

à X5 et X6 et

négativement

aux variables xi, x3,

X4, X7.

1.7.

_Exemple

2 1.7.1. Les données

On trouve dans Jackson

_[1991]

un

_exemple

de

_régression

PLS sur les données

suivantes :

Les données ont _{été collectées par le Dr. A.C. Linnerud de l’Université de}

Caroline du Nord. Il a mesuré sur

_vingt

hommes

_d’âge

_{moyen s’entraînant dans}un

club de

_gymnastique

trois

_{caractéristiques physiques}

et leurs résultats à trois

_types

d’exercice. Les variables

_physiques

sont les variables

_{explicatives,}

et les résultats aux

exercices les variables à

_expliquer.

(30)

Il

_s’agit

de relier les variables _y,=

Tractions,

Y2 =

_Flexions,

Y3 = Sauts _aux

variables

_explicatives

x, =

Poids,

_X2= Tour de

taille,

_X3= Pouls.

L’analyse

de la matrice des corrélations

_{(tableau 6)}

montre les

_points

suivants :

- corrélation

positive

entre Poids et Tour de

taille,

- corrélations

négatives

entre

_(Poids,

Tour de

taille)

et

_Pouls,

- corrélations

positives

entre

_Tractions,

Flexions et

Sauts,

- les variables

_Tractions,

Flexions et Sauts sont corrélées

_{négativement}

à Poids

et Tour de

taille,

et

_positivement

à Pouls.

TABLEAU 6

Données de

Linnerud,

matrice de corrélations

Une

_régression

« cohérente » devrait donc être de la

_{forme Yk = (30}

+

(31

Poids +

/?2

Tour de taille +

/3s

Pouls + c avec

03B21, /?2

0 et

03B23

> 0.

Les estimations

gj

du tableau 7 des résultats des

_régressions

des variables centrées-réduites

Tractions*,

Flexions* et Sauts* sur les variables centrées réduites

Poids*,

Tour de

taille*,

Pouls* montrent des résultats incohérents.

TABLEAU 7

Données de

Linnerud,

résultats des

_régressions

(31)

1.7.2. Résultats de la

_régression

PLS

1.7.2.1. Calcul des composantes

th,

Uh

Le

_logiciel

SIMCA

_permet

d’obtenir les vecteurs _propresWh, Ch et les

composantes

PLS

th,

Uh. Ces résultats sont donnés dans le tableau 8.

TABLEAU 8

(32)

Dans SIMCA

_chaque

composante

PLS Uh est normalisée de manière à ce _que

le coefficient de

_régression

de Uh sur

_th

soit

_égal

à 1. On trouve donc dans le tableau 8 les

_composantes

_{PLS Uh}

_{définies par}

où bh

=

t’hFh-1ch t’ht’h

est le coefficient de

_régression

de

_Fh-1ch

sur

th.

Les résultats des

_régressions

sont donnés dans le tableau 9.

TABLEAU 9

Données de

Linnerud,

coefficients

des

régressions

de

Eo

et

_Fo

sur

_{tl, t2, t3}

on déduit

et

Les

_composantes

PLS Uh

pouvant

s’exprimer

directement en fonction des rh,

le

_logiciel

SIMCA ne _{fournit pas les}vecteurs _propresCh.

(33)

et

Ona:

d’où le tableau 10 donnant les variances

_expliquées

_{par les}

_{composantes th.}

TABLEAU 10 Pouvoir

_explicatif

des

th

Ainsi les données étudiées sont essentiellement

unidimensionnelles,

au niveau de la relation entre Y et X.

1.7.2.3.

_{Interprétation}

des composantes PLS

Les

_composantes

_{PLS th}

_peuvent

s’écrire en fonction des

_Xj

centrées-réduites :

(34)

TABLEAU 11

Corrélations entre les variables et les composantes PLS

On déduit donc que la

composante tl

oppose la variable Pouls aux variables

Poids et Tour de taille. Elle classe les individus des

_grands/gros

aux

_{petits/maigres.}

La deuxième

_{composante t2}

est essentiellement corrélée à la variable Pouls. La dernière

_{composante t3}

_{n’apporte plus}

d’information.

La

_composante

PLS ul =

F0r1/~r1~2

s’écrit :

La

_composante

ul est un indice de

_performance

donnant

_plus

de

_poids

aux

variables Tractions et Flexions

_qu’à

la variable Sauts. On a cor

_{(ul, tl)}

= 0.55.

La

_composante

U2 s’écrit :

où

_Flk

est le vecteur des résidus de la

_régression

de

_FOk

sur

tl.

Cette

_composante

U2

ne

_peut

_s’exprimer

en fonction des variables Yk, mais on

_peut

utiliser les corrélations

entre les

_Yk

et U2 du tableau 11 pour

_{l’interpréter.}

La

_composante

U2 est redondante

avec ul. On a cor

_{(Ul, U2) =}

0.83. Il en va _{de même pour la}

_composante

_{u3 :} cor

(Ul, U3)

= 0.72 _et_cor

(U2, U3)

= 0.90.

1.7.2.4. Les

_graphiques

Le

_plan

_{(tel, t2)}

de la

_figure

8 est

_analogue

à un

_premier

_principal

dans

_l’espace

des

_Xj,

mais orienté vers

_{l’explication}

des

_Yk.

Cette carte des individus montre

clairement la

_{position particulière}

de l’individu 14. Il est _{très gros}

_(Poids

=

_247,

Tour

de taille =

46)

_etobtient les

plus

faibles résultats du groupe _enTraction

(= 1)

_etFlexion

(35)

FIGURE 8

Plan des composantes

(tl, t2)

Le cercle des corrélations de la

_figure

9 traduit bien les corrélations internes à

chaque

groupe de variables

X,

Y comme les corrélations entre _{les groupes X}et Y. Le

_graphique

de la

_figure

10 met en évidence les rôles

_{particuliers joués}

_{par les} individus

10,

14 et 20 :

- les individus 10 et 20 ont

à peu

près

les mêmes

_{caractéristiques physiques}

et des résultats aux exercices

_{opposés :}

l’individu 10 obtient les meilleurs scores aux exercices

Tractions,

Flexions et Sauts sur l’ensemble des 20

individus,

alors que

l’individu 20 est

_parmi

les

_plus

faibles,

- l’individu 14 a

_déjà

été mis en évidence dans la

_figure

8.

Il faudrait refaire

_l’analyse

en mettant en

_{points supplémentaires}

ces trois

individus.

On

_peut

_également

montrer les

_graphiques

des

_régressions

de

Flexions,

Trac-tions et Sauts

sur tl.

Ces 3

_graphiques

confirment les rôles

_particuliers

des individus 14 et _{20 pour}

la

_prédiction

des variables Tractions et Flexions. L’individu 10 a un score en Sauts

(36)

FIGURE 9 Le cercle des corrélations

FIGURE 10

(37)

FIGURE 11

Régression

de Tractions sur

_tl

FIGURE 12

(38)

FIGURE 13

Régression

de Sauts sur

_t1

1.7.2.5. Les

_équations

de

_régression

PLS

Seule la

_{composante tl}

_explique

une

_part

de variance de

Yk

significative.

Nous

avons donc réalisé les

_{régressions simples}

de

Tractions,

Flexions et Sauts sur la

composante tl.

La

_{composante tl}

s’écrivant :

(39)

et en données centrées réduites :

La

_comparaison

avec les résultats des

_régressions

_multiples

ordinaires

(Tableau

7)

est instructive : on a rendu les

_équations

de

_régressions

cohérentes en

_acceptant

une

_légère

diminution des

_pouvoirs

_explicatifs

de

_chaque

_régression.

1.8. Conclusion

La

_régression

PLS

_permet

de

_rapprocher

le statisticien du chercheur dans les

problèmes

de modélisation. En

_général

ce dernier souhaite en effet conserver dans son

modèle toutes les variables

_importantes

tout en obtenant des

_équations

de

_régression

cohérentes.

_Lorsque,

en

_{régression multiple}

_{il y}a multicolinéarité et/ou un nombre

important

de variables

_explicatives

_par

_rapport

au nombre

_{d’observations,}

la solution

la

_plus

courante consiste à exclure des variables

_explicatives

_{par des méthodes de}

pas-à-pas.

La

_régression

PLS

_permet

dans ces situations de conserver toutes les variables

explicatives

tout en obtenant une

_équation

de

_régression

cohérente.

Lorsqu’il s’agit

de relier un ensemble de

_Yk

à un ensemble de

_Xj,

on

_peut

essayer

l’analyse canonique.

L’intérêt

pratique

de cette méthode est souvent faible

car elle ne fait le

_plus

souvent

_qu’isoler

des

_couples

_{(Xj, Yk)}

à forte corrélation. Ainsi les variables

_canoniques

_expliquent

une

_part

_qui

_peut

être faible des variances des groupes de variables X et Y.

La

_régression

PLS

_apparaît

comme un

_compromis

entre

_{l’analyse canonique}

des groupes de variables X et Y et des

_analyses

en

_composantes

_principales

de chacun de ces _{groupes de variables.}

2.

_Applications

Nous allons

_présenter

dans cette deuxième

_partie

deux

_applications

réalisées chez

Rhône-Poulenc,

la

_première

au Centre de Recherches d’Aubervilliers et la seconde au Centre d’Industrialisation de Décines.

Les données relatives à ces

_applications

ont la

_{particularité}

de contenir des variables

_{qualitatives.}

La

_prise

en

_compte

de variables

_qualitatives

en

_régression

PLS ne _{pose pas de}

_{problèmes particuliers. Après}

avoir étudié en détail les deux

applications

nous _proposeronsen conclusion une

_{méthodologie générale}

de la

(40)

2.1.

_{Un problème}

_{de formulaction}

d’une huile

_{silicone fonctionnalisée}

2.1.1.

_Description

_{du problème}

Il

_{s’agit d’optimiser}

les niveaux de

_cinq

facteurs

_{expérimentaux}

_gouvernant

la stabilité d’une micro-émulsion d’une huile silicone fonctionnalisée. Les facteurs

_Xi

à

_X4

_{représentent}

des

_quantités

de constituants actifs et

_prennent

les

_{niveaux -1, 0,1}

et le facteur

_X5

est une condition de fabrication codée -1 ou 1. On a

_également

introduit toutes les interactions

Xh

x

_Xk

et les carrés

_X21,...,

_X24.

Ainsi l’ensemble X des variables

_explicatives

est constitué de 19 variables :

Un

_{plan d’expérience D-optimal}

(Fedorov, 1972)

a

_permis

d’obtenir 58

_expériences

décrites dans le tableau 12.

Pour

_{chaque expérience l’aspect}

de la formulation a été noté en

_sept

instants différents. Le résultat

Yk

de l’observation à l’instant k se traduit par l’attribution d’une

note

_(1,

2 ou

_{3) correspondant}

à une

_description

totalement

_qualitative

de

_l’aspect

de la formulation :

- 1 =

système

polyphasique

(SP),

la formulation s’est

_dégradée,

- 2 =

système

fluide

transparent

(SFT),

la formulation est

stable,

ne se

_dégrade

_pas,

- 3 =

système

dit "tout

_système

_visqueux"

_(TSV),

_{la formulation n’est pas}

complète-ment

_dégradée

_{mais n’est pas conforme.}

Après

entretien avec le

chercheur,

il est _{clair que}cette variable

_réponse

n’est pas ordinale. Cette variable sera _{donc considérée par la suite}comme nominale à 3 modalités. Le tableau des résultats

_{figure ci-après (tableau 13).}

Il

_s’agit

donc de relier les

_{réponses qualitatives}

aux

_sept

instants Y =

{Y1,..., Y7}

aux _{conditions de fabrication décrites par X}=

{X1,

... ,

X5,

X2

... ,

X24, X1

X2,...,X4 X5}.

2.1.2 La

_{méthodologie}

_statistique

On cherche à établir une

_équation

de

_{régression expliquant}

la stabilité de l’émulsion en fonction des facteurs

_{expérimentaux.}

Pour ce faire nous avons

_adopté

la

_{méthodologie}

suivante :

a)

On réalise une

_analyse

des

_{correspondances multiples}

du tableau Y des

_réponses

aux 7 instants. On ne retient que les

_composantes

principales

utiles à

l’in-terprétation

des résultats.

b)

On réalise des

_analyses

de la variance univariées de

_chaque

_composante

_principale

retenue en

_a)

sur _{les conditions de fabrication décrites par X. On}ne _{retient que}

les variables les

_{plus explicatives.}

(41)

(42)

TABLEAU 13 Observations à 7

époques

d)

On détermine enfin les niveaux des facteurs

_explicatifs

favorisant les

_produits

qualifiés

SFT.

2.1.2.1.

_L’analyse

des

_{correspondances}

_multiples

Les

_principaux

résultats de l’ACM sont :

- Le

tableau des valeurs propres

(tableau 14)

montre

_qu’il

_ya

_quatre

valeurs propres

supérieures

à

1/7

= 0.14. La structure recherchée étant mise _enévidence

dans le

_{premier plan principal}

nous n’avons conservé dans cette _{étude que les deux}

(43)

TABLEAU 14

Décomposition

de l’inertie

- Nous donnons dans le tableau 15 les coordonnées des

points-modalités

et

la carte des modalités dans la

_figure

14. Cette carte est

_{particulièrement}

informative

puisque

les _{formulations y}sont nettement

_séparées

selon leur

_aspect.

TAB LEAU 15

(44)

FIGURE 14 Carte des modalités

A _{propos du tableau 15}nous

_précisons

_{que les trois}

_{premiers points}

correspon-dent aux modalités

_{SP, SFT,}

TSV à

_l’époque

1,

les trois suivants

_{correspondant}

à ces

mêmes modalités à

_l’époque

2 ... et les trois derniers à ces modalités à

l’époque

7.

- Les résultats concernant les

points-individus (les expériences)

sont donnés dans le tableau 16 et visualisés dans la

_figure

15.

Remarque :

le

_point

18 cache les

_points

_{n°3, 4, 6, 9, 10, 11, 12, 13, 17, 18, 20,}

24, 26, 27, 28, 29, 33, 35, 38, 39, 40, 41, 47, 48, 49, 53, 55, 56, 57, 58;

tous ces

_points

correspondent

à une

_expérience

à

_réponses

SP aux

_sept

_époques.

La carte des

_expériences

de la

_figure

15 montre la difficulté du

_problème

à résoudre. Le bon

_{quadrant (produits SFT)}

_comporte

_peu

_{d’expériences,}

et la seule

expérience

entièrement satisfaisante

_(expérience

n°42)

apparaît

comme isolée. Elle

est associée à des valeurs des deux

_premières

_composantes

_principales

minimales. La

_première

_composante

_principale

_{CPI sépare}

la formulation

_dégradée

_(SP)

des autres cas. La deuxième

_composante

_principale

CP2

sépare

ensuite la situation

intermédiaire

(TSV)

de la formulation recherchée

_(SFT).

On recherche donc des conditions de fabrication rendant aussi

_négatives

_que

(45)

TABLEAU 16

Coordonnées des

_{points-individus (expériences)}

2.1.2.2.

_Analyse

de la variance des composantes

principales

sur les

conditions de

_fabrication

Les

_analyses

de la variance univariées des

_composantes

_principales

_{CPI, CP2}

sur les conditions de fabrication ont

_permis

de détecter des termes

_{particulièrement}

explicatifs :

-X3,

_X23,

Xl

X

_{X2, Xl}

X

_{X3, X2}

X

_{X3, X3}

X

_{X4, X3}

X

_X5

_{pour CP,}

- X3, X2

X

_{X3 pour CP2.}

(46)

FIGURE 15 Carte des individus

TABLEAU 17

Analyses

de la variance sur les conditions

de fabrication (variables

significatives)

2.1.2.3.

_Régression

PLS des _composantes

_principales

_CP1

et

_CP2

sur les variables

_{explicatives significatives}

Il est _{essentiel pour le chercheur de}conserver dans un modèle

_prédictif

toutes

(47)

conduit aux modèles

et la

_régression

PLS aux

_équations

de

_régression

Les

_signes

des coefficients de la

_régression

PLS sont

_plus

_{cohérents que}ceux

de la

_régression

_{pas à pas descendante.}

Les

_équations

(33)

et

₍₃₄₎

sont construites à

_partir

de deux

composantes

PLS

tl

et

t2

expliquant

30% de la variance du tableau des conditions de fabrication

_{significatives}

et 57% du tableau des

Yk.

Les reconstitutions des

_composantes

_principales

_CPI,

_CP2

_{par les}

_équations

de

régression

PLS

(33)

et

_{(34) apparaissent}

sur les

_figures

16 et 17. Le cercle des corrélations est donné dans la

_figure

18.

FIGURE 16

(48)

FIGURE 17

Graphique

[cp2

calculée,

CP2

observée]

FIGURE 18

(49)

2.1.2.4. Détermination des conditions

optimales

On cherche à minimiser CP1 et _{CP2 pour être dans le}

_quadrant

où se trouvent

les 7 modalités SFT. En examinant les

_équations

de

_régression

PLS et le cercle des

corrélations,

on constate _{que la}

_{configuration}

_permettant

de minimiser les

composantes

principales

est _{déterminée pour}

_{Xl, X2, X3}

et

_X4

fixés à -1 et _pour

X5

fixé à 1. Dans ces conditions

CPI

vaut -1.35,

ce

_qui

est

_{satisfaisant,}

mais

_CP2

n’est que faiblement

négative,

à savoir

_CP2

= -0.19. En conclusion le chimiste _est

capable (ceci

a été confirmé

_{expérimentalement)}

d’éviter la fabrication de

_produits

d’aspect

SP,

très rhédibitoire.

_Toutefois,

il est encore difficile de savoir comment

orienter

_{l’aspect plutôt}

vers _{SFT que TSV}en

_jouant

sur les facteurs

_{expérimentaux}

pris

en

_compte

dans cette étude. Ainsi la modélisation obtenue ne

_permet

_{pas de}

reproduire

la

_qualité

de

_{l’expérience}

n°42.

2.2.

_Application

de la

régression

PLS à la

_{spectrométrie infrarouge}

2.2.1. Introduction

Les

_{spécifications}

d’un

_produit

fini

_peuvent

_correspondre

à des

concentra-tions

_{(pureté, impuretés...),}

à des données de tests

_{physico-chimiques}

et

_plus

par-ticulièrement à des résultats de tests

_{d’application.}

Ces résultats se

_présentent

_{généralement}

sous la forme :

- test

correct,

- test incorrect.

Quand

la nature du test le

_permet,

on

_peut

souhaiter

_préciser

ces données de la

façon

suivante : - test correct, - test incorrect

(valeurs inférieures),

- test incorrect

(valeurs supérieures).

Ce test

_qui

fournit un résultat très

_important

sur la

_qualité

du

_produit

fini et son

orientation

future,

a

_parfois

l’inconvénient d’être

_long

à mettre en oeuvre.

Il est donc intéressant de chercher à

_développer

une méthode de

_remplacement

plus rapide.

Dans le cas _quenous

_présentons,

la

_{spectrométrie}

IR et la

_régression

PLS

permettent

d’obtenir des résultats similaires au test

_{d’application}

en cours avec un

gain

de

_temps

très

_important.

On trouvera une

_{présentation}

détaillée du contexte de cette

_application

dans Ménardo

(1993).

2.2.2. Présentation des données

(50)

- incorrect

pour

l’application

(valeurs inférieures)

~

_Groupe

1

-

correct _pour

_{l’ application}

~

_Groupe

2

-

incorrect pour

l’application

(valeurs supérieures)

~

_{Groupe 3}

La matrice Y est construite de la

_façon

suivante :

La variable indicatrice

_Yj

vaut 1 _{pour les individus du}

_{groupe j}

et _{0 pour les} autres.

Pour

_chaque

échantillon,

le

_spectre

IR a été

_enregistré

sur le même

_{spectromètre}

IRTF Bruker

IFS48,

dans les mêmes conditions.

La matrice X est constituée de 20

_{lignes (20 échantillons)}

et de 2946 colonnes

représentant

des mesures d’absorbances entre 3950 et 1300

cm-l.

Le format de la matrice X est donc de 20 x 2946.

Le

_logiciel

GRAM386-PLSPLUS

_permet

de traiter ce

_type

de données.

2.2.3. Etude

_{exploratoire : analyse}

en

_composantes

_principales

Nous avons utilisé le

_logiciel

GRAMS386-PLSPLUS _{pour réaliser}

_l’analyse

en

(51)

FIGURE 19

Analyse

en _composantes

_principales

de la matrice _X,

composantes

principales

1 et 2

Le

_{premier plan principal (Figure 19)}

ne

_permet

_{pas de}

_séparer

les groupes. Par

contre on constate sur le

_graphique

(CP1, CP3)

de la

_figure

_{20 que la troisième}

com-posante

principale

apporte

une meilleure discrimination des trois groupes initiaux.

2.2.4.

_Régression

sur _composantes

_principales

Nous avons réalisé une

_régression

de chacune des variables

_Yj

sur les trois

premières

composantes

principales

du tableau X.

_Chaque

échantillon est affecté au

groupe pour

lequel

l’indicateur calculé

Yk

est le

_plus

élevé. Les résultats sont

_présentés

dans la

_figure

21.

On note 5 échantillons mal classés sur les 20 initiaux. En validation croisée on

(52)

FIGURE 20

Analyse

en _composantes

_principales

de la matrice

_X,

composantes

principales

1 et 3

FIGURE 21

(53)

2.2.5. La

_régression

PLS

2.2.5.1.

Régression

PLS entre Y =

IY,,

Y2,

Y3}

_etle tableau X

Pour choisir le nombre de

_composantes

PLS à

retenir,

on a utilisé le critère PRESS

_proposé

dans GRAMS. Pour

_chaque

échantillon on calcule l’erreur de

prévision

des

Yk

sans utiliser cet _{échantillon pour construire le modèle. Le critère}

PRESS revient à choisir le nombre de

_composantes

_pour

_lequel

la somme des carrés

des erreurs de

_prévision

est minimale. Ceci nous a conduit à retenir les trois

_premières

composantes

PLS

tl, t2

et

t3.

Les

_plans

_{(tl, t2)}

et

_{(tl, t3)}

des

_figures

22 et 23 montrent _{que c’est l’axe 1}

_qui

apporte

la _{meilleure discrimination des trois groupes.}

FIGURE 22

Régression

PLS de Y sur X.

Représentation

des échantillons dans

_{le plan}

tl, t2

Dans la méthode de

_régression

PLS,

le calcul des axes est orienté vers

l’explication

de Y.

Utilisant des

_{composantes th}

orientées vers

_{l’explication}

de

Y,

la

_prévision

des groupes

d’origine

va évidemment s’améliorer.

_Chaque

échantillon est affecté au

groupe pour

lequel

Pk

est le

_plus

_présentés

(54)

FIGURE 23

Régression

PLS de Y sur X.

Représentation

des échantillons dans le

_plan

tl, t3

FIGURE 24

(55)

On ne note _{maintenant que 3 échantillons mal classés}sur les 20 initiaux. En

validation croisée on obtient 7 échantillons mal classés sur 20.

2.2.5.2.

_Régression

PLS de

_chaque

Yk

sur X

On réalise maintenant trois

_régressions

PLS

_{indépendantes.}

Nous avons retenu

les trois

_premières

_composantes

_{PLS pour}

_chaque

_régression

PLS. On

_représente

les trois

_plans

_{(tl, t2)}

_{correspondant}

aux trois

_régressions

PLS dans les

_figures

25, 26

et

27. On

_peut

noter _{que l’axe 1}

_apporte

_{bien la meilleure discrimination par}

_rapport

à chacun des trois groupes initiaux. On remarque aussi que dans les

plans

(t1, t2)

de

chaque analyse

les groupes visés sont bien isolés.

FIGURE 25

Régression

PLS de

Y1

sur X

Chaque

échantillon est affecté au _{groupe pour}

_lequel

Yk

est

le

_plus

_présentés

dans la

_figure

28.

Il

_n’y

a maintenant

_qu’un

seul échantillon mal classé sur les 20 initiaux. En

validation croisée le résultat s’améliore

_{également :}

5 mal classés sur 20.

2.2.6. Conclusion

Les travaux

_présentés

dans cette

_partie

mettent en évidence sur un cas réel

l’intérêt de la

_régression

_{PLS par}

rapport

à la

_{régression sur}

composantes

principales.

En

_régression

PLS la méthode PLS-1

_(on

_régresse

_chaque

Yk

sur

_X)

semble nettement

(56)

FIGURE 26

Régression

PLS de

Y2

sur X

FIGURE 27