R EVUE DE STATISTIQUE APPLIQUÉE
M. V IVIEN R. S ABATIER
Une extension multi-tableaux de la régression PLS
Revue de statistique appliquée, tome 49, n
o1 (2001), p. 31-54
<http://www.numdam.org/item?id=RSA_2001__49_1_31_0>
© Société française de statistique, 2001, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNE EXTENSION MULTI-TABLEAUX DE LA RÉGRESSION PLS
M. Vivien et R. Sabatier
Laboratoire de
Physique
Moléculaire et Structurale, UMR 9921, Faculté de Pharmacie, 15 av. Ch. Flahault, 34060 Montpellier Cedex 2, FranceRÉSUMÉ
Nous
présentons
ici une extension de la méthode PLS, l’ACIMO-PLS, permettant de modéliser «globalement
» un ensemble de K tableaux de données mesurés sur les mêmes n individus.L’optimisation
du critèreproposé
revient à la résolution de PLS traditionnel, maisengendre
desobjets
et aides àl’interprétation supplémentaires.
Unexemple
de données réellessera traité.
Mots-clés :
régression
PLS,analyse
sensorielle, validation croisée,analyse
multi-tableaux.ABSTRACT
In this article, we are
going
to present an extension for the PLS method, OMCIA-PLS, which allows a «global
»modelling
of K data sets measured on the same n individuals. Theoptimization
of the criterion that we propose amounts toresolving
usual PLS, butgives
extraobjects
andhelp
tointerpretation.
Anexample
based on real data will beprocessed.
Keywords :
PLS regression, sensoranalysis,
cross-validation,multiway analysis.
1. Introduction
Tout au
long
de cetarticle,
nous allons nousplacer
dans la situation danslaquelle
on
dispose
de K groupes devariables,
notéslyklk-1, .... K,
que l’on désireexpliquer
« globalement »
à l’aide d’un seul groupe deprédicteurs,
noté X. Ces K + 1 tableaux étant mesurés sur les mêmes n individus.Peu de méthodes relatives à ce
problème
ont étédeveloppées.
Wold et coll.(1987)
ontproposé
une méthodeappelée
«multiway
PLS »,MPLS, qui revient,
enfait à faire la
régression
PLS « usuelle » d’un cube de variables(n
x p xK) réponses
en le
dépliant
en une matrice de taille n xpK,
sur un cube de variables(n
x q xK’)
déplié
en matrice de taille n xqK’.
Plus
récemment,
Bro(1996)
adéveloppé
la PLSmulti-linéaire, N-PLS, qui
est basésur la maximisation d’un critère de covariance
généralisant
celui de PLS « usuelle »au cas de cubes de données.
Citons aussi la méthode Wold et coll.
(1996),
la PLShiérarchique, H-PLS, qui
estdestinée à
expliquer
K sous-groupes d’un ensemble de variablesréponses
par K’sous-groupes d’un ensemble de
prédicteurs.
Elle calcule des composantes detype
PLSpour
chaque
sous-groupes devariables,
et fait unerégression
PLS des composantesréponses
sur lescomposantes explicatives,
afin d’obtenir descomposantes
que nous dirons «globales
». Précisons que le calcul descomposantes
dechaque
sous-groupedépend
de lacomposante
«globale
», cequi
montre lacomplexité
del’algorithme
etnous amène à penser que cette
technique
ne maximise aucun critère.Qannari,
Courcoux & Maunit(1997)
ontproposé
une méthodeinspirée
del’Analyse
Procruste Généralisée
(Gower, 1975).
La méthode que nous proposons,
l’Analyse
de Co-InertieMultiple Orthogonale
- Partial Least
Squares, ACIMO-PLS,
maximise un critèrequi
peut être vu comme unegénéralisation
àplusieurs
tableaux de larégression
PLS « usuelle » de deuxtableaux,
telle que l’a définie Tenenhaus
(1995).
Ce critère est à mi-chemin del’Analyse Canonique
Généralisée(Carroll, 1968)
et de STATIS(Lavit, 1988).
Il se trouve que la solution est un
problème
aux valeurs propres, cequi présente l’avantage
d’être facile à résoudrecompte
tenu de la stabilité desalgorithmes
existants.De
plus,
les solutions de l’ACIMO-PLSpeuvent
s’obtenir par lerajout
dequelques
éléments et de nouveaux
graphiques
au programme de PLS à deux tableaux. Elle est donc facile à obtenir.D’un
point
de vuepratique,
cette méthodeprésente
un intérêt certain enAnalyse sensorielle,
où lestechniques
traditionnelles nepermettent
pas d’obtenir K modèlescomparables.
Cequi
estpossible
avec l’ACIMO-PLS : eneffet,
les K modèlesque fournit l’ACIMO-PLS sont construits en fonction des mêmes composantes des variables
explicatives,
c’est-à-dire des mêmes combinaisons linéaires des variablesexplicatives (cf. parties
4 et5).
Après
avoirprécisé
nosprincipales notations,
nousprésentons l’aspect
mathéma-tique
de l’ACIMO-PLS etexplicitons
sespoints
communs et ses avantages par rapport à unerégression
PLS à deux tableaux.Enfin,
nousl’appliquons
à unproblème d’Analyse
Sensorielle afin de montrer « sonintérêt ».
2. Notations utilisées
- A’ est la matrice
transposée
de la matrice A.-
(Yk, Qk, D), k = 1,...,
K Ktriplets statistiques.
Un tableauYk,
n x Pk,représente
un ensemble de Pk variables àexpliquer (variables réponses)
mesurées surles mêmes n individus.
Qk
est lamétrique,
Pk x pk, des individus dans IRpk et D lamétrique,
engénéral diagonale,
despoids
des individus dansl’espace
des variables IRn. Engénéral,
et sauf aviscontraire, Yk
est centré en colonne pour lamétrique
D.-
Wk
=YkQkY’k
est lamatrice,
n x n, desproduits
scalaires des individus du tableauYk
au sens de lamétrique Qk.
- (Y, Qy, D) triplet statistique
où Y est la matrice de taille n xL
pk obtenuepar
juxtaposition
des K tableauxYk :
Y -[YI ... 1 Y K ]. Qy
est lamétrique
desindividus dans
IR03A3k pk,
donnée par la matricediagonale
par blocs danslaquelle
lekième
bloc est lamétrique Qk.
-
(X, Q, D)
est letriplet statistique
oùX,
n x q,représente q
variablesexplicatives
mesurées sur les mêmes n individus que les tableauxYk. Q
est lamétrique
dans IRq. En
général,
X est centré en colonne pour lamétrique
D.- W =
XQX’.
-
Vkx
=V’Xk = Y’kDX
est la matrice des covariances entre les variables deYk
et celles de X.- s ==
1,...,
S indice desétapes.
S est le nombre d’axes retenus,qui
est aussile rang des modèles successifs emboîtés.
-
bk,s (resp. uk,s)
et as(resp. ts)
les axes(resp. composantes)
de co-inertied’ordre s associés
respectivement
aux tableauxYk
etX, qui
vont être définis ci-après.
3. Nouvelle
approche
pour PLS :ACIMO-PLS 1
L’Analyse
de Co-InertieMultiple Orthogonale -
Partial LeastSquares (ACIMO- PLS),
que nous allonsdévelopper,
est une méthode linéaire itérative basée sur la maximisation sous contraintes d’un critèregénéralisant
celui de PLS.On va chercher successivement s
(s = 1,..., S) composantes (vecteurs
de IRn combinaisons linéaires desvariables)
Uk,s pour les tableauxYk et ts
pour le tableau X telles que :e les composantes
{ts}s
forment unsystème D-orthogonal
de IRn et soient leplus explicatives
des variables deX,
e les composantes
{uk,s}s
soient aussireprésentatives
quepossible
de leurpropre groupe de variables
(Yk)
tout en étantproches
des composantests .
Les
composantes ts
seront ensuite utilisées pour modéliser les tableauxYk
et permettre d’obtenir une suite de modèles emboîtés(s)k.
Ces modèles sont linéairesen les
composantes
deX, lesquelles
tiennentcompte implicitement
de l’informationapportée
par les K groupes de variablesréponses.
Le choix du rang S des modèles
(nombres
decomposantes ts
de X entrant dans lemodèle)
se fait par validation croisée comme pour les méthodes PLS(Wold, 1966;
Tenenhaus et
coll., 1995).
1 Le nom ACIMO
(cf
(Vivien,1999))
provient d’une méthode plus générale, Analyse deCo-Inertie Multiple Orthogonale de K + 1 tableaux dont l’ACIMO-PLS est une variante.
La
Figure
1 résume ces propos.FIGURE 1 L’ACIMO-PLS
3.1. Solutions d’ordre 1
À
lapremière étape
de laméthode,
on va chercher K composantes uk,1 =YkQkbk,l
et la composante t1 =XQal
de X.On
appelle
ACIMO-PLS d’ordre1,
la maximisation de la fonctionobjectif suivante,
somme des carrés des covariances entre Uk et t,
K
f(b1,...,bK,a)=03A3cov2(YkQkbk,XQa)
k=l
sous les contraintes usuelles de
norme : ~bk~2Qk = 1,
Vk et~a~2Q
= 1.Les solutions sont déterminées
grâce
à la méthode desmultiplicateurs
deLagrange.
Le
Lagrangien
utilisé estoù À et
{03BCk}
sont,respectivement,
lesmultiplicateurs
associés aux contraintes denorme pour les axes de co-inerties a et
bk.
On en tire les
équations
normales :En
multipliant
àgauche l’équation (1)
par a’ et leséquations (2)
àgauche
parb’k,
on trouve :Enfin,
en utilisant ces résultats dans leséquations (2)
et(1),
on obtient lesrelations :
bk
étant de normeunité,
on a03BCk = ~VkXQa~Qk.
L’axe de co-inertie al recherché est donc le
premier
vecteur propre de la ma- trice(Q-symétrique, positive,
doncdiagonalisable
et à éléments propresréels)
K
03A3VXkQkVkXQ
associé à lapremière
valeur propreAi.
Lesaxes {bk,1}k
sontk=l
ensuite déterminés par les formules de transition
(6).
Les solutions obtenues sont bien le maximum de la fonction
objectif,
car les axes aet
bk
sont caractériséspar A (5) qui
estégal
aucritère,
etqui
est choisi maximum.On en déduit le même type de relations pour les composantes uk,1 =
YkQkbk,1, k = 1,..., K,
et ti =X Qa1
associéesrespectivement
aux tableauxYk, k
=1,...,K, etX:
avec 03BCk,1
= ~VkXQa1~2Qk,
valeur de03BCk associée
à a1.Donc, l’équation (8)
montre que t1 est lepremier
vecteur propre, non normé àl’unité,
K
de
WD03A3 WkD,
associé à saplus grande
valeurpropre Ai.
L’équation (9)
montre quel’image
de t1(donc composante
associée àX)
parl’opérateur
associé àYk
estproportionnel
à la composante uk,1.3.2. Solutions d’ordre s
(s
>1)
On définit les solutions d’ordre s, s >
1,
del’ACIMO-PLS,
par les solutions d’ordre 1 de l’ACIMO-PLS destriplets (Y(s-1)1,Q1, D),
...,(Y(s-1)K,QK,D),
(X(s-1), Q, D),
oùX(0)
=X, Y(0)k = Yk
etX(s-1), (resp. Y(s-1)k)
est le résidu dela
projection D-orthogonale
de X(resp.
deYk)
surl’espace T(s-1) engendré
par les vecteurst1,...,ts-1.
C’est-à-dire,
que l’axe as est lepremier (i. e.
associé à laplus grande
valeur propreÀs)
vecteur propre duproblème
suivant :OU Xk - kX désigne X(s-1)’DY(s-1)k.
Les axes
bk s
sont alors obtenus parbk,s
-1 03BCk,sY(s-1)’k DXQas, avec 03BCk,s =
~V(s-1)kXQas~2Qk.
Ainsi,
pardéfinition,
on obtient àl’étape
s unsystème
decomposantes tel
=X(l-1)Qal}l=1,...,s D-orthogonal
dans IRn.De
plus,
on a lespropriétés
suivantesanalogues
à celles de PLS ordinaire :Les démonstrations sont fournies dans
(Vivien, 1999).
3.3. Lien avec PLS « usuelle » 3.3.1.
Rappels
succints sur larégression
PLSRappelons
enquoi
consiste la méthode derégression
PLS d’untriplet (Y, Qy, D)
sur(X, Qx, D),
les deuxtriplets
étant mesurés sur les mêmes n in-dividus. L’introduction des
métriques
dans les espaces des individus est dûe à Cazes(1997).
C’est unesimple généralisation
de larégression
PLS telle que l’ont défini Wold(1966)
et Tenenhaus et coll.(1995)
au cas où lesmétriques Qx
etQy
ne sontpas
égales
à l’identité.La
régression
PLS est une méthode itérative basée sur la maximisation de la fonctionobjectif g(w, c)
==cov(YQyc, XQxw)
sous les contraintes de norme sur les axes~c~2QY = ~w~2QX =
1.À chaque étape s,
on maximise cettefonction g
enremplaçant respectivement
lestableaux « Y » et « X » par les résidus
(Y(s-1)
etX(s-1))
desprojections
D-orthogonales
de Y et X surl’espace engendré
par lescomposantes
PLS de X obtenuesaux
étapes précédentes.
L’axe ws, d’ordre s, associé à X est le vecteur propre associé à la
plus grande
valeurpropre
v2
deX(s-1)’DY(s-1)QYY(s-1)’DX(s-1)QX.03BD
estégale
au maximum ducritère g.
L’axe
d’ordre
s, cs, associé à Y est alors obtenu par la formule de transitionv
Le
système
des Scomposantes {XQXws}s=1,...,S
est alorsD-orthogonal,
cequi
permet d’écrire des modèles linéaires d’ordre S pour chacune des variables à
expliquer
de Y.
3.3.2. Relation ACIMO-PLS -
Régression
PLS « usuelle »Commençons
parpréciser quelques
notationssupplémentaires.
Ondésignera
par :
2022
bs,
vecteur de dimension03A3pk
x1,
les ème
axe de Y issu de larégression
PLS du
triplet (Y, Qy, D)
sur(X, Q, D),
. u, =
Y Q y b,,
vecteur de2R",
lasème composante
PLS deY,
2022
bs[k]
lekième
bloc delongueur
Pk du vecteurbs .
Nous avons les
correspondances
suivantes :Propriété.
- Les axes de co-inerties as(resp.
les composantests)
de l’ACIMO-PLS associés à X sont
identiques
aux axes d’ordres s(resp.
aux composantes d’ordres)
de X issus de larégression
PLS de(Y, Qy, D)
sur(X, Q, D).
De
plus,
on une relation entre les axes de co-inertie des tableauxYk
et l’axe PLS,bs,
associé à Y :
bk,s
=bs[k]/~bs[k]~Qk.
Enfin,
la composantePLS,
us, associée à Y est une sommepondérée
des composantes de co-inertie associées aux tableauxYk :
us =03A3~bs[k]~Qk
uk,s.k
En
effet,
les axes associés à X issus des deux méthodes vérifient le mêmeproblème
aux valeurs propres. Ce
qui implique l’égalité respective
des axes et descomposantes
d’ordre 1.Ensuite,
lesprocédures
de calculs desobjets
d’ordresupérieur
étantidentiques,
il est facile de montrer que les axes(resp.
lescomposantes)
PLS et lesaxes
(resp.
lescomposantes)
de co-inertie associés à Xcorrespondent
à tout ordre.La
propriété
relative aux axes associés àYk
est enpartie
due à la formule detransition entre
bs
et as :Attention : dans ce
qui
suit etjusqu’au paragraphe 3.4, afin d’alléger
les notations,nous noterons
Yk
etX,
au lieu deY(s-1)k
etX(s-1),
les tableaux àl’étape
s.À partir
de cetterelation,
on peutexprimer
les K blocs delongueur Pk
du vecteurbs
parbs[k] = 1 Y’kDXQas, et finalement bs[k]/~bs[k]~Qk
=Y’kDXQas/~Y’kDXQas~Qk.
1/s
Or,
nous avons montré(cf. paragraphe 3.1) que ~Y’kDXQas~Qk = 03BCk,s.
D’où,
Il est facile de montrer, de
plus, que ~bs[k]~Qk
=03BCk,s/03BBs.
Passons maintenant à la
propriété
sur lescomposantes.
Pardéfinition,
nousavons us =
YQy bs,
cequi peut
s’écrire aussi de la forme us =03A3 YkQkbs[k].
D’après l’égalité
obtenueprécédemment,
on déduit le résultat.Cette
expression
de us etl’égalité ~bs[k]~Qk
=03BCk,s/03BBs
montrent queplus
la covariance(qui
estpositive)
entre Uk,s et ts estfaible,
moins lacomposante
Uk,s entre enjeu
dans le calcul de us. Autrementdit,
moins lacomposante ts
estexplicative (proche)
de Uk,s, moins us en tientcompte.
On peut dire que usnéglige
de l’information au bénéfice de l’information la
plus importante.
3.4. Les modèles
{Sk}k=1,...,K
La modélisation de rang S des tableaux
Yk-
par X est immédiate enappliquant
les résultats de la
régression PLS,
carS
=[S1 |... |SK].
Nous
rappelons ci-après l’expression
de ces modèles linéaires({Sk}k=1,...,K)
et unepropriété, généralisant
celle de PLS « usuelle »(Tenenhaus, 1995), permettant
de les obtenir.Propriété
2013 Comme en PLS de deuxtableaux,
les composantes ts =X(s-1)Qas
peuvent s’écrire sous laforme
ts =Xw*
pour tout s =1,...,
S et03C9*s
est donné par :Propriété.
- Pour chacun des tableauxYk,
on a le modèle linéaire suivant :avec
Les démonstrations sont
disponibles
dans(Vivien, 1999).
3.5. Commentaires et liens avec d’autres méthodes
- L’ACIMO-PLS met en évidence une certaine
optimalité
de larégression
PLSde Y sur X.
En
effet,
l’ACIMO-PLS montre que les modèles obtenus pour lesE Pk
variablesréponses
par larégression
PLS de(Y, Qy, D)
sur(X, Q, D)
sontajustés
par tableau.Les
composantes
associées auxprédicteurs
sont lesplus explicatives
et lesplus
corrélées avec les
composantes
lesplus explicatives (Uk,s)
des variablesréponses.
- En
plus,
l’ACIMO-PLS fournit descomposantes
par tableaux. Onpeut
alorsreprésenter
sur un mêmegraphique
lespoints
de coordonnées(us, ts), {(uk,s, ts)}k,
ce
qui
donne une visionglobale
et/oupartielle (par tableau)
de laqualité
desrégressions partielles
de Y etYk sur ts
àl’étape
s. Si le nuage depoints
estproche
d’une
droite,
la relation entre les variables de Y et celles de X est bien linéaire etjustifie l’emploi
de cette méthode. L’ACIMO-PLSpermet
de faire une étudeplus approfondie quant
à la validité des modèles pour chacun des groupes de variablesréponses.
- Comme les
composantes
PLS associées aux variablesréponses,
les com-posantes {uk,s}s
ne forment pas unsystème D-orthogonal
dans IRn. Dans notreproblème, qui
est en fait une étude sur lamodélisation,
c’estl’orthogonalité
des com-posantes {ts}s qui
estimportante
ainsi que la relation entre les composantes Uk et u : c’est celaqui permet
l’obtention des modèles linéaires.Cependant,
onpeut
choisirdes
orthogonalités supplémentaires,
parexemple
sur lescomposantes {uk,s}s.
Nousavons
appelé
cetteméthode,
dont le but estdifférent, Analyse
de Co-InertieMultiple Orthogonale (Vivien, 1999).
- Le rang S des modèles ne
peut dépasser
le rang de X.- Notons que le critère
utilisé, 03A3cov2(t, u), peut
aussi s’écrire03A3r2(t, u)
k k
var(t)var(u). Ainsi,
en lemaximisant,
on maximise à la fois la corrélation entre les composantes et leur variancerespective.
Deplus,
celui-ci est unegénéralisation
« naturelle » du critère de la
régression
PLS « usuelle ». Eneffet,
maximisercov(YQYc, XQX03C9)
oucov2(YQYc, XQX03C9)
sous les contraintes de norme unité pour w et c, donne un résultatidentique.
- Si k = 1, l’ACIMO-PLS
correspond
à larégression
PLS deYI
sur X.-
Lorsqu’on
utilise lesmétriques
usuelles dans les espaces desindividus,
c’est-à-dire les
métriques identités,
les modèles obtenus sont ceux de Wold et coll.(1987)
avec la
multiway
PLS.- Les solutions d’ordre 1 de l’ACIMO-PLS
correspondent
aux solutions d’ordre 1 del’Analyse
de la Concordance définie par Lafosse et Hanafi(1997).
-Les K
composantes
de co-inertie uk,1 de l’ACIMO-PLS peuvent se retrouver, à la normeprès,
avecl’approche
PLS définie par Wold(1985)
etreprise
par Tenenhaus(1999).
En suivant le réseau de causalité décritFigure
2 faisant intervenir K + 1 variables latentes(1 exogène
et Kendogènes)
et K + 1 blocsréflectifs,
et en utilisant le mode A et le schéma centroïde(ou factoriel),
les estimations externes(notées «Yj »
par Tenenhaus
(1999))
des K variables latentesendogènes correspondent,
à la normeprès,
aux composantes de co-inertie Uk,l de l’ACIMO-PLS.Si,
lors de la maximisation ducritère,
on avaitimposé
auxcomposantes t
et Uk d’êtrede norme unité au lieu de
l’imposer
aux axes deco-inertie,
on aurait bien évidemment retrouvé les résultats del’approche
PLS.Mais,
dans ce cas, le critère à maximiser serait une somme de corrélations aucarré,
cequi
ne seraitplus
du tout le mêmeproblème.
- Avec un choix
particulier
deX, Qk
ouQ,
les solutions d’ordre 1 de l’ACIMO- PLScorrespondent
aux solutions d’ordre 1 del’Analyse
de CO-inertieMultiple,
ACOM, (Chessel
etHanafi, 1996),
deAnalyse Canonique
Généralisée deCarroll,
FIGURE 2
Réseau de causalité pour
l’approche
PLSACG, (Carroll, 1968)
ou encore del’Analyse
enComposantes Principales
sur Vari-ables
Instrumentales, ACPVI, (Rao, 1964).
Ces résultats étantplus théoriques
que pra-tiques,et
finalement asseztechniques,
nous n’en donnons pas ici les démonstrations.On
peut
les trouver dans(Vivien, 1999).
- D’un
point
de vuepratique,
il suffit d’utiliser unerégression
PLS « usuelle »en y
ajoutant quelques
calculs.-
Enfin, touj ours
d’unpoint
de vuepratique,
onpeut
comparer la variance d’une composante de co-inertie Uk,s(resp. ts)
avec la variance de lacomposante
d’inertie(issue
del’ACP)
de même ordre issue del’Analyse
enComposantes Principales (ACP)
du
triplet (Yk, Qk, D) (resp.
dutriplet (X, Q, D)).
Plus elles sontproches,
meilleureest
l’explication
du tableauYk (resp. X)
par l’axe de co-inertiecorrespondant.
Les
graphiques appelés
«w* c» par Tenenhaus(1998)
sont bien sûr faisablesici,
ainsi que toutes les aides à
l’interprétations
que l’on utilise en PLS. Mais nous ne les ferons pas dansl’exemple
traité par lasuite,
pour une économie deplace.
Deplus,
ilsemble naturel de comparer la variance des
composantes
uk,s à celle descomposantes
de même ordre issues de la
régression
PLS « usuelle » deYk
surX,
ainsiqu’à
lavariance des
composantes
de même ordre de l’ACPVI de(Yk, Qk, D)
parrapport
à X. Ces dernièresanalyses
visant àexpliquer indépendamment chaque
tableauYk
parX,
lescomposantes
associées ont toutes les raisons d’êtreplus explicatives
dechaque
tableau que les composantes de
l’ACIMO-PLS,
si biensûr,
Xexplique
un tant soitpeu le tableau
Yk.
Lescomposantes
de l’ACIMO-PLSexpliquent
chacun des tableauxen tenant
compte
de l’informationapportée
par les autres variablesréponses,
d’oùl’intérêt en
Analyse
Sensorielle(ce
que nousexpliciterons
auxparagraphes
4 et5),
et dans ce
cadre,
cette méthodepermet
lacomparaison
des différents modèles.4.
L’Analyse
sensorielle et l’ACIMO-PLSEn
Analyse Sensorielle,
onpeut
être confronté à deux types de situations : soit modéliser lesappréciations hédoniques
des consommateursquant
auxproduits
étudiés à l’aide des
réponses
de Kjuges (tableaux
despropriétés sensorielles) (Robin, 1996),
soitexpliquer
lespropriétés
sensorielles desproduits
en fonctiondes
caractéristiques physico-chimiques
de ces mêmesproduits,
afin d’étudier leur influence sur lesréponses
données par lesjuges (Qannari,
Courcoux &Maunit, 1997).
C’est dans cette dernière situation que nous allons nous
placer.
Les méthodestraditionnellement utilisées pour résoudre ce
problème,
sontbasées,
toutd’abord,
sur la recherche d’un tableau « moyen », résumant les
propriétés
sensorielles à l’aide de la méthode STATIS(Lavit, 1988; Schlich, 1993)
ou de méthodes Procrustes Généralisées(Gower, 1975; Qannari et coll., 1997) puis
sur l’utilisation de méthodesd’analyses
de deux tableaux.La méthode la
plus immédiate, qui
consiste à modéliser le tableauconjoint
Y ==[Y1| ... 1 y K] (K
tableaux despropriétés sensorielles)
par le tableau X(tableau
despropriétés physico-chimiques
desproduits sujets
àl’étude) grâce
à larégression PLS,
semble
ignorée. Or,
celle-cipossède
despropriétés d’optimalités qui
la rendent trèsproche
del’ACIMO-PLS,
comme nous avons pu le voir dans leparagraphe précédent.
L’ACIMO-PLS
permet
d’étudier le tableau X etd’expliciter
son influence sur lesétudes sensorielles de manière
générale.
On peut donner un modèle
YS
pour chacun des tableaux tenantcompte implicitement
de tous les tableaux. Ces modèles
présentent
un intérêt : ils tiennentcompte
desréponses
de tous lesjuges,
et ont tendance à « améliorer » un tableauayant
desréponses éloignées
des autresjuges.
Deplus,
les modèles pour les K tableaux sontcomparables,
car ils sontexpliqués
par les mêmescomposantes t
et sont de mêmerang. Alors
qu’en
faisant Krégressions
PLSséparées (par exemple),
on n’a apriori
pas de raison d’obtenir à
chaque
fois les mêmescomposantes
pourX,
ni des modèles de même dimension.Ici,
si lesréponses
desjuges
sontcohérentes,
les modèles devraient être « presque »proportionnels.
Un des buts final est de
prédire
lesréponses
desjuges.
Pourcela,
onpeut,
comme dansPLS,
utiliser un critère du type validation croisée pour valider defaçon
« interne » unmodèle.
5.
Application
àl’Analyse
Sensorielle 5.1. Présentation des données utiliséesLes données
(voir l’Annexe )
que nous allons étudier(brièvement)
sont cellesutilisées par Gonzalez
(1982)
dans sa thèse.Elles ont été recueillies à l’ENSBANA
(Dijon) auprès
de 7juges qui
seront ici lestableaux
Yk(K
=7).
Il
s’agit d’expliquer
lespropriétés
sensorielles de cafés boissons à l’aide depropriétés physico-chimiques
descafés,
ces dernières étant associées au tableau X.Dix-huit échantillons de café ont été
préparés
suivant troisparamètres, température, proportion
mouture-eau,granulométrie, ayant respectivement trois,
trois et deuxmodalités.
Quatre
de ceséchantillons, ayant
despropriétés physico-chimiques
relativementproches,
ont étés utilisés comme témoins lors de lacomparaison
parpaires (décrite ci-après)
avec treize des échantillons restants. Le dernier échantillon n’a pas été utilisé.Chaque juge
acomparé
trois fois chacun des treize échantillons avec un témoin et arépondu
à sixquestions : lequel
des deux est leplus caractéristique
enparfum,
leplus
intense enparfum,
leplus
amer, leplus acide,
leplus caractéristique
en arômeet le
plus
intense enarôme,
tout enprécisant
si la différence lui a semblétrès facile, facile, délicate, difficile,
ouquasiment impossible
àpercevoir.
Une échelle de
notation 2
numérotée de 1 à5,
a été mise aupoint
afin de résumerl’opinion
des 7juges
sur les treize échantillons vis-à-vis desquestions :
1 : le témoin est nettement
supérieur
àl’échantillon,
2 : le témoin est
supérieur
àl’échantillon,
3 : le
juge
n’a pas perçu dedifférences,
4 : l’échantillon est
supérieur
autémoin,
5 : l’échantillon est nettement
supérieur
au témoin.Ce sont ces notes que l’on retrouve dans les 7 tableaux de données. Les 7 tableaux sont donc tous constitués de valeurs
homogènes
et du même ordre degrandeur.
Lesnotations sont
explicitées
dans le Tableau 1.Préparation
des données :Tous les tableaux sont D-centrés avec la
métrique
uniforme D =Id13/13.
Dans les espaces des individus
(les cafés)
dechaque tableau,
on utilise lesmétriques
identité :
Qk
=Id6 Vk (p/c =
6propriétés sensorielles)
etQ
=Id10 (9 =
10propriétés physico-chimiques).
De
plus,
les tableaux ont étéréduits, car, comme
le montre le Tableau2,
les inerties des tableaux associés sontdisparates :
lepremier
a une très faible inertie parrapport
aux autres tableaux.
Après réduction,
les 7 tableauxYk
ont ainsi la même inertie à savoir 6. Le tableau X(propriétés physico-chimiques)
a une inertie de 10.2 Pour une description détaillée de l’échelle de notation, se référer à la thèse de Gonzalez
(1982).
TABLEAU 1 Les données Variables des tableaux X et
Yk :
TAB LEAU 2 Inertie des 7 tableaux
juges
5.2.
Application
de l’ACIMO-PLSNous allons modéliser à l’aide de l’ACIMO-PLS les tableaux des 7
juges
enfonction des
propriétés physico-chimiques
des cafés.L’application
a été réaliséeaprès programmation
sous SPLUS® (Venables
&Ripley, 1996).
5.2.1. Résultats de
l’analyse
proprement diteLe Tableau 3 nous
permet
d’étudier laqualité
des composantes uk,, et Uk,2qui, rappelons-le,
ne sont pasorthogonales,
pourchaque
tableauYk.
TABLEAU 3
Résultats de l’ACIMO-PLS d’ordre 1 et 2 :
03BBs
donne le maximum du critère àl’étape
s.cov2
donne les covariances carréepartielles cov2 (Uk,s, ts).
V arianceACP donne la variance des composantesprincipales
dechaque Yk.
Variance Uk donne la variance des composantes Uk de l’ACIMO-PLS. Variance PLS donne la variance des composantes PLS desYk
issues de larégression
PLS deYk
sur X. V arianceAC PV lreprésente
la variance des composantes de l’ACPVI de(Yk, Id6, D)
par rapport à X.Nous pouvons voir que, pour tous les
juges,
les variances des différentes composantessont relativement
proches,
sauf pour lesjuges 2,
4 et 6. Il est clairque X n’explique
pas bien les
réponses
dujuge
6 : la variance de lacomposante ACPVI, qui
a un sensici,
est de 1.947 sur lepremier
axe, alors que la variance dupremier
axe d’inertie est de3.260. La variance sur l’axe 1 de la
composante
de l’ACIMO-PLS sesitue,
engénéral,
entre la variance de la
composante
ACPVI et de lacomposante PLS,
les 3 étant assezproches.
Il ne semble pas y avoir une relation très nette entre lesréponses
dujuge
6et les
propriétés physico-chimiques
des cafés. Nous pouvons remarquer que pour lesjuges
1 et7,
avec descomposantes
ACIMO-PLS trèsproches
descomposantes
deX,
les variances des différentescomposantes
sont trèsproches.
Lejuge
3 est celui dontles composantes sont les
plus
covariées avec t(composante
deX).
Mais la variance de l’axe d’inertie est un peuplus
élevée que les trois autres variances(qui
sont trèsproches).
La
Figure
3 illustre les covariances carréespartielles :
lesjuges
4 et 6 sedistinguent
des autres
juges
par descomposantes
faiblement covariées avec les composantes de X. Nous pouvons alors penser que les modèles de rang 1 et 2 pour ces 2juges
ne sontpas
significatifs.
FIGURE 3
Covariances carrées
partielles
entre Uk et t pour les 2premières
composantes5.2.2. Choix de la dimension commune des K modèles
Si l’on utilisait les valeurs successives de A comme critère
d’ajustement
desmodèles
k = Xk,
nous serions amenés à choisir les modèles de rang 1 commesuffisamment
explicatifs.
Une autre solution pour retenir le rang des
modèles, peut
consister à étudier l’évolution despourcentages
de varianceexpliquée
par lesapproximations Yk,
pour chacun desjuges,
en fonction du rang s du modèle(Tableau 4).
Nous pouvons constater que lavariance
expliquée 3
pour chacun desjuges, augmente
peu àpartir
del’étape
1. Lapremière
composanteti explique
à elle seuleplus
de la moitié de l’inertie totale de X(57.93%).
La deuxièmecomposante, qui n’apporte
que 18%, environ,
d’informationsupplémentaire,
est utile pour lesreprésentations graphiques,
mais n’a pas lieu d’être retenue dansl’expression
des modèles terminaux.De
plus,
le pourcentage d’inertieexpliqué
par lespropriétés physico-chimiques
pour lejuge 6,
est très faible parrapport
aux autres : lesréponses
dujuge
6 sont peu liées auxpropriétés physico-chimiques
des cafés. Lejuge 3, lui, répond
leplus
enrelation avec les
propriétés physico-chimiques.
On retrouve là le fait que lapremière
composante dujuge
3 est laplus
covariée avec tl.TABLEAU 4
Pourcentage
de variance deYk expliquée
parÊk
et de X
expliquée
par ts pour s =1,
... , 6.5.2.3. Recherche du rang du modèle par validation croisée
Un PRESS
global (sur
les Ktableaux)
nous apermis
de retenir des modèles de rang 1.On a
représenté (Figure 4)
le PRESSglobal (somme
des PRESS totaux partableau)
et total par variable
(somme
des PRESS par variable de chacun desjuges).
On peut trouver
quels
sont lesjuges qui
sont les moins bienprédits
en dimension 1grâce
aux PRESS totaux par tableau(Tableau 5).
On peutégalement
comparer les PRESS des tableaux entre eux, car les tableaux initiaux sont constitués du même type de valeurs. Les modèles de rang 1 pour lesjuges
3 et 7 ont leplus grand pouvoir prédictif.
Ce sont aussi ceux dont lescomposantes
ACIMO-PLS sont lesplus proches
de celle de X en dimension 1.
On remarque à nouveau que le
juge
6 sedistingue
des autres : son PRESS est leplus
élevé
quelque
soit la dimension du modèle.3 Variance expliquée par la modélisation de Yk de rang s :
tr(’skDskQk).
FIGURE 4
PRESS
global
etdécomposition
par variable de celui-ci
en fonction
du rang du modèle.TABLEAU 5
PRESS
global
et PRESS total pourchaque
tableau.5.2.4. Les modèles
On donne à titre
d’exemple
les coefficients centrés et réduits3
des modèles de rang 1 pour lesjuges
6 et 7(Tableau 6).
TABLEAU 6
Coefficients
des modèles de rang 1 pour lesjuges
6 et 7.JUGE
6,
RANG 1JUGE
7,
RANG 1D’une manière
générale
ce sont les variablesD04, D05,
EXS et CIDqui
sont lesplus
influentes sur lesréponses
desjuges.
On note que les coefficients pour lejuge
6 sont très
petits
parrapport
à ceux des autresjuges (environ
10fois).
Lessignes
des coefficients du
juge
6 ne sont pas les mêmes que ceux des coefficients dujuge
7.Parfois,
ils sontopposés,
cequi signifie
que les 2juges répondent
inversement l’un de l’autre pour certainesquestions.
Remarques
-
Ici,
l’étude des coefficients des modèles retenus est raisonnable commedans « PLS usuelle » et contrairement à la
régression multiple
aux moindres carrésordinaire.
- Une autre manière de valider un
modèle,
est d’étudier l’évolution des coefficients des modèles en fonction leur rang croissant s.Lorsqu’il
y a une«