R EVUE DE STATISTIQUE APPLIQUÉE
P. B RITO
C. C HABANON
Analyse de données numérique et symbolique appliquée au confort automobile
Revue de statistique appliquée, tome 42, n
o4 (1994), p. 39-59
<http://www.numdam.org/item?id=RSA_1994__42_4_39_0>
© Société française de statistique, 1994, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ANALYSE DE DONNÉES
NUMÉRIQUE ET SYMBOLIQUE
APPLIQUÉE AU CONFORT AUTOMOBILE
P.
Brito(1),
C.Chabanon(2)
(1) Universidade de AveiroDept.
de Matemática 3800 AveiroPortugal
(1)INRIA-Projet
CLORECRocquencourt
78153 LeChesnay
(2) Renault S.A. Centretechnique d’Aubevoye
DE/DESC/0865 27940
Aubevoye
FranceRÉSUMÉ
Une étude portant sur le confort
subjectif
en automobile estexposée.
L’étudecomprend
deux
parties
distinctes : lacartographie
interne,qui
met en relation l’avis des experts avec les mesurespratiquées
sur les véhicules, et lacartographie
externe,qui
tient compte desimpressions
des passagers. Dans lapremière partie,
nous utilisons la classificationhiérarchique
pour trouver une bonne
partition
de l’ensemble des voitures et lasegmentation
par arbre binaire pour obtenir lesrègles
d’affectation aux classes. Dans la secondepartie,
l’étude de lacartographie
externe, nousanalysons
un tableau portant sur 10 versions, à traversl’analyse
des
correspondances multiples,
la classificationhiérarchique
et la classificationpyramidale symbolique.
Dans cette étude, la classificationpyramidale symbolique
aprésenté l’avantage,
par rapport à la classification
hiérarchique classique,
de fournir des classesauxquelles
nouspouvons associer une
interprétation caractéristique
en terme de variables actives, ordonner defaçon pertinente
les 10 versions et faireapparaître
des classesqui
n’existent pas dans la hiérarchie etqui
nuancentl’interprétation.
Mots-clés :
Classification pyramidale symbolique, classification hiérarchique, confort
auto-mobile.
SUMMARY
In this paper we present a
study
on carsubjectif
comfort. Thisstudy
consists of two distinct parts : the internalcartography,
which relates the expertsjudgement
and the measuresmade on vehicules, and the extemal
cartography,
which takes into account the passengersimpressions.
In the first, we use hierarchicalclustering
to determine agood partition
of theset of cars, and
segmentation by
abinary
tree to obtainassignment
rules. On the other hand, thestudy
of extemalcartography,
where a data table on 10 versions is studied,comprehends multiple correspondence analysis,
hierarchicalclustering
andsymbolic pyramidal clustering.
In this
study, symbolic pyramidal clustering
presents theadvantage,
as concems classical hierarchicalclustering,
toyield
classes to which a characteristicinterpretation,
in terms of the40 P. BRITO, C. CHABANON
active variables, can be associated, to
meaninfully
order the 10 versions, and toproduce
classeswhich cannot be found in the
hierarchy
and which allow for agraded interpretation.
Keywords : Symbolic clustering,
hierarchicalclustering,
vehiclecomfort.
1. Introduction
Le confort d’une automobile est
quelque
chose de trèssubjectif
quel’entreprise
Renault mesure
depuis
de nombreuses années. Lespectre fréquentiel
de laréponse
de la voiture aux excitations de la route est
découpé
en bandes defréquence
pour faciliterl’analyse,
la mise aupoint
et lacompréhension
desphénomènes.
La bande des basses
fréquences (BF)
détaillée dans cet article occupe laplage
0-2 hz. C’est
elle,
parexemple, qui
occasionneparfois
le «mal de mer» sur route.Elle est perçue
physiquement
comme undéplacement
alors que lesfréquences plus
élevées le seront comme des ondes de
pression (
si lafréquence f
estsupérieure
à50hz).
L’analyse
des données a mis à notredisposition
un ensemble d’outilsqui permet
lasynthèse
multidimensionnelle et la sélection deparamètres pertinents.
La reconnaissance des formes nous a
apporté
les outils d’aide à la décision. Plusrécemment, l’analyse
de donnéessymboliques
apermis
d’identifier des références stables en terme de confortsubjectif.
Cette formed’interprétation
des résultats semblebeaucoup
mieuxappropriée
au moded’analyse
desexperts
de l’automobile.2.
Méthodologie
L’analyse subjective
estpratiquée
en deuxétapes :
unepremière qui
construit lacartographie
interne despréférences (cf. figure 1)
c’est-à-dire cellequi
met en relationl’avis
subjectif
desexperts
du confort avec les mesurespratiquées
sur lesvéhicules;
FIGURE 1
Cartographie
interne despréférences
Dans la
figure 1, chaque ligne
du tableaureprésente
un essai sur véhicule etchaque
colonnerespectivement
lejugement
desexperts
et lesparamètres
mesuréssur route.
L’analyse
de ces entrées fournit en sortie lesrègles
de décision. Les avissubjectifs
desexperts
valident les différents résultatsd’analyse
et lesrègles
calculées.Ils n’interviennent pas dans les calculs. Une seconde
analyse
établit lacartographie
externe des
préférences (cf. figure 2),
c’est-à-dire celle des passagers(clients).
FIGURE 2
Cartographie
externe despréférences
Dans la
figure 2, chaque ligne
du tableaureprésente
unessai,
caractérisé par les décisions calculées à l’aide de lasegmentation
au cours de lapremière étape,
les
paramètres
deconfiguration
du véhicule(c’est-à-dire
les lois d’amortissement de l’avant et del’arrière)
et lesréponses
sur lesimpressions
perçues au cours de l’essai.En
sortie, l’analyse
fournit lesrègles symboliques
associantpoint
de vue duclient, point
de vue del’expert
via lesrègles
calculées etconfiguration
véhicule.3.
Analyse
de lacartographie
interne despréférences
3.1. Les données
Cette
analyse
a été effectuée sur un ensemble de 50 véhicules Renault et autres. Les voitures étaientéquipées
d’accéléromètres verticauxqui procurent
lesdéplacements
par doubleintégration.
Cesdéplacements
sont traités defaçon
à obtenirles termes
caractéristiques
du pompage, dutangage
et ducopiage
àpartir
des mesuresréalisées sur une route
( cf. figure 3).
Le pompage est un mouvement verticalgénéré
par le
profil longitudinal
de la route. Letangage
est un mouvement d’oscillation de l’avant sur l’arrière créé par le mêmeprofil.
Lecopiage (
ouroulis)
est un mouvementd’oscillation latéral créé par le
profil
transversal de la route.Chaque
véhicule estétiqueté
par l’avissubjectif
del’expert.
Le tableau de données croise les véhicules avec lesparamètres
dedéplacements
issus del’analyse spectrale. Chaque déplacement
est caractérisé par sonamplitude
maxi a et lafréquence
associée
f .
Les valeursd’amplitude
maxi sontmoyennées
sur toute la durée de l’essai.Dix
paramètres
sont ainsi calculés àpartir
desquatre
accélérations.42 P. BRITO, C. CHABANON
FIGURE 3 : Paramètres extraits
Exemple
du tableau de données :Les véhicules mesurés couvrent tous les
segments
de la gamme Renault(Safrane, R21, Clio, Twingo),
Volvo ainsi quequelques étrangères
de diversesprovenances
(cf. figure 4).
La
figure
4 montre enexemple
l’ensemble des véhicules mesurés en pompage.La
fréquence enregistrée f 2
estreprésentée
en abscisse etl’amplitude
associée a2 enordonnée.
FIGURE 4 :
Exemple
sur le pompageLes outils mis en oeuvre sont la classification
hiérarchique
basée sur l’indice de l’accroissement de l’inertie(ou
indice deWard)
et la discrimination nonparamétrique (ou segmentation
par arbrebinaire).
Pour cettedernière,
l’ensemble des données estdécoupé
en un ensembled’apprentissage (50%) qui permet
le calcul desrègles
etun ensemble test
(50%) qui permet
de mesurerl’adéquation
avec lejugement
desexperts.
3.2. Recherche d’une
partition
à l’aide du modèlehiérarchique
Rappelons
briévement que la classification ascendantehiérarchique (C.A.H.)
consiste à construire itérativement une suite de
partitions
emboîtées de moins en moinsfines,
dont lareprésentation graphique
est l’arbrehiérarchique (ou dendogramme) (Ward (1963». (cf. figure 5)
FIGURE 5
Exemple
d’unepyramide
et d’une hiérarchieCette méthode est bien
adaptée
pour des ensembles de données depetite
taillequi génère
desreprésentations
de faible encombrement.Le modèle
hiérarchique
a été étendu au modèlepyramidal (Diday (1984, 1986)) qui
construit une suite de recouvrements emboités au lieu departitions
emboitées. Le modèlepyramidal
estrepris
auparagraphe
4.5.2.1.Nous avons
appliqué
le modèlehiérarchique
sur le tableau des 50 véhicules décrits par les 10 variables définissant le pompage, letangage
et lecopiage.
3.3. Résultats sur les données du
confort
L’examen de l’arbre par les
experts
en confort a été un moyenrapide
dedéterminer le nombre de classes raisonnables. De cette confrontation entre le savoir- faire dans le métier du confort et la
représentation
de la C.A.H. nous avons choisi de sélectionner undécoupage
enquatre
classeshomogènes. (cf. figure 6).
Ces classes sont ensuite considérées comme des références stables en terme de confort. L’ensemble44 P BRITO, C. CHABANON
des classes couvre le confort des véhicules actuels
depuis
ceux à caractèresportif :
laclasse 1 à ceux confortable à l’extrême la classe 4.
FIGURE 6
Classification hiérarchique
sur les données duconfort
Les classes 1 à 4
partitionnent
les véhicules en tendancesportive,
tendance très confortable ou intermédiaires.3.4. Recherche d’un critère de décision 3.4.1. Le modèle de la
segmentation
nonparamétrique
On
désigne
parsegmentation
la famille des méthodes de discrimination nonparamétrique qui
construisent un arbre de décisiongénéralement
binaire(Friedman (1977)).
Achaque
noeud non terminal del’arbre,
est associée un testqui permet
la descente à droite ou àgauche
d’un individu dans l’arbre(cf. figure 7).
Leprincipal avantage
des arbres de décision réside dans la lisibilité desrègles
de décision que l’on obtient en définissant les outils suivants :- un ensemble de
questions binaires;
- un critère d’évaluation des coupures
engendrées
par lesquestions;
- une
règle
d’arrêt de construction del’arbre;
- une
règle
d’affectation dessegments terminaux;
- une
règle
d’affectation d’un nouvel individu.Dans le cas
présent,
on a utilisé comme critère la distance deKolmogorov-Smimov (K.S.).
Celui-ci a été défini pour lasegmentation
en deuxclasses, puis
étendu à unnombre
quelconque
de classes apriori (Celeux,
Lechevallier(1982».
Comme
règle
d’arrêt de la construction del’arbre,
on aimposé
que les noeuds terminaux soienthomogènes, c’est-à-dire, qu’ils
ne contiennent que des éléments d’une même classe(de
la classification obtenue au§3.3).
On résume ci-dessous le critère dans le cas de deux classes
Pi
etP2.
Pour
chaque
variable yj, soientf i
etfj2
les densités deprobabilité
des groupesPl
etP2
etFi
etF2
les fonctions derépartition correspondantes.
Soient 7rl(respectivement 7r2)
laprobabilité a priori d’appartenir
àPl (respectivement P2)
etII
etl2
les coûtsde mauvaise classification. On suppose de
plus
que 7r* l1
= 7r* l2.
Leprincipe
de laméthode repose sur la recherche d’une coupure
qui correspond
à la minimisation durisque
deBayes R(z)
d’une mauvaise classification d’un individu.On dira que
Pl
est lapopulation
inférieure sisinon on dira que
P2
est lapopulation
inférieure.Soit z la valeur
qui
définit la coupure; si pour cettevariable,
l’individu à affecterprésente
une valeur inférieure à z, on l’affecte à lapopulation inférieure,
sinon on l’affecte à lapopulation supérieure.
Si
Pl
est lapopulation inférieure,
lerisque
de mauvais classement estsinon,
cerisque
est donné par :dans le cas
(1),
on a minR(z)
~ maxz z
alors que dans le cas
(2),
on a min z zR(z) ~
maxComme on ne connait pas, a
priori,
lapopulation
inférieure et cellesupérieure,
lepoint qui
minimise lerisque
deBayes
est lepoint
c tel que :Minimiser le
risque
deBayes
revient à maximiser la distance deKolmogorov-
Smimov
D (z) qui
mesure deséparabilité
de deux fonctions derépartition.
Enpratique,
Fi
etF2’
ne sont pas connues, et il faudra les estimer par les fonctions derépartition empiriques correspondantes.
La
règle
de classification d’un nouvel individu est alorssimple : partant
dusommet de
l’arbre,
on effectue àchaque
noeud le testqui permet
de choisir la branche46 P. BRITO, C. CHABANON
à
suivre,
le parcours se terminelorsqu’on
aboutit à un noeud terminal(feuille)
del’arbre;
l’individu est alors affecté à la classecorrespondante.
3.5. Résultats obtenus sur les données
confort
L’arbre construit sur nos données est
indiqué
sur lafigure
7 ci- dessous :FIGURE 7
Arbre de discrimination calculé à
partir
des données duconfort
L’arbre
obtenu est en accord avec la hiérarchie construite avec l’indice de Ward.On constate que la classe 4 est celle
qui
sesépare
enpremier
lieu dansl’arbre;
surla
hiérarchie,
c’est cellequi s’agrège
leplus
tard(donc,
à un niveauplus
élevé del’indice)
au reste de l’ensemble. Les classes 1 et2, qui
sont les dernières à êtreséparées
dans
l’arbre,
sont aussi cellesqui s’agrègent
à unplus
bas niveau sur la hiérarchie.La sélection de 3
paramètres (var 1,
var 3 et var7) parmi
ceuxprésents
permet l’établissement derègles
de décisions d’unegrande
lisibilité. Parexemple
larègle désignant
la classe 3 est la suivante :Si
(var
18)
et(var
3 >7)
alors l’individuappartient
à la classe 3 Le tauxapparent (respectivement réel)
de bon classement obtenu sur l’ensembled’apprentissage (respectivement
sur l’ensembletest)
a été de 100%(respectivement 96%).
L’analyse
de stabilité de l’arbre de décision ci-dessus a été réalisée par unetechnique
debootstrap
sur l’ensemble des 50 véhicules. Cette méthode consiste à tirer au hasardplusieurs
fois de suite un sous-échantillon de lapopulation
avec lacontrainte d’avoir un
représentant
dechaque
classe pour valider letirage.
Environvingt tirages
ont ainsi été conservés. La variabilité des seuils de décision observéesur l’ensemble des simulations
permet
de calculer une moyenne et unécart-type
bootstrap.
Cetécart-type, comparable
à unedispersion, permet
de moduler les seuilsproposés
en discrimination.Pour
juger
ledegré d’appartenance
d’un essai à uneclasse,
nous avonsarbitrairement écarté les seuils de la discrimination par
rapport
au seuil moyenbootstrap
de ±103C3 et de ±203C3.Ainsi,
on créel’équivalent
des limites des cartes de contrôle. Nous considéronsqu’au
delà de ±203C3 du seuil moyen, iln’y
a pasd’ambiguïté
de décision. Entre ±203C3 et =blcr du seuil moyen, la décision est limite dans la
classe;
en dessous de ±103C3 du seuil moyen, il y a
ambiguïté
caractérisée éventuellement par desjugements
différents entre lesexperts.
Au cours de laphase
de mise aupoint,
cesinformations nous ont
permis
d’évaluer assezprécisément
lespoints
à améliorer pour atteindre laprestation
désirée.4.
Analyse
de lacartographie
externe despréférences
4.1. Les données
Cette
analyse
s’intéresse à laperception
du confort BF à «chaud»après
uneconduite sur route; elle est réalisée à l’aide d’un
questionnaire
detype
fermé. Au cours del’essai,
les véhicules subissent du pompage, dutangage
et ducopiage (cf. figure
3 pour la
définition).
Douze personnes, horsexperts conforts,
ont étéinterrogées.
La campagne d’essais a été menée sur une Renault 25
qui comporte quatre
loisprogrammables
surchaque
essieu : loi1,
loi2,
loi 3 et loi 4. Dix versionsparmi
les seize
possibles
ont étéproposées
auxenquêtés
pourapprécier
le confort.Chaque
personne a
essayé
dans un ordrepré-établi chaque
version de laplus
caricaturale à laplus fine,
ultimemélange
d’un bon confort. La classe 1 est absente des tests.Le
questionnaire proposait quatre questions, possédant
chacunequatre
mo- dalitéséquiréparties
sur l’échelle des valeurssubjectives
et ordonnées de manière naturelle du très fort sous-amortissement(«quasi-
absence del’amortisseur»)
à unsur-amortissement
(«quasi-
absence desuspension»).
Les
règles
calculées auparagraphe précédent complètent
les variables activessur la
configuration essayée
endésignant
la classed’appartenance
en confort.Trois outils ont été mis en oeuvre pour
analyser
ce tableau :l’analyse
des cor-respondances multiples (A.C.M.) (
L. Lebart(1977)) complétée
par lesanalyses élémentaires,
la C.A.H. et enfin la classificationpyramidale symbolique exposée
endétail dans la suite de l’article.
48 P. BRITO, C. CHABANON
4.2.
Histogrammes
Quel est le niveau d’amortissement
global ?
Quel est le niveau de sous-amortissement avant ?
Quel est le niveau de sous-amortissement arrière ?
Quel est le niveau de
copiage ?
Quelle est la classe
d’appartenance
en confort BF ?(issue de l’arbre de décision )
Quel est le type de loi sélectionné à l’avant ?
Quel est le type de loi sélectionné à l’arrière ?
La
première question
montre que les véhiculesprésentés
couvrentéquitable-
ment les trois niveaux d’amortissement. Aux deux
questions suivantes,
les personnes ontrépondu,
engénéral,
sur-amorti de l’avant et de l’arrière. Pour lecopiage,
ilsont souvent
répondu léger
et moyen, avec toutefois un niveau de nonréponse
élevé(modalité «indéfinissable»).
4.3. Résultats issus de L’A.C.M
L’analyse
est effectuée sur le tableau des variables illustratives ci-dessous :FIGURE 8
Plan de
projection
1-2 de l’A. C.M.50 P. BRITO, C. CHABANON
L’A.C.M. fait ressortir sur ce
premier plan
factoriel l’évolution du niveau d’amortissement avantprincipalement expliqué
par l’axe 1 et l’évolution du niveau d’amortissement arrière et ducopiage principalement
sur l’axe 2. Une évolution surl’essieu avant ou sur l’essieu arrière n’aura pas les mêmes effets sur le confort
subjectif
des passagers.
La version 1
(loi
1 Av/ loi 1Ar)
estanalysée globalement
sur-amortie par l’ensemble desenquêtés.
Demême,
la version 7( loi
1 Av/ loi 4Ar)
semble avoir unamortissement
global
normal. Enfin les versions 3(loi
3 Av/ loi 3Ar)
et 13( loi
3 Av/loi 4
Ar)
sontjugées globalement
sous- amorties.Subjectivement,
lesinterrogés
ont trouvé la version 7 comme un boncompromis
d’amortissement
global, qu’ils
définissent par unléger
sous-amortissement de l’avant et un moyen sous-amortissement de l’arrière. Audelà,
on tend sur des voitures extrêmes(raides
oumoles).
Ils considèrent que le
copiage
s’atténue au fur et à mesure que le sous- amortissement arrièreaugmente.
Cette sensation a peu de relation avec le sous-amortissement avant.
De
même,
ils considèrent que toutes les versions de la classe 4 de la classification BF(versions 3,4,13,14)
se caractérisent par un fort sous-amortissement avant. Par contre, le fort sous-amortissement arrière est perçu à la fois dans les classes 3 et 4.L’analyse
de la stabilité dupremier plan
factoriel a été réalisée àpartir
de20 sous-échantillons de 9 à 10
enquêtes parmi
les 12disponibles.
Elle confirme laposition
des modalités dans leplan.
4.4. Résultats de la classification
hiérarchique
FIGURE 9
Hiérarchie sur variables actives de la
représentation
externeLa construction de la hiérarchie suivant l’indice de Ward s’effectue sur les variables actives : la classification BF
(issue
de l’arbre dedécision)
et les lois avantet arrière.
La coupure a été établie à
partir
d’uneinterprétation
visuelle desregroupements proposés
aux différents niveaux de lareprésentation figure
9. Elle isole la version 14qui
était une voiture très caricaturale.La
représentation figure
9 ci-dessus échelonne les versions du sur-amortissement àgauche
sur legraphique
au sous amortissement à droite et un boncompromis
aucentre du
graphique.
Comme le critèrepermet
despermutations
des individus(les versions)
les uns parrapport
aux autres, l’échelonnement des versions degauche
àdroite n’est pas forcément
unique.
Parexemple,
si Vers 2 et Vers 9 sontpermutées,
lecritère est
inchangé
par contrel’interprétation subjective
est contrariée.De
plus,
le critèred’agrégation
n’assure pasqu’un
élément d’une autreclasse,
ne vérifie pas les
propriétés
associées à une classe donnée. Il y a absence de recouvrement des groupesG1, G2,...
cequi gène
considérablementl’expert
dans leschoix
d’interprétation.
Ceci nous a conduit àemployer
la classificationpyramidale symbolique.
4.5.
Classification pyramidale symbolique (C.PS)
Le but de
l’approche proposée
est celui d’obtenir une structured’héritage
surles
données,
dont les classes sont associées à un ensemble depropriétés
sur les valeursprises
par les variables. Pour obtenir une telle structure, la méthode de classificationpyramidale symbolique
est utilisée. Le modèlepyramidal
constitue une extensionde la classification
hiérarchique, présentant
des recouvrements emboîtés au lieu departitions,
deplus chaque
classe d’unepyramide
doit être un intervalle d’un ordre totalsur les individus classifiés. La
C.P.S., qui
relève des méthodes dites «de classificationconceptuelle»,
utilise le modèlepyramidal
pour obtenir une structure oùchaque
classeest associée à une
conjonction
depropriétés portant
sur les valeurs des variablesdescriptives.
4.5.1. Le
langage
dereprésentation
Le
langage
dereprésentation
utilisé est basé fondamentalement sur la notiond’objet symbolique (Diday (1987, 1991),
Brito(1991)).
Unobjet symbolique peut
être assimilé à uneconjonction
depropriétés portant
sur les valeursprises
par les variables :on
parle
alors de définition en intention del’objet symbolique.
Cespropriétés peuvent porter
soit sur les individuspris séparément (cas
desobjets assertion)
soit sur lesrelations entre individus
(cas
desobjets
horde et desynthèse).
Un autre moyen dedéfinir un
objet symbolique
est l’énumération exhaustive de tous les individus(ou
tous les
k-uplets d’individus) qui
satisfont laconjonction
depropriétés :
onparle
alorsde définition en extension. Par la
suite,
nousn’envisagerons plus
que le cassimple
des
objets
assertion.Soit 0 l’ensemble des
objets observés,
Ç2 ={w1,
... ,wn} ~ Il, où 03A0
est lapopulation
étudiée(ensemble
desobservables). Chaque
élémentde ]"[
est décrit par52 P. BRITO, C. CHABANOl
p
variables y2 :
. Nous avons alors :Le
point (y1(w),..., yp(w))
E 0 =01
x ... xOp
estappelé description
de w, etO = O1
x ... xOp l’espace
desdescriptions.
Un
objet
assertion est formé d’uneconjonction
d’événements élémentaires de la forme[yi
=Vi],yi
E{?/i,..., yp}, Vi C Oi,
sur un ensembleYI ç {y1,..., yp}.
Sans
perte
degénéralité,
onpeut
considérerY1
={y1,..., yq}, q
p. Unobjet
assertion «a », noté :
exprime
la condition « la variable y,prend
des valeursdans V1
et ... et la variable ypprend
des valeurs dansVq».
Pour
chaque variable,
on donne un ensemble de valeursqui représente
savariabilité dans la classe considérée.
Remarquons
que ce modèle contient le modèle tabulaire usuel comme casparticulier,
en associant àchaque individu-ligne
du tableaula fonction indicatrice du
point qu’il représente.
On associe à un
objet
assertion deuxapplications :
D’une
part a :
O ~{vrai,faux}
telle quea(xl,
...,xp) =
vrai ssi Vi =1,...,
q, xi E
Vi,
a est donc la fonction decaractéristique
de l’ensembleVI
x ...x Vq
xOq+l
x ... x
Op ;
et d’autrepart,
a* : 03A9 ~{vrai,faux}
telle quea*(w) = a(Y(w)) : a* (w)
= vrai ssi sadescription appartient
à l’ensembleVI
x ... xVq
xOq+1
X ... xOp.
On définit l’extension de a
(sur 03A9)
par :et son extension virtuelle
(sur 0),
La notion d’extension virtuelle
permet
de munirl’espace
desobjets
assertiond’une relation d’ordre
partielle, qui
estsimplement
la relation d’inclusion dansl’espace
dedescription :
unobjet
a estplus général qu’un objet
assertion b(b
est
plus spécifique
quea)
siextob ~
extoa. Cette relationd’ordre, appelée
aussi«spécialisation- généralisation»
estprésente
dans les travaux deplusieurs
auteurssous des formes
équivalentes (Mitchell (1982),
Gascuel(1989), etc.).
Des
opérations
d’union et d’intersection ont étédéfinies, permettant
degénéraliser
ou despécifier
lespropriétés explicitées
par deuxobjets
assertion. Si(où
l’onpeut
avoirVi
=Oi
et/ouWi
=Oi
pourquelque i)
alors :On verra facilement que al U a2 est
l’objet
assertion leplus spécifique qui
estplus général
que a etb;
demême,
ai n a2 estl’objet
assertion leplus général qui
estplus spécifique
que a et b. Il est aussi facile de démontrer que extç2(al
Ua2) ~
(extnal
Uextna2),
maisextn(al
na2) = (extnal
nextna2).
Complétude
Dans le cadre d’une méthode de
classification,
la notiond’objet symbolique,
associant à une classe d’individus une
représentation
enintention, permet
d’obtenirune
interprétation
des classes en termes des variablesdescriptives.
Une classe donnée d’individuspeut
êtrereprésentée
par différentsobjets
assertion : onpeut
tenircompte
ou non de toutes les
variables,
considérer unobjet
assertionplus
ou moinsgénéral,
etc.La notion de
complétude (Diday (1987),
Brito(1991)) permet
d’associer à une classeun
objet
assertion - ditcomplet - qui exprime
la dualité intention-extension. Unobjet
assertion est dit
complet
s’ilexplicite
toutes lespropriétés
de son extension et s’ilest minimal
(pour
l’ordreintroduit)
à vérifier cette condition. Ce choixcorrespond
àchercher des
descriptions complètes
tout en évitant dessur-généralisations.
La notionde
complétude
a été formalisée dans le cadre de la théorie desCorrespondances
deGalois
(Brito (1991)), généralisant l’approche
de Wille(1982) déjà proposée
parBarbut et
Monjardet (1970).
4.5.2. La méthode de
classification
4.5.2.1 Le modèle
pyramidal
Le modèle de la
représentation pyramidale (Diday (1984, 1986);
Bertrand(1986); Bertrand, Diday (1990)) généralise
celui des arbreshiérarchiques
enprésentant
des recouvrements emboîtés au lieu departitions
emboîtées.Soit SZ l’ensemble
(fini)
desobjets
à classer. Unepyramide
est une famille P de sous-ensembles non vides de Q
(appelés
aussi«paliers»),
telle que4)
il existe au moins un ordre total sur SZ tel quechaque
p E P est un intervalle de cet ordre. Un ordre satisfaisant4)
est ditcompatible
avec P.Généralisant le modèle
hiérarchique
enpermettant
laprésence
de classes non-disjointes,
la classificationpyramidale produit
une structurebeaucoup plus simple
54 P. BRITO, C. CHABANON
que la structure en treillis
puisque chaque
classe est un intervalle d’un ordre total 8(en conséquence,
lespyramides
neprésentent
pas de croisement au niveau de lareprésentation graphique).
Comme pour les
hiérarchies,
unepyramide
induit un indice de dissimilarité surl’ensemble 0 classifié. Dans le cas
pyramidal,
cetindice, appelé
indicepyramidal (ou
encore dissimilarité de
Robinson)
vérifie lespropriétés
suivantes :(i) d(x, y)
= 0 * x = y(ii)
Il existe un ordre 0 tel quex8y8z * d(x, y) >, maxf d(x, y), d(y, z)
Le
premier algorithme
de classification ascendantepyramidale
a étéproposé
par
Diday (1984),
paranalogie
à la méthode de classification ascendantehiérarchique.
Bertrand
(1986)
expose unalgorithme qui
vérifie lesprincipes
énoncés dansDiday (1984)
et où les choix à effectuer lors del’implémentation informatique
sontprécisés.
Un deuxième
algorithme,
que l’on démontre êtreéquivalent
aupremier,
est aussiexposé, ayant l’avantage
de réduire lacomplexité
del’étape
de recherche ducouple
de
paliers
àagréger.
4.5.2.2.
Classification pyramidale symbolique
La méthode de classification
pyramidale symbolique (Brito (1991))
construitune
pyramide
par unalgorithme
ascendant. Les critères de formation des classes sont ici detype logique,
basés sur les notionsd’intention/extension,
cequi
conduit à unestructure de classes
interprétées.
La méthode construit une
pyramide
utilisant unalgorithme
detype
ascendant.Chaque palier
formé serareprésenté
par unobjet
assertion. Soit p unpalier
candidat àêtre
formé,
paragrégation depi,...
pm,représentés, respectivement,
par a1, ..., am.On associe alors à
p l’objet
assertion a = al U... U am(remarquons
que ai U ... U amest
l’objet
assertion leplus spécifique qui généralise
si,...,am).
On démontre dans Brito(1991)
quel’objet
assertion ainsi défini estcomplet.
Le critèreprincipal qui guide
le choix del’agrégation
à effectuer est la convergence intension-extension : lepalier
p = pi U ... U pm est formé si extna = pl U ... U pm = p.Ainsi,
seules les classes admettant unedescription conjonctive
sont formées. Lespaliers
dont lesobjets
assertion associés sont
plus spécifiques
sont d’abord créés. L’ordre de« spécialisation- généralisation»
étantpartiel,
un indice degénéralité
d’unobjet assertion, compatible
avec cet ordre a été défini. La
pyramide
obtenue en find’algorithme présente
alors unestructure
d’héritage,
en d’autres termes,chaque palier
hérite despropriétés possédées
par ses
prédécesseurs.
En
pratique, l’algorithme
commence par chercher la meilleureagrégation
binaire
(c’est-
à-dire cellequi agrège
deuxpaliers);
s’iln’y
a pasd’agrégation
binairevérifiant les conditions
imposées, l’algorithme
cherchera alors lecouple
depaliers agrégeables qui,
par union avec unpalier voisin, permet
de former un nouveaupalier
vérifiant ces conditions
(on
effectue alors uneagrégation non-binaire).
4.5.3 Résultats sur les données du
confort
FIGURE 10
Pyramide
sur les variables actives de lareprésentation
externeLa méthode de classification
pyramidale symbolique
a étéappliquée
à l’ensem-ble des 10
versions,
décrites par les 3 variables actives(la
classification BF et les lois avantarrière)
du tableau despréférences
externesfigure
2.La
figure
10 montre lapyramide obtenue,
ainsi que les classes considérées intéressantes.Du sur-amortissement
(à droite)
au sous-amortissement(à gauche),
les ver-sions s’échelonnent et
s’agrègent
dansplusieurs
groupes distincts(G1,...,G5).
L’emboîtement des groupes
présente
ainsi les nuancesd’appréciations:
Parexemple
le groupe G5 recouvre des
jugements
de G3 et de G4.A
partir
despaliers
de lapyramide
et de la structured’héritage,
les variables ac-tives et illustratives nous fournissent l’ensemble des
règles d’interprétation
suivantes :Groupe
1 : versions1,2,5,9
G1
= [classe
= classe2,
classe3]
n[loi-av
= loi1,
loi2]
^[loi-ar
= pas de loi4]
A[am-global
=normal, sur-armorti]
^[sous-a-av
=léger, sur-amorti]
^[sous-
a-ar =
léger, sur-amorti]
/B[copiage
= n’est pasindéfinissable]
Ce groupe
agrège
des versions avec une tendance au sur-amortissement de l’avant(variable sous-a-av)
et de l’arrière(variable sous-a-ar).
Certainsenquêtés
56 P. BRITO, C. CHABANON
jugent globalement
cetype
d’amortissement normal( variable am-global).
Lecopiage
n’est pas clairement identifié.
Groupe
2 : version2,9,10
G2=[classe
= classe2,
classe3J
A[loi-av
= loi2J
^[loi-ar
= pas de loi1 J
n[am-global
=normalJ
n[sous-a-av
=pas fortJ
^[sous-a-ar
=pas fortJ
^[copiage - léger, moyenJ
Ce groupe
agrège
des versionsjugées globalement
normalesqui
ne sont pas fortement sous-amorties de l’avant et de l’arrière. Lecopiage
n’est pas fort.Groupe
3 : versions7,9,10,13
G3=[classe = classe 3,
classe4J
^[loi-av
= pas de loi4J
n[loi-ar
= loi3,
loi4J
A[am-global
=sous-amorti, normalJ
A[copiage
=léger, moyenJ
Ce groupe est
jugé
bon et sous-amortiglobalement.
Aucune indication nepeut
être donnée sur le sous-amortissement avant et arrière car les avis sonttrop partagés.
Toutefois le
copiage
n’est pas fort.Groupe
4 : versions3,4,13,14
G4=[classe
= classe4J
n[loi-av
= loi3,
loi4J
^[loi-ar
= pas de loi2J
^[sous-
a-av
= fort, moyenJ 1B [copiage
=léger, moyenJ
L’ensemble des
enquêtés
trouvent le sous-amortissement avanttrop prononcé.
Le
copiage
esttoujours jugé
moyen ouléger.
Les avis sont très contrastés surl’amortissement
global
et sur le sous-amortissementarrière;
aucune tendance ne se détache pour ces deuxpoints.
Groupe
5 : versions3,4,7,13
G5=[classe
= classe3,
classe4J
^[loi-av
= pas de loi2J
A[loi-ar
= loi3,loi 4] ^ [am-global
=normal,
sousamortiJ
A[sous
-a-av= fort, moyenJ
^[copiage
=léger, moyenJ
Comme dans le groupe
4,
lejugement global
est normal etsous-amorti, principalement
sur l’essieu avant.En
reportant
les groupes construits par lapyramide figure
10 sur leplan
1-2 del’ACM
figure 8,
nous faisonsapparaître
l’évolution des versions du sur-amortissementau sous-amortissement ainsi que les nuances
d’appréciation subjective
suivantqu’on
aime une version
plus
sur-amorti ouplus
sous-amorti.La liaisons entre les
versions, marquées
par un traitfort,
et tellesqu’elles apparaissent
lors de la visualisation de lapyramide figure 10,
montrent ainsi lacapacité
de la méthode à retrouver un ordre
implicite.
FIGURE 11
Classes de la
pyramide
sur leplan
deprojection
1-2 de l’A. C.M.FIGURE 12
Classes de la hiérarchie sur le
plan
deprojection
1-2 de l’A. C.M.58 P BRITO, C. CHABANON
Ce recouvrement,
comparé
à lapartition
de la hiérarchiefigure
12ci-dessus,
montre le groupe formé des versions « sur- amortissement
global »
defaçon identique, et prend
encompte
les nuances autour ducompromis
«amortissementglobal
normal».De
plus,
il n’isole pas la version 14 extrême dans le sous-amortissement.Finalement,
ilsuggère
quechaque
passager, identifié à un groupeG1, ...,
G5a
posteriori, répond
à laquestion
«ce véhicule est sur-amorti ou sous-amortiglo-
balement ?» de manière relative dans l’ordre
implicite.
Parexemple
les personnes identifiées dans G1(respectivement G3)
trouveront sur-amorti la version 1(respec-
tivement la version
9)
et sous-amorti la version 9(respectivement
la version13).
5. Conclusion
L’analyse
des donnéespermet
lasimplification
du nombre deparamètres
nécessaires à la
compréhension
d’unphénomène puisque
3 variables(varl
var3var7) parmi
les 10 ont été sélectionnées par la discrimination par arbre binaire.Quelque
soitla
qualité
desparamètres : judicieux,
redondants ou pas, cetteopération
de réductionest souvent
observée,
l’idéal étant de se ramener auplan
pour effectuer une décision defaçon simple
ou visuelle.La discrimination par la méthode des arbres binaires et la classification
pyramidale symbolique apportent
lasynthèse
des résultats sous forme derègles
et desnuances
d’appartenance
à telle ou telle classepriori.
Lamanipulation
desymboles
et de
règles
sontplus compréhensibles
par lesexperts
de l’automobile que desplans
factoriels. La confrontation de leurs connaissances avec les
interprétations
issues desméthodes
employées
a validé le processus de traitement utilisé et lesquatre
classes de confort bassefréquence proposées.
L’interprétation
de la C.P.S.complétée
par l’A.C.M met en relief les nuancesd’appréciation
suivant que l’on aime une voituresportive
ou très confortable. Si les avisdivergent quelque
peu suivant lesgoûts
dechacun,
tousacceptent
une version idéale à 9 ou 7. Deplus,
leplan
factoriel montre lacapacité
de la méthode de classificationpyramidale
à retrouver un ordreimplicite
dans le tableau dedonnées;
en
effet,
les versions s’échelonnent d’une version sur-amortie, qualifiée
desportive
voir
«karting»
à une version très trèssouple
voire «bateau».Cet article montre la démarche
adoptée
pour caractériser de manièreobjective
leconfort dans le domaine des basses
fréquences
et l’avis du conducteurqu’il
soitexpert
ou non.Bibliographie
M.
BARBUT,
B. MONJARDET(1970).
Ordre etclassification, Algèbre
et combina-toire;
Tome I etII, Hachette,
Paris.P. BERTRAND
(1986).
Etude de lareprésentation pyramidale,
Thèse de 3 èmecycle,
Université de Paris-IX