R EVUE DE STATISTIQUE APPLIQUÉE
R. C HIFFLET P. G ERIN A. D AZORD J. P. B OISSEL
Essai de définition de la structure de la qualité de la vie à l’aide de techniques d’analyse de données
Revue de statistique appliquée, tome 41, n
o1 (1993), p. 5-35
<http://www.numdam.org/item?id=RSA_1993__41_1_5_0>
© Société française de statistique, 1993, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ESSAI DE DÉFINITION DE LA STRUCTURE
DE LA QUALITÉ DE LA VIE A L’AIDE
DE TECHNIQUES D’ANALYSE DE DONNÉES *
R. Chifflet
(1),
P. Gerin(2),
A. Dazord(2),
J.P. Boissel(3)
(1 ) Unité dePharmacologie Clinique
et SCRIPT INSERM(2) SCRIPT, INSERM,
Hôpital
St Jean de Dieu, 69008Lyon
(2) Unité dePharmacologie Clinique,
Université CI. Bernard,162 avenue
Lacassagne,
69003Lyon
RÉSUMÉ
La
qualité
de la vie est d’abord un conceptphilosophique.
L’étudier àpartir d’enquêtes
(ici, par lequestionnaire PQVS) implique
sa modélisation.L’analyse statistique
desréponses
par des méthodes
d’analyse
des données associées à des moyensinformatiques appropriés,
donne un sens à d’autres concepts, tels que la structure de la
qualité
de la vie. Ellemontre
plusieurs
de ces structures, chacune reflétant une attitude différente face aux diverses dimensions de la vie. Ceci établit un nouveau lien entre ce conceptphilosophique
dequalité
de la vie et le monde réel.
Mots-clés :
Qualité
de vie,questionnaire, analyse
des données,classification, analyse factorielle,
structurehiérarchique,
structure axiale.SUMMARY
Quality
of life is aphilosophical
concept. Itsstudy through
surveys (here,using
thePQVS questionnaire) implies
to build a model of it. Statisticalanalysis
of the responses,through
dataanalysis
methods associated with convenient software, leads to new concepts, such as thequality
of life structure. Several such structures can be shown, each of themdisplaying
a different attitude towards several dimensions of life. This is a new link between thephilosophical
concept ofquality
of life.Key-words : Quality of life, inquiry, classification,
dataanalysis, classification, factor analysis,
hierarchical structure, axial structure.* Une version moins complète de cette étude est parue dans le numéro 8 de la revue de Modulad de décembre 1991 sous le titre «Essai de structuration de la qualité de la vie à l’aide de techniques d’analyses des données».
6 R. CHIFFLET, P GERIN, A. DAZORD, J. P. BOISSEL
1. Introduction
L’étude de la
qualité
de la vie futpendant longtemps
réservée auxphilo- sophes, qui
en faisaient une étuderéflexive ; puis
elle a étéprogressivement abordée
selon une
méthodologie scientifique,
par deshistoriens, ethnologues
ousociologues (Bradbum 1969, Campbell 1976 ;
Andrews etWithey 1976; Bryant
et Veroff1982)
et
enfin,
très récemment(3) (Bardelli
et Saracci1980),
par des médecins(dans
lecadre d’essais
thérapeutiques) (Najman
et Levine1981; Flanagan 1982; Wenger
et coll
1987 ;
Gerin 1989a etb).
On
peut
aborder laqualité
de la vie sous unangle objectif, qu’il s’agisse
du contexte matériel de
vie, objet
d’étudeprivilégié
deséconomistes,
ou de lasanté,
àlaquelle
les médecins ont tendance à réduire laqualité
de lavie,
comme en
témoignent
les dénominations mêmes des instrumentsqu’ils
utilisenthabituellement pour
apprécier
laqualité
de la vie(Quality
ofwell-being : (18), Kaplan
Anderson1987;
SicknessImpact
Profile(5), : Bergner 1987;
McMasterHealth Index
Questionnaire (10), :
Chambers1987; Nottingham
Health Profile(21). :
McEwen1987).
Cependant,
si ces éléments concrets sontimportants,
l’essentiel est la manière dont ils sont vécus par lessujets
concernés : «les seules évaluations valables de laqualité
de la vie sont celles obtenuesauprès
dessujets eux-mêmes, qui
mesurentleurs
progrès
parrapport
aux buts(de vie) qu’ils
se sont fixés»(17). Joyce 1987).
Cette
«qualité
de la viesubjective »,
dont il est exclusivementquestion
dans cequi suit, peut
être définie comme «lacapacité
individuelle àagir
dans un ensemblede rôles sociaux divers et à en tirer satisfaction»
(20)
McCullough 1984),
ouplus largement
comme lacapacité
à avoir et réaliser desprojets (12),
Cohen1982),
cequi permet
alors de la concevoir « en termes de distance entre laposition
d’une personne et ses buts»(24).
Sartorius1987).
A ceniveau,
lesquestionnaires
utilisés par lessociologues
sedistinguent
de ceux utilisés par lesmédecins,
ces derniersexplorant particulièrement
cequi
est enrapport
avec lasanté,
lespremiers
s’intéressantdavantage
aux buts conscients et à la vision consciente dumonde, qui
sont lesfacteurs de
qualité
de la vie lesplus importants
pour dessujets
en bonne santé.Ainsi
définie,
cettequalité
de la viesubjective peut
être étudiée sous deuxpoints
de vue, que l’onpeut désigner
par les termesquantitatif
etqualitatif.
Son évaluation
«quantitative» peut
reposer sur l’évaluation des satisfactions- insatisfactions concernant une série d’items couvrant les diverschamps
del’expérience
vécue(notamment
les divers fonctionnementphysiques
ou intellec-tuels
qui correspondent
à lasanté,
mais aussi la vie relationnelle et la vieintérieure,
la manière depercevoir
le monde et de se situer dans cemonde).
Seule cetype
d’évaluation a été abordé dans le cadre des essaisthérapeutiques.
L’importance
de l’étude« qualitative »
de laqualité
de lavie,
ou de sa struc-ture, a
pourtant
étésoulignée
par lesphilosophes,
leshistoriens,
lessociologues.
Ce
type
d’évaluation mérite d’intéresser aussi lesmédecins,
pour deux raisons : d’unepart,
des situations de viecritiques (du
fait de conditionspathologiques
et/outhérapeutiques) peuvent
modifier les échelles de valeur dessujets qui
lesaffrontent ;
et d’autre
part,
les indicationsthérapeutiques peuvent
gagner àprendre
encompte
une
typologie
dessujets
fondée sur leurs centres d’intérêt dans la vie : il est «utile d’identifier lessujets qui
... ont uneprobabilité plus
élevée deprofiter
des résultatsQUALITÉ
subjectifs
favorables que l’on sait ne pas concerner tout le monde»(12).
Cohen1982).
C’est
la
raison pourlaquelle
nous avons inclus desquestions permettant d’explorer
les échelles de valeursindividuelles,
dans lequestionnaire
que nousavons
élaboré
pour évaluer laqualité
de la vie dans lechamp
médical(15,16).
Gerin 1989 a et
b).
La solution retenue consiste àexplorer l’importance
accordéepar les
sujets
àchacune
des dimensions de la vieexplorées
par cequestionnaire.
Dans ce
champ
derecherche,
cet instrument est ainsi lepremier
visant à une telleévaluation
qualitative
de laqualité
de la vie.. Le. but de ce travail est de vérifier si cet instrument
(PQVS) permet
effectivement dedégager
une structure de laqualité
de la vie. Pourcela,
nous avons
cherché,
àpartir
de méthodesd’analyse
des données et de méthodesempiriques,
à définir despartitions
en groupeshomogènes
et de nombre de classesoptimal,
et vérifié leur stabilité : ceci nous apermis
dedégager
une structurehiérarchique,
enplus
d’une structure axialeplus classique
en ce domaine.2. Méthode 2.1 Instrument
La version utilisée du
questionnaire PQVS explore
16domaines,
trèsdivers,
de la viequotidienne (fonctionnements somatique
etpsychique,
insertionsociale,
vie
relationnelle,
intérêt pour lemonde),
et pour chacun d’eux(outre
la satisfac- tion/insatisfactionéprouvée
en cequi
concerne cet item et ledegré
dechangement
constaté à ce
propos) l’importance
accordée par lesujet
à cet item dans sa vie.Ces données sont utilisées ici comme indicateurs des échelles de valeurs indivi- duelles. Les
caractéristiques
duquestionnaire
avec lessigles
des 16 items retenus sont fournis en annexe(§6).
2.2
Sujets
L’étude a
porté
sur lessujets
del’enquête
dite «OCAPI»qui
ontrépondu
àtoutes les
questions.
Cet essaithérapeutique
avait pour but de comparer les effetssur la
qualité
de vie dequatre grandes
classesd’anti-hypertenseurs,
d’efficacitéégale
sur latension,
utilisés enpremière
intention(un diurétique : l’ AldactazineR ;
un
béta-bloquant :
leDethinelR ;
un inhibiteur del’enzyme
de conversion : leRenitecR ;
un inhibiteurcalcique : l’Isoptine LPR).
Il était conduit en ville par des médecinsgénéralistes.
Nous avons étudié d’abord en
septembre
1989 unpremier
échantillonA,
de 283sujets (correspondant
à l’ensemble dessujets disponibles
à cettedate).
Puisen
juin
1990 nous avonsdécoupé
l’ensemble des 402sujets ayant répondus
àtoutes les
questions
sélectionnées alorsdisponibles
en deux sous-groupes : B(les
283
premiers sujets)
et C(les
119 dernierssujets),
afin depréciser
les résultatsassez stables pour tirer des conclusions. Comme le fichier de données avait été au
préalable
trié par numéro de centre de traitement et numéro depatient
et comme àpriori
laprise
encompte
d’un nouveaupatient
dans un centrequelconque pouvait
8 R. CHIFFLET, P GERIN, A. DAZORD, J.P. BOISSEL
être vue comme aléatoire nous avons en fait admis que les 2 échantillons de 283 individus
provenaient
de 2tirages
aléatoires de lapopulation
de 402sujets.
La moyenne
d’âge
est de 52.2 ans(écart type : 11,9),
peu différente entre les hommes et les femmes(51,8
et52,8).
Les sexes sont presqueégalement représentés (46
%d’hommes,
54 % defemmes).
2.3 Procédures
Ces
sujets
ontrempli
cequestionnaire
un moisaprès
la découverte de leurhypertension
artérielle(asymptomatique),
leuracceptation
departiciper
àl’enquête,
et la mise en route de leur traitement. Ils l’ont fait une fois le cabinet médical
quitté,
en utilisant une
enveloppe pré-adressée
au centre de coordination.2.4
Analyse
des données 2.4.1 Considérationstechniques
Les
paliers
deréponse («sans importance»,
«assezimportant»
et «trèsimportant»)
sont ordonnés. Si l’on considère commeégales
les distances entrepaliers consécutifs,
onpeut
coder cespaliers
par les valeurs0,1,2
et utiliserl’analyse
encomposantes principales,
des classificationsautomatiques
basées surune distance
euclidienne, l’analyse discriminante;
si cepostulat
n’était pasfondé,
cela n’introduirait enpratique
que de faibles erreursd’appréciation (23). Nunnally 1978).
Mais onpeut
aussi faire abstraction de l’ordre même de cespaliers
deréponse,
les considérer comme desimples
modalités deréponse différentes,
dans desanalyses
decorrespondances multiples.
2.4.2
Analyse
des données proprement ditea)
Dans unpremier temps,
uneanalyse globale
a étééffectuée,
par uneanalyse
en
composantes principales
normée. Mais seul un«phénomène
de taille»apparaît alors,
reflétant surtout la structure duquestionnaire (c’est-à-dire
que les variables sontpratiquement
toutespositivement
corrélées entreelles,
ou que laréponse
d’unsujet
à unequestion
tend à déterminer saréponse
auxautres).
Poursupprimer
cephénomène
de taille deux directions étaientpossibles :
utiliserl’Analyse
Factorielle desCorrespondances Multiples
oudécomposer
lapopulation
en sous-groupes«homogènes»
et éffectuer l’étude de chacun. Nous avons dans cet articleopté
pour le deuxième choix.
b)
lesdécompositions
de lapopulation
en sous-groupeshomogènes
ont étéfaites en utilisant
plusieurs
foisl’algorithme
des nuéesdynamiques
deDiday (13), Diday 1971),
en faisant varier le nombre de classes de 2 à8,
de manière à sélectionner le nombre de classes«optimal» (en
fonction durapport
variance interclasse / variance totalecorrespondant
à chacune despartitions,
et à l’aided’un critère
pragmatique
basé sur la distribution desrapports obtenus).
Une valeurélevée de ce
rapport signifie
que les groupes sonthomogènes
et distincts les uns des autres, en termesmathématiques
que l’oninterprète
en termes decomportement
psychologique.
c)
Dans un deuxièmetemps,
la cohérencelogique
de l’ensemble de ces classesa été vérifiée
(par
un testempirique
consistant àapprécier
pourchaque
individusa distance par
rapport
à «l’individutype»
de saclasse,
distanceappréciée
parle nombre et le
degré
desdiscordances,
établissant un indice de«dissemblance»),
et la
signification
des classes ainsi obtenues a été ébauchée en relevant «l’ordred’importance
des variables » danschaque
classe.d)
Dans un troisièmetemps,
pour mieuxinterpréter
lasignification
desclasses,
une sélection des variables lesplus représentatives
dechaque
classe a étéfaite en retenant les variables pour
lesquelles
le nombre dessujets
dont laréponse
diffère de celle de «l’individu
type »
de la classe est inférieur à un seuil donné.Les variables
représentatives
ont pu être ainsi réduites de moitié ou d’un tiers.e)
Desanalyses
decorrespondances multiples (classe
parclasse)
et desanalyses
discriminantes(entre
groupes declasses)
ontpermis
de vérifier etpréciser
la
signification
des classes et la structure de laqualité
de la vie de cessujets.
f) Enfin,
desreprésentations graphiques
ont donné une schématisation visuelle des structures desclasses,
àpartir
des moyennes des variables sur chacune des classes. Laprésentation
desdispersions
n’aurait pas de sensici, puisque
la distinction entre les classes repose sur une
approche
multi et non pas uni- dimensionnelle : les classes ne se différencient pas, hormis les classesextrêmes,
si l’on essaie de les comparer selon une seulevariables, quelconque.
3. Résultats
3.1
Analyse
encomposantes principales
Elle a été éffectuée sur l’échantillon A
comportant
283 individus et 16 variables. Les deuxpremiers
axes del’analyse
encomposantes principales (normée,
sans
rotation) représentent 48,9
% et8,5
% de la variance totale. Les axes suivantsne montrent que des
phénomènes
liés à depetits
nombresd’individus,
aussi ne sont-ils pasprésentés
ici. La constitution de ces deuxpremiers
axes est donnéepar la table 1 et la
figure
1. Enfait,
lapremière composante
est si fortementprédominante qu’elle
estpratiquement
la seule àinterpréter.
Toutes les variablesse trouvent
pratiquement
contribuer à sa constitution(«phénomène
detaille») :
cela
signifie
que si l’on considère lessujets
dans leurensemble,
lacomposante principale
de la structure axiale de leurqualité
de vie est le fait d’accorderplus
ou moins
d’importance
à l’ensemble des itemsexplorés
par lequestionnaire,
demanière
homogène.
Autrementdit,
cetteanalyse
traduit seulement le faitqu’il
ya des
sujets plus
ou moins «enthousiastes» : à un extrême se situent ceuxqui
trouvent tout très
important,
et à l’autre ceuxqui
trouvent que rien n’estimportant.
Ce
premier
résultat estimportant
mais ne révèlequ’un aspect
de la structure recherchée : uneimportante
variation del’importance
accordée à l’ensemble des items. Pour chercher s’il éxiste d’autres variationssignifiantes,
discriminant lessujets,
nous avons abandonné l’étudeglobale
de l’ensemble dessujets
auprofit
del’étude de sous-groupes
homogènes :
c’est le but de la classificationqui
suit.10 R. CHIFFLET, P. GERIN, A. DAZORD, J. P. BOISSEL MM 1 Z U2 l 3MIKKK 112 : 7!1!IClL
Code des variables 6 Gestes courants
9 Déplacements
12 Fatigue
15 Digestion
18 Sommeil 21. Sexualité
24 Attention, concentration 27 Relations en général
31 Activités Quotidiennes 34 Préoccupation par la Santé
, 37 Inttrlt pour le monde
40 Activités en Groupe
43 Relations avec des Amis
46 Relations avec les Proches (superposé avec 27)
49 Activités 52 Loisirs
FIGURE 1
Structure de la
qualité
de la vieEchantillon A :
Analyse
enComposantes Principales
TABLE 1
Structure de la
qualité
de la vieEchantillon A :
Analyse
enComposantes Principales
3.2
Classification
par la méthode des nuéesdynamiques
La méthode de
Diday (méthode
denoyaux-partition)
a été utilisée enprenant
comme distance entre les
sujets (définis
par l’ensemble de leursréponses)
ladistance euclidienne
classique (entre
lespaliers
deréponse :
de 0 à2),
et commenoyaux d’une classe
quelconque
son centre degravité.
Dans ce casparticulier l’algorithme
des Nuéesdynamiques
se ramène à la méthode «k-means»(Ball
etHall
(1965); Forgy ( 1965)).
La table 2 montre pour l’échantillon A l’évolution en fonction du nombre de classes(en lignes)
de la variance interclasse(première colonne),
durapport
variance interclasse/variance totale(2e colonne)
et de ladifférence entre ces
rapports
successifspris
deux à deux(troisième colonne).
Lecritère
pragmatique
retenu pour déterminer les nombres de classes despartitions
«optimales»
que nous sélectionnerons est le suivant : on s’intéresse auxpoints
derupture présentés
par l’évolution de ces écarts(marqués
ici par desastérisques) :
entre 4 et 5
classes,
et entre 7 et 8 classes. Or avecquatre classes,
la distribution dessujets
entre les classes est trèsinégale (115 sujets
pour la classecentrale);
au12 R. CHIFFLET, P GERIN, A. DAZORD, J. P. BOISSEL
contraire,
unepartition
ensept
classes donne une distribution assezéquilibrée : 44, 42, 33, 76, 23,
43 et 22. C’est donc cettepartition
que nous retenons. D’autres critères auraient pu être citons ceux que l’on trouvera dans(
I.C. Lerman1981,
B.Leclerc et G. Cucumel1987,
L. Hubert P. Arabie1986). Celui
que nous avonspris
ici àl’avantage
d’êtresimple
etd’interprétation
aisée.TABLE 2
Structure de la
qualité
de la vieEchantillon A :
Classification
par les nuéesdynamiques
La table 3 en
présente
un résumé. Les classesapparaissent
sur leslignes,
eton a des blocs de trois colonnes
(chacune correspondant
à une modalité deréponse :
PI : pas
d’importance;
AI : assezimportant;
TI : trèsimportant)
relatifs à chacun des items. Les nombresindiquent
lespourcentages
des modalités deréponse.
Les classes ont été ordonnées de
façon
inverse de laposition
de leur centrede
gravité
sur lepremier
axe del’analyse
encomposantes principales.
La classe1 est formée des individus
ayant répondu
trèsimportant
à lamajeure partie
desquestions
surl’importance
accordée à l’évolution des items duquestionnaire,
laclasse 7 est formée de ceux
ayant répondu
«pasimportant».
QUALITÉ
TABLE 3
Tableau des pourcentages des modalités de
réponse
obtenues pour
chaque
item(C1,..., C7)
partition «optimale»
de A en 7 classes. Echantillon ARENC. AMIS REL. PRO. ACT. DOM. LOISIRS ACT. QUOT. SANTE MONDE ACT.GROUPE
GESTC SOMME FATIGUE DIGESTION SOMMEIL SEXUALITE ATTENTION REL. GENS
3.3 « Ordre
d’importance
des variables » danschaque
classeNous avons établi pour
chaque classe,
de manièreempirique,
la distribution desréponses
dessujets.
La table 4 illustrel’exemple
les données de la classe 3(échantillon A) :
pourchaque
item etchaque modalité,
elleindique
lepourcentage
dessujets ayant répondu
suivant cette modalité. La modalité pourlaquelle
cepourcentage
est maximum(souligné,
dans latable)
est par définition cellequi
définitla
réponse
de «l’individutype»
de cette classe. Onpeut
alors classer les items en fonction du niveau de cette modalité deréponse
et de son score. La variable deplus grand
score et deplus grande
modalité est mise entête ;
la variable deplus grand
score et de modalité strictement inférieure à cette dernière estplacée
en finde liste. Ce classement est illustré
(ici,
pour la classe3)
par la dernière colonne de cette table. On voit dans cetexemple
que la variable«importance
accordéeà la modification de la santé» avec un score de 81 associé à la modalité «très
importante»
estplacée
entête,
tandis que le groupe de variables«importance
accordée
auxgestes
courants, aux sorties etdéplacements,
à lafatigue
et à ladigestion»
estplacé
en fin de liste bien quepossédant
un score moyen de 70. Ce14 R. CHIFFLET, P. GERIN, A. DAZORD, J.P BOISSEL TABLE 4
Structure de la
qualité
de la vieEchantillon A. Détermination des modalités de
réponse
de
«l’individu-type»
d’une classe(exemple
de la classe 3)classement
permet
de voir directement sur cette classe 3 uneprédominance
desitems relationnels sur les items fonctionnels.
3.4 Contrôle de la cohérence des classes
La méthode des nuées
dynamiques
a sa cohérence propre. Mais pourpouvoir interpréter
lasignification
du noyau(ici,
le centre degravité)
dechaque classe,
il faut
pouvoir interpréter
ce noyau comme l’ensemble des modalités deréponse
d’un
individu-type,
fictif. Si on autorise lesindividus-type
dechaque
classe à avoir des modalités deréponse
continues(ici,
dans l’intervalle0-2),
la cohérence des classes n’est pas à démontrer carl’individu-type
est par définition le noyau de la classe.Sinon, l’individu-type
est défini enprenant
les modalités deréponse
lesplus proches
du noyau de laclasse;
il faut alors démontrer la cohérence desclasses,
c’est-à-dire démontrer queglobalement,
sur l’ensemble dessujets,
la distance dechaque sujet
àl’individu-type
de la classe àlaquelle
ilappartient
est inférieure àsa distance à l’un
quelconque
des autresindividus-type.
C’est ce que nous avons fait.La méthode est
illustrée,
pour l’échantillonA,
par la table5, qui
donnel’exemple
dessujets
2 et186,
membres de la classe 1. Lapremière
colonneindique
la modalité de
réponse
del’individu-type
pourchaque
item(dans
cetexemple, toujours
la modalité2,
c’est-à-dire «trèsimportant»,
car cette classe 1correspond
à des
sujets «enthousiastes») ;
les deux colonnes suivantes montrent lesréponses
de ces deux
sujets ;
laligne
inférieureindique
la somme des écartsprésentés
parchaque sujet,
sommeprise
comme « indice de dissemblance avec"l’individu-type" »
d’une classe donnée
(ici,
la classe1).
TABLE 5
Structure de la
qualité
de la vieEchantillon A. «Indice de dissemblance » (classe 1 et deux sujets de la classe 1 )
De manière
générale,
cet indice de dissemblance est à son minimumquand
il concerne la classe du
sujet,
et ilaugmente progressivement quand
il concernedes classes de numéro d’ordre
plus élevé,
ou moinsélevé(
onrappelle
que lesclasses sont ordonnées de
façon
inverse à laposition
de leur centre degravité
16 R. CHIFFLET, P GERIN, A. DAZORD, J.P. BOISSEL
sur le
premier
axe del’ACP).
La table 6 montre cette évolution des indices de dissemblance de ces mêmessujets (2
et186)
sur l’ensemble dessept
classes : leur indice croît à mesure que l’ons’éloigne
de la classe 1. Cette table montre aussil’exemple
dessujets
126 et 259qui,
eux, sont membres de la classe 3 : pour euxaussi,
cet indice croîtquand
ons’éloigne
de leurclasse,
que ce soit alors dans la direction des classes de rang inférieur ousupérieur.
TABLE 6
Structure de la
qualité
de la vieEchantillon A. «Indice de dissemblance» (ensemble des classes et 4
sujets)
Ceci s’observe
globalement
pour l’ensemble dessujets :
ils sont, de manièregénérale, plus proches
del’individu-type
de leur classe que de tous les autres. Onpeut
donc considérer commepositif
ce test de cohérence.3.5
Interprétation
des classes 3.5.1 Recherche des variablescaractéristiques
des classesPour
interpréter
lasignification
desclasses,
ils’agit
depréciser quelles
variables en sont les meilleurs
descripteurs.
Pourcela,
nous avonscompté
au niveaude
chaque
classe de l’échantillonA,
pourchaque item,
le nombre desujets
dontla
réponse
diffère de celle del’individu-type
de sa classe. Plus ce «nombre de discordances» estfaible, plus
l’item estcaractéristique.
Ceci est illustré par la table7, qui
montre ce nombre de discordances dans le cas de la classe 3(colonne N).
Ici nous,avons défini un seuil 14 de telle sortequ’environ
un tiers des itemspuisse
être retenus commeimportants(ce
sont ceux dont le nombre de discordancesest inférieur ou
égal
à 14(nombres soulignés
sur latable)).
Dans ce cas de la classe3,
ces itemsappartiennent
à deuxcatégories,
suivant quel’individu-type
de cetteclasse a utilisé la modalité de
réponse
«trèsimportant»
ou «assezimportant»
(partie
inférieure de la table7).
TABLE 7
Structure de la
qualité
de la vieEchantillon A. (Classe 3) il Nombre de discordances
2’ Descrinteurs de la classe 3
3.5.2 Recherche d’une structure sur les sept classes
Il existe
plusieurs façon
de définir une hiérarchie sur l’ensemble des 7 classes obtenu. Onpeut
utiliser desprocédés empiriques
deregroupement
des classes ou établir une hiérarchiedichotomique
à l’aide de la méthode de Ward parexemple.
Nous avons successivement utilisé ces deux
approches.
18 R. CHIFFLET, P. GERIN, A. DAZORD, J. P. BOISSEL
L’approche empirique
Nous avons utilisé un
procédé
de classificationempirique
pour regrouper nossept
classes en trois groupes, le nombre 3 étantsuggéré
par lephénomène
de taillede
l’Analyse
enComposantes Principales
et l’existence de 3 modalités deréponse.
Nous avons tout d’abord considéré la
partition optimale (par
la méthode des nuéesdynamiques,
cf§3.2)
en 3 classesGl, G2,
G3 de l’échantillon A. Nous avons alorsregroupé
les classes de lapartition optimale
en 7 classes en 3 groupesAl, A2,
A3 de telle sorte que le cardinal de l’intersection de toute classe i d’un groupeAj
avec
Gj
soitsupérieur
au cardinal de son intersection avec tout autre groupeGl.
La
partition
en 3 classes de l’échantillon A obtenue est lapartition 1-2-3,
4-5 et6-7
(Cf
hautfigure 2).
Desanalyses
discriminantes effectuées sur les classes et sur cesregroupements
de classes montrent non seulement une excellenteséparation
entre les classes étudiées deux par deux
(ce qui
est dû àl’emploi
de la méthode des nuéesdynamiques),
mais aussi une très bonneséparation
entre ces groupes de classes(taux
de bon classement :93,6
entre les groupes 1-2-3 et4-5; 93,9
entre les groupes 4-5 et 6-7 et de 100 entre les groupes 1-2-3 et6-7;
lapartie
hautede la
figure
3 visualise lesoppositions
entre cesgroupes).
Cette dernière n’est pas due à la méthode des nuéesdynamiques
etpeut
donc être attribuée à une structurehiérarchique
«naturelle»sous-jacente (cf figure 2).
FIGURE 2
Hiérarchie
interprétable
sur l’ensemble des classes Echanzillon Avaleur de la fonction linéaire discriminante des groupes
(1
23); (4 5)
valeur de la fonction linéaire discriminante des groupes
(4 5) ; (6,7)
valeur de la fonction linéaire discriminante des groupes
(1
23) ; (6 7)
FIGURE 3
Analyses
discriminantes. Echantillon A20 R. CHIFFLET, P. GERIN, A. DAZORD, J. P. BOISSEL
Il est intéressant de comparer ces trois groupes
1-2-3,
4-5 et 6-7 aux trois groupesG 1,
G2 et G3 de lapartition « optimale »
en trois classes obtenue par les nuéesdynamiques
sur l’échantillon A. Pourcela,
on effectue lescomparaisons
1-2-3/Gl,
4-5/G2 et 6-7/G3(partie supérieure, A,
de la table8) :
lespourcentages (indiqués
sur la deuxièmeligne) indiquent l’importance
de leurs intersections. On constate ainsi que les groupes1-2-3,
4-5 et 6-7 sont peu différentsrespectivement
des groupes
G1,
G2 et G3 : onpeut
donc les identifier. La même conclusions’impose
àpartir
de l’observation des autres échantillons : Cf lesparties
B et C dela même table.
Utilisation de
l’algorithme
de WardL’algorithme
de Wardappliqué
aux données décrites dans lapartie
basse dela table 8 nous a donné sur l’ensemble des 7 classes la hiérarchie du bas de la
figure
2 que nous allons brièvement commenter. Il y
apparait
2grands
groupes:( 1,2,3)
et(4,5,6,7),
alors que dansl’approche précédente
on en avait 3 :(1,2,3) (4,5)
et(6,7).
Le deuxième groupe
(4,5,6,7)
est constitué de 2 sous groupes(4,5,6)
et(7).
Danscette
approche
la classe 6 se voit rattachée à la classe des « modérés » alors que dansl’approche précédente
elle se trouvaitplacée
avec le groupe des« pessimistes ».
Onpeut interpréter
cephénomène
en disant que lephénomène
humeur que nous avonsdégagé
estcomplexe.
Il se compose d’une tendancegénérale donnée
pas les troispaliers( PI,AI
etTI)
et d’une tendance«euphorique»
ou «relationnelle» montrant les individus de tendancegénérale
PI sousl’angle
AI.Le bas de la
figure
2 se lit de lafaçon
suivante. Pourchaque
classe on aindiqué
sadispersion
et son nombre d’éléments. Ladispersion
d’une classe obtenue par la réunion de 2 classes existant s’établit en faisant la somme des inerties deces 2 dernières classes à
laquelle
onajoute
la valeurindiquée
sur l’axegradué
dubas de cette
figure.
Parexemple
ladispersion
de la réunion des classes 2 et 3 vaut 477 et ce nombre estégal
à la somme des 3 nombres 274 198 et 5.Si on essaye
d’analyser grossièrement
cettehiérarchie,
on voitqu’elle
montreun
découpage
en 4 classes intéressant1,(2,3),(4,5,6),7.
Les classes extrêmes 1 et 7se trouvent détachées des autres. On voit bien que ce sont des classes extrêmes.
3.5.3
Représentations graphiques
associéesNous
rappelons
que les modalités deréponses (PI,AI,TI)
ont été codées0,1,2.
La moyenne des modalités de
réponses
à unequestion,
fournie par un ensemble d’individus a un sens si on la voit comme unpositionnement
de cet ensemblede
sujets
parrapport
à ces trois modalités deréponses.
Sur lafigure
4 on trouveles
graphiques
des moyennes, pourchaque question,
des classes despartitions
«optimales»
de l’échantillon A. En haut de cettefigure
se trouve legraphique
associé aux trois classes de la
partition «optimale»
de A en 3 classes. Au milieu de cettefigure
celui associé aux 4 classes de lapartition «optimale»
de A en 4classes et au bas de cette
figue
se trouve legraphique
associé aux 7 classes de lapartition «optimale»
de A en 7 classes. Cettefigure
4permet
de comparer visuel- lement lespartitions « optimales »
en3, 4
et 7 classes de l’échantillon A. Lapartition
QUALITÉ
TABLE 8 Qualité de la vie
(ocapi) Comparaison
despartitions
en 3 classesECHANTILLON A
(t.2.3,4,6,8.7) · partition ’optimale’ de A en 7 classes
(1,2,3,4,6.(8,7» . (B1.B2.B3.B4.B6.BO) - · partition optimale d B en e classes (1,(2,3).4.8,(8.7» - (C1.C2.C3.C4.CC) - · partition optimale de C en 6 classe*
123 . r6union des 3 classe* 1.2.3 ou de. 2 classes 1.(2.3)
ECHANTILLON A partition optimale en 7 classes
dispersion d’une ctasse ’ somme des carrés des distances de ses éléments à son centre de gravité
variance d’une ctasse ’ d!sperston/(nb.varabtes*cardtnat)
·dispersion/(16·cardinal)
cardinat ’ cardinal de la classe
22 R. CHIFFLET, P. GERIN, A. DAZORD, J. P. BOISSEL
Partition "optimale"
en3 classes
partition optimale
en4 classes
Partition Optimale
en7 classes
FIGURE 4
Typologie
sur les items. Echantillon AQUALITÉ
«optimale»
en 3 classes ne faitapparaître qu’un
effet humeur lié aux modalités deréponse ( PI, AI, TI).
Lespatients
ont tendance àprivilégier
une modalitéde
réponse
et às’y
tenir. Nousappelons
par la suite cephénomène
humeureffet questionnaire.
Lapartition optimale
en 4 classes montrel’apparition
d’unautre
phénomène
que nous rattachons àl’opposition
« fonctionnel-reste des items »précédemment
décrite. Nous dirons que nous avons affaire à uneperturbation
del’effet
questionnaire.
Lapartition
en 7 classes quant à elle superposeplusieurs
effetsdifficilement visualisés
quand
toutes les classes sontreprésentées
sur un mêmegraphique (bas
de lafigure 4).
Pourplus
declarté,
cettepartition
estprésentée
en 3temps
sur lafigure
4 bis : en a nefigurent
que les classes 1-4-7objectivant
« l’effetquestionnaire»;
enb,
les items fonctionnels et relationnels montrent, une balance inverse entre les classes 2 et 3(La
classe 3privilégie
le relationnel au fonctionnel tandis que la classe 2 a tendance à mettrepratiquement
sur le mêmepied
ces deuxcatégories
enayant
tendance toutefois àpréférer
lefonctionnel).
Enc)
onaperçoit
un troisième
phénomène : l’opposition
«attituderepliée ;attitude
ouverte aux autreset au monde » schématisée par la
représentation graphique
des moyennes des items des classes3,
4 et 5.3.5.4 Recherche des contrastes entre classes
Ces
analyses (Cf paragraphes
3.1 et3.2) permettent
aussi depréciser
l’in-terprétation
des classes. Unexemple
en estdonné,
pour lecouple
des classes 2 et3,
par la table9, qui
montre les valeurs(multipliées
par100)
de la fonction discri- minanteassociée,
sur les items classés par ordrealphabétique.
Ils sontrepérés
parun *
quand
leur valeur absolue excède10,
seuil que nous avons arbitrairement fixé pour retenir un item comme discriminant. Pour cecouple
declasses,
la discrimi- nation reposedonc,
par ordred’importance décroissant,
surl’importance
accordéeaux
gestes
courants, à lafatigue,
à ladigestion,
auxdéplacements,
à lasexualité,
aux
loisirs,
aux relations avec des amis. Ledémarquage
entre les classes 2 et 3porte
donc surl’opposition
vie fonctionnelle/vie relationnelle.TABLE 9
Recherche des contrastes entre classes
Exemple
des classes 2 et 3. Echantillon ACoordonnnées de la
fonction
linéaire discriminantemultipliées
par 100.24 R. CHIFFLET, P GERIN, A. DAZORD, J. P. BOISSEL
opposition fonctionnel relationnel
opposition attitude repliée-ouverte
FIGURE 4bis
Echantillon A. Partition