E. H ENRI R IARD
M. T ENSAOUT
Construction d’un schéma d’implication entre variables issues d’une analyse des correspondances multiples. Développements. Application
Mathématiques et sciences humaines, tome 135 (1996), p. 19-31
<http://www.numdam.org/item?id=MSH_1996__135__19_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1996, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
CONSTRUCTION D’UN
SCHÉMA
D’IMPLICATION ENTRE VARIABLES ISSUES D’UNE ANALYSE DES CORRESPONDANCES MULTIPLES.DÉVELOPPEMENTS.
APPLICATION E. HenriRIARD1,
M. TENSAOUT2RÉSUMÉ -
L’une des limites de l’analyse descorrespondances multiples
appliquée à degrands
tableaux de données qualitatives est la
difficulté d’analyse
et d’interprétation des structures de relations entre variables.Afin de
dépasser
la frontièredescriptive,
il est proposé une méthodologie de recherche de schémasd’implication
reposant sur les fréquences conditionnelles données par les tableaux de Burt.L’analyse des
correspondances
multiples y est utilisée comme filtre principal de variables à partirdesquelles,
etdans le cadre des méthodes explicatives, sont construits des graphes orientés. Ils sont accompagnés d’indices (fonction, direction
d’infuence,
force motrice, outre celui de masse) qui apportent une plus grande lisibilité des variables impliquées et ouvrent sur d’autres analyses statistiques avancées.SUMMARY - Construction of an involvement scheme among variables issued from a multiple correspondence analysis. Developments. Application.
One of the limits of
multiple correspondence
analysisapplied
on large tables of qualitative items, is thedifficulty of analysis
and interpretation on the structure of relations among variables.In order to outpass the
descriptive frontier,
we propose a researchmethodology
on involvement schemes which is based on conditional frequencies givenby
Burt’s tables.The
multiple correspondence
analysis is used as a principalfilter
for variables from which (and as part of explanatory nwthods) oriented graphs are buit-up. They areaccotitpagnied by
some indicators (function, influence direction,driving
force, besides one of the mass), whichprovide
a greaterlegibitity of the
variables involved, andopen the way to other advanced statistical analysis.
1. INTRODUCTION
La richesse de
l’analyse
descorrespondances multiples appliquée
à degrands
tableaux de donnéesd’enquête (de
forme I xJ)
estcependant
amenuisée par les difficultés àexpliquer
lastructure des relations entre variables ou leur
proximité
sur leplan
factoriel et à les utiliserpleinement
dansl’interprétation
del’analyse.
Ces restrictions tiennent au caractèresymétrique
attribué aux relations entre ces variables que rien n’interdit
(par exemple Worsley, 1987)
deconsidérer a
priori
commeasymétrique.
1 Docteur ès Lettres, Laboratoire de Psychologie, Université Paris XIII, Avenue J.B. Clément, F 93430 Villetaneuse.
2 Docteur en
Économie,
Laboratoire Gama, Université Paris X, 200 avenue de la République, F 92001 Nanterre Cedex.Partant de ce
point
de vue, il estproposé
uneméthodologie
de la recherche de schémasd’implication
basée sur lacomparaison
defréquences
conditionnellesqui
donne lieu à la construction degraphes.
Laprocédure
ne concerne que les variables estimées influentes àpartir
des critères de
l’analyse
descorrespondances multiples
Sonoriginalité
consiste en effet àopérer
à
partir
des résultats de cette dernièrequi paraît plus adaptée
pour réduire le nombre de variablesinitiales3.
La théorie combinatoirepermet
elle aussi de rechercher des schémasd’implication
entre variables mais elle nécessite un nombre restreint de variables pour
qu’une interprétation
soit
possible (Van Buggenhaut, 1987, p. 17).
Nous
présentons [section II]
les différentesapproches
des schémasd’implication (implications statistiques, approche booléenne,
théorie desgraphes), puis [section III]
nousproposons la
procédure d’analyse
defréquences
conditionnellesdéveloppée
sur un courtexemple
àpartir duquel [section IV]
sont avancés d’autresindices, qui
concourent,eux-aussi,
àenrichir la lecture des données de
l’analyse
desconespondances multiples.
2.
MÉTHODES
D’ANALYSE D’UN TABLEAU DE CONTINGENCE(I
xJ)
2.1. Présentation
Seuls les tableaux de
contingence
degrande taille,
construits àpartir
desquestionnaires
ou desépreuves projectives présentent
un intérêt véritable pourl’analyse
desdonnées4.
Leuranalyse
est le
plus
souvent réalisée sur la base d’une réduction dedonnées,
la recherche defacteurs,
la construction declasses,
la sélection de variablesqui
résument au mieux l’information du tableau initial. Les variables ainsi sélectionnéespermettent
d’élaborer des schémasexplicatifs
ouprédictifs
et décisionnels.Aucune méthode
d’analyse
des données nerépond
simultanément à cesexigences.
2.2. Pour
répondre
à cesobjectifs,
demultiples
méthodespeuvent
être retenues 2.2.1.L’analyse
descorrespondances inultiples
L’analyse
descorrespondances multiples
a une efficacité reconnue pour réduire les variables du faitqu’il s’agit
d’une méthodedescriptive exploratoire.
Maiscomparativement
aux modèlesgraphiques
et auxanalyses
combinatoires(çfi
parexemple Guénoche, Monjardet, 1987),
ellene
peut répondre
aux autresexigences.
2.2.2. Les
classification
L’objectif
est de réduire les observations en classeshomogènes.
Mais cette méthode estplus adaptée
à la réduction deslignes (individus, objets) qu’à
celle des colonnes(variables),
et parailleurs,
le choix des indices de similarité se révèle assez délicat(Volle,1993, p.272).
Les modèles
graphiques
et la méthode combinatoire sont surtoutexplicatives
etpermettent
d’affiner les résultats obtenus par les méthodesprécédentes.
2.3. Les modèles
graphiques
Les modèles
graphiques permettent
de sélectionner un ensemble de variables clé fondées surcertaines des
propriétés
des modèlesgraphiques (Whittaker, 1990 ; Fine, 1992 ; Falguerolles
et3 La réduction du nombre de variables peut être obtenue par d’autres méthodes que celle de l’analyse des correspondances multiples des données. Par exemple, par la typologie qui porte cependant davantage sur les
individus que sur les variables.
4 Les tableaux de petite taille ont des méthodes spécifiques d’analyse, par exemple le khi carré.
Jmel, 1993).
Elles diffèrent del’analyse
descorrespondances multiples5
du fait que la sélection des variables obéit à des critèresstatistiques
issus de la théorie desprobabilités (par exemple
modèles
log-linéaires,
théorie del’information).
Mais deux inconvénientsmajeurs
limitent lerecours aux seuls
graphes.
2.3.1. Leur lisibilité réduite
lorsqu’ils
sont utilisés directement sur degrands tableaux,
cequi
aboutit à ne retenir
généralement qu’une
dizaine de variables(Falguerolles
etJmel, 1993).
2.3.2.
L’impossibilité
decomprendre
ladynamique
inhérente à la structure des variables d’ungraphe (leurs
relations restentsymétriques),
du faitqu’ils
ne sont pas orientés(Falguerolles
etJmel, 1993).
Les schémas
d’implication,
dont lesplus représentatifs
sontl’approche statistique
etl’approche booléenne,
permettent dedépasser
ces limites.2.4. Les schémas
d’implication :
si A alors BDans un sens
strict,
toute relationd’implication
se traduit par A # B(si
A alorsB).
Elle doitêtre
systématiquement
vérifiée sur l’ensemble de l’échantillon.L’implication
"nonstricte",
ou"quasi implication",
est une relation danslaquelle
l’observation del’implication
d’une variable A sur une variable B est vérifiéeuniquement
sur uneproportion (non précisée)
de l’échantillon(Van Buggenhaut, 1987).
L’introduction des limites d’un intervalle de confiance à un seuil deprobabilité
fixé est une autrefaçon
de traiter desimplications
non strictes.2.4.1.
Approche
booléenneL’approche
booléenne est classée dans les méthodes combinatoires. Ces dernières relèvent desmathématiques
discrètes des structures finies(ordres, graphes, hypergraphes),
alors quel’analyse
multifactorielle descorrespondances
repose surl’algèbre
linéaire et lagéométrie
euclidienne. Dans cet article on s’intéresse
principalement
auxanalyses
booléennes desquestionnaires (Flament, 1976 ;
VanBuggenhaut, 1987).
Il est montré
(Flament, 1976) qu’il
estpossible
de caractériser unprotocole
et d’extrairedes schémas
d’implication
pour la recherche d’un idéal d’unealgèbre
de Boole et de sonalgèbre quotient (Van Buggenhaut, 1987).
Dans ce casl’implication
stricte est déterminée à l’aide du P.C.U.6 et concerne la totalité ou uneproportion
de lapopulation
seulement(Van Buggenhaut,
1987, p. 14). Cependant,
on ne retient que les P.C.U. dont lalongueur
est auplus égale
à 2.Au-delà,
le schémad’implication
estcomplexe
et devient difficilementinterprétable.
2.4.2.
Implication statistique
L’implication statistique
repose sur des indices construits àpartir
desprobabilités
conditionnelles. Elle est
appréciée
différemment selon les auteurs.; Elle est dite
"presque
satisfaite"lorsque
l’indiceH(a, b)
appartenant àl’intervalle ]-
oc+1]
estproche
de 1. Enexemple,
le tableau suivant croisant la distribution des variables a et b.5
L’analyse
des correspondances multiples utilise des critères empiriques pour la sélection de variables à partir de plans factoriels, tels les contributions relatives (COR), ou absolues (CTA), les valeurs propres, les valeurs test.Ces variables sont dites "influentes".
6 P.C.U.
Projections Canoniques
UltimesTableau 1.
n 1 o est
équivalent
ànaab
L’indice de
quasi-implication
est donné par la formule suivante :(Loevinger,1947, in
Gras etLarher,1993).
Mais selon Gras et Larher
(idem)
cet indice estinvariants
et il ne repose pas sur une échelle deprobabilité.
e Gras et Larher
proposent quant
à eux un indice[cp(a, b)] qui porte
sur des variables binaires :· L’implication
est dite "admissible"lorsque
l’indiceq (a, b)
est -1,65 (pour
(X,=0,05)
ou, autrement,
lorsque
dans uneexpérience,
le nombre d’individus contredisantl’implication
est "invraisemblablement"
petit
parrapport
à celui "attendu" dans unehypohèse
d’absence de lienimplicatif. (Gras
etLarher, 1992, p.7)8.
Une extension de cetteimplication statistique
entrevariables
numériques
ou modales estégalement possible (Bailleul
etGras, 1994).
En
résumé,
les limitestechniques
des études actuelles sur les indicesd’implication
entreles variables d’un
graphe
sont les suivantes :7 Indice indépendant de toute dilatation des ensembles de départ.
8 La littérature concernant la construction d’indices est abondante. Il n’est pas dans notre propos d’en faire une
présentation
exhaustive (çf. Ganascia, 1991). En résumé, pour des échantillons importants, il est possibled’utiliser l’un ou l’autre de ces indices.
·
Lorsque
le nombre de variables estélevé,
cequi
est trèsfréquent
dans les étudesempiriques
menées dans les sciences
humaines,
l’examen des variables deux àdeux,
nécessaire à la construction des schémasd’implication,
est difficilementapplicable.
e Le caractère multidimensionnel des
données9
n’est paspris
encompte
et il s’avèreimpossible
de construire une
configuration.
* Les
hypothèses
fortesposées
sur les lois.Tout ceci réduit la
portée
del’analyse,
d’autantqu’aucune
méthode nerépond
à elle-seule à ces différentscritères,
cequi
rend le choix exclusif de l’une d’entre elles d’autantplus
discutable.
Partant des
plans
factoriels danslesquels
lesproximités
entre les variables influentespeuvent
êtreinterprétées
comme des relationssymétriques (A
~B ) 10,
notre méthode consiste à définir et à construire des schémasd’implication
àpartir
de ces variables. Lesproximités
entrevariables
peuvent
être recherchées àpartir
de leur contribution à l’inertie d’un axe factoriel oubien à
partir
d’une formeclassique
de nuages depoint (la
formecirculaire,
la foimetétraèdre,
l’effetGuttman,
l’effet detaille...).
Onparle
alors de"régionnement
duplan".
D’autres méthodes sont
possibles
pour cetteopération.
Parexemple
la recherche de classeshomogènes
issues d’une classificationautomatique
des variables.3. PROPOSITIONS POUR LA RECHERCHE DE
SCHÉMAS
D’IMPLICATION 3.1. Lesétapes
3. l.1. Cette recherche est réalisée sur la base des variables dites " influentes ". Il
s’agit
desvariables
qui
résument au mieux l’information initiale. Le choix de ces variables est réalisé surla base des valeurs propres
(qui permettent
de retenir lesaxes),
et à l’aide de leur contribution relative et de leur contribution absolue à ces axes.Cette
étape préliminaire qui
filtre les variables lesplus pertinentes
résout pourpartie
laquestion
du choix des variables àexaminer,
ce que nepeuvent
réaliser les méthodes combinatoires. Eneffet,
si celles-cipeuvent,
enthéorie,
tout à faitpermettre
la sélection desvariables,
enpratique,
ellesprésentent
un certain nombre de limites sur les tableaux detype
I xJ, lorsque
les variables sontnumériques11 ;
et pourl’interprétation
des résultats(cf. 2.4.1).
Ces variables constituent le référentiel dans la recherche d’un schéma
d’implication.
Ellessont issues d’une même
région
et sont mises en relation deux à deux àpartir
desfréquences
conditionnelles du tableau de Burt. Ceci
correspond
à un sous-tableau de BUI1apuré.
9 Il traite simultanément de l’ensemble des variables, ce qui n’est pris en compte que partiellement dans les analyses réalisées par paire de variables.
io En analyse des correspondances multiples, après avoir tenu compte des erreurs de perpective, la proximité
observée entre deux variables résulte de profils voisins ou peut être due à la présence d’une ou plusieurs autres
variables.
Il Pour le traitement des tableaux de type K x K (variables ordinales ou quantitatives), les méthodes
combinatoires sont les plus efficaces.
3.1.2. Parmi ces
variables,
seules sont retenues celles dont lafréquence dépasse
un certain seuil(cf. exemple 3.2).
Lacomparaison
desfréquences
conditionnelles est réalisée àpartir
du test deMc Nemar sur échantillon
appariél2.
3.1.3.La recherche d’une relation de
prédominance
oud’asymétrie
est effectuée sur cesvariables
prises
deux à deux. Cette relation est réflexive mais non transitive. Mais souscertaines
conditions,
il estpossible
de définir une relation depré-ordre partiel (Bailleul
etGras, 1994,
p.43).
L’ensemble de cette
procédure permet
de construire ungraphe
fini orienté dont lessommets
représentent
les variables et les arêtes flêchées les relationsd’implication
entrevariables. Celles-ci
peuvent
être testées avec un critèreempirique
oustatistique.
3.1.4. Le réseau des relations ainsi construit
permet
decomprendre
ladynamique
de l’ensemble des variables àpartir
de laproximité
de celles d’unerégion
etd’expliquer
aussi laproximité
dedeux variables par la
présence
d’une troisième. Eneffet,
la démarcheclassique
dans ce derniercas consiste en un retour sur les données initiales
(examen
des distributions desfréquences
desvariables). Dépassant
cetteapproche descriptive, l’analyse
desfréquences
conditionnelles estfondée sur des tests et des critères
statistiques qui apportent
uneréponse plus rigoureuse
à laquestion
desproximités
entre variables.3.2.
Développement
de laméthodologie
Soit deux variables X et Y à deux modalités
(respectivement A,B
et1,2),
retenues selon les critères del’analyse
descorrespondances multiples.
Le tableau de BU11 de
configuration générale
extrait du tableau initial est le suivant :Tableau 2. Tableau des
profils
horizontaux de BurtCe tableau
peut
se lire enlignes
ou en colonnes. Ilindique
lesfréquences
ou les effectifs entredeux variables croisées.
Il
s’agit
deproportions
conditionnelles.Lecture :
P(A/l) signifie
laprobabilité
d’avoir la modalité A à laquestion
X sachantqu’il
a étérépondu
la modalité une de laquestion f13.
12 Test des hypothèses Ho : pl = p2 ; et H1: P 1 # P2. La règle de décision au risque m = 0,05. Si le Khi carré de Mc Nemar est supérieur à 3,83,
l’hypothèse
H1 est retenue. Sinon Ho. Le khi carré calculé est donné par la formulex 2
= (n 1-n2)2 /
(n 1 + n2) dans laquelle n 1 et n2 (effectifs) sont définis à partir de la formule dutableau 1.
13 La fréquence conditionnelle pjli = nij / ni. représente la proportion d’individus qui présentent la modalité Si
sachant yi.
°
Exemple
.
Sip(All) = 80/100,
celasignifie
que 1 entraîne laprésence
de A dans 80 cas sur 100.~ Si par ailleurs
p~l~A~ -10/100,
celasignifie que A
entraîne laprésence
de 1 dans 10 cas sur100.
LA
PRÉSOMPTION
D’IMPLICATION VA DONC DANS LE SENS 1 ~ ACette
règle
de décision estempirique.
Pour desprobabilités
moinstriviales,
il est nécessaire de recourir à des testsstatistiques.
Une illustration en estproposée
dansl’exemple
suivant.3.3.
Exemple
3.3.1. On considère les données recueillies par
questionnaire auprès
de 210sujets
par la méthode del’échantillonnage
au hasard stratifié.Sept questions
"ouvertes" ou multi-items ontété
posées.
Leur traitement parl’analyse
descorrespondances multiples
apermis
de retenir les modalitéssignificatives qui
ont donné lieu à une recodification sous forme de variablesdichotomiques.
Ici est considéré le sous-ensemble des filles(effectif = 100).
Lerégionnement
des variables sur le
plan
factoriel a donnéquatre régions principales.
Les variablesprésentées
sont issues de l’une de ces
régions,
les variables non influentes(celles
dont la CTR14 estinférieure à la CTR moyenne - soit 1/nombre de
variables -)
ne sont pasreportées.
Les variables
dichotomiques
retenues pour cetexemple
sont les suivantes : AProjet précis
etargumenté (Ouil Non)
B Présence d’autres
projets
par lepassé (Ouil Non)
C Recherche
personnelle
d’informations sur leprojet professionnel (Oui/ Non)
D
Mariage envisagé (Ouil Non)
E Connaissance des conditions matérielles de vie de son
père
dans sajeunesse (Oui/ Non)
F Connaissance d’éléments de la vie affective de sa mère dans sa
jeunesse (Oui/ Non)
G Orientation donnée par la mère auprojet
de la fille(Ouil Non)
H Discrimination des rôles dans la famille
(Oui/ Non)
3.3.2. La
représentation graphique
usuellepermet
de relever l’existence de deux sous-groupes(A,B,D
etC,E,F,H)
et d’une variableplus
isolée(G),
variables rassemblées par une dimension latente(cf. Figure 1).
Figure
1. Extrait duplan
factoriel14 "C’est la contribution d’une variable à l’inertie d’un axe. Elle pennet de classer des variables par ordre décroissant selon leur rôle dans l’analyse".
3.3.3. Recherche d’un schéma
d’implication
entre variablesSoient les variables
A, B,D.
Tableau 3. Tableau de Burt
(effectifs)
Lecture :
cf tableau
1. N.B. Les effectifs observés sont les suivants :var. A :
précision projet
de vie : Oui :60 ;
Non : 40.Recherche des
implications
entre variables.1 - Entre var. A et var. B
· Le test de Mc Nemar est
égal
à ::13,515
. Le test de Gras et Lahrer est
égal à : - 1,78 16
On en déduit
que B implique
A2 - Entre var. D et var. B
. Le test de Mc Nemar est
égal
à :2,98
·Le test de Gras et Lahrer est
égal
à : -2,84
On en déduit que D
implique
B.3 - Entre var. D et var. A
·Le test de Mc Nemar est
égal
à :9,6
·Le test de Gras et Lahrer est
égal
à : -2,12
On en déduit que Dimplique
A.La concordance des résultats obtenus par l’indice de Gras et Lahrer et le khi carré permet d’affirmer l’existence d’une relation
d’implication
entre les variables A etD,
et A et B danslaquelle
on observe D ~ Aet B =~A,
ce que résume legraphe
suivant :Figure
215 La formule numérique développée est :
[(3~ -12)]2 I
50)].16 La formule numérique développée est [(12 - (50 X 40) / 100) / 4,47]. Cette implication est admissible au
niveau de confiance 96,2%.
Cette
procédure appliquée
à l’ensemble des variables choisies duplan
d’unerégion
considérée
permet
de construire legraphe
suivant.Figure
3. Les variables considérées sontdichotomiques.
(Ne
sontreportées
que les variablesqui
satisfont aux critères COR etCTR).
3.3.4. De cette
représentation graphique
il résulte que laprécision
duprojet (A)
résulteplutôt
des influences exercées par l’ensemble des autres variables et non pas
uniquement
de celles du sous-groupe de A(soit
B et D sur leplan
factoriel(cf. figures
1 et2)).
Elle permet
donc,
tout en en conservant tous les avantages, dedépasser
la lecture usuellebasée sur les seuls critères d’aide à
l’interprétation (COR17@ CTR,
axesfactoriels,
valeurstest...).
3.3.5. Le réseau de relations entre variables
peut
être soumis à uneanalyse
factorielle confirmatoire detype
"méthode causale"(par exemple, in Bagozzi,198o).
4.
INTERPRÉTATION
DUSCHÉMA
D’IMPLICATIONLa lecture du schéma
d’implication permet d’apporter
uneréponse plus précise
à laquestion
desrapports que des éléments
psychiques peuvent
entretenir. Les relations entre variables de cetordre sont sous-tendues par la
présence
del’énergie psychique
mobilisée par cette situation.Elle est
analysable
selon trois indices(direction d’influence,
fonction etintensité)
issusdirectement des schémas
d’implication,
et d’unquatrième (masse) déjà présent
dansl’analyse
des
correspondances multiples.
’
1~ C’est le cosinus carré m, dans lequel oc est l’angle formé par une variable avec un axe. C’est un indicateur de la
qualité de la représentation d’une variable par sa projection sur l’axe (la qualité de la représentation d’une variable est considérée comme "bonne lorsque COR est proche de 1)".
4.1. La direction des influences
Les arêtes du
graphe
donnent lesgrandes
voies de la circulation del’énergie.
Cette lecture directe fournit une informationprécieuse qui
donne du sens à des dimensionspsychologiques
d’autant
quelles
s’inscrivent dans des mouvements dechangement,
de transformation. Cette lecture peut être facilitée par l’indicedéveloppé
auparagraphe
suivant.4.2.
Lafonction 18
d’une variable dans ungraphe
Trois fonctions directement issues des schémas
d’implication
sontproposées : émetteur,
synapse,
récepteur.
L’attribution d’une fonction à une variable clarifie le sens à donner aux rapports de double détermination
qu’entretiennent
lescomposantes
de la viepsychique.
Deux de ces fonctionsémanent directement de la théorie de la communication : celle
d’émetteur,
définie comme laqualité
d’une variableimpliquant
au moins laprésence
d’une autre variable sans êtreimpliquée
par
quelque
variable que ce soit(dans l’exemple,
les variables G etC) ;
celle derécepteur,
définie comme la
qualité
d’une variableimpliquée
par une ouplusieurs
autres variables sansqu’elle n’implique
elle-même laprésence
d’une ouplusieurs
autres variables(dans l’exemple,
lavariable
A).
Ce schéma de lecture des
graphes
a étécomplété
parl’adjonction
d’une troisième fonctionappuyée
sur la notion de synapse dont lacaractéristique majeure
est deposséder
la doublefonction d’émetteur et de
récepteur (dans l’exemple
les variablesD, B, F, E,
H ont la fonctionsynapse).
Outre leur fonction de"relais"d’énergie psychique
entre deux(ou plus)
autresvariables,
ces variables traitent de l’ "intermédiaire" etpourraient
avoir pourpropriété
detransformer
l’énergie psychique
afin de la rendreopératoire auprès
de certaines autres variables.Ainsi dans
l’exemple,
laprésence
d’unprojet précis (A)
résulte de l’influence exercée directement par toutes les variables(sauf C).
Mais l’influence de certaines d’entre elles n’est pasuniquement
directe et est renforcée par l’intermédiaire d’autres variables(par exemple
l’influence de D sur A est renforcée par l’intermédiaire de E et de
B).
Les fonctions attachéesaux variables
permettent également
de moduler le sens à donner à unjeu
d’influencess’exerçant
sur une variable
(ayant
elle-même fonction derécepteur
ou desynapse),
selon laqualité
defonction des variables
qui
l’influencent(émetteur
ousynapse)
et le nombre de variables ayant ce rôle. Il est en effetprobable
quel’implication
nepeut
avoir la mêmesignification
selonqu’elle
est le fait d’une ou de
plusieurs variables,
que dans ce dernier cas il y aitpluralité
ou non defonctions
(émetteur
ou synapse,compte-tenu
dupoint précédent).
Les fonctions facilitent la lecture dugraphe.
Parexemple,
lepoint
dedépart peut
être constitué par les variables"émetteur", puis
sepoursuivre
par celles de"synapse",
enfin parcelle(s)
de"récepteur" (dans l’exemple : G 9 A ; G 9 D 9 A ; ou 9 B ;
G 9F...).
Ces fonctions
peuvent
êtrereportées
sur legraphe
selon unjeu
desymboles.
Cette
procédure peut
êtreappliquée
àn’importe quelle
variabledichotomique
d’ungraphe
construit dans ces circonstances et est enrichie par l’indice
développé
auparagraphe
suivant.4.3. L’intensité de
l’implication (ou pouvoir moteur)
L’intensité de
l’implication
est donnée par le Khi carré de Mc Nemar et l’indice de Gras etLarher.
18 Le terme de "fonction" n’est pas à prendre dans un sens mathématique. Il
s’agit
du mode de relation d’une variable avec l’ensemble des autres variables d’un même graphe.Elle donne une visibilité à la
puissance
de la réalisation d’un événement. Parexemple, lorsque
le Khi carré de Mc Nemar estplus
élevé pour une variablecomparativement
à une autre,cela
signifie
que saprésence
estdavantage "expliquée"
par cette variable que par celle desautres. Un
jeu
de traits(pointillés,
ou traitspleins
parexemple) reportés
sur legraphe peut
traduire cette intensité. Dansl’exemple développé,
lapuissance
des variables B et Hs’exerçant
sur A est
supérieure
à celle des autres, cequi
module l’affirmation selonlaquelle
toutes lesvariables
(à l’exception
deC)
influencent laprésence
de A. Eneffet,
les variablesD, E, F,
Gont une
puissance
motrice sensiblementégale
entre elles mais inférieure à celle de B et H.Donc,
une hiérarchisation du
jeu
des influences estpossible
etpeut
être combinée avec les autresindices. Dans
l’exemple,
elle s’établit comme suit :B,
Hpuis D, E, F,
G.4.4. Le
poids
dechaque
variableLe
poids
dechaque
variable a la mêmesignification
que dansl’analyse
descorrespondances multiples qui
le fournit(hiérarchisation
desvariables).
Il est doncproportionnel
à l’effectif dessujets qui,
dansl’exemple,
ontrépondu positivement
auxquestions.
Il peut être d’autant mieux utilisé pour lacompréhension
de l’ensemblequ’il
est alors rattaché à une "fonction". Celle-cisera donc d’autant
plus importante
que son inertie sera élevée(et inversement).
Cequi peut
être noté sur legraphique
par unjeu
desymboles
etguider
lui-aussi lalecture,
en la hiérarchisant selonl’importance
de l’émetteur parexemple,
et - ou - durécepteur.
5. CONCLUSION
La
méthodologie proposée qui
combine les avantages de différentesapproches permet
derépondre
pourpartie
à laproblématique
del’analyse
des structures des relations entre variables.Ses avantages sont très nettement situés : - dans le choix des variables à
partir
del’analyse
descorrespondances multiples ; -
dans les cartes causalesétablies ;
et - dans les indicesqui
lesaccompagnent.
Les relations entre des variables deux à deux doivent êtreinterprétées
commedes
hypothèses
sur la direction llo111inante des influences entreelles, compte-tenu
desprécautions
courantes.Des extensions de cette
méthodologie
sontpossibles
à des tableaux binaires detype
=
Pr(X
=i,
Y= /,
Z =k) lorsque
les effectifs des cases le permettent >5),
et sur desvariables
numériques
et modales.La
méthodologie proposée
rend lisibles diverses manifestations del’énergie psychique
entre variables nominales. Le relief évident
qui
est ainsi restitué auxphénomnènes psychiques
ouvre sur des
perspectives
intéressantes découlant des fonctions et des critèressubséquents qui peuvent
sans doute êtregénéralisées
à de nombreuses autres situations. Mais ces nouvellespistes
offertes par l’outilstatistique
ne constituentqu’une
aide à la décision que seuls le chercheur et lepraticien
sont à même deprendre
du fait de leurexpérience,
et dont ils ne doiventpas se
désapproprier.
BIBLIOGRAPHIE
AMARGER
S.,
DUBOISD. ,
PRADEH., Imprecise quantifiers
and conditionalprobabilities,
in :
Symbolic
andquantitative approaches
touncertainty (Kruse R., Siegel P.), Springer- Verlag, 33-37.
ARABIE
P.,
BOORMANA.,
LEVITTP., "Constructing
block models : how andwhy", Journal of Mathematical Psychology,17,1978, 21-63.
BACHER
F.,
Lesenquêtes
enpsychologie,
T.2, Lille,
Presses Universitaires deLille,1982.
BAGOZZI
R.P.,
Causalmodels in marketing,
NewYork, Wiley,1980.
BAILLEUL
M.,
GRASR., "L’implication statistique
entre variablesmodales", Mathématiques, Informatique
et Scienceshumaines,1994,128, 41-57.
BENZECRI
J.P., Correspondence Analysis Handbook,
NewYork, Dether,1992.
CAZES
P. ,
BAUMEDERA.,
BONNEFOUSS,
PAGESJ-P., "Codage
etanalyse
detableaux
logiques ;
introduction à lapratique
des variablesqualitatives",
Cahiers duBURO,
SérieRecherche, 1977,
27.CHANDON
J.-L.,
PINSONS., Analyse typologique:
théories etapplications, Paris, Masson,
1981.
DER MEGREDITCHIAN
G.,
Le traitementstatistique
des donnéesinultidimensionnelles, T.1, Paris, École
Nationale deMétéorologie, 1988, (in
P.Pottier, 1994).
FAVERGE
J.M.,
Méthodesstatistiques
enpsychologie appliquée, Paris,
Presses Universitaires deFrance, 1965.
FALGUEROLLES A.
de,
JMELS.,
"Un modèlegraphique
pour la sélection de variablesqualitatives",
Revue deStatistique appliquée, 1993, XLI, 1, 23-41.
FALGUEROLLES A.
de,
JMELS.,
"Modèlesgraphiques gaussiens
etanalyse
encomposantes principales : complémentarité
et choix devariables",
Publication du Laboratoire destatistique et probabilités, Toulouse,1992, 3,1-25.
FINE
J.,
Modèlesgraphiques d’association,
clans : modèles pourl’analyse
des donnéesmultidimensionnelles, Paris, Economica,1992, 273-313.
FLAMENT
C., L’analyse
booléenne dequestionnaires, Paris, Mouton, 1976.
FREUD
S., Métapsychologie, Paris, Gallimard,1968.
GANASCIA
J.G.,
"CHARADE :Apprentissages
de bases deconnaissances,"in
Introductionsymbolique-numérique
àpartir
dedonnées, Cepadues,1991.
GIBBONS
J.D., Nonparametric
Measuresof Associations, London,
NewDelhi, Newberry
Park, University
paper, 1993.GOODMAN
L.A.,
KRUSKALW.H.,
Measuresof association for
crosssclassifications,
NewYork.
SpringerVerlag,
1979.GRAS
R.,
LARHERA., "L’implication statistique,
une nouvelle méthoded’analyse
dedonnées", Mathématiques, Informatique
et Scienceshumaines, 1992, 120, 5-31.
GUÉNOCHE A.,
MONJARDETB.,
Méthodes ordinales et combinatoires enanalyse
desdonnées, Mathématiques
et Scienceshumaines, 1987,100, 5-47.
HERMAN
J., Analyse
des donnéesqualitatives :
traitementd’enquêtes,
modèlesmultivariés,
T.2, Paris, Masson,
1986.LERMAN
I.C.,
GRASR.,
ROSTAMH.,
"Elaboration et évaluation d’un indiced’implication
pour des données
binaires,
I etII", Mathématiques
et Scienceshumaines, 1981, 74, 5-35
et75,
5-47.LONG
J.S.,
Covariance structure models: an introduction toLISRE, Sage University
paper 34.POTTIER
P.,
"Mesure de la liaison entre deux variablesqualitatives:
relations entre uncoefficient de corrélation
généralisé
et le khicarré",
Revue deStatistique appliquée, 1994, XLII, 1,
41-62.REYNOLDS
H.T., Analysis of
nominaldata, London,
NewDehli, Beverly Hills, Stages
publications,
1984.RIARD
E.H.,
L’adolescent etsa famille:
lagenèse
duprojet
de vie"(étude
àpartir
d’unepopulation
scolarisée des deux sexes de 14-15ans),
Thèse de Doctorat d’Etat ès Lettres etSciences
humaines,
Université Paris-XNanterre,
1991.SAPORTA
G., Probabilités, analyse
de données etstatistique, Paris, Éditions Technip,1990.
SPRENT
P., Applied non parametric
Statisticalmethods, London,
NewYork, Tokyo, Melbourne, Madras, Chapman
andHall,1990.
VAN
BUGGENHAUT, J., "Questionnaires
booléens : schémasd’implications
etdegrés
decohésion".
Mathématiques
et Scienceshumaines, 1987, 98,
9-20.VOLLE
M., Analyse
desdonnées, Paris, Economica,1993.
WHITTAKER
J., Graphical models
inapplied
multivariatestatistics,
NewYork, Wiley,
1990.
WORSLEY K.
J.,
"Unexemple
d’identification d’un modèlelog-linéaire grâce
à uneanalyse
des