M ATHÉMATIQUES ET SCIENCES HUMAINES
J EAN -M ARC B ERNARD
C AMILO C HARRON
L’analyse implicative bayésienne, une méthode pour l’étude des dépendances orientées. I : données binaires
Mathématiques et sciences humaines, tome 134 (1996), p. 5-38
<http://www.numdam.org/item?id=MSH_1996__134__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1996, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’ANALYSE IMPLICATIVE
BAYÉSIENNE,
UNEMÉTHODE
POURL’ÉTUDE
DESDÉPENDANCES ORIENTÉES.
I :DONNÉES
BINAIRES * Jean-MarcBERNARD1,
CamiloCHARRON2
RÉSUMÉ -
La réussite àl’épreuve A implique-t-elle, approximativement,
la réussite àl’épreuve B ?
Parmi les indicesdescriptifs proposés
pour mesurer de tellesdépendances orientées,
nous considérons l’indice H de
Loevinger, qui s’exprime simplement
en termes des taux de liaisonentre modalités. A
partir
de cetindice,
nousdéfinissons
les notions dequasi-implication,
dequasi-équivalence
et dequasi-indépendance
dans un tableau decontingence
2 x 2.Cependant,
lesméthodes inductives
correspondantes,
parce quefondées
sur des raisonnementsasymptotiques,
nefournissent
pas d’énoncévalide,
ni pour les données defaible taille, ni, paradoxalement,
pour lescas où le modèle
logique
est presqueparfaitement vérifié. L’approche bayésienne
del’inférence
évite ces
difficultés
et conduit à des énoncés sur lagrandeur
desquasi-implication
et autresrelations de ce type. La méthode
proposée, l’Analyse Implicative Bayésienne (AIB),
constituéede ces deux volets
(descriptif
etinductif),
est illustrée sur uneexpérience
dePsychologie
duDéveloppement
relative à la construction du nombre chezl’enfant.
SUMMARY -
Bayesian Implicative Analysis,
a method for thestudy
of orienteddependen-
cies. I :
Binary
data.Does success to test A
imply, approximately,
success to test B ?Among
thedescriptive
indicesthat were
proposed
to measure such orienteddependencies,
wefocus
onLoevinger’s
H which hasa
simple expression
in termsof
the association rates between modalities. From thisindex,
wedefine
the notionsof quasi-implication, quasi-equivalence
andquasi-independence for
a 2by
2contingency
table.However,
thecorresponding existing inferential frequentist methods,
becausethey
are based onasymptotic considerations,
do notprovide
valid statements, neitherfor
smalldatasets,
nor,paradoxically, for
cases in which theimplication
isdescriptively
almostverified.
The
Bayesian approach
toinference
avoids thesedifficulties
andprovides
inductive statementsabout the size
of quasi-implications
and other typesof "quasi-"
relations. Theproposed method,
the
Bayesian Implicative Analysis, composed of
these two aspects(descriptive
andinductive),
is illustrated on an
experiment from Developmental Psychology
about number construction in children.* Les auteurs tiennent à remercier Henry Rouanet pour ses remarques et suggestions qui les ont
conduits à clarifier et affiner certains arguments au coeur de cet article, ainsi que Bruno Lecoutre et Denis Corroyer pour leurs commentaires.
1 Laboratoire de
Psychologie Cognitive,
CNRS ER 125, Université Paris 8, 2 rue de la Liberté, 93526Saint-Denis Cedex.
2LaPsyDEE,
CNRS URA 1353, Université Paris 5.1.
INTRODUCTION
L’étude
développementale
des enfants révèle desdépendances
entre lesacquisitions cognitives
successives. Lepsychologue
cherche à mettre en évidence cesdépendances :
s’il est
possible
de montrer que la réussite àl’épreuve
Aimplique
la réussite àl’épreuve B,
il pourra avancerl’hypothèse
que les processuscognitifs
mis enjeu
dansl’épreuve
Bsont nécessaires à ceux intervenant dans
l’épreuve
A. Ceproblème
de la mise en évidencede
dépendances
orientées se rencontre dans de nombreux autres domaines de recherche :didactique,
détermination d’échelles de mesure enpsychologie,
évaluation de facteurs derisque
enépidémiologie, exploitation
des bases dedonnées,
pour n’en citer quequelques-
uns.
Prenons
l’exemple, baptisé "Fractions-1",
d’uneexpérience
sur la construction du nombre chezl’enfant,
danslaquelle
deux desépreuves
consistent à déterminer unequantité
par l’intermédiaire d’une fraction
qui peut exprimer,
soit unrapport partie-partie (A),
soitun
rapport partie-tout (B).
Nous reviendrons defaçon plus
détaillée sur cetteexpérience
à la section 5
(les épreuves
A et B y sontdésignées respectivement
parQRPP
etQRPT).
Le tableau 1 donne les résultats
conjoints
à ces deuxépreuves
pour les lui5 élèves del’expérience.
Tableau 1:
Exemple
"Fractions-1 ". Effectifs observés pour le croisement des deux variables binaires A(rapport Partie-Partie)
et B(rapport Partie-Tout);
a et bdésignent
laréussite,
a’ etb’ l’échec.
Parmi les 39 élèves
qui
réussissentl’épreuve A,
36(soit 92.3%)
réussissent aussil’épreuve B,
alors que dans l’ensemble la réussite à B n’est pasmajoritaire (43.6%).
Ainsi on
peut
dire que, sur cet ensembled’élèves,
engénéral,
la réussite à Aimplique
laréussite à B. Aux trois
exceptions près
des élèves de la caseab’,
il y aimplication
de avers b. Par
contre,
laréciproque
de cetteimplication
est loin d’être vérifiée : sur 72sujets qui
réussissent àB,
seuls 36(soit 50.0%)
réussissent à A. Ainsi on adescriptivement
une
quasi-implication
de a versb,
mais non de b vers a ; cettedissymétrie
tient à ce quel’épreuve
A estplus
difficile quel’épreuve
B.Dans la suite de cet
article,
le terme"implication",
sansprécision,
sera àprendre
dans un sens
large ; lorsqu’il
sera nécessaire depréciser,
nousdistinguerons
la"quasi- implication" (en
bref"q-implication" ),
notéede
l’"implication
stricte" de lalogique formelle,
notée "~" .Conclure à une
q-implication a
-~b,
c’est bien entendu conclure à unedépendance
entre A et
B,
maisplus précisément
à unedépendance
dans une certainedirection,
cellede
l’implication
stricte a F b. Nous considéreronségalement
ici la recherche d’une conclusion dequasi-équivalence (en
brefq-equivalence)
entre a et b -qu’on
noteraa ~-->
b,
c’est-à-dire à unedépendance
dans la direction del’équivalence
stricte a 4==~ b.De
façon générale,
cet article sera ainsi centré sur l’étude desdépendances
orientées entrevariables binaires.
Dans un
prochain
article(Bernard, Charron,
souspresse),
nous étudierons ladépendance
orientée entre deux variables A et Bayant
un nombrequelconque
demodalités,
avec leproblème
de la. mesure del’adéquation
des données à un modèlelogique
caractérisé par un ensemble
d’implications.
A
partir
des observations du tableau1, commente
décrire etquantifier
la relation deq-implication,
et(ici)
inférer sur cette relation dans lapopulation
dont les 16~~ élèvesobservés sont issus ?
Pour l’étude des
dépendances orientées,
les indices usuels d’écart àl’indépendance
dans un tableau de
contingence A
xB, descriptifs (e.g. 0
oujJ2)
ou inductifs(e.g. X2),
sont
inadaptés
en raison de leur caractèreglobal et, surtout,
de leursymétrie
en A et B.De ce fait des méthodes
statistiques spécifiques
sontrequises.
Le
problème
de laquasi-implication
entre variables binaires adéjà
été abordé dans cette revue sousl’appelation d’ "implication partielle" (Luxenburger, 1991)
ou sous celled’ "implication statistique" (Gras, Larher, 1993 ; Lerman, Gras, Rostam, 1981).
Mais cestravaux, qui
ont constitué un despoints
dedépart
dunotre,
n’abordent chacunqu’un
aspect
duproblème : descriptif
pour lespremiers, inductif pour
les seconds. Enparticulier, l’approche
de Gras & Larher(1993)
ne conduitqu’à
une conclusion derejet
del’hypothèse d’indépendance
dans la direction d’uneimplication,
mais nepermet
pas véritablement dequantifier
ledegré
dequasi-implication.
L’indice d"’intensitéd’implication" proposé
parces auteurs
est, malgré
ce que son nomsuggère,
un indicecomposite qui mélange
lescomposantes descriptive (degré
dequasi-implication)
et inductive(l’effectif
desdonnées).
De ce
fait,
il nepermet
pas dedistinguer
le cas d’un faible écart àl’indépendance
avecdes données
nombreuses,
de celuioù, malgré
un effectifplus faible,
les données militent vraiment pour unequasi-implication (voir Charron, 1996).
Conformément à la
ligne générale
tracée parRouanet,
Bernard & Le Roux(1990), l’approche
que nous proposonsintègre
les deuxaspects descriptif
et inductif enprocédant
selon deux
étapes : l’étape descriptive permet
dedégager
unepropriété
d’intérêt des donnéesobservées ; l’étape
inductive considère les données comme un échantillon d’unepopulation plus
vaste et vise àgénéraliser
cettepropriété
à lapopulation.
Parmi les indices
descriptifs proposés
pour mesurer lagrandeur
de liaisons ori-entées,
nous considérerons iciuniquement
l’indice H deLoevinger (1947, 1948).
Il estcourant d’utiliser cet indice pour
l’analyse
d’unequasi-implication,
mais nous étendronségalement
son usage pour l’obtention d’une conclusion dequasi-équivalence
ou dequasi- indépendance.
Lagénéralisation
de cet indice pour des variables non binaires conduit à l’indice "Del"(Hildebrand, Laing
&Rosenthal, 1977),
dont un autre casparticulier
est l’indice
"Ilappa" (Cohen, 1960).
Ces autres indices seront abordés dans Bernard &Charron
(sous presse).
Les méthodes inductives
correspondantes proposées
dans la littérature ont étédéveloppées
dans le cadre del’ in f érenee f réquentiste (tests d’hypothèses,
intervalles deconfiance),
et se heurtent aux difficultés inhérentes à ce cadre(voir
e.g. Rouanet etal., 1991).
Une de cesdifficultés, qui
n’est pas quetechnique,
est celle de se débarrasser desparamètres parasites,
avec deuxangles d’attaque possibles : développer
des méthodes ap-prochées
fondées sur des résultatsasymptotiques (Copas
&Loeber, 1990 ; Fleiss, 1981 ;
Hildebrand et al.
1977),
ou réduirel’espace
desparamètres (ou
celui deséchantillons)
enprocédant
à des tests conditionnels(Copas
&Loeber, 1990 ; Gras, Larher, 1993 ; Lerman, Gras, Rostam, 1981). Cependant,
aucune de cesapproches
n’estpleinement
satisfaisante.La
première
fournit desapproximations qui
sont d’autantplus
mauvaises que les donnéessont peu nombreuses
et/ou
extrêmes. Dans laseconde,
les difficultés résident dans lerisque
d’arbitraire du choix de tel ou tel conditionnement.
(ies difficultés Il’existent pas, en
revanche,
dansl’approche bayésienne
de l’inférencestatistique.
Au niveauthéorique,
cetteapproche permet
en effet d’inférer surn’importe quel
indiced’intérêt,
enfournissant,
comme résultatfinal,
une distribution deproba-
hilité relative à la valeur de l’indice dans la
population parente.
Cettepossibilité générale d’inférence, qu’offre l’approche bayésienne,
s’estlongtemps
heurtée aux difficultés tech-niques posées
par les calculsbayésiens.
Maisl’explosion
récente des moyensinformatiques généraux
et ledéveloppement
d’outilsalgorithmiques spécifiques d’approximation,
notam-ment par
échantillonnage
dans la distributionbayésienne, permettent
désormais sa miseen oeuvre
pratique.
En
résumé,
le propos duprésent
article est double :(i~
proposer, sur la base de l’indiceH,
des indicesdescriptifs
mesurant lagrandeur
d’unequasi-implication,
d’unequasi- équivalence
ou d’unequasi-indépendance
entre deux variablesbinaires ; (ii)
proposer uneméthode
générale
d’inférencebayésienne
pourl’analyse
inductive relative à ces indices.L’ensemble de ces deux volets constitue la base de ce que nous
appellons l’Analyse Implicative Bayésienne (en
brefAIB),
méthode dont les bases ontdéjà
étédégagées
dans Charron
(1996).
La suite de cet article est
organisée
comme suit. La section 2rappelle
les définitions d’indices usuels associés à un tableau decontingence
et enparticulier
un tableau 2 x 2.La section 3
présente
le voletdescriptif
del’analyse implicative,
et la section4,
son voletinductif,
avec lacomparaison
del’approche bayésienne
et del’approche fréquentiste.
Lasection 5 montre une
application
de l’AIB à des données relevant de lapsychologie
dudéveloppement.
La section 6évoque
la mise en oeuvreinformatique
de l’AIB.Enfin,
lasection 7 conclut sur les
points
essentiels et lesavantages
de la méthodeproposée.
2. DEFINITIONS ET NOTATIONS
Nous donnerons tout d’abord les définitions et notations d’un certain nombre de statis-
tiques
associées à un tableau decontingence,
ainsi quequelques
résultatsqui
leur sontrelatifs. Ces définitions et notations
sont,
pour laplupart, reprises
de Rouanet & Le Roux(1993)~.
2.1. Cas
général :
tableau decontingence quelconque
Etant données deux variables
catégorisées
A et Bcomprenant
chacune un nombrequelconque
demodalités,
on note a(resp. b)
une modalitéquelconque
de A(resp. B).
Onparlera
de "z?ariableshomologues" lorsqu’il
existe unecorrespondance bijective
entre A etB
privilégiée méthodologiquement
et reflétée par l’ordre d’énumération de leurs modalitésrespectives :
alcorrespond
àbl,
a2 àb2,
etc..Les effectifs observés sur un groupe de n observations sont notés nAB =
(nab)(a,b)EAxB
et les
fréquences conjointes correspondantes fAB,
avecf ab
=nab/n.
On notef a et f b
lesfréquences marginales4 : f a
=EBEB f ab
etf b
=¿aEA fab.
3Nous adoptons notamment les notations duales des mesures
(indices
enbas)
et des variables(indices
en
haut).
La distinction fondamentale entre ces deux typesd’objets
statistiques, rappelée par cesnotations, tient à ce que, lorsqu’on regroupe plusieurs
catégories,
les mesures s’ajoutent alors que les variables se moyennent.4Nous considérerons tout au
long
de cet article qu’aucune des fréquencesmarginales
n’est nulle.On
appelle fréquences-produits5 fA fB = 1,f af b(,,b)EAxB·
Il y aindépendance
locale en-tre a et b
lorsque
lafréquence conjointe f ab
estégale
à lafréquence-produit correspondante .f,,,fb.
L’écart àl’indépendance
pour les modalités a et 6 est défini commefab - /a/6.
Si onra,pporte
cet écart à lafréquence-produit f ~, f 6,
on obtient le taux de liaison entre a et b :Le taux de liaison est un indice
symétrique : tab
=tba.
Sonsigne indique
s’il y a attraction(tab
>0), indépendance
locale(tab
=0),
ourépulsion (t~b 0),
entre les modalités aet b. Le
protocole
des taux deliaison, tA$ _ ()(a,6)exB? pondéré
par lesfréquences- produits f A f B,
est unobjet
essentiel pourl’analyse
d’un tableau decontingence
engénéral (Rouanet,
LeRoux, 1993),
et s’avérera être unobjet-clé
dans lesdéveloppements qui
vont suivre. La
propriété
suivante seraparticulièrement importante : Vab, tab 2: -1,
avectab
= -1 ==>f ab
= 0. Leprotocole pondéré
des taux de liaison est centré( i. e. de
moyennepondérée nulle), et, plus précisément,
doublementcentré,
i. e. centré à la fois enlignes
eten
colo,nnes.
Lecarré-moyen
decontingence jJ2
n’est autre que la variance de ceprotocole :
Le
jJ2
est un indiceglobal d’importance
de liaison dans un tableau decontingence.
Il estnul dans le cas de
l’indépendance globale
entre A et B(qu’on
notera A 1LB),
c’est-à-direlorsqu’il
y aindépendance
locale entre toutes lespaires possibles
de modalités a et b.2.2. Cas
particulier
d’un tableau 2 x 2Pour le cas d’une variable
binaire, A2,
on note a et a’ ses deuxmodalités ;
ondésignera
la réussite par a et l’échec par a’
lorsque
la notiond’échec/réussite
estpertinente.
Pour un tableau
A2
xB2 (deux
variables A et Bbinaires),
le coefficient decontingence 4> (dont
le carré est le4>2)
est le coefficient de corrélation linéaire entre les variables A etB,
obtenu parexemple
en codant a et b par la valeur1,
et a’ et b’ par la valeur 0(tout
autre
codage numérique respectant
les ordres a > a’ et b > b’ conduit à la même valeur pour4»
:De
plus
les taux de liaison desquatre
cases du tableau sont liés entre eux. Ces relations mutuelles sont évidenteslorsqu’on exprime
lesquatre
taux de liaison en fonctionde 0
etdes
fréquences marginales :
5 Nous évitons pour celles-ci le terme de "fréquences
théoriques"
dontl’usage
est courant mais quidonne trop à penser que la seule théorie possible est celle de l’indépendance entre A et B.
De ces
relations,
il ressort tout d’abord que si un des taux de liaison estnul,
alors0
est nul et donc les trois autres taux de liaison le sont aussi : dans un tableau2 x 2, l’indépendance
localeéquivaut
àl’indépendance globale.
Il ressortégalement
que les tauxde liaison de deux cases diamétralement
opposées
sont nécessairement de mêmesigne, signe
déterminé par celuide 0;
c’est uneconséquence
de lapropriété
de"double- centrage".
Lorsque 0 et,
enconséquence, tab
etta~6~, sont positifs (resp. négatifs),
onparlera
de liaisonpositive (resp. négative )6 . Enfin,
le coefficientjJ2
estégal
aux deuxproduits-croisés
destaux de
liaison 7 :
- 1 1,1 1, , .... , ", ""
Remarque :
Lesstatistiques
que nous venons de définir( f AB, tAB, 0, jJ2)
sontdescrip- tives,
c’est-à-direqu’elles
nedépendent
que desfréquences conjointes f AB
et non del’effectif total n. Chacune
peut
aussi bien être calculée sur un échantillon de données que sur lapopulation. Lorsque
nous aborderonsl’étape inductive,
nous aurons besoin de considérer simultanément les données observées et lapopulation,
et il y aura alors lieu dedistinguer
lesstatistiques
calculées sur les donnéesobservées, désignées
engénéral
par des lettres latines(e.g. f
pour lesfréquences)
de leurséquivalents
dans lapopulation désignées
engénéral
par des lettres grecques( e.g,
p pour lesfréquences).
3. ANALYSE DESCRIPTIVE DES IMPLICATIONS POUR UN TABLEAU 2 x 2 Revenons sur
l’exemple
"Fractions-1"(cf.
tableau1).
On se demandesi,
sur la base deces
données,
il estpossible
de conclure que la réussite àl’épreuve
Aimplique,
engénéral,
la réussite à
l’épreuve
B : a -~ b ? Nous étudierons icil’aspect descriptif
de cetype
deproblème.
Cetteétape descriptive peut
êtreenvisagée
comme laréponse
à laquestion :
"Si les données observées constituaient l’ensemble de la
population d’intérêt, qu’aurait-on
envie de conclure ?". Cette
étape
ne fait intervenir que lesfréquences conjointes (ou
desindices dérivés
d’elles).
Lesfréquences conjointes
etmarginales
pourl’exemple
"Fractions- 1" sont données dans le tableau 2.Tableau 2:
Exemple
"Fractions-1".Fréquences conjointes
etmarginales.
3.1. Indice
descriptif d’implication
pour un tableau 2 x 2 : l’indice H deLoevinger
Si on raisonne dans un cadre
logique, l’implication
stricte "a ~ b"exprime l’impossibilité
d’observer
conjointement
a etb’,
soit unefréquence fab’
= 0. Ainsi "a ==> b" constitueun modèle dans
lequel
la case ab’ est "interdite" : on dira que la case ab’ constitue une case d’erreur pour le modèlelogique a
~ b. Dans lapratique,
il est rare d’observer uneparfaite
conformité avec un modèle aussifort,
d’où l’idée de proposer un indicedescriptif
mesurant la
grandeur
de laq-implication
de a vers b.’Qualifier
une liaison de "positive" ou de"négative"
est relatif aux ordres d’énumération des modalités de A et B choisis, et n’a de sens véritable que si les variables binaires A2 et B2 sonthomologues.
7Les équations
(4)
et(5)
sont, à notre connaissance, peuclassiques.
Puisque
dans le cas del’implication
stricte "a F b" on afabl
=0,
un indiceacceptable
de
grandeur
d’uneq-implication
doit mesurer lapetitesse
defabl. cependant
le seul’ fait que lafréquence fabl
soitpetite
n’est pas suffisant pour conclure à laq-implication a
2013~ b.En
effet,
sif ab
estégalement petite,
alors la conclusion doit seulement être que la modalitéte est rare ; d’où la nécessité d’évaluer la rareté de ab’ en la
rapportant
à celle de a,puis symétriquement
en larapportant
à celle de b’. Par ceraisonnement,
on aboutit à l’indiceHa6
deLoevinger (1947, 1948),
r
défini de
façon
à ce que sa valeurmaximale, 1, corresponde
au cas del’implication stricte8.
A titre
d’exemple,
pour les données "Fractions-1"(cf.
tableau2)
et l’étude de la q-implication "a
2013b",
on trouve ainsi :Hab
= 1 -0.018/(0.236
x0.564)
= 0.864.3.2.
Propriétés
de l’indice H Indice H et taux de liaison.A la
comparaison
deséquations (1)
et(6),
on constate que l’indice H n’est autrc quel’opposé
du taux de liaison de la case d’erreur ab’ :De ce
fait,
lespropriétés
de l’indice H se déduisent directement de celles des taux de liaison.Valeurs
possibles
de H.L’indice
Hab peut
valoir de -oo à1 ;
une valeurnégative correspond
à une attraction entrea et
b’,
cequi
va àl’opposé
d’uneq-implication
de a versb ;
la valeur 0correspond
à uneindépendance
locale entre aet b’ ;
une valeurpositive correspond
à unerépulsion
entreles modalités a et b’ et donc à un écart à
l’indépendance
dans la direction del’implication
de a vers
b ;
la valeurmaximale, 1,
est obtenue pour unerépulsion
maximum entre a etb’,
c’est-à-dire pourtab~
_ -1 soit encoref abl
=0, qui correspond
au cas del’implication
stricte a ~ b.
Pour
pouvoir parler
d’unequasi-implication
a --~b,
il ne suffit pas queHab
soitpositif,
mais il faut aussiqu’il
soit suffisammentproche
de1 ;
c’est le cas dans notreexemple
où on a trouvéHab -
0.864. La définition de critèresprécis
pourqu’un
écartorienté à
l’indépendance puisse
êtrequalifié
dequasi-implication
sera discutéeplus
loin.Implication contraposée.
Les deux
implications strictes,
a ~ b et sacontraposée b’
~ a’ sontlogiquement équivalentes.
A-t-on uneéquivalence analogue
au niveau desq-implications,
c’est-à-dire des indices H associés ? Du fait de(7)
et de lasymétrie
du taux deliaison,
on a :8 Cet indice a été initialement proposé en psychométrie pour mesurer
l’homogénéité
entre deux épreuves, d’où la notation H. Dans sa définition initiale, l’indice deLoevinger
est un indice symétrique qui vaut, selon nos notations, Hab si fô > f a et Hba sinon, d’où son autre définition symétrique en tantque
~~~max ~
Néanmoins, dans ce texte, nous parlerons de l’ "indice de Loevinger" pourdésigner
l’indicedissymétrique
défini par(6).
Ainsi la
grandeur
de laq-implication
a --~ b est la même que celle de laq-implication contraposée b’
-->a’,
toutes deux valantl’opposé
du taux de liaison de la case d’erreur associée ab’.Plus
généralement,
chacun desquatre
indices deLoevinger
associé à une des casesd’erreur
possibles
de A x Bcorrespond
à la mesure d’une desq-implications
du tableau 3.Le tableau 4
donne,
pourl’exemple "Fractions-1", l’opposé
du taux de liaison dechaque
modalité
composée
de A xB ;
chacune de ces valeurs est l’indice H pour laq-implication correspondante
du tableau 3. Dans la case ab’ on retrouve l’indice relatif à laq-implication
a --~
b, Hab
=0.864,
c’est-à-dire celle pourlaquelle
la case ab’ est une case d’erreur.Tableau 3:
Q-implications correspondant
aux qua- tre cases d’erreurpossibles
d’un tableau 2. x 2.Tableau 4:
Exemple
"Fractions-1 ".Opposés
des taux de liaison-i°’b (in-
dices
H).
Non
symétrie
de H.Comme on le voit dans le tableau
3,
les deuxq-implications a
-~ b et b - acorrespondent respectivement
aux cases d’erreur ab’ eta’b,
et ainsi les indices Hqui
leurs sont associés sont
respectivement Hab = 2013~~
1 etHba _ _talb.
Enconséquence,
l’indice H n’est pas
symétrique :
engénéral,
on aHab =1 Hba.
Apartir
de(4),
on montreque ces deux indices ne sont
égaux
que dans le casparticulier
oùf a = fb (et
donc aussifat = fbl):
ùPar contre ces deux indices sont nécessairement de même
signe,
lesigne
de0.
Plusprécisément,
onpeut
facilement déduire de(4)
lesinégalités
du tableau 5.Tableau 5:
Inégalités
entreHab
et Hba selon lesigne de 0
et le sens de l’écart entrefa
etfb.
De
plus, l’équation (5), qui exprime 0
comme la moyennegéométrique
de deux indicesH, implique
enparticulier
que lecoefficient 0
est nécessairement intermédiaire entreHab
et
Hba.
Cecipermet
de biencomprendre
le caractère local de l’indice H : unindice 0 positif témoigne
d’une liaisonpositive
entre A et B mais nepermet
pas dedistinguer
lecas où
Hab
etHba
sontproches,
du cas où l’un est élevé et l’autrepetit.
h
3.3. Relations orientées de
degré
h :relations ,
et1
Quasi- implication
dedegré
h.L’énoncé
Hab
> 0indique
un écart àl’indépendance
allant dans la direction del’implication a
Fb, mais,
comme on l’adit,
est insuffisant pour conclure à unequasi-
implication.
Pourrépondre
à cetobjectif,
introduisons unevaleur-repère
h,(0
fi1)
pour
Hab ; lorsque Hab
estsupérieur
àh,
onparlera
dequasi-implication
dedegré h,
cequ’on
notera :C"est pour les
valeurs-repères h
lesplus
élevées que lequalificatif "quasi" prend
sonsens le
plus
fort. Le cas extrême est celui del’implication
stricte obtenu pour h = 1 :(a 1 > b) (a b).
Pour Il =
0,
la relation0 )
estsymétrique, puisque Hab
età
sonttoujours
de mêmesigne.
Pour toute valeur h >0,
parcontre,
larelation h )
ne l’est pas.Quasi-équivalence
dedegré
h.On
parlera
dequasi- équivalence (ou q-équivalence)
dedegré h, a ( h ) b, lorsque
les deuxq-implications réciproques
sont vérifiées au mêmedegré :
z nouveau le cas extrême h = 1
correspond
àl’équivalence
stricte :(a H b)
~(a
T#b).
Cette relation est évidemmentsymétrique.
Quasi-indépendance
dedegré
h.Lorsqu’aucune q-implication
dedegré h
nepeut
être déclarée(pour
aucuncouple
demodalités de A x
B),
la conclusion est celle d’unequasi- indépendance (ou q-indépendance)
h
de
~c~/re ~
entre les variables A etB,
A 1B ;
cette relationsymétrique
est définie par :Puisque
lavaleur-repère
h estpositive,
la condition7~
h esttoujours automatiquement
vérifiée pour les indices
H~b négatifs
d’un tableau 2 x2 ;
la contrainteexprimée
par cettedéfinition
porte
donc en fait sur les deux indices H du tableauqui
sontpositifs9.
A
l’opposé
des deux relationsprécédentes,
c’est pour les valeurs de h lesplus
faiblesque le
qualificatif "quasi" prend
son sens leplus
fort. Nous étendrons cette définition pour~z = 0 en incluant le cas
d’égalité (Hab
= h =0),
defaçon
à ce que le cas extrême de,
o
q-indépendance, corresponde
àl’indépendance
stricte :(A
1B)
~(A
-iLB).
Relations de
degré
h et indicep.
. h h
, ..
Les relations -- et 1 sont
symétriques.
Parailleurs,
sur la base de l’indice ,..0,
onpeut
définir les notionssymétriques
de "liaison notable entre a et b" et de "liaisonnégligeable
entre A et B".
Quel
lien existe-t-il entre ces deux sortes de conclusionssymétriques ?
h h h
4Soulignons
que les trois types de conclusions qui viennent d’être définies(a -
b,a b
et A 1B)
s’obtiennent sur la seule base des deux indices H positifs d’un tableau.
L’équation (5) qui
relie lejJ2
aux taux de liaison fournit laréponse
à cettequestion puisqu’on
en déduit que :Par contre les assertions
réciproques
ne sont pas vraies. Considérons parexemple
le cas0
>0 ;
l’énoncé> h
entraîne seulementqu’une
desq-implications ~
entre a et b estvérifiée,
mais non nécessairement lesdeux,
etl’énoncé 0
himplique
seulementqu’une
de celles-ci n’est pas vérifiée. Ceci traduit le fait
déjà souligné que, 0
étant une moyennegéométrique
des indicesHab
etHba,
sa valeurn’indique
pas si ces indices sontproches
ouéloignés
l’un del’autrel°. Ainsi,
les notions que nous introduisons ici deq-équivalence
etde
q-indépendance
dedegré h
sontplus
fortes quecelles, plus usuelles,
de liaison notableet de liaison
négligeable
basées sur le0.
,,Nlo,iî transitivité des relations de
degré
h.Les relations
~
et~
ne sont pas transitives hors du cas extrême h =1 ;
la relationh
,
1 n est
jamais
transitive.3.4.
’~7aleurs- repères h
pourHab
La
spécification
devaleurs-repères
pour l’indice Hpeut
être abordée selon deuxoptiques.
Celles-ci se
distinguent
par lepoint
deré f érence qu’on
yprivilégie.
Dans la
première optique,
lepoint
de référenceprivilégié
est celui del’indépendance
en-tre A et
B,
i. e.Hab
=0,
laproblématique
étant alors dequalifier
l’écart àl’indépendance :
écart
négligeable
siHab
estproche
de0,
écart notable dans la direction de a - b s’ilen est suffisamment
éloigné.
Cette distinctionpeut
êtreopérationnalisée
par le choix de deuxvaleurs-repères hne9
eth,,,t
pourHab
délimitantrespectivement
lesrégions "proche
de 0"’ et "suffisamment
éloigné
de 0". Cetteoptique
est cellequ’on
retrouve dans le con-texte
plus général
de l’étude del’importance
des effets(l’indépendance
étant assimilable à 1"’absenced’effet" ).
Dans cecontexte, Corroyer Rouanet (1994)
ont discuté la définition devaleurs-repères
pour l’indice0.
Or lesinégalités (11) obligent
à choisir pourHab
desvaleurs-repères également acceptables
pour0.
Desvaleurs-repères
pourHab
cohérentesavec les critères
proposés
par ces auteurs sont :/~e~
= 0.20 ethn,t
= 0.40.Dans la seconde
optique, qui
est ici lanotre,
lepoint
de référenceprivilégié
est celuide
l’implication stricte,
i. e.Hab
=1,
et laproblématique
est alors dequalifier
l’écart àl’implication :
on auraquasi-implication lorsque
cet écart est suffisammentpetit,
c’est-à-dire
lorsque Hab
est suffisammentproche
de1,
et absence dequasi-implication lorsqu’il
ensera
trop éloigné.
Ici aussi onpeut opérationnaliser
cettedistinction
par le choix de deuxvaleurs-repères hquasi
ethtend.
Relativement à cechoix,
les conclusions autorisées seront alors les suivantes :absence de
q-implication
tendance à la
q-implication
q-implication (12)
10Une pratique répandue consiste à quantifier la q-équivalence à partir de l’utilisation conjointe du 0
et de l’indice Haô seul : on conclut à la q-équivalence lorsque les deux indices sont proches de 1
(voir
e. g.Bideaud, Lautrey,
1983).
Comme on le voit ici, cette procédure n’est pas injustifiée, mais la symétrie dela conclusion cherchée nous fait préférer l’utilisation conjointe de Haô et de Hba.