M ATHÉMATIQUES ET SCIENCES HUMAINES
J EAN -M ARC B ERNARD
C AMILO C HARRON
L’analyse implicative bayésienne, une méthode pour l’étude des
dépendances orientées. II : modèle logique sur un tableau de contingence
Mathématiques et sciences humaines, tome 135 (1996), p. 5-18
<http://www.numdam.org/item?id=MSH_1996__135__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1996, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’ANALYSE IMPLICATIVE
BAYÉSIENNE,
UNEMÉTHODE
POURL’ÉTUDE
DESDÉPENDANCES ORIENTÉES.
II :MODÈLE LOGIQUE
SUR UN TABLEAU DECONTINGENCE
*Jean-Marc
BERNARD1,
CamiloCHARRON2
RÉSUMÉ -
Dans Bernard & Charron(1996),
nous avonsproposé
une nouvelleméthode, l’Analyse Implicative Bayésienne (AIB),
pour l’étude desdépendances
orientées entre deuxvariables
binaires,
méthodequi
permet de conclure en terme dequasi-implication
entre modalitésdes variables. Nous étendons ici cette méthode au cas d’un tableau de
contingence
A Bquelconque
avec leproblème
de la mesure dudegré
dequasi-adéquation
des données à un modèlelogique
donné. Au niveaudescriptif,
la méthode repose sur l’indice"Del ", proposé
par Hildebrandet al.
(1977), qui généralise
l’indice H deLoevinger. L’étape
inductive est ici aussienvisagée
dans le cadre
bayésien.
SUMMARY -
Bayesian Implicative Analysis,
a method for thestudy
of orienteddependen-
cies. II :
Logical
model on acontingency
table.In Bernard & Charron
(1996)
weproposed
a newmethod,
theBayesian Implicative Analysis, for
thestudy of
orienteddependencies
between twobinary variables,
method which enables to conclude in termsof quasi-implication
between modalitiesof
the variables. In thisarticle,
weextend the method to the
general
caseof
an A Bcontingency table,
with theproblem of
mea-suring
thedegree of quasi-conformity of
the data to agiven logical
model. At thedescriptive level,
the method is based on the "Del "index, proposed by
Hildebrand et al.(1977),
which gen-eralises
Loevinger’s
index H. Hereagain,
the inductive step isenvisaged
within theBayesian framework.
1. INTRODUCTION
Dans un
précédent
article(Bernard, Charron, 1996),
que nousabrégerons
par la suiteen
"BC-96",
nous avons étudié lesdépendances
orientées entre deux variables binairesA2
etBz ;
leproblème
de base que nous avons traité est celui consistant àjuger
del’adéquation
des données à un modèleimplicatif (a
-b),
defaçon
àconclure, lorsque
les données le
permettent,
à une"quasi-implication" (a
-~b).
La méthodeproposée, l’Analyse Implicative Bayésienne (ou AIB), permet,
selon les cas, une conclusion dequasi- implication,
dequasi-équivalence,
ou encore dequasi-indépendance.
Au niveaudescriptif,
* Nous remercions Henry Rouanet et Denis
Corroyer
pour leurs remarques sur une version antérieure de cet article, ainsi que Jacques Lautrey pour avoir attiré notre attention sur leproblème
que nous traitons ici.1 Laboratoire de
Psychologie Cognitive,
CNRS ER 125, Université Paris 8, 2 rue de la Liberté, 93526Saint-Denis Cedex.
2LaPsyDEE,
CNRS URA 1353, Université Paris 5.cette méthode repose sur les
quatre
indices H deLoevinger
associés à chacune des cases du tableau2 x 2, et,
au niveauinductif,
sur l’utilisation del’approche bayésienne.
Dans l’article
présent,
notre propos concernera les situations où laquestion
d’intéretporte
sur ladépendance
orientée entre deux variablescatégorisées
A et Bayant
un nombrequelconque
demodalités,
avec leproblème plus général,
de la mesure del’adéquation
des données à un modèle
logique
défini par un ensembled’implications.
Notre démarcheprocédera
à nouveau en deuxtemps : étape descriptive qui
conduit à unepropriété
des
données, propriété
dontl’étape
inductivepermet
d’évaluer lagénéralisabilité
à lapopulation
dont les données sont extraites.L’étape descriptive
repose sur l’indice "Del"proposé
parHildebrand, Laing
& Rosen- thal(1977) ;
l’indice Delgénéralise
l’indice H deLoevinger (1947, 1948)
ainsi quel’indice
"Kappa"
de Cohen(1960) ;
il mesure ledegré
de"quasi-adéquation" (en
bref"q-adéquation" )
de donnéescatégorisées
bivariées à un modèlelogique
d’intérêt reliantles deux variables.
En ce
qui
concernel’aspect inductif,
l’inférence relative à l’indice Del a été moins étudiée que celleportant
sur l’indice deLoevinger.
Enparticulier,
aucuneapproche
fondéesur des tests conditionnels ne semble avoit été
développée.
A notreconnaissance,
seulsHildebrand et al.
(1997)
ontproposé
une méthodefréquentiste asymptotique,
mais ellese heurte aux mêmes difficultés que celles
évoquées
dans BC-96 : du faitqu’il s’agit
d’une méthode
approchée
fondée sur unargument asymptotique,
sa validité est discutablelorsque
les données sont peunombreuses,
cas où l’inférence est laplus nécessaire,
oulorsque
les données sontproches
du modèlelogique,
cas où l’inférence est véritablement utile. D’où l’alternative que nous proposons d’utiliserl’approche bayésienne, exempte
deces
limitations,
etqu’il
estpossible
de mettre en oeuvrepratiquement grâce
à une méthodeapprochée
de calcul paréchantillonnage-MC ( "MC"
pour"Monte-Carlo" ), présentée
dansBC-96 et décrite en détail dans Bernard
(soumis).
2. NOTATIONS
Rappelons
brièvement les notations utilisées dans BC-96. Etant données deux variablescatégorisées
A etB,
on note a(resp. b)
une modalitéquelconque
de A(resp. B).
On notenab l’effectif observé de la case ab du tableau de
contingence
A x B(et
nAB l’ensemble de ceseffectifs), f ab
lafréquence conjointe correspondante (et f AB
l’ensemble de cesfréquences)
et
f a
etf b
lesfréquences marginales associées3.
Dans
BC-96, l’analyse implicative
pour un tableau 2 x 2 est fondée sur les taux de liaisons entremodalités,
indices locaux d’écart àl’indépendance4.
Les taux de liaison sontégalement
les indices de base pour l’articleprésent.
Onrappelle
que le taux de liaisontab
entre a et b vaut
avec comme
propriétés
essentielles :Vab, tab > - 1,
ettab = -1 fa b
= 0.Une autre
propriété importante
est celle du moyennage parregroupement :
si on effectue uncodage A’
et B’ des variables A et B(application
de A vers A’ et de B3Les fréquences
marginales
sont toutes supposées non-nulles.4Nous renvoyons à BC-96, Rouanet, Le Roux & Bert
(1987)
et Rouanet & Le Roux(1993)
pour ledétail des propriétés des taux de liaison.
vers
B’),
les nouveaux taux de liaisonta’b’
s’obtiennent par moyennagepondéré
destab
des cases ab
regroupées,
avec commepoids
lesfréquences-produits correspondantes fafb :
3. ANALYSE DESCRIPTIVE : INDICE Del POUR UN
MODÈLE LOGIQUE
,~1~I SUR UN TABLEAU A x BPour deux variables binaires
A2
=(a, a’}
etB2 = fb, b’}, l’implication
stricte ~’a ==} b"constitue un modèle dans
lequel
la case ab’ est "interdite" : la case ab’ constitue ainsi une case d’erreur pour le modèlelogique
M =(a ==} b).
DansBC-96,
nous avons eu recoursà l’indice de
Loevinger, Hab
=-tab’,
comme mesure dudegré d’adéquation
des données àce modèle :
Hab
est un indicedescriptif
dudegré
dequasi-implication a
- b.Considérons maintenant un tableau de
contingence
relatif à deux variables A et Bayant
des nombresquelconques
de modalités. Considéronségalement
unehypothèse
de recherche
qui s’exprime
comme un modèlelogique M,
constitué d’uneconjonction d’implications. Chaque implication
du modèle se traduit par une ouplusieurs
casesd’erreur dans le tableau A x B. Tout modèle M
peut
ainsi aussi bien être défini soit par un énoncélogique,
soit par l’ensemble S des cases d’erreur associées. On notera eab la variable indicatrice de ab EC)
c’est-à-dire que eab = 1 si abE E
et eab = 0sinon5.
A titre
d’illustration,
nousprendrons
unexemple
de données relatives àl’investigation expérimentale
des stades dePiaget,
extrait de Jamison(1977)
et queappelerons
icisimplement l’exemple
"Stades" : dans cette recherche 101 enfants ont été soumis à deuxépreuves,
sériation deslongueurs (A)
et inclusion deslongueurs (B), chaque épreuve
sesoldant par la
catégorisation
de l’enfant en trois niveaux deperformance : "pré-opératoire"
(al
etbl),
"transition"(a2
etb2)
ou"opératoire" (a3
etb3).
Le tableau 1 donne les effectifs observés nAB.Tableau 1:
Exemple
"Stades". Effectifs observés nAB sur 101 enfants classés selon le niveau atteint pour la sériation deslongueurs (A)
et l’inclusion deslongueurs (B), d’après
Jamison(19 ~7,
p.248).
Dans ce
contexte,
unehypothèse psychologique
d’intérêt est celle selonlaquelle
il n’estpossible
d’atteindre le niveau ipour B
que si on adéjà
atteint au moins le niveau i pour 50n peut parler de modèle-vide lorsque C =0,
de modèle-ligne(resp. modèle-colonne) lorsque E
estconstitué uniquement de une ou plusieurs
lignes (resp. colonnes)
de A x B, et demodèle-propre
dans lesautres cas. Seuls les modèles-propres qui expriment véritablement l’idée d’une dépendance orientée entre
A et B nous concerneront par la suite.
A.
Ainsi,
le modèlelogique
d’intérêtpeut
être décrit par les deuximplications suivantes6 :
L’ensemble des cases d’erreur £ associé au modèle Jt~l donné en
(3)
estfiguré
par des casesgrisées
dans le tableau 2 : E =Jalb2, alb3, a2b3}.
Tableau 2:
Exemple
"Stades". Ensemble £ des cases d’erreur(cases grisées)
associées au modèleM donné à
l’équation (3).
Hildebrand et al.
(1977)
ontproposé
un indicegénéral, appelé "Del",
pour mesurer ledegré
dequasi-adéquation
des données à un modèlelogique
.I~Iquelconque.
Cetindice,
que nous noterons
c!~, peut
se définir commel’opposé
de la moyennepondérée
des tauxde liaison des cases
d’erreur,
lespoids
étant lesfréquences-produits associées7 :
En
particulier,
pour un tableau 2 x 2 et pour un modèle ,J~I constitué de la seuleimplication
a -
b,
il y a une seule case d’erreurab’,
et on retrouve alors l’indice deLoevinger Hab :
L’indice
d~ apparaît
ainsi comme unegénéralisation
de l’indice deLoevinger
H. Un indice H mesure ledegré
deq-adéquation
des données à un modèlelogique
élémentaire(une
cased’erreur
unique) ;
pour un modèlelogique complexe
JIiI(plusieurs
casesd’erreur),
l’indicedam
est une moyennepondérée
des indices H associés à chacune des cases d’erreur dumodèleg.
Le tableau 3fournit,
pourl’exemple "Stades",
les indices H associés àchaque
case de A x
B,
considérée comme une cased’erreur ;
danschaque
case on aégalement indiqué
lepoids
associéf a f b.
Apartir
de ce tableau et des cases d’erreur associées aumodèle
,I~f (cf.
tableau2),
on calcule aisémentd~ :
’Cette hypothèse conduit à ce que Jamison
(1977)
appelle le "Wohlwill’sdivergent-decalage
pattern of intertask relation" .7L’indice Del est noté V M par Hildebrand et al.
(1977).
Cet ouvrage est en grande partie consacréà l’indice Del ; nous y renvoyons le lecteur pour des précisions et des propriétés
importantes,
mais nonessentielles pour les besoins de cet article.
8En adoptant la définition
(4),
notre présentation de l’indice Del met l’accent sur ses liens avec l’indice de Loevinger. Mais Hildebrand et al.(1977)
proposent une autreinterprétation
de cet indice en tant qu’une"proportionate reduction in error
(pire)
measure".Si,
à partir de la variable A, on cherche àprédire
lavariable B, la prise en compte du modèle .M se traduira par une certaine proportion moyenne pi d’erreurs de prédiction, alors que sa non-prise en compte se traduira par une proportion d’erreurs po ; l’indice dé peut s’exprimer comme
(pl - po)/po
et mesure ainsi la réduction relative d’erreurs de prédiction induitepar la prise en compte du modèle.
Tableau 3:
Exemple
"Stades". Indices deLoevinger
H associés àchaque
case d’erreurpossible ab,
i. e.-tab.
En bas dechaq ue
casefigure
lepoids correspondant,
i. e.f a f b .
3.1. Valeurs
possibles
de l’indice DelEtant défini comme moyenne
pondérée
dequantités comprises
entre -oo et1,
l’indicedo peut
varier lui-aussi entre -oo etl’unité9.
L’indicedM
vaut 0lorsqu’il
y aindépendance
stricte entre A et B
(A
1LB), mais,
hors du cas d’un tableau 2 x2,
laréciproque
n’est pas vraie. Une valeurd,~,~
> 0indique
un écart àl’indépendance
dans la direction du modèleM ;
par contre une valeurcl
= 0signifie
seulement que l’éventuel écart àl’indépendance
n’a pas lieu en direction du
modèle,
et non pasqu’il
y aindépendance :
eneffet, lorsque
les taux de liaisons sont non tous
nuls,
il estpossible
d’obtenir une moyenne nulle pourles taux de liaison d’un sous-ensemble strict des cases de A x B.
La valeur
maximale, 6~
=1,
est obtenuelorsque
les taux de liaisontab
des casesd’erreur valent
tous -1,
c’est-à-direlorsque
lesfréquences fab
des cases d’erreur sont toutesnulles,
c’est-à-dire encorelorsque
le modèle est strictement vérifié. La valeur trouvéeici, de
=0.851,
est relativementproche
de 1 etindique
donc undegré
élevé deq-adéquation
des données au modèle.
3.2.
Valeurs-repères
pour l’indice DelRelativement à deux
valeurs-repères dtend
etdq.~as~,
onparlera
d’absence deq-adéquation (si
dM dtend),
de tendance à laq-adéquation
si(dtend dM dquasi)
ou deq-adéquation (si
dM > dquasi)
des données aumodèle,
conformément aux termesdéjà adoptés
pourqualifier
les
q-implications
dans BC-96. Etant défini comme une moyennepondérée
d’indices H deLoevinger,
l’indice Del doit êtreapprécié
avec les mêmes critères que ceuxadoptés
pour cepremier ;
ainsi on recourra depréférence
aux mêmesvaleurs-repères
que cellesproposées
dans BC-96 pour l’indice H :
dtend
= 0.40 etdquasi
= 0.60.Rappelons
néanmoins que cesvaleurs-repères
ont seulement un caractère indicatif.Comme
alternative,
onpeut également
considérer unegrille
devaleurs-repères
parrapport auxquelles
on situera l’indiceDel,
parexemple : 0, 0.20, 0.40, 0.60,
0.80 et 1.3.3. Modèles
logiques équivalents
et indice DelL’indice Del
possède
unepropriété
d’invarianceparticulièrement appréciable.
Considéronsun
codage A’
et B’ des variables A et Bqui
estcompatible
avec la structure de l’ensembledes cases d’erreur
Si
c’est-à-dire quechaque
nouvelle case a’b’correspond
auregroupement
9Pour un modèle-vide l’indice dM est indéfini ; pour unmodèle-ligne
ou un modèle-colonne il vaut 0quelles que soient les données, du fait que le protocole pondéré des taux de liaison est centré en
lignes
eten colonnes. L’indice d~ n’a donc d’intérêt que pour les
modèles-propres (pour
ces notions, voir note5).
de cases ab
ayant
toutes même eab =eârb~’
Pour un telcodage,
le modèle J~I sur A x B estlogiquement équivalent
au modèleM’
sur A’ x B’. On montrequ’alors
on a~~
=dMI.
Cettepropriété
d’invariance découle directement de lapropriété
de moyennage parregroupement
des taux de liaison(équation (2))
et de la définition de l’indice Delcomme moyenne
pondérée
de taux de liaison(équation (4)).
3.4. Modèle
d’équivalence,
indice x("Kappa")
L’indice ~
( "~1’appa" )
introduit par Cohen(1960) permet
de mesurer l’accord entre deuxjuges ayant
chacunséparément
affecté des observations à un ensemblepré-déterminé
declasses. Les observations
peuvent
alors êtrerangées
dans un tableau croisé A xB,
où laclasse attribuée par
un juge
constitue la variableA,
et celle attribuée par l’autre la variable B. Les deux variables A et B sont alorshomologues,
la modalité aicorrespondant
à lamodalité
bi.
Un accordparfait
entrejuges
se traduit par l’absence d’observations dans lescases extérieures à la
diagonale,
c’est-à-dire les casesaibj
avec i7~ ~.
Autrement
dit,
l’accordparfait
constitue un modèlelogique
.~Iqu’on peut exprimer
par A ~
B,
i. e.Vi, ai
~bi.
L’indice ~ n’est autre que l’indice Delappliqué
à cemodèle
d’équivalence :
3.5.
Q-adéquation
au modèle a ~ b etq-équivalence
pour un tableau 2 x 2Pour un tableau
2 x 2,
nous avons introduit dans BC-96 la relation de"q-équivalence
dedegré
h"qui,
en utilisant l’indice Del introduitici, peut s’exprimer
comme :En d’autres
termes,
pour undegré h fixé,
il y aq-équivalence
entre a et blorsque
lesindices d associés aux deux modèles
logiques
élémentairescomposants
a - b et b - adépassent
chacun h.Mais,
dans laligne
de l’articleprésent,
onpeut également
se poser laquestion
de laq-adéquation
au modèlelogique
a T# b dont ledegré ~0~=~
se calcule comme moyennepondérée
deda_b
et4=~’
Pour undegré
hfixé,
onparlera
deq-adéquation
dedegré h
au modèle a ~ b
lorsque da_b >
h.D’après
ces deuxdéfinitions,
il est clair que laq-équivalence
entre a et b dedegré h implique
laq-adéquation
au modèle a ~ b dedegré h,
mais que laréciproque
n’est pas vraie :a H
bsignifie
queda~b
etdb~a
sont tous deuxsupérieurs
ouégaux
àh,
alorsque
da_b > h indique
seulement que leur moyenne estsupérieure
ouégale
à h. La notion deq-équivalence
entre a et bproposée
dans BC-96 est doncplus
forte que la notion deq-adéquation
au modèle a ~ b.3.6. Intérêt et limites de l’indice Del
Le
point précédent indique
que, pour leproblème
del’adéquation
à un modèlelogique complexe (plusieurs
casesd’erreur),
deuxapproches peuvent
êtreenvisagées :
dans laligne
de la définition de la
q-équivalence,
onpeut requérir
une condition surchaque
case d’erreurprise isolément,
alors que, dans laligne
de l’indice moyenDel,
onimposera
seulement unecondition
globale.
Cette remarque
permet
depercevoir
l’intérêt et les limites de l’indiceDel, qui sont,
en somme, ceux que
présente
tout indice moyen. Ilpermet
dequantifier
par une seule valeurnumérique l’adéquation
des données à un modèlelogique
éventuellementcomplexe,
à
partir
des valeurs des indices deLoevinger
relatifs auxq-implications
élémentairescomposantes. Mais,
sauf dans le cas extrême où cet indice vaut1,
le résultatglobal qu’il
fournitn’indique
rien sur les écarts entre ces valeurs : certaines desq-implications
élémentaires
peuvent
être dedegré
élevé et d’autres de faibledegré. Ainsi, lorsqu’on
arecours à l’indice
global
Del et même si sa valeur estélevée,
il seraimportant
d’examinerdans le détail les indices de
Loevinger composants,
afin de déterminer si les éventuellescases "déviantes" n’amènent pas à reconsidérer ou à amender le modèle initial.
4. ANALYSE INDUCTIVE
Nous renvoyons à BC-96 pour des considérations
générales
sur l’inférence sur les donnéescatégorisées
et sur les deuxapproches envisageables : approches fréquentiste
etbayésienne.
Nous nous
placerons toujours
ici dans le cadre d’un modèled’échantillonnage
multinomial : lesfréquences
observéesfAB
sont le résultat dutirage
aléatoire d’un échantillon de taillen dans une
population
infinie caractérisée par lesfréquences parentes
~0,4B.A l’indice
descriptif
observéd~,
calculé en fonction desfréquences
observéesf AB
selon
l’équation (4), correspond
leparamètre parent
inconnuêm, qu’on
calculerait defaçon analogue
en fonction desfréquences parentes
~CAB.L’étape
inductive a pour but dese prononcer sur
8M
au vu des données observées.4.1. Inférence
fréquentiste
sur l’indice DelHildebrand et al.
(1977)
ont étudié l’inférence relative à8M
dans le cadrefréquentiste,
enproposant l’approximation asymptotique
de la varianced’échantillonnage
ded~,,~
suivante(cf.
Hildebrand etal., 1977, équation (7),
p.200) :
’où les coefficients cab sont donnés par :
les eab
étant, rappelons-le,
les variables indicatrices des cases d’erreur.Pour
l’exemple
"Stades" nous avons trouvédescriptivement dM
= 0.851. L’intervalle de confianceapproché (approximation normale)
pourbm
déduit del’équation (9),
à lagarantie y
=0.95,
est :IC =
(0.654;1.048] (10)
De
façon analogue
à ce nous avions constaté dans BC-96 pour certaines des méthodesasymptotiques proposées
pour l’indice deLoevinger,
l’intervalle de confiance obtenu icicouvre des valeurs
impossibles
pourô,~,~,
constatqui
entachefortement,
dans le casprésent,
la validité de cette méthode
approchée.
Defaçon générale,
cette méthode est en fait d’unintérêt limité
puisque
sa validité nécessite que les données soient en nombre suffisant et que l’indice observéde
ne soit pastrop proche
de sa borne maximale 1.Malheureusement,
à notre
connaissance,
aucune méthodefréquentiste alternative, qu’elle
soit basée sur unemeilleure
approximation
ouqu’elle
fasse intervenir des testsconditionnels,
n’a étéproposée jusqu’à présent".
4.2. Inférence
bayésienne
sur l’indice DelL’approche bayésienne
de l’inférencepermet
de lever les limitationsprécédentes. Rap- pelons
brièvement les éléments de cetteapproche qui
sontprésentés plus
en détail dansBC-96,
section 4.3(voir
aussiBernard, 1991).
Apartir
d’une distribution initiale de Dirich- letDi ~aAB~ (avec Va, b,
aab2:: 0)
sur ~CAB, on est conduit à une distributionfinale
deDirichlet Di
(aAB
+nAB) qui intègre
l’informationapportée
par les données. De cette dis- tribution finaleglobale
sur ~AB, onpeut
déduire la distribution finale de toutparamètre
dérivé des ~AB, et en
particulier
duparamètre d~.
La méthode
d’échantillonnage-MC (Bernard, soumis) permet
de résoudre leproblème technique
délicat du calcul des distributionspertinentes
et des énoncésprobabilistes
associés. Dans cette
méthode,
onapproche
la distribution finale sur ’PAB par un échantillon aléatoire de celle-ci. Ledegré d’approximation
est contrôlable par le nombre d’échantillons- MCextraits ;
dans l’articleprésent,
tous les calculs ont été réalisés avec N =105 échantillons-MC,
nombrequi
procure une bonnequalité d’approximation.
L’unique point
de choix del’approche bayésienne
est celui desforces
initiales aAB.Dans la
perspective d’analyse
desdonnées,
nous avonsprivilégié
deux solutions pour cechoix :
(i)
l’idée de zoned’ignorance qui
consiste à considérer l’ensemble des distributions initiales définies par la contrainteZab
aab = 1(voir
aussiBernard, 1996
etWalley, 1996) ;
et
(ii)
la notion de distributionfinale
standard(ou simplement
distributionstandard)
obtenue avec les forces initiales aab =
1/~,
avec K = A x B(solution
initialementproposée
parPerks, 1947).
Nous
préconisons
l’utilisation de la solutionstandard, qui
fournit un résultatunique,
avecle recours
conjoint
à la zoned’ignorance
pour l’évaluation de la sensibilité de ce résultatau choix des forces
initiales
Considérons à nouveau
l’exemple
"Stades"(cf.
tableau1)
avec le modèle M donné àl’équation (3).
Lapremière étape
consiste à déterminer la distribution standard sur le vecteur de 1 = 9fréquences parentes
p AB ; celle-ci est donnée par :La distribution standard de
6M, approchée
paréchantillonnage-MC
dans cette dis-tribution standard
globale,
est donnée à lafigure
1. Elle est assezdissymétrique
du faitd’un indice observé
élevé, dM = 0.851, proche
de la borne maximum 1 pour6M.
Sescaractéristiques
de centralité etdispersion
sont :Moy
= 0.830 etEty
= 0.102.L’indice observé
présente
lapropriété ~( f AB ) - (dam> 0.60).
Laprobabilité
pour que cettepropriété
soit vérifiée dans lapopulation
se déduit de cettedistribution,
etvaut :
Prob( 6M
>0.60) =
0.969.Ainsi,
pour lavaleur-repère dquasi = 0.60,
onpeut
conclure à uneq-adéquation
des données au modèle .N( avec une bonnegarantie,
0.969.100n peut supposer que la raison de l’absence de tests conditionnels est la difficulté de déterminer une
statistique ancillaire pour 6M par laquelle on puisse conditionner.
11 Outre cette mesure de sensibilité, la notion de zone
d’ignorance
présentel’avantage
de conduire à des résultats invariants pour toutrecodage
des variables compatible avec le modèle ,M(cf. 3.3) ;
ceci n’estpas le cas de la solution standard qu’il faut spécifier à un niveau donne de
codage
des variables.Figure
1:Exemple
"Stades". Distributionbayésienne
standard de6M (approchée
par unéchantillon-MC de taille N =
105).
L’indice observé
dM
= 0.851présente
aussi lapropriété (dam> 0.80),
mais cettepropriété plus
forte nepeut
êtregénéralisée
avec unegarantie
suffisantepuisqu’on
trouve :Proô(ôM
>0.80)
= 0.675.Pour offrir un
point
decomparaison
entrel’approche bayésienne
standard etl’approche fréquentiste
de la section4.1,
onpeut
calculer l’intervalle de crédibilité standard pour6m,
à la
garantie
0.95(intervalle symétrique),
c’est-à-dire
qu’on
a :Prob(0.584 bm 0.972)
= 0.95. Cet intervalle est delargeur
sensiblement
égale
à l’intervalle de confiancecorrespondant
donné en(10),
mais estdécalé à
gauche,
de sortequ’il
ne couvre pas de valeursimpossibles
pourbm.
Ceciest une
propriété générale
del’approche bayésienne proposée ici ;
cetteapproche peut
ainsi
s’appliquer
aussi bien avec des données peu nombreusesqu’avec
des données pourlesquelles
l’indice observéd~
estproche
de 1.Les énoncés
probabilistes précédents
ont été obtenus avec la solution standard. Pour chacund’eux,
onpeut
faire varier les forces initiales dans la zoned’ignorance
et calculerchaque
fois laprobabilité associée, d’où,
en fin decompte,
l’obtention d’un intervalle deprobabilités
par énoncé. Pourparvenir
à cetobjectif,
nous proposons uneprocédure approchée simplifiée qui
consiste à étudier seulement deuxpoints
extrêmes de la zoned’ignorance,
l’un où les forces finales nAB + aAB sont lesplus
en faveur dumodèle,
l’autreoù elles sont le
plus
en sadéfaveur 12.
Pour l’énoncé
ô M
>0.60,
on trouve ainsi uneprobabilité qui
varie de 0.933 à0.982 ;
onpeut
donc conclure que,quel
que soit le choix des forces initiales dans la zoned’ignorance,
on a
Proô(ôM
>0.60)
> 0.933. Avec unevaleur-repère
moinsélevée,
parexemple 0.50,
on aura une
garantie
minimumplus grande :
pour toutpoint
de la zoned’ignorance,
ona
Prob( hM
>0.50)
> 0.982.l2précisément,
on maximise(ou
onminimise)
selon aAB, l’indice d~ calculé non pas à partir des nAB mais à partir des nAB + aAB .Pour avoir une idée
globale
de l’effet des forces initiales(dans
la zoned’ignorance)
sur la distribution
finale,
onpeut
calculer les intervalles de crédibilité à lagarantie
0.95
correspondant
aux deuxpoints extrêmes, qui
sontrespectivement : [0.522; 0.952]
et
[0.622; 0.981].
La sensibilité des résultats à la distribution initiale n’est pas
insignifiante,
mais restemodérée;
en tout état de cause, pour lavaleur-repère 0.50,
onpeut
conclure à la q-adéquation
des données au modèle J~I avec unegarantie
d’au moins 0.982.5. APPLICATION
À
L’EXEMPLE FRACTIONS :MODÈLE
IMPLICATIF ENTRE"PARTIE-PARTIE" ET "PARTIE-TOUT"
Nous
reprendrons l’exemple
des données "Fractions"déjà présenté
etanalysé
enpartie
dans BC-96
(voir également Charron,
1995 et souspresse). Rappelons
que les donnéesconcernent 165 enfants et adolescents
qui
doivent résoudre une série deproblèmes impliquant
desfractions ; chaque
enfant passe sixtypes
deproblèmes
obtenus en croisant"type
de tâche" - calcul de la fraction"OF",
de laquantité comparée "QC"
ou de laquantité
de référence"QR" -
et deux "situations" - la fraction(donnée
ou àcalculer)
exprime
unrapport
Partie-Partie "PP" ou unrapport
Partie-Tout "PT".Dans
BC-96,
nous avons abordé l’étude de la structureimplicative globale
reliant lessix
épreuves
binairesQCPT, QCPP, QRPT, QRPP,
OFPT etOFPP,
enproposant
unrésumé des relations
d’implication
entrechaque paire d’épreuves.
Unehypothèse générale
de cette recherche est que la réussite aux situations Parties-Tout est nécessaire à la réussite
aux situations Partie-Partie. Lors de cette
première analyse,
nous avons effectivement trouvé de nombreusesq-implications
dedegré
élevé de "réussite à la situation PP" versla "réussite à la situation PT"
correspondante.
Cependant,
cettepremière analyse
constitue seulement unejuxtaposition d’analyses spécifiques
réalisées tâche par tâche. La secondeanalyse envisagée
ici a pour but de fournir uneréponse plus globale
àl’hypothèse d’implication
des tâches Partie-Partie versles tâches Partie-Tout. Pour
cela,
nous considèrerons le modèlelogique
M suivant :"La réussite à une tâche donnée dans la situation PP
implique
la réussite à cette même tâche dans la situationPT,
etceci, quelle
que soit la tâche(QC,
QR
ouOF)."
Pour
juger
del’adéquation
des données à cemodèle,
construisons deux nouvelles variablescatégorisées :
la variable "PP"correspond
aupattern
deréussite/échec
auxtrois
épreuves QCPP, QRPP
etOFPP,
etcomprend
donc 8(= 23) modalités ;
la variable"PT", à
8 modalitéségalement, correspond
aupattern
deréussite/échec
aux troisépreuves QCPT, QRPT
et OFPT. Le tableau 4donne,
eneffectifs,
larépartition
des 165 élèves selon ces deuxvariables,
enindiquant également
les cases d’erreur associées au modèle ,zizi .La
grande majorité
des observations tombent dans une des 27 cases autorisées par le modèle(153
sur165) ; parmi
ces 27 casesautorisées,
seules 4 n’ont pas été observées.Parmi les 37 cases d’erreur
possibles,
9 ne sont en fait pas vides et ont recueilli seulement 12 observations en tout.Qualitativement,
cespremiers
résultats vont dans le sens dumodèle d’intérêt. Pour
quantifier descriptivement l’adéquation
des données aumodèle,
oncalcule l’indice Del observé et on trouve :
Tableau 4:
Répartition
des 165 élèves selon les variables PP et PT. Pourchacune,
les modalités notéesel,
e2 et e3indiquent
la réussite aux tâchesQC, QR
et OFrespectivement ;
les modalitése12,
e13 et e23indiquent
la réussite aux deux tâchescorrespondantes;
enfin les modalités 0 et "e123"indiquent respectivement
l’échec ou la réussite aux trois tâches. Les cases d’erreur associées au modèle M sont soit vides(lorsque non-observées)
soitgrisées (lorsqu’observées).
Cette valeur suffisamment
proche
de1, indique
uneq-adéquation
au modèledescriptive-
ment élevée. Si on
analyse
en détail le calcul conduisant à l’indiceglobal d,,,~,
on constateque les indices H associés aux neuf cases d’erreur non vides varient de -2.93 à
0.74,
ceuxassociés aux cases d’erreur vides valant nécessairement
toujours 1 ;
les deux seules casesd’erreur pour
lesquelles
l’indice H estnégatif (ce qui
va àl’opposé
dumodèle)
sont lescases
(PP
=e2,
PT =0)
et(PP
=e13,
PT =e3) qui
necomportent
chacunequ’une
seule observation et dont les
poids (les fréquences-produits)
sontpetits.
La
figure
2 donne la distributionbayésienne
standard de l’indiceparent bM,
obtenueavec un échantillon-MC de taille 1V =
105.
On notera la moindredissymétrie
de cettedistribution par
rapport
à celle de lafigure 1 ;
ceci découle du faitqu’ici
l’indice observéest moins
proche
de la borne maximum 1 et que les données sontplus
nombreuses.De cette
distribution,
on déduit parexemple
les énoncés inductifs suivants :Le
premier
énoncépermet
de conclure inductivement que, pour lavaleur-repère quasi
=0.60,
il y aq-adéquation
des données au modèle M avec une fortegarantie,
0.9995. En sefixant une
garantie plus petite, 0.95,
onpeut
même conclure à laq-adéquation
audegré
0.705. Le dernier énoncé donne l’intervalle de crédibilité standard pour
bm
à lagarantie
0.95.
La sensibilité au choix de la distribution initiale est ici faible : à l’intérieur de la
zone
d’ignorance,
l’énoncébM
> 0.60 atoujours
unegarantie supérieure
à0.999,
et lesintervalles de crédibilité associés aux deux
points
extrêmes de cette zone sont[0.676; 0.880]
et