R ÉGIS G RAS
A NNIE L ARHER
L’implication statistique, une nouvelle méthode d’analyse de données
Mathématiques et sciences humaines, tome 120 (1992), p. 5-31
<http://www.numdam.org/item?id=MSH_1992__120__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1992, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’IMPLICATION
STATISTIQUE,
UNE NOUVELLEMÉTHODE
D’ANALYSE DE
DONNÉES Régis
GRAS et AnnieLARHER1
RÉSUMÉ -
Si le problème de la concomitance de deux variables a et b trouve une partie de sa réponse dansl’étude
symétrique
de la corrélation ou dans celle de la similarité, celui de l’implication (si a alors b) passe, en revanche, par l’examen d’une relation dissymétrique. Par rapport à uneproblématique psychologique
decomplexité,
R. GRAS, dans sa thèse, aapporté
une contribution qui a permis de nombreuses applications de cetype de relation dans des travaux de recherche en
psychologie génétique
et en didactique desmathématiques,
domaines non exclusifs d’autres champs d’application. Mais les variables considérées dans sa recherche se limitent
aux variables binaires,
présence-absence
d’un caractère chez un individu donné. Ils’agit
ici d’étendre l’étude del’implication statistique (ou
quasi-implication)
à d’autres types de variables et, surtout, à des classes de telles variables. Cette extension nous permet de construire un arbre de classes orientées. Cesdéveloppements
et cetteconstruction
originale
résultent,principalement,
de la thèse d’Annie LARHER.SUMMARY - Statistical inference, a new method of data
analysis.
If the
problem
of the simultaneity of two variables a and b finds part of its solution in the symmetrical study ofcorrelation or similarity, the question of inference
(if a
then b) has on the other hand toundergo
the examining ofa
dissymetrical
relationship. In relation with apsychological problem
of complexity, R. GRASbrought
in histhesis a contribution that made possible a number
of applications
of this type ofrelationship
in research inpsychological
genetics or in mathematical didactics, those areas notprecluding
other application fields. But thevariables taken into account in his research are restricted to
binary
ones,presence-absence of a feature
in a givenindividual. The purpose here is to extend the
study of
the statisticalinference
(orquasi-inference)
to other types ofvariables and above all, to classes
of
such variables. This extension allows us to build a treeof
oriented classes.These
developments
and thisoriginal
constructionmainly proceed from
Annie LARHER’s thesis.INTRODUCTION
La notion de similarité entre attributs a et b - ou variables binaires - est essentiellement
symétrique.
Maiss’agissant
derépondre
à l’étude de "si a alorsb",
R. GRAS[GRAS 1979]
puis
I.C.LERMAN,
R.GRAS,
H. ROSTAM[LERMAN, GRAS, ROSTAM, 1981]
ont définiet
précisé
la notion dequasi-implication
mesurée par une intensitéd’implication
et la notion degraphe d’implication, image
de la relation depréordre partiel qui
en découle. L’intensitéd’implication s’exprime,
dans le casgénéral,
par uneintégrale gaussienne, qui
rend compte du caractère invraisemblable de l’observation faite du nombre de cas oùl’implication
a ~ b setrouve
défaillante,
dans unehypothèse
d’absence de lienimplicatif
apriori.
Despropriétés
decette
intensité, rappelées
ou étudiées dans la thèse d’A. LARHER[LARHER,1991],
sous ladirection de R.
GRAS,
serontprésentées
ici. Maisl’originalité
de cette thèse et des travauxmenés
depuis
consisteprincipalement, toujours
defaçon dissymétrique :
1 Institut de Recherche
Mathématique
de Rennes, Campus de Beaulieu - 35042 RENNES CEDEX.- d’une part, dans l’extension à d’autres
types
de variables(modales
etfréquentielles)
de lanotion d’intensité
d’implication
et de sonuniformisation,
- d’autre part , dans la construction nouvelle d’un indice
d’implication
entre classes a et b devariables,
étendant l’évaluation del’implication a ~ b
à celle de~1
~ô3,
sur la base d’une cohésionimplicative
suffisante des classes examinées et d’une relationimplicative
maximaleentre leurs éléments
respectifs,
- enfin dans
l’organisation
en structure arborescente de l’ensemble declasses, organisation empruntée
à la classificationhiérarchique
construite avec l’indice de I.C. LERMAN. Maisici,
lelien entre deux noeuds de l’arbre est orienté.
Nous examinerons
plus
en détail ces deux volets.Les
concepts théoriques qui s’y
rattachent ne doivent pas être considérés comme desspéculations
détachées de la volonté de construire des modèles de comportements ou de processus depensée.
Aucontraire,
ils s’inscrivent enréponse, provisoire
sansdoute,
àquelques questions
levées par notreproblématique
actuelle endidactique
desmathématiques
mais extensible à d’autres
champs, questions qui
serviront de support intuitif à la modélisationpuis
la formalisationqui suivront ;
parexemple :
°
- à un niveau de cursus
donné,
peut-on, dans unesituation-problème donnée,
déterminer unehiérarchise
partiellement
ordonnée UCprocédures
de résolution deproblèmes
demathématiques, signes
d’une connaissance en voie de constitution ?- à un niveau de cursus
donné,
peut-on définir àpartir
de classes ordonnées deprocédures,
desconceptions homogènes
et résistantes relativement à un certainsavoir 2 ?
etc.
Comme nous en verrons un
exemple
dansle §
3.1 nous avons utilisé les modèlesstatistiques
élaborés pour des variables(§ 1), puis
des classes des variables(§ 2)
afin d’outillerles
utilisateurs,
le didacticien enparticulier,
dansl’approche
dequestions
telles que ci-dessus.Notre
problématique
croise celle de certains chercheurs enintelligence
artificielle dont nousreparlerons plus
loin et dont le souci est :- d’une part, la considération modale de la relation d’attribution d’un
descripteur
déterminé à unobjet (ou
unsujet)
etl’apprentissage
d’une base deconnaissances,
- d’autre part, la reconnaissance de formes.
Cependant,
comme nous venons de levoir,
bien que lapremière problématique
ne soit pas orientée par lesproblèmes d’apprentissage (au
sens del’I.A.)
ou de structure de base deconnaissances,
nospoints
de vuepourraient
serejoindre
dans la nécessité deplacer
lessujets,
ayant conduit à une classification
hiérarchique
ouimplicative,
par rapport aux ensembles de variables classifiées.1. IMPLICATION ENTRE VARIABLES BINAIRES ET EXTENSION 1.1. Modélisation
Dans le cas
binaire,
la situationgénérique
est la suivante. Croisant unepopulation
E et unensemble de variables V et du fait de l’observation
exceptionnelle
del’implication
stricte de la variable a sur lavariable b,
on veut donner un sensstatistique
à uneimplication
non stricte :2 Citons, par exemple, les conceptions "causaliste" ou "chronologiste" que de jeunes étudiants ont de la notion de
probabilité
conditionnelle.a ~ b. En termes
ensemblistes,
A et Breprésentant
lessous-populations respectives
où lesvariables a et b
prennent
la valeur 1(ou "vrai"),
il y aéquivalence
à mesurer l’inclusion nonstricte de A dans B.
Par
exemple,
si a est l’attribut "cheveux blonds" et b l’attribut"yeux
bleus" dans unepopulation
Ed’étudiants,
les données pour étudiersi a =::> b,
dans le cas où Card E =10,
peuvent seprésenter
de 3façons
différentes :S’inspirant
de la méthode de I.C. LERMAN[81]
pour définir lasimilarité,
R. GRAS[79]
axiomatise la notion
d’implication statistique
de lafaçon
suivante :Soit X et Y deux
parties
aléatoiresquelconques
deE, choisies indépendamment (absence
de lien a
priori)
et de mêmes cardinauxrespectifs
que A et B. SoitY
et B lescomplémentaires respectifs
de Y et de B dans E.AXIOME 1
(a
~b)
est admissible au niveau deconfiance
1- oc si et seulement siIntuitivement et
qualitativement,
cecisignifie
quel’implication
a ~ b sera admissible à l’issue d’uneexpérience
si le nombre d’individus de E la contredisant dansl’expérience
estinvraisemblablement
petit
parrapport
au nombre d’individus attendu dans unehypothèse
d’absence de lien. Par
exemple
si Card E= 100,
Card A= 35,
Card B= 50,
alorsCard
(A
f~B )
= 3 est "invraisemblablementpetit"
pour une absence de lien entre a et b.La modélisation
probabiliste
que nous retenons defaçon privilégiée
est décrite par un processus detirage. aléatoire
en 3étapes (cf.
I.C.LERMAN,
R.GRAS,
H. ROSTAM[81]).
Notons
na,nb,n"b,nalBb,navb
les cardinauxrespectifs
de A,B , B,
A nB ,
A u B :- on considère le référentiel E comme la réalisation d’un référentiel
aléatoire C
dont le cardinalen.
serait une variable aléatoire de Poisson deparamètre
le cardinal n de Eobservé, hypothèse compatible
avec les situations lesplus fréquemment
rencontrées etqui
ne nuit pas à lagénéralité
de la modélisation :
- le choix aléatoire d’une
partie quelconque (par exemple X)
de cardinal aléatoire K pour unedistribution uniforme de p
probabilité
sur les élémentsde C
etégale
gà d (dans
le cas deX,
d =m
na) est alors de
type
binomial :" . - .
- X et
~
étant deuxparties quelconques
choisies defaçon indépendante parmi
lesparties
ayantrespectivement
pour cardinaux na et nb, laprobabilité qu’un
élémentde C appartienne
àX fl
Y est :
PROPOSITION 1.
La variable aléatoire Card
(X
fl~’ )
suit la loi de Poisson deparamètre
np(a~ p(b) .
La loi de
probabilité
conditionnelle du cardinal de X nY
est binomiale deparamètres
met
pour s
naAb
et m > navb
Par
suite,
en faisant varier le conditionnement de~,
on obtient :La variable aléatoire Card
(X m IJ
suit donc la loi de Poisson deparamètre n x
= n p(a)p(h)
(de
moyenne et de variance nx).
D’autres modélisations conduiraient à une loihypergéométrique
ou à une loi binomiale.COROLLAIRE. Comme I.C.
LERMAN,
nous réduisons et centrons cette variable de Poissonen la variable :
_______________________________
Dans
l’expérience,
la valeur observée deQ(a,b)
estimplication
de a sur b.indicateur de la non-
Dans les cas
légitimant
convenablementl’approximation na nb
la variableQ(a,E)
suit la loi normale centrée réduite. L’intensité
d’implication, qualité
de l’admissibilité dea #
b, pour na
np, est alors définie àpartir
de l’indice~(~ )
par :DÉFINITION
1.AXIOME 1’. L’axiome 1 devient :
1 L’implication a ~ b
sera admissible au niveau de confiance 1 - a si et seulement si1
Notons que, si
l’approximation gaussienne
n’est pasvalide,
il est loisible de revenir auxorigines poissonniennes
de la variable Card(X n Y)
et de considérer :Exemple,
Considérons les données ci-contre danslesquelles :
Alors
et
On dira dans ce cas que
(a
~b)
est admissibleau niveau de confiance
96,5
%.Remarquons
deux valeursparticulières :
et
On notera que
l’approche
ci-dessus peuts’exprimer
en termes de testd’hypothèse.
Cependant,
nous ne retenons pas cette voiequi,
du fait de sa visée deprise
dedécision,
limiterait les considérations
qui
vont suivre. Mais cettepossibilité
marque bien la différence avecl’approche
de J. LOEVINGER(LOEVINGER [ 1947]) qui
définissait laquasi-implication
de asur b par l’indice
qui prend
ses valeurs sur]-~,1 ] :
Si
H(a,b)
est"proche"
de1, l’implication
est"presque"
satisfaite.Mais,
comme on levoit,
cet indiceprésente l’inconvénient,
ne se référant pas à une échelle deprobabilité,
de ne pas fournir de seuil de vraisemblance et d’être invariant dans toutedilatation de
E, A, B
et An B.
On a d’ailleurs la relation suivante entreH(a,b)
etq(a,b ) :
Cette limitation
apparaît
dansl’approche
de J. PEARL(PEARL [1988]),
de S. ACID et als(ACID [ 1991 ] )
et A.GAMMERMAN,
Z. LUO(GAMMERMAN
A et LUO Z.[ 1991 ] ).
Chezces derniers
chercheurs,
c’est l’écart entre la distributionconjointe
entre a et b(et
non aet b)
etla distribution
produit qui
tient lieu de critèrecomparatif.
Dans la recherche sur
l’apprentissage
de bases de connaissances de J.G. GANASCIA(GANASCIA
J.G.[1991]),
où "l’incertitude" surl’implication
a ~ b est évaluée par l’indice : 2Pr[b a] -1
et étendue à des classes devariables,
lasimplicité
del’approche
de laquasi-implication
sepaie
selon ces deux mêmes inconvénients. Deplus,
cet indice nesépare
pas,
numériquement,
deuximplications
dont l’une serait triviale et l’autre hautement informative.1.2.
Quelques propriétés
du modèle del’implication statistique.
A. LARHER dans sa thèse
[ 1991 ]
étudie et démontre différentespropriétés de q
et ç. Lesplus importantes, auxquelles
nousadjoignons
lespropositions
5 et6,
sont les suivantes :PROPOSITION 2.
Si,
na étant fixé et A inclus dansB,
nb tend vers n(B
croît versE),
alorstend vers
0,5.
Unprolongement
par continuité nous permet donc de définir : si B = E alorsqJ(a,b )
=0,5.
PROPOSITION 3. Pour toute variable a :
Or,
pour n assezgrand,
l’intervalle ci-dessus est voisin de[O,n],
cequi
permet d’affirmer quel’implication statistique a
~ a a un sens, tout en réservant une limite de confiance à la stabilité du caractèrereproductible
de la variable a.PROPOSITION 4. La relation
1t
surV2 définie
par :dès que (p
(a,b-) ~t 0,95
et que navérifie ( 1 )
est
réflexive,
mais nisymétrique,
niantisymétrique,
ni transitive.Pour lui associer un
graphe valué,
sanscycle
ettransitif,
on enprendra
la restriction1B’
aux variables vérifiant la condition : si a
1B’ b
et btn’c,
alors l’arc(a,c) appartient
augraphe
seulement si
0,5. 9’
définit alors unpréordre partiel
et permet unereprésentation
claire de la relation
d’implication statistique (cf.
GRAS[1979]).
On décrit dans[LERMAN I.C.,
GRASR.,
ROSTAM H.1981] l’algorithme qui permet
de le construire. Ce seuil de0,5 permet,
en outre, la satisfaction d’unobjectif
d’accroissement informationnel. Eneffet,
si I estl’incertitude associée aux variables a et
b,
il permet de vérifierI(a b) _ I(a).
Remarque
1. Notreapproche
diffèreégalement
de celle de S. AMARGER et als(AMARGER S.,
DUBOIS D. et PRADE H.[1991]) qui,
àpartir
d’une certaine inférence(une probabilité conditionnelle
telle quep(b a) appartient
à unintervalle,
sans êtreparfaitement connue),
induisent
transitivement,
deproche
enproche,
desprobabilités
conditionnelles sur ungraphe incomplet,
et cela sans la contrainte d’un seuil. Notreproblématique,
àl’opposé,
visel’analyse
d’un tableau
donné,
sans ambition inductive apriori,
mais enimposant
un seuilqui
autorise la fermeture transitive dugraphe implicatif.
PROPOS MON 5.
Comparons
lecoefficient
de corrélationp(a,b)
et l’indiceq(a,h )
et
Ainsi
q (a,b-) = 0 e* p(a,b) = 0
etp(a,b) >_
0 «0,5.
Cecisignifie
queimplication
et corrélation linéaire vontplutôt
"dans le même sens".Cependant,
on peut observerune croissance de
l’implication
en même tempsqu’une
décroissance de la corrélation. Cequi
montre
bien, qu’outre
ladépendance
aux effectifs n, n- a et nb, lera pp ort P q
qindique
la non-coïncidence des deux concepts.
La double situation suivante l’illustre :
Par suite :
- d’une part, al et
bl
sont moins corrélées que a2 etb2 ,
- d’autre part, l’intensité
d’implication de al
surb1
estplus
forte que celle de a2 surb2 puisque
ql q2.
PROPOSITION 6
Considérons le
X2 d’indépendance
des variables a etb ;
alorsLa démonstration est
aisée,
enparticulier
si l’on remarque quex2
= np2.
On constate ainsi que les deux
concepts ~X2
etq2
ne sesuperposent
pas.q(a,b)
est la racinecarrée de la contribution à
;r2
de la case(a,b)
du tableau de croisement des 2 variables a et b. La seuleconsidération,
nonrelative,
dex2
et des effectifs des 4 cases de cetableau,
comme le fontsouvent les
psychologues,
ne peut donc pas rendre compteprécisément
del’implication.
Remarque
2. Etudions la sensibilité de q aux faibles variations d’effectif.Supposons
pour cela que, parexemple, nllAbdevienne n’ab = nab + k
où k sans que varient na etnb .
Alors :L’effet de l’erreur de mesure k est atténué en
qui
permet dans laplupart
des casde maintenir la validité d’une
implication
au même seuil ou à un seuil voisin.1.3. Extension à des variables
numériques
Dans les
paragraphes précédents,
nous avons étudié le croisement entre un ensemble de variables et un ensemble desujets,
croisementqui,
à la variable binaire a, associe la valeura(x)
= 1(x
satisfaita)
ou 0(x
ne satisfait pasa).
Dans sa
thèse,
A. LARHER considère deux autres types de variables :- variables modales associées à une
logique
multivalente où les valeurs de vérité ne sontplus
seulement "vrai
( 1 )"
oufaux (0)"
mais toute valeur de[0,1 ] .
La valeurprise
par la variable asur le
sujet
x est alorsa(x)
élément de[0,1 ].
On retrouve ici un type de variable que E. DIDAY(DIDAY
E.[1991])
axiomatise et étudie enprofondeur
dans le cadre del’analyse
desconnaissances
(au
sens del’I.A.). Mais,
notre théorisation seraplus élémentaire ;
- variables
quantitatives spécifiant
un certain nombre de foisoù,
parexemple,
la variable a estprésente
chez lesujet
x. Parexemple, a
étant uneprocédure
derésolution, a(x)
est le nombre de fois où xl’emploie
au cours de la résolution d’unproblème.
En
fait,
unesuggestion
de I.C. LERMAN confortant notre propreapproche,
permetd’interpréter
ces variables en terme de variablesfréquentielles
définies de lafaçon
suivante :Soit
V2
et i ~E,
oc(resp. P)
la valeur maximum de a(resp. b)
sur E. oc;(resp.#ç)
la valeur observée de a
(resp. b)
sur i. Posons :et
Ces valeurs pour oc
= ~3 = 1,
ai et~3~
= 1 ou 0 étendent alors le cas binaire où les effectifsfréquentiels
sont na, nb etna,,b .
Eneffet,
silA
et1B
sont les fonctions indicatrices des sous-ensembles d’individus
possèdant respectivement
les caractères a etb,
l’effectif s’écrit :Donc posons, comme pour les variables binaires :
qui
sera, pour vb, l’indicateur retenu pourl’implication statistique
de a sur b.Nous en donnerons un
exemple
dans leparagraphe
3.3.2. IMPLICATION ENTRE CLASSES DE VARIABLES.
Elle ne
prend
véritablement son sensqu’à
conditionqu’à
l’intérieur dechaque
classe devariables dont on examine la relation avec
d’autres,
existe une certaine "cohésion" entre les variablesqui
laconstituent,
ceci afin que le "flux"implicatif
d’uneclasse et
sur une classe ?soit nourri d’un "flux" interne à
~t
et alimente un’flux"
interne à 13. Cettecohésion, généralement
nourrie de cohérencesémantique
ou, dans le cas de ladidactique,
de conditionspsychologiques, cognitives, situationnelles,
etc., doit se traduire ici par une mesure(quantitative).
Onpourrait
penserqu’un
ensemble d’indices de similarité assez élevés entre les éléments de la classe serait un bon indicateur de cohésion. Nous ne retenons pas cetteapproche qui
ne rendrait compte que d’une cohésion deprofils symétriquement comparables,
ne restituantpas une
dynamique
interne orientée(donc
nonsymétrique). Or,
nousdisposons
avec lesintensités
d’implication
entre variables d’un instrument de mesure d’un emboîtement de deuxparties
d’unepopulation
E. Parexemple,
si dans la classe à 3 éléments a,b,
c, on observe :=
0,97, çfb,6)
=0,95,
=0,92, ,
on pourra dire que la classe orientée de a vers cadmet une bonne
cohésion ;
; cequi
ne serait pas le cas si=
0,82,
=0,38
=0,70
=0,48
> C’est donc cette voie quenous choisissons pour une cohésion
implicative
doncorientée,
comme peut l’être une filiationprocédurale
ou unegenèse.
Nous verrons ensuitequel
indicateurpermettrait
de rendre compte d’une extension auxclasses,
de la notiond’implication.
2.1. Cohésion
implicative
Afin d’en améliorer
l’intuition,
nous la définironsprogressivement
pour2, puis
3 et r élémentsde classe.
La
cohésion,
se voulant indicateur d’ordreimplicatif
au sein d’une classe devariables, s’oppose
en cela au"désordre" dont rend comptel’entropie
d’uneexpérience
aléatoire.Rappelons
ausujet
de celle-ci que, X étant une variable aléatoire prenant ses valeurs dans S = muni de la loi{ p 1,p2,...,pk } , l’entropie
estl’espérance mathématique
dela variable
I(X) prenant
les valeursI(m 1), I(m2),...J(mk) ; I(mj)
est l’incertitude sur ouinformation
apportée
par la réalisation de{mj }.
Ainsi :est
l’entropie
del’expérience.
2.1.1. Cas de 2 éléments : classe
(a,b).
Supposons na _
nb. Nous allons définir la cohésion ducouple (a,b).
Soit X
la variable aléatoire indicatrice de l’événement[6(~,6) > q(a,b)].
Alors :L’entropie
ou incertitude de cetteexpérience
est alors :Par
exemple :
. si = p =
0,95,
alors :. si
= 1,
= 0 en convenant que 0 ln 0 = 0. si =
0,5, alors 8[/(X)]
= 1(entropie maximale).
Mais si = 1 -
x)] .
Précisément,
enposant : C = f (p) _ - p log2 p - ( 1-p ) log2 (1-p ),
on a :f( 1 p ) = f(p ).
L’entropie
est doncsymétrique
par rapport à p =0,5 .
,De
plus, «L
= pour p E]0, 1 [ donc 9
croît de 0 à 1 sur]0;0,5]
et décroît de 1 à 0dp
psur
[0,5;1 [.
Aussi,
lapropriété
desymétrie de C
allant à l’encontre de ladissymétrie
de laquasi- implication,
nous retiendronsfinalement,
comme indicateur decohésion, l’application
c définiesur V x V par :
DÉFINITION
2. La cohésion ducouple
de variables(a,b)
tel que na 5 nb est le nombrec(a,b)
où :
La fonction "carré de
l’entropie"
est choisie pour des raisons de renforcement du contrastesur
[0,1 ].
Nous prenons la racine carrée de soncomplément
à 1 pour donner à la cohésion la dimension del’entropie
et pour accroître sa valeurnumérique (en
effet pour[o,1 ],
1-x2>_1-x)
2.1.1.1.Etude aux limites Posons :
c(a,b)
=g(C)
=g[f(p)]
c(a,b)
croît donc de 0 à 1quand
p =~~)
croît de0,5
à 1. La fonction c de p est continue enp=1
2Nous
prolongeons
par continuité en prenant :c(a,b)
= 1lorsque p
= 1(c’est-à-dire lorsque l’implication a b
eststricte).
Remarque
3.Rappelons
un résultat démontré dans la thèse d’A. LARHER :si na
nb
et siq(a,b)
_0,
alors l’intensitéd’implication
de a sur b estsupérieure
à celle de b sur a. Cequi signifie
que :Appelant
classe(a,b)
lecouple (a,b)
telque na _
nb , la cohésion de la classe(a,b)
estdéfinie sans
équivoque
àpartir
de laplus grande
des intensités relatives à(a
~b)
et(b
~a).
D’où la :
DÉFINITION
2’Remarque
4.Lorsque
b = a et que nous avons vuque
(cf. p. 11) 0,95
:::;(p(a,a) :9
1. La cohésion de la classe(a,a)
a donc un sens et, engénéral, puisque
lim c= 1 ,
cette cohésion est très voisine de 1. Pardéfinition,
nous poserons donc :p - 1
2.1.2. Cas de 3
éléments a, b
et c.Six valeurs d’intensité
correspondent
apriori
à l’ensembleÀ
=( a,b,c } :
Nous souhaitons que l’indice de cohésion
implicative
contienne l’information révélée par les relationsimplicatives
binaires entre tous les éléments de l’ensemble . Mais,
en même temps, pour conserver ladynamique dissymétrique
del’implication,
seule la relation laplus puissante
entre deux élémentsquelconques
restepertinente
par rapport à notreobjectif.
Parsuite, parmi
toutes les associations 3 à 3 ne faisant intervenirqu’une
foischaque couple
d’éléments de
{ a,b,c }
et restituant au mieux lapuissance
de certainesimplications,
nousretenons les valeurs :
1 - ., -
- r · 1
Comme
précédemment,
dans le cas où ils sontsupérieurs
ouégaux
à0,5,
les maximaobtenus sont
compatibles
avec l’ordre des effectifs et ne. Parexemple,
sin,,,:g
nb É. ne, les trois maxima (a;# et m (b_C)DÉFINITION
3. Lecouple 0 = ((a,b j,c j
sera encoreappelé
classe et sa cohésionimplicative
sera
définie
ainsi :moyenne
géométrique
des cohésions des classes à 2 élémentsLa
préférence
accordée à la moyennegéométrique plutôt qu’à
la moyennearithmétique
tientà notre
volonté,
d’une part d’obtenir une cohésion nulle pour une classe dès que la cohésion d’un de sescouples
estnulle,
c’est-à-dire dès que lesimplications
mutuelles sont inférieures ouégales
à0,5,
d’autrepart
de "ramener" auvoisinage
de 1lorsque
les cohésions descouples
sont assez fortes.2.1.3. Cas de r éléments al, a2,...,ar.
Nous
opérons
commeci-dessus,
c’est-à-dire en retenant les maxima des intensitésd’implication
entre 2 éléments
quelconques
de l’ensembleÀ
={ al,a2,...,a1 } .
A ces maxima sont associés les cohésionsimplicatives
descouples
et l’ordre induit surÀ
par les effectifs nal, na2’ ..., nar. Parexemple,
sina2
", nar, nousappellerons
classe lecouple C1 = (((~1,~2)~3).’"~).
etcomme il y
a r (r 2 -1 ) paires,
sa cohésionimplicative
sera :DÉFINITION
4moyenne
géométrique
des cohésions de classes à 2 éléments2.2.
Implication
entre classes.Nous souhaitons que
l’implication
entre deux classes se constitue àpartir
des informations suivantes :- les cohésions
respectives
des 2classes,
- une intensité
d’implication
extrémale des éléments d’une classe sur les éléments del’autre,
- les cardinaux
respectifs
des 2 classes.Chacune de ces informations crédite l’indice que nous retiendrons si :
.
- l’indice croît avec les cohésions de
chaque
classe et s’annulelorsque
la cohésion de l’une d’entre elles estnulle,
- l’indice croît avec la liaison extrémale
(minimale
si l’on vise undegré d’exigence élevé,
maximale si l’on recherche une
souplesse réaliste),
- l’indice décroît avec les cardinaux des
classes,
euégard
à laprise
encompte
d’une liaison maximale.Posons :.
ri etB
deuxparties disjointes : fi = (al,...,ar} et B
=~bl,...,bS} , Ct
et ô3 les classesqui
leur sontrespectivement
associées ,. C(G )
etC(13)
leurs cohésionsrespectives.
Conformément aux lois de
probabilité
des sup. de variablesaléatoires,
apriori
uniformément
distribuées,
nous définissons l’indiced’implication 03)
de laclasse 0
versla classe 03 par :
DÉFINITION
5.1
L’expression C(!8)] représente
la cohésion moyenne(géométrique) de Q et 13 ;
elle
intègre
les informations de cohésivité des 2 classes enjeu ;
deplus,
cetteexpression
est telleque si et
C( 03)
sont simultanémentmultipliées
park,
alors1¡I(a,b)
estmultipliée
par k.REMARQUES
1 °)
SiÀ
etB
sont réduits à dessingletons,
etdonc 0
et #3 à descouples
d’élémentségaux,
cette formule vérifie la définition de
l’implication
entre variablespuisque
dans ce casC( 15) = C( ô3) = 1 ;
l’indice choisi coïncide alors avec l’intensitéd’implication,
soit :y¡(a,a), (b,b)) =
«a,b).
2°)
La méthode de construction de l’indiced’implication
ci-dessus montre à l’évidencequ’elle
est
indépendante
de la nature des variablestraitées,
que celles-ci soientbinaires,
non binaires oufréquentielles.
3°)
Un critèred’implication
entre classesbasé,
dans le cas des variables binaires(ou attributs),
sur la réunion ensembliste des ensembles d’individus
possédant
ces attributs n’est paspertinent.
D’une
part,
ilprivilégie
les seules variables de cette nature, d’autre part il ne rend pas compte de la cohésion des classes.Par
exemple,
si a, b et c sont des attributsreprésentés respectivement
par lesparties A,
B etC ci-dessous et
si,
deplus, Card(A
UB),
CardC,
etCard[(A
UB)
tlCi
restent constants, onpeut
obtenir des situations très différentess’opposant
à l’idée intuitive del’implication
entreclasses telle que nous la concevons. La cohésion de
(a,b)
et lespositions respectives
deA,
B etC dans 3 cas différents montrent de
façon
évidentel’inadéquation
du choix de la réunion poursignifier l’implication :
Card(A
UB)
= 20Card[(A
UB) n CI
= 10La cohésion de la classe
(a,b)
et la relationimplicative
de(a,b)
sur c sont manifestement très différentes dans les 3 cas, alors que ceux-ci sont trèscomparables
selon le critère de la réunion ensembliste.4°)
Les moyens de calcul àdévelopper
pour examiner tous les indicesd’implication
de classesdans un ensemble de x variables
(définies
sur unepopulation
de nindividus)
croissentexponentiellement
avec x ; eneffet,
l’ensemble desparties
à considérer contient 2x éléments.Aussi,
dans laréalité,
nous pensons raisonnable deprocéder
de lafaçon
suivante :- calculer les
implications
entrevariables,
- construire
puis analyser
legraphe d’implication (cf. p.11 ),
- émettre des
hypothèses
quant à la cohérence de formation de classes par rapport à laproblématique initiale,
- constituer de telles classes de variables
(items
ou modalités deréponse
dans le cas d’unquestionnaire)
et évaluer les valeurs des indicesd’implication
entre ces classesprises
2 à2 ;
éventuellement,
modifier sensiblement les contenus de ces classes pour améliorer les valeurs des indicesd’implication.
Un indicateurstatistique, qui
reste àdéterminer, pourrait
servir àdéfinir un test d’arrêt de modification.
Par
exemple,
dans le cas où les variables seraient desprocédures (disjointes
ou non, maisidentifiables en
présence-absence
chez chacun desindividus),
onpourrait
obtenir des relationsentre classes de
procédures, gommant
les effetsmicroscopiques
deprocédures
tropparcellisées
et rendant compte de démarches
générales,
voire deconceptions,
ayant une certaine stabilité.Notons à ce
sujet
que la condition dedisjonction de A et B exprimée plus
hautpeut
être levéesans affecter radicalement les
objectifs
déclarés à propos del’implication
entre classes : eneffet,
la cohésion de classes est un garant
d’homogénéité "dirigée" qui
relativise l’incidencequ’aurait
le
premier
facteur duproduit
définissantl’implication où G
et T5 sont les classesrespectivement
associées auxensembles A et B .
Pour terminer ce
paragraphe, soulignons
l’intérêt des notions de cohésion etd’implication
entre classes pour
l’analyse implicative.
Soit une
classe Ci
de variables de cohésion non nulle. Si l’une de sesvariables,
a, admetune
implication
inférieure à0,5
sur une variable d’une classe03,
legraphe implicatif
ne pourra rendre compte de cetteimplication
en raison del’exigence
d’une intensitésupérieure
ouégale
à0,5
pour la fermeture transitive dugraphe (cf. p. 11).
Par contre,l’implication
entre classes nesollicitant que le sup des
implications dirigées
de a versb,
l’attribut a vaapparaître
dansl’implication Q ==>
03.Ainsi,
nous conservons une informationqui
auraitdisparu
si l’on s’était contentéd’envisager l’implication
de variables seules.2.3. Etude de la vraisemblance de
~3).
Dans ce
paragraphe,
nous cherchons des critères permettant, àpartir
d’une valeur observée dansune
situation, toujours
dansl’hypothèse
d’une absence de lien apriori,
d’accorder un sensimplicatif
à la liaison nonsymétrique
de l’ensemble de variablesÀ (classe associée : Cf)
surl’ensemble de variables ?
(classe
associée :03).
Enfait,
à travers lequestionnement
de lavaleur de nous avons la même attitude que
1
celle que nous avons eue à
l’égard
de = 1 -P~Q (a,b-) :9
Pourcela,
il nous fautexaminer les lois
régissant
les variations des variables enjeu :
intensitésd’implication
etcohésions
implicatives.
Lacomplexité
des calculs nous contraint à des études limitées maisdéjà significatives
del’implication
deet
sur 13 ou"degré
d’étonnement" des valeurs observées(cf.
p.
20).
2.3.1. Loi de variation de
c(a,b).
Nous menons cette étude dans le cas des variables
binaires,
mais cette étude serait trèsproche
dans les autres cas.
Lorsque
la cohésion d’une classeet
estfaible,
la liaisonimplicative
entre les éléments estcependant
loin d’êtrenégligeable.
Eneffet,
cette valeur faible restecependant
le témoinqu’il
existe
toujours
entre 2 élémentsquelconques
de l’ensemble associéA
uneimplication
unidirectionnelle au moins
égale
à0,5.
Précisons cela dans le cas oùA
=PROPOSITION 7. Posant a’ = 1 - a e
[0,1] ,
O etr(a,b)
les variables aléatoires dont les réalisationsempiriques respectives
sontd’implication
p(~,&)
et la cohésionc(a,b)
alors :
a)
Deux attributs a et b étantdonnés,
considérons en effet la variable aléatoire (D dont la valeurobservée,
na Ab étant connu, estqi...a,b) Ainsi, [1>
> 1 -oc]
si et seulement si[Q(a,b
oùç’~l
est la fonctionréciproque
del’intégrale gaussienne :
Revenant à la nature
"poissonnienne"
de la variableCard(X
nY)
définieau § 1.1, représentant
le cardinal aléatoire de A nB
de valeur observéen_g
on obtient :,
avec
Bien
entendu,
pour n assezgrand,
nous retrouvons : 1 -a] s
a donc 0 estuniformément distribuée sur
[0,1].
Par
exemple,
sib)
Soit oc’ = 1 - a > 0.Alors,
revenant sur les variations dec(a,b)
en fonction de examinons la loi de la variable aléatoirer(a,b),
de réalisationc(a,b),
en fonction de cellePr[r(a,b)
>a’]
Supposant >_ 0,5
réalisé :d’où
Exemples.
* si
*