M ARC B AILLEUL R ÉGIS G RAS
L’implication statistique entre variables modales
Mathématiques et sciences humaines, tome 128 (1994), p. 41-57
<http://www.numdam.org/item?id=MSH_1994__128__41_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1994, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’IMPLICATION
STATISTIQUE
ENTRE VARIABLES MODALES Marc BAILLEUL etRégis
GRAS1RÉSUMÉ - L’implication statistique, selon R.Gras, permet d’associer à un ensemble de variables binaires ou
fréquentielles
unpréordre représentable
par un graphe non symétrique et par une hiérarchie ascendante.L’analyse
d’un questionnaire à modalités totalement ordonnées nous contraint, pour conserver l’information maximale, à étendre cette notion à des variables modales et, par suite et a fortiori, à desvariables ordinales qui s’y ramènent. A la suite de cette construction, on examine les contributions d’individus
ou de catégories de sujets à certains chemins du graphe ou à certaines classes de la hiérarchie. Une nouvelle
catégorisation des individus en découle, induite par des comportements
comparables
àl’égard
de ces variablesmodales.
SUMMARY - Statistical implication between modal variables
If we refer to the research carried out
by
R.Gras, the statisticalimplication
allows to combine arepresentable pre-order
with a set ofbinary
variablesby
means of a non symetrical graph, using anascending
hierarchy.Analysing a questionnaire based on
orderly displayed
modalities means that we have to widen this very notion to modal variables, then, a fortiori to ordinal variables, if we want to keep the full meaning of the whole thing. Next, we go through the individual contributions from either individuals orclassified subjects,
pointing up either some branches of the graph or some classes appearing in the hierarchical organization. Sothat we can
clearly
get a new categorization of individualsinferred by
behavior similar to those stemming from these modal variables.INTRODUCTION
Nous avons
présenté
la notiond’implication statistique
entre variables dans cette Revue[ 10]
et mis en évidence son
originalité
par rapport :* d’une
part,
aux méthodesd’analyses
de données desressemblances,
* d’autre
part,
auxapproches
récentesd’analyses
nonsymétriques
visant à rendrecompte
d’une inférence ou d’une inclusion.Les
premières
sont basées sur des indices de similarité ou des distances et sont donc nécessairementsymétriques.
Lessecondes, qui
nous sont connues à l’heureactuelle2,
utilisent essentiellement la notion de
probabilité
conditionnelle et la relation deBayes, permettant,
leplus
souvent, de faire des étudessimplement
locales(liaison
entre deuxvariables)
et nedisposant
pas d’un seuild’acceptabilité
de la relation mise en évidence.Nous
cherchons,
au moyen del’implication statistique,
à structurer un ensemble devariables,
de naturevariée,
en ungraphe
nonsymétrique,
transitif etpondéré
par des indicesprobabilistes,
l’idée intuitiveprimitive
etparadigmatique
étantd’organiser
un ensemble de1 Institut de Recherche Mathématique de Rennes,
Campus
de Beaulieu - 35042 RENNES CEDEX2 Citons, par exemple, J.LOEVINGER [15], E.DIDAY [6], J.PEARL [16], S.ACID et als [1], A.GAMMERMAN ET Z.LUO [7], J-.G.GANASCIA [8], S.AMARGER et als [3].
variables
binaires,
par la relation "si a alorsb",
sur la base d’observations de la relation dansune
population
desujets
oud’objets.
Cette structurepeut
être étendue à des classes de variables etconduire,
comme dans les méthodessymétriques,
à une hiérarchie ascendante.Nous
présenterons
brièvement lesprincipes
de la méthode tellequ’elle
s’estdéveloppée après
la thèse de R.Gras[9],
sous sadirection,
à travers les propres thèses de A.Larher[12],
S.AG Almouloud[2],
A. Totohasina[18]
et H.Ratsimba-Rajohn [17]. Puis,
nous
développerons
les extensions de cette méthode à l’examen de la contribution dessujets
à des classes de variables
agrégées
par un indice de cohésionimplicative, toujours
nonsymétrique,
extensions au crédit de la thèse récente de M.Bailleul[4],
en droiteligne
desprécédentes.
1. PRINCIPES
GÉNÉRAUX
DE L’IMPLICATIONSTATISTIQUE
1.1 Le cas
paradigmatique :
variables binairesUn ensemble de variables binaires V étant
donné,
on examine les réalisations de cesvariables sur une
population
E desujets (ou d’objets). Intuitivement,
si A(resp. B) représente
dans E lasous-population
vérifiant ou satisfaisant la variable a(resp. b),
laqualité
de
l’implication
a=>b sera d’autant meilleure que l’inclusion de A dans B seraproche
del’inclusion
parfaite,
euégard
aux tailles de A et B. Plusprécisément,
X et Y étant deuxparties
deE,
choisies aléatoirement etindépendamment
dans l’ensemble desparties
decardinaux
respectivement égaux
à ceux de A etB,
si oc est un seuil deprobabilité :
Notons n, na, les cardinaux
respectifs
deE, A, B ,
A n B. Il est démontré dans[ 14],
que la variable aléatoirecard(X
n~ ,
réalisée à travers n.,, F, suit la loi de Poisson deparamètre
Dans de bonnes conditionscardinales,
la variable aléatoire centrée réduite :- r-
. suit
approximativement
la loi normaleSoit
q(a, b )
la réalisation de 1Dans la
pratique,
on retientgénéralement
le niveau de confiance0,95,
mais ce niveaupeut
être modifié en fonction des conditionsexpérimentales.
On démontre aisément que si
na ~
nb, alors résultat conforme avecl’intuition. De
plus,
on établit dans[ 10],
les relations existant entre lex2 d’indépendance,
lecoefficient de corrélation linéaire et le
paramètre q(a, b ),
relationsqui
prouvent la non- coïncidence desconcepts.
1.2 Extension à d’autres variables
Une même
interrogation
surl’implication
entre variablespeut
êtreportée
sur deux autrestypes :
* des variables
numériques:
parexemple,
le nombre de fois où un certain caractèreapparaît
chez unsujet,
* des variables modales : par
exemple,
la valeur de vérité ou l’intensité d’un certainprédicat
chez unsujet.
Ce nombre de l’intervalle[o,1] peut
aussireprésenter
une variableordinale
grâce
à unesegmentation
discrète de l’intervalle. Cette situation est traitée dans la thèse de M.Bailleul[4]
où il considère desdegrés
d’accord desujets
avec despropositions.
Nous y reviendrons par la suite.
Un indice
d’implication
est défini sur cesvariables,
unifiées sous le vocable"fréquentielles"
[10],
et sa restriction aux variables binaires coïncide avec l’indice définiplus
haut.1.3
Implication
entre classes de variablesRendre compte d’une
dynamique implicative,
d’une sorte de fluximplicatif,
au sein d’unensemble de
variables,
avec uneapproche permettant,
comme pour descouples
devariables,
de conserver leplus significatif,
le"presque vrai",
estl’objectif
de cettegénéralisation.
Celle-ci doit
intégrer
les relations inter-variables et favoriser leregroupement,
au sein d’une mêmeclasse,
des variables lesplus
liées.Deux concepts cherchent à satisfaire ces contraintes :
* la cohésion d’une classe de variables construite sur la notion
d’entropie
"implicative",
* l’intensité
d’implication
d’une classe sur une autre,prenant
encompte
laqualité
decohésion de chacune d’elles et une relation
implicative
extrémale entre elles.Posons: p= max et supposons
na _
nb.L’entropie
del’expérience
où peutou non se réaliser l’événement
[Q(a, b ) >q(a, b )]
est alors:Ainsi,
la cohésion d’une classe croît avec l’absence de désordreimplicatif
entre ses élémentset
ceci,
d’autantplus
que la classe est degrand
effectif.L’implication
entre deux classes est donc d’autantplus
forte que la cohésion de celles-ci(leur
"crédibilité
implicative")
et leur liaison maximale sont elles-mêmesfortes ,
et que leurs effectifs sont faibles(car
ils affectent la liaisonmaximale).
1.4 Les
représentations graphiques
associéesL’approche
que nous avonsadoptée
pour définir une"quasi-implication"
entre variables de l’ensemble V nouspermet
de munir V d’une structure depréordre partiel
sous la condition d’admettre la transitivité àpartir
d’un seuil d’intensitéd’implication pris
engénéral égal
à0,5
(valeur
indifférente parrapport
àl’implication).
Onpeut
donc associer à cepréordre
ungraphe transitif,
nonsymétrique, pondéré
par les intensitésd’implication,
dont les noeudssont les éléments de V et les arcs des flèches
implicatives.
Cegraphe
est un très bon outil pourl’usager
car il luipermet
d’embrasser simultanément les sous-structures totalement ordonnées de la structure de V.Exemple :
Remarque.
Si,
au lieu depondérer
legraphe
à l’aide des intensitésd’implication,
nous le faisons aumoyen des cohésions des
couples (origine, extrémité)
dechaque
arc, l’ensemble des arcs, fermetures transitivescomprises,
admet sespondérations
dans l’intervalle[0,1].
Il est
possible également
dereprésenter
selon une hiérarchie ascendanteclassique
une autrestructuration de V obtenue par l’examen de
l’implication
entre classes de variables. Cette hiérarchie se construit selon le critère de la cohésion des classes. Parexemple,
aupremier
niveau se réunissent en une classe les deux variables dont la cohésion est maximale. Au niveau
suivant,
une classe à trois éléments se constitue selon ce mêmecritère,
à moinsqu’une
nouvelle classe à deux élémentsn’y
ait une meilleure cohésion. La classification s’arrête dèsqu’il
s’avèreimpossible
de trouver une nouvelle classe de cohésion non nulle.Exemple :
2.
ÉLÉMENTS
MAJEURS D’UN GRAPHE OU D’UN ARBRE IMPLICATIFSLes notions
qui
suivent vont, d’unepart, quantifier
lasignificativité
desreprésentations
de lastructure de l’ensemble des
variables,
et, d’autrepart,
faire le lit de la relation dessujets
à cesreprésentations.
Tous lesconcepts
introduits conduisent à desalgorithmes, programmés
dans le
logiciel
C.H.I.C[5] qui
permet d’effectuer tous les calculs et lesreprésentations graphiques
afférents.2.1 Noeuds
significatifs
Pour définir cette
notion,
nousprocèderons
comme I.-C.Lerman dans le cas de la ressemblance[ 13],
à ceciprès
que nous considéreronsplutôt
lescouples
que lespaires
devariables en raison de notre
objectif
dedissymétrisation poursuivi [17].
Eneffet,
la cohésioncalculée sur l’ensemble des classes de variables
(a,b)
telles que na nb et a~b(donc c(b,a) c(a,b)),
permet de définir sur cet ensemble unepréordonnance 0
degraphe 0(0)
dans VxV.A
chaque
niveau de la hiérarchieimplicative
obtenueprécédemment,
onpeut
associer un indicesignifiant
un certainaccord,
une certaine résonance entre lapartition
de l’ensemble des variables relative à ce niveau et lapréordonnance
initiale. Cet indice est basé sur le nombre decouples déjà
réunis et celui descouples séparés
conformément à cettepréordonnance.
Il varie d’un niveau au suivant et sert de critère brutd’adéquation
de lapartition
avec S~. Précisons.Soit
rlk
lapartition
de V observée au niveau k de la hiérarchieimplicative.
Descouples
sont réunis à ce kième niveau et d’autres sont encore
séparés.
NotonsRIIk
etSflk
lesensembles
respectifs correspondants.
L’ensemble n[SIIk
xRIIk]
contient lescouples
de
couples qui,
au niveauk, respectent
lapréordonnance
initiale. Associonsalors
commenous le faisons pour card
(A
nB ),
l’indice aléatoire card[G(Q*)
n[SMk
xRrlkl 1
où ~2*est une
préordonnance
aléatoire dans l’ensemble l’ensemble uniformémentréparti
despréordonnances
définissables sur V avec despropriétés
cardinalescomparables
à celles deS~. Cette variable aléatoire admet pour
espérance
1/2 card[Snk
xRIIk]
et pourécart-type
[card [SIIk x RIIk]
x card 1/2. L’indice centré et réduits(Q, k) correspondant
varied’un niveau à l’autre de
façon
non monotone et c’est luiqui
est retenu comme critère designificativité
d’un "bon ordre" de la hiérarchie au niveau k..
Ce sont les niveaux
significatifs
que retiendraplus particulièrement
l’utilisateur à des finsd’analyse
attentive.2.2. Chemin
significatif
dugraphe implicatif
-Puissance de ce cheminA travers ces
notions,
nous voulonsporter
intérêt à la consistance d’un chemin dugraphe
défini dans
le §
1.4. Nous savons que legraphe
est, parconstruction,
transitifpuisque
toutefermeture transitive admet une
pondération égale
à l’intensitéd’implication
au moinségale
à0,50 (cohésion >0).
Par contre, lapondération
de ses arcspeut
être variable de0,50
à1,00.
1 .
Ce sont les chemins
significatifs qui,
pour une valeur de ço relativementélevée,
parexemple 0,95,
crédibiliserontl’analyse
en termes de filiationimplicative,
même si rien negarantit
unebonne
qualité
des fermetures transitives à ce niveau[ 12].
Afin de
quantifier
la"rigidité" globale
d’unchemin,
on pourra associer à un chemin la moyennegéométrique
descomposantes
de son vecteurpuissance,
donc de sespondérations.
2.3 Vecteur
puissance
d’une classeSupposons qu’une
classe C de variablesapparaisse
à un niveau k de la hiérarchieimplicative.
Elle est le fruitd’agrégations
successives de classesplus petites
formées à des niveaux inférieurs et, enparticulier,
àl’agrégation
de deuxclasses,
A et B au niveauk-l,
telles que A=>B au sens
du §
1.3.Dans la formule de la définition
4,
lecouple (a,b)
est celuiqui
conduit au sup. de la liaisonimplicative
de A sur B.Mais,
au cours de lagenèse
deC,
d’autres sous-classes se sontformées,
les classes A et B parexemple
et d’autres antérieurement àelles,
parl’agrégation
de classes
plus petites.
Achaque
niveaud’agrégation correspond donc,
comme au niveauk,
un
couple générique porteur
de la liaison maximale au sein de la classe constituée à ceniveau. Soit
g
k-1 le nombre decouples génériques qui
ont doncprécédé
lecouple (a,b).
Ce vecteur est un élément de
représentation
que l’on attachera à la classe C.Ces différentes
images
vectorielles desgraphe
et hiérarchie vontpermettre
d’introduire unemétrique
sur des espaces dereprésentation
où lessujets -
comme il est fait defaçon
duale enanalyse
factorielle descorrespondances - pourront
êtreprojetés.
3. LA
QUESTION
DE LA CONTRIBUTION DES INDIVIDUSL’approche probabiliste développée
dans leparagraphe
ci-dessus laisseapparaître
l’absencede
réponse
ausujet
de la"responsabilité"
des individus dansl’apparition
desphénomènes représentatifs
obtenus(classes
cohésitives ou chemins dugraphe).
Enanalyse
factorielle descorrespondances,
leproblème
se résoud au moyen de laprojection
des variablessupplémentaires
ou des individus sur lesplans
factoriels des variablesprincipales.
Enanalyse hiérarchique
dessimilarités,
on calcule les contributions des individus ou descatégories
d’individus à unepartition
choisie[13].
Unquestionnement
du mêmetype "peut-
on évaluer la
part
des individus dans lesphénomènes implicatifs ?"
est apparu fin91,
début 92 simultanément chez deuxchercheurs,
H.Ratsimba-Rajohn
et M. Bailleul pour des variables binaires pour lepremier
et modales pour le second.3.1
L’approche
de H.Ratsimba-Rajohn
Cet auteur
présente
dans sa thèse[17],
la notion derespect
d’uneimplication
entre variablesbinaires de la
façon
suivante :- un individu x contredit
l’implication
entre deux variables oc etfi
s’il a attribué à oc la valeur 1 et àfi
la valeur0,
ou encore si la variablefi
n’est pas satisfaite par x alors que al’est,
- l’individu respecte
l’implication
a s’il a attribuéà P
la valeur1, quelle
que soit la valeur attribuée à a,- si x a attribué à a et
à P
la valeur0,
l’auteur "mesure" alors lerespect
del’implication (vraie
du strictpoint
de vue de lalogique binaire)
par un nombrecompris
entre0 et 1
qu’il
fixe arbitrairement à0,5, interprété
comme unsigne
de neutralité par rapport àl’implication.
Une
imprécision apparaît
en cequi
concerne le respect del’implication
où deuxcomportements différents
(attribution
aucouple
des valeurs(0,1)
ou(1,1))
serontappréciés
de la mêmefaçon.
3.2. Extension aux variables modales
Cette
proposition,
si on l’étend à des variablesmodales,
conduit à un manque definesse,
voire à des incohérences. Examinons
l’exemple
suivant où x, , x2 ,..., xs sont dessujets
eta,b,...,f
des variables.On voit ici que les individus xl , x2 et X3 ont
globalement
le mêmecomportement
parrapport
aux trois
implications (valeur
attribuée à lapremière
variable inférieure ouégale
à cellequi
est attribuée à la
deuxième)
et que les individus x4 et x5 ont l’attitude inverse. Cescomportements globalement identiques
traduisent-ils néanmoins desintérêts,
ou des désintérêts aussimarqués
pour les trois relationsimplicatives ?
Onpeut
en douter enregardant
lespoids
affectés par les individus aux différents items.Pour lever
l’ambiguïté, qui conduit,
si onapprécie
d’une seule et mêmefaçon
lerespect (ou
la
contradiction)
del’implication, lorsqu’on
calcule les distances des individus à la classe formée des troisimplications
ci-dessus(cf. paragraphes suivants),
à des valeurségales
pources distances relativement à xl , x2 et x3 d’une part, x4 et xs d’autre
part, malgré
desréponses
fortdifférentes,
M. Bailleul[4]
aprocédé
en deuxtemps :
- ordonner l’ensemble des
couples
deréponses possibles,
- lier la valeur
qui
mesure lerespect
ou la contradiction del’implication
à l’intensité de cetteimplication.
Cette
stratégie
a été fécondepuisqu’elle
apermis
de leverl’ambiguïté
relevée ci-dessus etd’intégrer
le cas des variables binaires.4. NOTION DE
DEGRÉ D’ADHÉSION
A UNE IMPLICATIONOn se
place
par la suite dans le cas de variables modalesoù,
si n est le nombre total de modalitésqu’il
estpossible
d’affecter àchaque variable,
chacune d’entre elles se verra.... 1
6 il
attribuer un
poids
variant de1,
laplus forte,
à 0 par fraction de(
n-1 On notera VAL l’ensemble des
poids
attribués ainsi aux variables.4.1 Ordonner l’ensemble des
couples
deréponses
ou decomportements
Nous
allons,
dans unpremier temps,
examiner unexemple,
n =4 ,
et proposer une méthodeintuitive pour ordonner l’ensemble des
couples
deréponses
ou attitudespossibles
auregard
d’une
implication.
L’intuition, qui
suit unelogique "naturelle",
décrite enlangage
naturel dans la colonne de droite de cetableau,
suit-elle aussi une certainelogique mathématique ?
En d’autres termes,peut-on algorithmiser
cette"logique
naturelle" ?Remarque
1Le nombre de cas de contradiction de
l’implication
a => best 1
le nombre de cas d’adhésion à
l’implication
a => b estOn retrouve bien le nombre total de
couples
de valeurspossibles nZ . Remarque
2Le cas des variables binaires n’est
qu’un
casparticulier
de ce casgénéral.
Vérifions-le. Pour les variables
binaires,
on a n = 2 .rang 1 contradiction de a => b rang 2
position
neutrerang 3 adhésion à a => b rang 4 adhésion maximale
Cet ordre sur l’ensemble des
couples
de valeursqu’il
estpossible
d’attribuer aux variablescorrespond
bien à l’ordre quesuggère
lalogique
naturelle et lève alors lesambiguïtés
rencontrées par H.
Ratsimba-Rajohn.
4-2 Le
degré
d’adhésion à uneimplication
On va chercher à
apprécier
l’adhésion d’un individu à uneimplication
entre variables par une formulequi prendra
encompte
la notion de rangproposée
ci-dessus et l’intensité elle-même del’implication
entre les deuxvariables,
c’est-à-dire la "crédibilité" de cette relation.On considère deux variables a et b de V.
Sur VxV est définie la relation
d’implication, appréciée
par uneapplication
de VxV dans[0,1] qui,
à toutcouple
d’éléments deV,
associe l’intensité del’implication
Appelons ’Pa l’application
suivante :l’individu x.
Ainsi,
ledegré
d’adhésion d’un individu à uneimplication
donnée entre deux variables estnul si le rang du
couple
de valeursqu’il
a affectées à ces deux variables est 1(le plus petit rang) ;
il est maximal etégal
àcp(a, b )
si le rang ducouple
de valeursqu’il
a affectées auxdeux variables est
n2 (le
rang leplus élevé).
Remarque :
La difficulté soulevéeplus
haut dansl’exemple disparaît.
Eneffet,
lespositionnements
différents de deux individusx 1
etx2
parrapport
aucouple
de variables(a,b)
seront"appréciés"
par deux nombres distinctspuisque,
dans ce cas : rg(’Pa (xl) , 1 ’Pb
5. DISTANCE D’UN INDIVIDU A UNE CLASSE OU A UN CHEMIN SIGNIFICATIF 5.1 Vecteur
puissance implicative
d’un individu parrapport
à une classe5.2 Distance d’un individu à une classe
Etant donnés une classe C =
{al ,...,
à s"étages , rl,r2,...,rs
les simplications génériques
de C et les s coefficients coefficientsd’implication qui
leur sontassociés,
on noteVc
le vecteurpuissance
de C etVc(x)
le vecteurpuissance
del’individu x par
rapport
à la classe C .On
appelle
distance de l’individu x à la classeC ,
notée d(x,C),
une distance dutype x2
entre
Vc
etVc(x).
Le choix de cette distance
permet
depondérer
les contributions euclidiennes avec lecomplément
à 1 descpl
afin de mettre en relief unphénomène qui
sera d’autantplus important
que le coefficient
(pi
sera voisin de1,
c’est-à-dire que la relationgénérique
de la sous-classe d’indice i sera intense.On pose donc la définition
qui précise
laprécédente
en se substituant à elle :d
apparaît
comme une distance dux2
entre les deux distributions(1 -
et(1 - degr. 1 (x) ).
Remarquons
que, si= 1,
alorsdegr 1 (x)
= 1 pour tout individu x deI,
sinon(pi
ne seraitpas
égal
à 1«pi
nepeut
être strictementégal
à 1 que si tous les individus adhèrent totalement à la relation définie sur l’ensemble desvariables).
On
peut
alors poser, parprolongement
parcontinuité,
d(x,C)
= 0 .5.3 Distance d’un individu à un chemin
significatif
Considérons un chemin Ch =
(v 1---~ v2
-~ ... -~vS).
Par
généralisation
de cequi précède,
onappellera
distance d’un individu x au cheminCh,
-
une distance du
type 12
entre le vecteurpuissance implicative
du chemin et levecteur
puissance implicative
de l’individu x par rapport à ce cheminVch ) .
Vch
a pourcomposantes 1es 2 coefficients , intensités des implications qui
composent le
chemin,
i variant de 1 às-1 , j
étantsupérieur
à i.Vch(x)
a pourcomposantes les 2 ~~ degrés
d’adhésion de l’individu x auximplications qui composent
lechemin,
i variant de 1 às-1 , j
étantsupérieur
à i.5.4 Retour sur
l’exemple
Nous allons illustrer les notions ci-dessus en
reprenant l’exemple
duparagraphe
3.2. Onpeut
supposer que lesimplications
a =>b ,
c => d et e => f sont lesimplications génériques
d’une classe C(avec
e = a et f = d parexemple).
Les
degrés
d’adhésion sont arrondis au centième.On aura alors :
et
Les
ambiguïtés
relevées au 3.2 sont maintenant levées et les distances calculéescorrespondent
bien à cequ’on
en attend intuitivement.6. CONTRIBUTION D’UN INDIVIDU A LA CONSTITUTION D’UNE CLASSE OU D’UN CHEMIN
6.1 Individu neutre
On dira que l’individu
xn
est neutre pour la classe C s’il a affecté la valeur 0 à toutes les variables en relation par lesimplications génériques ri .
On dira que l’individu
xn
est neutre pour le chemin Ch s’il a affecté la valeur 0 à toutes les variablesqui composent
ce chemin.6.2
Propriétés imposées
à la notion de contributionNous allons fixer à cette
contribution,
àdéfinir,
des contraintes "intuitives".(cl)
: elle devra être maximale etégale
à 1 pour un individu x dont la distance à la classe C estnulle,
(c2)
: elle devra être nulle pour un individu neutre,(c3)
: elle devra êtrenégative
pour tout individu"plus éloigné
de C" que ne l’est unindividu neutre.
6.3 Définition de la contribution d’un individu à la constitution d’une classe ou d’un chemin
-
(ci)
estrespectée :
y(x,C)
= 1 si d(x,C)
= 0-
(c2)
estrespectée :
y(x~ , C)
= 0- y
(x,C)
est une fonction décroissante de d(x,C).
- Vérifions la condition
(c3)
en recherchant la valeur minimale de y(x,C) .
y
(x,C)
est minimale => d(x,C)
est maximaled’où max i
individus
Calcul de d
(xn , C)
On a par définition de d :
et,
d’après
la définition dudegré
d’adhésion de x à uneimplication
on a donc :D’où:
et
Si l’on se
reporte
àl’algorithme
d’ordonnancement despaires
de valeursqu’il
estpossible
d’affecter aux items
(3.1 ),
onpeut
calculerrgn.
Le
couple (0,0)
s’obtient enprenant
la deuxièmepartie
del’algorithme
avec i = net j
= 0.Il
Le rang est alors déterminé par ~.
On trouve alors fmalement : min
y (x,C) = 20132013~ ,
relation danslaquelle
ndésigne
leindividus
~ q
nombre de valeurs
qu’on peut
attribuer aux items.On en conclut que la condition
(c3)
est bienrespectée.
6,4 Retour sur
l’exemple
On a ici n =
4 ,
doncrgn
= 7 .On obtient pour fmir :
y
(xl , C)
=0,5221 , y (x~ , C)
=0,8685 ,
y(x3 , C)
=0,1141,
les contributions dex2
etx3
sontpositives,
ils adhèrent à la classe C ., les contributions de
xd
etx5
sont. . -
négatives,
ils contredisent la classe C.’
7. UNE SITUATION
TRAITÉE
Dans une recherche récente
[4],
nous avons travaillé avec desquestionnaires
detype
choixordonné de mots dans un corpus donné pour tenter de saisir les
représentations
que lesenseignants
demathématiques
avaient del’enseignement
de leurdiscipline.
Nous leur avons,de
plus,
demandé de seplacer
dequatre points
de vue différents :- l’enseignement
desmathématiques
telqu’ils pensent
que l’Institutionl’attend, - l’enseignement
desmathématiques
telqu’ils
leperçoivent
autourd’eux,
- leur idéal de
l’enseignement
desmathématiques,
- leur propre
enseignement
desmathématiques.
Les
réponses
ordonnées desrépondants
ont été transformées enréponses
modales(cf.
plus haut)
surlesquelles
nous avons mené desanalyses implicatives
dont nous avons traduitgraphiquement
les résultats sous forme degraphes implicatifs.
Dans cesgraphes, apparaissent des "structures",
c’est-à-dire des ensemblesorganisés
de mots. Le travaild’interprétation
nous a amenés à caractériser chacune de ces structures.Pour ce
qui
concerne lelycée,
trois structuresapparaissent
dans chacun des quatrepoints
de vue. On en trouve unrécapitulatif
ci-dessous.Il a été
possible
de calculer les contributions dechaque répondant
à chacune desstructures. On
peut
ensuite mener sur ces contributions desinvestigations
relativement à des variablessupplémentaires indépendantes,
legrade
parexemple.
Ainsi ilapparaît qu’au lycée,
les
agrégés
contribuentsignificativement plus
que les certifiés aux structures despoints
devue INST et IDEAL dans
lesquelles l’enseignant ménage
uneplace plus importante
àl’élève :
IL
etHIID
Peut-on lire ici le faitqu’une plus grande
maîtrise(théoriquement
aumoins)
du savoir strictementdisciplinaire permet
auprofesseur
de proposer des situationsd’enseignement
danslequel
le"risque" qu’il prend,
en laissant une marge d’initiative àl’élève,
estplus grand
que dans des situationsd’enseignement plus guidées,
voirefermement balisées ?
Si cette constatation est relativement
abrupte,
il convientcependant
de lapondérer
enprécisant qu’elle
neporte
que sur ce que desenseignants
demathématiques
disent penser et nepréjuge
pas de cequi
se passe effectivement dans la classe avec les élèves. On en a une illustration dans le fait que, si la contributionglobale
des certifiés estsignificativement plus
forte que celle desagrégés
à la structureIIM ,
centrée sur le fonctionnement"quasi-
idéal" de
l’enseignement
desmathématiques,
on n’a pas de différencesignificative
inverse enfaveur des
agrégés
pour la structureL.
caractérisée commeenseignement qui
tend às’adapter
simultanément à la demande sociale et aux élèves.Les outils
mathématiques présentés
ci-dessus nous semblent ainsi être efficaces pourl’investigation
desreprésentations,
en ce sensqu’ils permettent :
- dans un
premier temps,
de mettre en évidence des réseauxorganisés
devariables,
- dans un deuxième
temps,
d’évaluer la"responsabilité"
desrépondants
ou de groupes derépondants
dansl’apparition
de ces réseauxorganisés.
8. CONCLUSION
La construction
théorique
que nous venonsd’exposer
doit son existence à desquestions posées
par desproblèmes
réels apparus endidactique
desmathématiques
chez les chercheurset les formateurs
d’enseignmts[ 1 1] .
Connaître les difficultésqu’on
y rencontre, lesanalyser, intégrer
leur connaissance dans unepratique,
nécessitent dedisposer
d’indicespermettant
de les identifier et de formuler desdiagnostics.
Desquestionnaires,
desenquêtes,
desobservations nous y aident à condition de
disposer
d’outilsd’analyse
assezsouples
pour que différentstypes
d’indices restituent des nuancescomportementales.
C’est le cas desréponses
modales.
L’approche théorique précédente
lepermet
en les structurant defaçon dynamique
en raison de la
dissymétrie
de leur considération. En outre, reconnaîtrequels descripteurs
sont
plus particulièrement
associés aux éléments de structure ou en sontresponsables,
c’est-à-dire reconnaître
quels
individus y contribuentpermet
de fournir des informations sur la stratification de lapopulation
étudiée : la théorie de la contribution des individus satisfait cette attente. Il est bien évident que lechamp
desapplications peut s’élargir
à d’autresdisciplines
que la
didactique : citons,
enparticulier,
lamédecine,
lapsychologie
et lasociologie.
ANNEXE
Variables binaires comme cas
particulier
de variables modalesSupposons
que nous travaillions avec des variables binaires.Reprenons,
dans ce cas,l’exemple présenté.
Le tableau du 5-4 devient alors le tableau ci-dessous :BIBLIOGRAPHIE
[1]
ACIDS.,
de CAMPOSL.M.,
GONZALEZA.,
MOLINAR.,
PEREZ de la BLANCAN., Learning
with Castle inSymbolic
andquantitative approaches
touncertainty, Springer- Verlag,1991,
99-106.[2]
AG ALMOULOUDS., L’ordinateur,
outil d’aide àl’apprentissage
de la démonstrationet de traitement de données
didactiques,
Thèse de l’Université de Rennes1, Mathématiques
et
applications,1992.
[3]
AMARGERS.,
DUBOISD.,
PRADEH., Imprecise quantifiers
and conditionalprobabilities -
inSymbolic
andquantitative approaches
touncertainty (R. KRUSE,
P.SIEGEL), Springer-Verlag,1991, 33-37.
[4]
BAILLEULM., Analyse statistique implicative :
variables modales et contribution dessujets. Application
à la modélisation del’enseignant
dans lesystème didactique.
Thèse del’Université de Rennes
1, Mathématiques
etapplications,1994.
[5]
C.H.I.C. ouClassification Hiérarchique Implicative
et Cohésitive :logiciel d’analyse
dedonnées, IRMAR,
Université de Rennes 1.[6]
DIDAYE.,
Towards a statisticaltheory of
intentionsfor knowledge analysis, Rapport
de recherche
1494, I.N.R.I.A.., Rocquencourt,
1991.[7]
GAMMERMANA.,
LUOZ., Constructing
Causal Treesfrom
a medicaldatabase,
Technical
Report
TR91002, Department
ofComputer Sci.,
Heriot-WattUniv., Edimburgh.
[8]
GANASCIAJ.G.,
Charade :Apprentissage
de bases deconnaissances,
Inductionsymbolique -numérique
àpartir
dedonnées, CEPADUES,
1991.[9]
GRASR.,
Contribution à l’étudeexpérimentale
et àl’analyse
de certainesacquisitions cognitives
et de certainsobjectifs didactiques
enmathématiques,
Thèse d’EtatMathématiques
etApplications,
Université de Rennes1,1979.
[10]
GRAS R. et LARHERA., "L’implication statistique,
une nouvelle méthoded’analyse
de
données", Mathématiques, Informatique
et SciencesHumaines, 120,1992,
5-31.[11]
GRASR.,
TOTOHASINAA.,
AG ALMOULOUDS.,
RATSIMBA-RAJOHNH.,
BAILLEUL
M.,
La méthodeimplicative
endidactique. Applications.
Actes duColloque
"20ans de la
Didactique
desMathématiques
enFrance ",
La PenséeSauvage, Grenoble,1994,
349-363.
[12]
LARHERA., Implication statistique
etapplications
àl’analyse
de démarches de preuvemathématique,
Thèse de l’Université de Rennes1, Mathématiques
etApplications,1991.
[13]
LERMANI-C., Classification
etanalyse
ordinale desdonnées, Dunod, Paris,1981.
[14]
LERMANI-C.,
GRASR.,
ROSTAMH.,
"Elaboration et évaluation d’un indiced’implication
pour des donnéesbinaires", Mathématiques
et SciencesHumaines, 74, 1981,
5-35 et
75,1981,
5-47.[15]
LOEVINGERJ.,
Asystematic approach
to the construction and evaluation of tests ofability, Psychological Monographs, 61, n°4,1947.
[16]
PEARLJ.,
ProbabilisticReasoning
inintelligent
systems,Morgan Kaufmann,
SanMateo,1988.
[17]
RATSIMBA-RAJOHNH.,
Contribution à l’étude de la hiérarchieimplicative, application
àl’analyse
de lagestion didactique
desphénomènes
d’ostension et decontradiction,
Thèse de l’Université de Rennes1, Mathématiques
etApplications,1992.
[18]
TOTOHASINAA.,
Méthodeimplicative
enanalyse
de données etapplication
àl’analyse
deconceptions
d’étudiants sur la notion deprobabilité conditionnelle,
Thèse del’Université de Rennes