R EVUE DE STATISTIQUE APPLIQUÉE
J.-B. L AGRANGE
Analyse implicative d’un ensemble de variables
numériques; application au traitement d’un questionnaire à réponses modales ordonnées
Revue de statistique appliquée, tome 46, n
o1 (1998), p. 71-93
<http://www.numdam.org/item?id=RSA_1998__46_1_71_0>
© Société française de statistique, 1998, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ANALYSE IMPLICATIVE D’UN ENSEMBLE
DE VARIABLES NUMÉRIQUES;
APPLICATION AU TRAITEMENT D’UN QUESTIONNAIRE
À RÉPONSES MODALES ORDONNÉES
J.-B.
Lagrange
Laboratoire de
Didactique -
Institut de RechercheMathématique
de Rennes (France)RÉSUMÉ
Cet article
présente
une extension del’analyse implicative.
La«propension»
est définiecomme association
non-symétrique
de deux variables à valeurs dans [0; 1]. L’«intensité depropension»
est introduite afin de décider si une association observée est ou nonsignificative.
Dans le cas de variables binaires, l’intensité de
propension
estégale
à l’intensitéd’implication.
Dans les autres cas, l’intensité de
propension
estplus
fiable que l’intensitéd’implication.
Les «filiations» sont introduites comme
organisations
despropensions
dans un ensemble devariables.
Une
application
de l’extensionproposée
au traitement desréponses
modales ordonnées à unquestionnaire d’opinion
estprésentée
et discutée. Certains résultats du traitement desréponses
à unquestionnaire passé
dans le cadre d’une recherche endidactique
sontprésentés
en conclusion.
Mots-clés :
Analyse implicative,
variablesnumériques,
questionnairesd’opinion, propension, filiations.
ABSTRACT
This paper introduces an extension of
implicative analysis.
We define"propensity"
asa
non-symmetric
association of two variables whose valuesbelong
to [0; 1]. We introduce"intensity
ofpropensity"
to decide whether an observed association isstatistically significant.
If the variables are
binary,
theintensity
ofpropensity equals
theintensity
ofimplication.
Otherwise, the
intensity
ofpropensity
is more reliable than theintensity
ofimplication.
"Families" of variables are introduced to
organize
thepropensities
in a set of variables.We then consider
questionnaires
with afour-way
Likert scale answergrid
and discuss the use ofpropensity theory
toanalyze
the answers. Weapply
this method to aquestionnaire,
part of
ongoing
didactic research.Typical
didactic and statisticalfindings
of this research arediscussed in the conclusion.
Keywords : Implicative analysis,
numerical variables,questionnaires,
propensity.1. Introduction :
propension
etimplication
Nous nous proposons de
dégager
des associations orientéessignificatives
dansun ensemble de variables
numériques.
Ces associations doivent rendrecompte
dela notion intuitive de
«propension»,
au sensoù,
parexemple, l’âge
d’un individupeut
avoir une influencesignificative
sur sapropension
à l’achat de tel bien de consommation. Nous cherchons deplus
uneorganisation
des associationssusceptible
de
dégager
dessystèmes d’explications.
L’analyse implicative (Gras, 1979; Lerman, Gras, Rostram, 1981)
constitue lepoint
dedépart
de cette étude. Dans cetraitement,
l’intensitéd’implication quantifie
une tendance à l’inclusion d’une
partie
A dans unepartie
B. Si l’on considère des variables binaires a etb,
l’intensitéd’implication
de lapartie
A dont a est la fonction indicatrice vers lapartie B
dont b est la fonction indicatrice rendcompte
de la«propension»
de a vers b. La modélisationprobabiliste qui
conduit à l’intensitéd’implication
est donc valable pour déterminer des associations entre variables binaires.Gras, Lahrer, (1993)
ontconjecturé
que l’intensitéd’implication pouvait
rendre
compte plus généralement
de l’association de variables non binaires. Pouréprouver
cetteconjecture,
nous nous proposons de construire une modélisation valable pour des variables à valeur dans[0; 1], puis
de comparer les associations issues de cettemodélisation,
à cellesqui
résulteraient de l’intensitéd’ implicationl .
En
analyse implicative
onreprésente
l’ensemble desimplications significatives
dans un ensemble de variables sous forme d’un
graphe.
Bailleul(1994)
a montré parexemple
comment un telgraphe pouvait
aider àinterpréter
les relationsstatistiques
entre
opinions d’enseignants
deMathématiques
surl’enseignement
de cette disci-pline. Néanmoins, l’interprétation
d’ungraphe implicatif pose problème
à cause dela non-transitivité de la relation : des variables sans liaison
significative
se trouventainsi reliées dans un même chemin
implicatif.
Nous cherchons donc à isoler des«filiations»
partielles
neprésentant
pas ce défaut.Nous examinons ensuite comment les éléments
théoriques
ainsidégagés peuvent
êtreappliqués
au traitement desréponses
à modalités ordonnées dans unquestionnaire d’opinion.
Nous comparons à d’autres choix de traitement et nousprésentons
les résultatsdidactiques
issus dudépouillement
d’unquestionnaire passé
par 460 élèves dans le cadre d’une recherche en
didactique
sur l’utilisation d’unlogiciel
de calcul formel pourl’apprentissage
desmathématiques.
2. La
quantification
de la«propension»
Dans cette
partie,
nous exposons une modélisation de la relation depropension
entre deux variables à valeurs dans l’intervalle
[0; 1 ].
Cette modélisation est conformeaux
principes
del’analyse
des données tellequ’exposée
dans(Lerman, 1986).
Ondétermine un indice de
non-propension
d’une variable vers l’autre. Si la valeur observée de cet indice esttrop
faible pour êtrestatistiquement compatible
avec unehypothèse
d’absence de lien apriori
entre lesvariables,
on conclut que la relation depropension
est établie.Concrètement,
la modélisation conduit à définir une intensitél Dans la suite, le terme « propension » sera employé quand il s’agira de la relation entre variables à valeur dans [0; 1]. Le terme «implication» sera employé pour qualifier la relation entre variables binaires.
L’intensité de propension désignera la mesure de la propension, telle que nous la définissons dans ce texte. L’intensité d’implication désignera la mesure de l’implication, telle qu’introduite par (Lerman, Gras, Rostram, 1981) pour les variables binaires, et utilisée par (Gras, Lahrer, 1993) pour d’autres types de variables.
de
propension
entre deux variabless’exprimant
comme une valeur de la fonction derépartition
de la loi normale centrée réduite. Choisissant un seuil derisque
E,l’analyste
conclura à une relation de
propension,
si cette intensité estsupérieure
à 1-E.2.1. Un indice de
non-propension
Considérons deux variables a et
b,
et les vecteurs de réels de l’intervalle[0; 1] (ai)
et(bi) représentant
les valeurs de ces variables observées chez les individus i d’unepopulation
P de taille n.Il y a
propension
de a vers b si on rencontre en moyenne peu d’individus pourlesquels (ai)
est fort et(bi)
faible. Nous considérerons donc la moyenne sur P desai(1 - bi)
comme un indice de« non-propension »
de a vers b. Dans cetindice,
pourun individu
donné,
une valeur faible de b est d’autantplus prise
encompte
que la valeur de a pour le même individu est forte.On conclut à la
propension
de a vers b dans P si cette moyenne estsignificati-
vement faible. La moyenne observée est donc
comparée
à cellequi
résulterait d’unehypothèse
d’absence de lien. Cettecomparaison
nécessite une modélisation afin de déterminer la loi deprobabilité
d’un indice aléatoire dont lamoyenne ai(1-bi) n
serait une valeur observée.
2.2. Détermination de l’indice aléatoire
Considérons un ensemble E
«grand»
de taillek,
et un ensemble de variables aléatoires(Ai)i~E (resp. (Bi)i~E), de
mêmeloi, représentative
de la variable a(resp. b).
Iln’y
a pas de lien apriori
entre a et b surE,
et donc nous supposons les 2 x k variablesAi, Bi indépendantes.
Considérons aussi unepartie
aléatoire P deE, représentative
de lapopulation
observée P.Soit n la taille de l’ensemble P. Nous supposons les k événements
fi
EP}
indépendants
et deprobabilité n
Ainsi,
est un indice aléatoire dont l’indice moyen de nonpropension
est la valeur observée.Nous testons
l’indépendance
entre les événementsfi
~P}
et les variablesAi(1 - Bi),
auregard
de la valeur observée de l’indice aléatoire. Un seuil derisque 03B5
étantfixé,
supposonsqu’il
existe un réel a tel que, avec cettehypothèse d’indépendance, P(Z 03B1) =
E. Si la valeur observée icpai(1-bi) n
est inférieure à a, elle est
significativement faible, comparée
à la distribution de Z avecl’ hypothèse
d’indépendance.
Il y a donc dans ce caspropension
de a vers b dans l’ensemble P.Note 1 :
L’indépendance
entre lesévénements {i
~P}
et les variablesAi (1 - Bi)
n’est paséquivalente
àl’indépendance
entre lesévénements {i
EP}
etles variables
Bi(1 - 4i).
Ainsi la définition de lapropension
n’est passymétrique
ena et b.
Note 2 : Posons
Ti
=1i~PAi(1 - Bi).
On a alors Z =Ti n.
Les variablesAi (1 - Bi)
sontindépendantes
par suite del’indépendance
desAi, Bi. Les fi
EPl
sont
indépendants
entre eux etindépendants
desAi(l - Bi).
Donc lesTi
sontindépendantes.
Dans le
paragraphe suivant,
nous déterminons la loi commune desTi, puis
laloi
asymptotique
de Z.2.3. La loi
asymptotique
de l’indice aléatoireProposition
1Si les variables
Ai(1 - Bi)
ont une fonctioncaractéristique cp (t)
alors l’indice aléatoire Z suitasymptotiquement
la loi normaled’espérance E[Ai(1 - Bi)]
et deE[(Ai(1 - Bi))2]
vanance .
n
Lemme : Les variables
Ti - 1i~PAi(1 - Bi)
ont pourfonction caractéristique
1
+ n k(~(t) - 1).
Preuve du lemme :
Par suite de
l’hypothèse d’indépendance,
pourchaque i,
entre l’événement{i
eP}
et la variableAi(1 - Bi), E[eitAi(1-Bi)/i
EP]
=E[eitAi(1-Bi)]
=cp(t)
et donc
Preuve de la
proposition :
Le nombre d’éléments de E étant
k,
et lesTi
étantindépendants,
la fonction ca-ractéristique
de l’indice aléatoire Z= E Ti est 03A8(t)
= 1+ n cp - -
1k.
Posons
03BB1
=E[Ai(1 - Bi)], 1B2
=E[(Ai(1 - Bi))2].
On ale développement
limité
~(t)
= 1 +i03BB1t - 03BB2 2t2
+t203B5(t)
et donc :Utilisons le
développement
limitéLn(l
+u)
=u -1U2
+u203B51(u).
En
posant
, etaprès
simplification :
Nousconsidérons
que k
étantgrand devant n, n
= 03B55(1 n),
et donc2.4. L’intensité de
propension
Il résulte de ce
qui précède,
que, pour n assezgrand,
la loi deest
approchée
par la loi normaleN(0, 1).
Par suite de
l’indépendance
deAi
etBi
on aE[Ai(1 - Bi)] = E(Ai)(1 - E(Bi))
et03A6
désignant
la fonction derépartition
de la loi normale centréeréduite,
et sE ai (1 - bi)
l’indice observé
i~P n,
l’hypothèse
d’absence de lien serarejetée
siP[Z s]
03B5, c’est-à-dire si03A6(-q) 1 - 03B5.
Soit ma
(resp. mb)
la moyenneempirique
de a(resp. b),
et soit va(resp. vb)
leur varianceempirique.
n étantgrand,
ma(resp. mb)
est peu différent deE(Ai) (resp. E(Bi)),
et va(resp. vb)
est peu différent deVar(Ai) (resp. Var(Bi))
et doncDéfinitions :
Soit a
(resp. b)
une variable de moyenneempirique
ma(resp. mb)
et de varianceempirique
va(resp. vb).
est le coefficient de
propension
dea vers b.
2022 03A6 (-(a, b))
est l’intensité depropension
de a vers b.Remarque :
Le numérateur de
(a, b) s’exprime
aussiIl est donc
égal
àl’opposé
de la covarianceempirique
de a et b. Parconséquent
l’intensité de
propension
de a vers b estsupérieure
à0,5
si et seulement si leur covariance estpositive.
3.
Comparaison propension
/implication
Dans ce
paragraphe,
nous montrons que lapropension généralise
aux variablesà valeurs dans
[0; 1] l’implication
entre variables binaires. Pour différencier les variables à valeurs dans l’intervalle[0; 1] des
variablesbinaires,
nous introduisons le«rapport
de variance». Cerapport
traduit lafaçon dont, statistiquement,
la variableprend
les valeurs intérieures de l’intervalle. En fonction de cerapport,
nous examinons dansquelle
mesure lapropriété
decompatibilité
avec l’ordre des moyennes, résultatremarquable
de la relationimplicative,
reste vraie pour la relation depropension.
Nous comparons de même les valeurs de l’intensité
d’implication
et de l’intensité depropension,
defaçon
à savoir si l’intensitéd’implication
constitue ou non uneapproximation
fiable de l’intensité depropension.
3.1. Les variables binaires
Une variable binaire est
égale
à soncarré,
et donc si a et b sontbinaires,
avec les notations ci-dessus : va +
m2a =
ma et vb +(1 - mb ) 2
= mb d’où(a, b) = s - ma(1 - mb) ma(1 - mb) n. Dans
ce cas,q(a, b)
coïncide avec le coefficientq(a, b)
utilisé en
analyse implicative.
Dans le casbinaire,
l’intensité depropension
est doncégale
à l’intensitéd’implication 03A6(-q(a,b))
introduite par Gras(1979)
etLerman, Gras, Rostram, (1981).
3.2. La
compatibilité
de la relation avec l’ordre des moyennesGras,
Lahrer(1993)
observent que dans le cas de variables binaires a(resp. b)
de moyenne ma
(resp. mb)
si ma mb alors03A6(-q(a, b)) 03A6(-q(b, a)). Donc,
si ma mb et si
l’implication
de b vers a estsignificative,
alorsl’implication
de avers b l’est
aussi,
avec une intensitésupérieure.
Dans ce cas, on considère seulementl’implication
de a versb, qui
est laplus significative.
Ce résultat conduit à considérer la relationimplicative
comme nécessairement orientée de la variable dont la moyenne est la moins forte vers celle dont la moyenne est laplus
forte : nous disons que la relationimplicative
estcompatible
avec l’ordre des moyennes.Nous examinons cette
question
dans le cas de variables à valeurs dans[0; 1],
car elle conditionne la définition de la
propension.
Proposition
2 :Soient a et b deux variables à valeur dans
[0; 1],
de moyenne ma(resp. mb),
de variance va(resp. Vb)
et de covariancepositive,
03A6(-(a, b)) 03A6(-(b, a))
si et seulement si1 - 2mb 03BDb +m2b 1 - 2ma 03BDa + m2a.
Preuve :
03A6(-(a, b)) 03A6(-(b, a))
estéquivalent
à(a, b) (b, a).
Lesnumérateurs de ces deux coefficients de
propension
sont tous les deuxégaux
àl’opposé
de la covariance
(supposée positive)
de a et b. Les coefficients sont donc dans l’ordre desdénominateurs,
et doncConséquence :
La
compatibilité
de la relation depropension
avec l’ordre des moyennes n’est passystématiquement
vérifiée.Preuve : considérons par
exemple
une variable a binaire de moyenne Ma et une variable b de moyenne mb et de variancemb(1 - mb) 2.
On
peut cependant
énoncer une condition suffisante pour que la relation depropension
soitcompatible
avec l’ordre des moyennes. Pour cela posons la définition suivante :Définition
Soit x une variable à valeur dans
[0; 1],
de moyenne mx et de variance vx nonnulle. On
appelle «facteur
de variance» le réelmx(1 - mx)
.
l/x
Propriété
Pour toute variable x à valeur dans
[0; 1],
de variance nonnulle,
le facteur de variance estsupérieur
ouégal
à 1.Preuve : on a
x2 x
et donc mx2 mxd’où 03BDx
mx -m2x.
On a alors la
proposition suivante, qui généralise
le cas binaire :Proposition
3Soient a et b deux variables à valeur dans
[0; 1],
de moyenne ma(resp. mb),
de covariance
positive
et de même facteur de variance.Preuve : Soit k le facteur de variance commun à a et b.
D’après
laproposition
2Il suffit ensuite de remarquer que la fonction x ~
1 - 2x x(1 + (k - 1)x)
estdécroissante pour
k 1 et 0 x 1.
Remarques
etconséquences
e Si x est une variable à valeur dans
[0; 1],
de facteur de variance k et y une variable binaire de même moyenne que x. On a 03BDx =03BDy k.
Le facteur de variance est doncreprésentatif
du resserrement des valeurs de lavariable, comparé
à celui d’une variable binaire.. Si pour un ensemble de
variables,
le resserrement estcomparable,
on observerala même
compatibilité
de la relation depropension
avec l’ordre des moyennes que dans le cas binaire. Ce sera parexemple
le cas si les variables mesurent descomportements comparables
dans unepopulation.
3.3. L’intensité
d’implication
est-elle uneapproximation fiable
de l’intensité de
propension ?
Gras,
Larher(1993)
ontconjecturé
que l’intensitéd’implication 03A6(-q(a, b))
pouvait
rendrecompte
de l’association de variables binaires ou non. Nous avons vuci-dessus
qu’une
modélisation de la relation depropension
conduit à l’intensité depropension 03A6(-(a, b)).
Comparons
ces deuxintensités,
enreprenant
les notations duparagraphe
2.Les numérateurs des coefficients
d’implication
et depropension
étant lesmêmes,
comparons les dénominateurs. Les variables a et 1- b sont à valeurs dans
[0; 1],
doncon a
Si l’on considère des relations
significatives,
les numérateurs sontnégatifs
etdonc (a, b) q(a, b) 0. donc 03A6(-(a, b)) 03A6(-q(a, b)), l’égalité
étant obtenueseulement dans le cas binaire. L’intensité
d’implication
est donc inférieure à l’intensité depropension.
Nous nous proposons d’étudier leurs valeurs dans des castypiques.
Sielles différent peu, on pourra
accepter
laconjecture
deGras,
Larher(1993).
Dans lecas
contraire,
il faudrapréférer
l’intensité depropension
pour une meilleure fiabilité.Pour
simplifier,
nous nousplaçons
dans le cas de variablesayant
le même facteur de variance k. Selon la remarqueci-dessus,
nous pouvons supposer que cecas est le
plus fréquent.
Ceci nouspermet
deplus
de poserl’hypothèse
ma mb,puisque
nous nous intéressons à lapropension
laplus significative.
Proposition :
Soient a
(resp. b)
à valeur dans[0; 1],
de moyenne ma(resp. mb),
tels que ma mb, et de même facteur de variance k. On a l’encadrementPreuve : En
posant
03B1 = ma et03B2
= mbÉtudions
les variationsde A (a, /3)
=q(a, b) (a, b).
On aPosons P(03B1, 03B2) = (1-03B1+03B1k)(03B2+k-03B2k) de façon que 03BB(03B1,03B2) = P(03B1, 03B2) k
P étant croissant en ma et décroissant en mb, la valeur minimum de À est :
03BB(0, 1) = 1 k
On a
P(o, 03B2) - P(03B1, 03B1)
=(a - 03B2)(1 -
03B1 +03B1k)(k - 1)
Comme 03B1 03B2,
on aP(03B1, 03B2) P(03B1, a)
=-03B12(k - 1)2
+03B1(k - 1)2
+ k.La valeur maximum du dernier membre est atteinte en a
= 1 2.
La valeur maximum de A est
donc : 03BB (1 2, 1 2) = k + 1 2k.
Conséquence :
le Tableau 1 donne l’encadrement de À pour les valeurs de k de 2 à4, puis
des encadrements de l’intensitéd’implication
pour une intensité depropension
valant0,9 puis 0,95.
On constate que pour ces valeurstypiques
d’intensitéssignificatives,
des valeurs du facteur de variancesupérieures
ouégales
à 2 donnent uneintensité
d’implication
notablement inférieure à l’intensité depropension.
Il faudradonc,
pourplus
defiabilité,
considérer dans ce cas l’intensité depropension plutôt
que l’intensité
d’implication.
TABLEAU 1
4. Les filiations 4.1. Les
graphes implicatifs
Considérons non
plus
deux variablesisolées,
mais un ensemble de variablesreprésentant
certainscomportements
d’unepopulation
donnée. Gras(1979)
aproposé
de
représenter
lesimplications
dans un ensemble de variables sous forme d’ungraphe
orienté où les variables sont reliées entre elles selon la relation
implicative;
on nefait pas
apparaître
les transitivités et si pour deux variables a etb,
les intensités03A6(-q(a, b)) et 03A6(-q(b, a))
sont toutes les deuxsignificatives,
on considère seulementl’implication
dont l’intensité est laplus
forte. Du fait de lacompatibilité
de la relationavec l’ordre des moyennes, on ne
peut
pas avoir decycles,
en dehors de ceuxqui joignent
des variables«jumelles».
Deux variables a et bsont jumelles
si les intensitésd’implication 03A6(-q(a, b)) et 03A6(-q(b, a))
sontégales
etsignificatives.
Dans ce cas,leurs moyennes sont
égales.
Les
«graphes implicatifs»
ontpermis
desinterprétations intéressantes,
notam-ment par Bailleul
(1994). Néanmoins,
la non-transitivité de la relationimplicative (Larher, 1991) complique l’interprétation
de cesgraphes,
car, lelong
d’un mêmechemin
peuvent
se trouver des variables non consécutivesqui
ne sont pas en relationimplicative.
Onpeut
même trouver sur ces chemins des variables dont l’intensitéd’implication
est inférieure à0,5,
et donc dont la covariance estnégative.
Dans le cas de la relation de
propension,
une difficultésupplémentaire
seprésente,
car, comme nous l’avons vu, lacompatibilité
de la relation avec l’ordre des moyennes(au
sens de3.2)
n’est pas vérifiée.4.2. Les chemins de
propension
Comme en
analyse implicative,
nouschoisissons, lorsque
deuxpropensions réciproques
sontsignificatives,
de conserver cellequi
a l’intensité laplus
forte.Comme nous l’avons vu au
paragraphe 3.2,
ce choixpeut
conduire à retenir unepropension
noncompatible
avec l’ordre des moyennes. Onpeut cependant
penserque dans de nombreux
exemples,
les facteurs de variance des variables étantproches,
ce cas ne se
présentera
pas.D’autre
part,
nousimposons
aux chemins depropension
de relier seulement des variablesayant
une covariancepositive,
et d’être maximaux.Enfin,
nous considérons ensemble les cheminsayant
la mêmeextrémité,
et nousappelons
filiations lesgraphes
ainsi formés.
L’existence de
cycles
serait contraire à la notion intuitive depropension,
saufdans le cas où le
cycle
est constitué de relationssymétriques,
c’est-à-dire que pour tous lescouples
de variables a et b consécutives de cecycle,
l’intensité depropension
de avers b est
égale
à l’intensité depropension
de b vers a. Nous avons vu que, enanalyse implicative,
tous lescycles
sont constitués de telles variables dites«jumelles».
Nousmontrons ci-dessous que cette
propriété
reste vraie pour les chemins depropension.
Définitions
On choisit un seuil de confiance c inférieur à
0,5.
1)
Relation depropension :
aRb si et seulementsi 03A6(-(a, b)) 1 - 03B5 03A6(-(a, b)) 03A6(-(b, a))
2)
Chemins depropension :
ce sont lesn-uplets (ao an)
de variables distinctes tels que :3)
Filiations : une filiation est constituée des chemins depropension ayant
une extrémité commune.4)
Variablesjumelles :
deux variablesa, b
sontjumelles
si et seulement siPropriétés
Nous formalisons et démontrons les
propriétés
avancées ci-dessus.1)
Si aRb alorscov(a, b)
> 02)
Si aRb et si a et b ont le même facteur devariance,
alors ma mb3)
Les chemins sont sanscycles,
sauf entre variablesjumelles.
Preuves :
1)
Résulte de la remarque duparagraphe
2.4.2)
Résulte de laproposition
3 duparagraphe
3.2.3)
Considérons uncycle,
c’est-à-dire une suite(ao... an)
où ViaiR
ai+l et ao = an.Il résulte de la définition de
R,
que,alors, ~i03A6(-(ai, ai+1)) 03A6(-(ai+1, ai)).
D’après
laproposition
2 duparagraphe
3.2. Vi1 - 2mai+1 03BDai+1 + m2ai+1 1 - 2mai 03BDai + m2ai
et donctous ces
quotients
sontégaux.
Enappliquant
laproposition 2, partie réciproque,
Vi
03A6(-(ai, ai+1)) = 03A6(-(ai+1, ai))
et donc ai et ai+1 sontjumelles.
5. Le traitement d’un
questionnaire
àréponses
modales5.1. Choix de la
définition
des variables et du traitement associéNous considérons ici un
questionnaire
constitué d’un ensemble 0d’opinions,
pour chacune
desquelles
les individus ont à choisir une modalité deréponse parmi
les 4 suivantes : «Pas du tout
d’accord»,
«Plutôt endésaccord»,
«Plutôtd’accord»,
« Tout
à fait
d’accord». Parmi les définitionspossibles
desvariables,
et les traitements associés voici deuxoptions principales.
1)
Considérer le choix d’un individu pour uneopinion
comme une variablequalitative
àquatre
modalités. Sur les variables ainsidéfinies,
rechercher etanalyser
des associations
dissymétriques (Abdesselam
etSchektman, 1996).
2) Quantifier
les différentes modalités deréponse
defaçon
à obtenir une variableà valeur dans
[0; 1].
Traiter les variables ainsi définies selon lesprincipes
définis dans cet article.La
quantification
a nécessairement un côté arbitraire. A des fins decomparaison,
nous nous proposons d’étudier deux
options :
2.a)
Unequantification
binaire. On affecte 0 aux deux modalités dedésaccord,
et 1 aux deux modalités d’accord. On traite alors avec l’intensité
d’implication.
2.b)
Unequantification
«nuancée». On affecterespectivement 0, 1/3, 2/3, 1
aux différentes modalités dans l’ordre croissant desdegrés
d’accord. On traite alors avecl’intensité de
propension.
5.2.
Comparaison
Considérons trois
jeux
de données simulées. Le Tableau 2 donne les effectifs croisés deréponses
à deuxquestions x
et y suivant les 4 modalitésindiquées
ci-dessus(xl
ety1
pour «Pas du toutd’accord»,
..., x4 ety4
pour «Tout àfait d’accord»).
Le
premier jeu
de données Jl estsymétrique
en x et y. Nous l’avons construit pour avoir une valeursignificative
de l’intensité depropension.
Lejeu
de données J2 est obtenu en«nuançant»
lesréponses
de 60 personnes à laquestion x :
elles passent de x4 àx3,
sanschanger
leurréponse
à y. Lejeu
de données J3 est obtenu ennuançant
à nouveau lesréponses
de ces 60 personnes, mais cette fois à laquestion
y.TABLEAU 2
Pour
chaque jeu
dedonnées,
le Tableau 3présente
1)
Le tau deGoodman-Kruskal,
obtenu en considérant x et y comme deux variables à modalitésqualitatives.
Eneffet,
Abdesselam et Schektman(1996) présen-
tent ce tau comme une mesure
possible
de l’associationdissymétrique
entre deuxvariables de ce
type.
2)
L’intensitéd’implication
entre deux variables binaires obtenues en affectant zéro aux deux modalités dedésaccord,
et un aux deux modalités d’accord.3)
L’intensité depropension
entre deux variables à valeurs dans[0 ; 1 ],
obtenuesen affectant
respectivement 0; 1/3, 2/3,
1 à xl etyl,
x2 ety2,
x3 ety3,
x4 ety4.
Le tau de Goodman est
identique
dans les troisjeux :
eneffet,
on passed’un jeu
à l’autre par unepermutation
de modalitésqui
n’affecte pas l’associationdissymétrique.
Comme toutes les mesures de l’associationdissymétrique
de deuxvariables,
le tau est une sommation sur lescouples (i, j)
de modalités en x et en y.Il est
possible
derepérer
dans chacun desjeux
dedonnées,
un termeprépondérant
dans cette sommation et de
l’interpréter
comme « xiexplique yj».
On constateainsi,
que le même tau d’associationdissymétrique
dans les troisjeux s’interprète
par desassociations différentes de modalités.
L’intensité
d’implication
entre variables binaires est aussi la même dans les troisjeux.
Eneffet,
on nuance lesréponses
à l’intérieur de modalitésd’accord,
etdonc,
les variables binaires nechangent
pas d’unjeu
à l’autre.L’intensité de
propension
entre variablesquantifiées
sur l’échelle0, 1/3, 2/3,
1 varie fortement d’un
jeu
de données à l’autre. Lapropension
est trèssignificative
pour le
jeu Jl,
nonsignificative
pour lejeu J2,
etquasi
inexistante pour lejeu
J3.TAB LEAU 3
On constate donc que, avec la
quantification choisie,
l’intensité depropension
est très sensible au
déplacement
d’individus dans les nuances deréponses,
à ladifférence des tau et intensité dans les autres choix. Si l’on fait le choix d’une
optique qualitative,
ondevra,
pour deuxvariables,
étudier des associationsparmi
16couples
de modalités telles que «Plutôt en désaccord avec x
explique
Tout àfait
d’accordavec y», ce
qui dépasse
en finessed’analyse
ce que nousenvisagions.
Si l’on seplace
dans une
optique quantitative,
il estjustifié d’employer
une échelle dutype 0, 1/3, 2/3, 1, plutôt
quebinaire2 , qui
nerespecte
pas les nuancesexprimées
par lessujets.
6.
Application
à une recherche endidactique
Nous avons eu à traiter les
réponses
à unquestionnaire passé
par 460 élèves del’enseignement
secondaire. Ces élèvesparticipaient
à uneexpérience
d’introduction dulogiciel
de calcul formel DERIVE dansl’enseignement
desmathématiques (Lagrange, Drouhard, 1995) (Lagrange, 1996).
Lesprofesseurs,
membres d’un groupepiloté
par le ministère del’Education,
avaient établi une liste de 17opinions
sur lapertinence
dulogiciel
pourl’apprentissage
desmathématiques (Annexe 1,
Tableau7).
Il
s’agit
dans ceparagraphe
de montrerquels
résultatsstatistiques
etdidactiques
ilest
possible
d’obtenir àpartir
du traitement décrit dans l’article.6.1.
Problématique
Voici un
exemple
de relation entreopinions
que nous cherchions à tester.Le
questionnaire proposait l’opinion
numérotée3, significative
d’une résistance à l’utilisation dulogiciel : « Ça ne
sert à rien de travailler avecDERIVE, puisque,
auxcontrôles et aux examens,
il faut rédiger
les calculs et les démonstrations». Nous nous attendions à ce que les difficultés rencontrées dans l’utilisation dulogiciel
entraînentune
«propension»
à cette attitude.L’opinion
numérotée 7permettait
à l’élève detémoigner
de difficultés rencontrées :«DERIVE, ça complique plus
que ça n’aide pourapprendre
desmathématiques».
Nous nous attendions à ce que cetteopinion
2 L’échelle adoptée pour la quantification «nuancée» reste bien sûr arbitraire. Nous montrons seulement
qu’elle est préférable à une quantification binaire.
soit
plus
minoritaire que lapremière,
et nous cherchions àquantifier
lapropension
que donnerait cette seconde
opinion
à lapremière.
Nous souhaitions savoir deplus
si d’autres
opinions
sur DERIVEétaient,
ellesaussi, susceptibles
de conduire à cette attitude derésistance,
c’estpourquoi
il nous fallaitorganiser
l’ensemble des relations entre les 17opinions.
6.2. Résultats
Quatre possibilités
deréponse
étaientproposées
aux élèves comme au para-graphe
5.1. Nous avons fait le choix de laquantification «nuancée»,
avec les coef- ficients considérés ci-dessus :0, 1/3, 2/3,
1. Nous avons calculé les moyennes et facteurs de variance des 17opinions (Tableau 8,
Annexe2), puis
lespropensions
des17 x 17
couples
de variables(Tableau 9).
Nous étudions la distribution du facteur de variance dans les différentesopinions, puis quelques propensions
et filiations à titred’exemple,
ainsi quel’interprétation didactique qu’on peut
en faire.Le
facteur
de varianceAu
paragraphe 3.2,
la notion de facteur de variance a été introduite commereprésentative
duregroupement
des valeurs d’une variable à valeur dans[0; 1 ],
com-paré
à celui d’une variable binaire de même moyenne. Dans le cas d’unquestionnaire d’opinion,
le facteur de variance mesure lafaçon
dont les individus utilisent lesnuances intermédiaires. Nous avons démontré que la
propriété remarquable
des va-riables
binaires,
decompatibilité
de la relation avec l’ordre des moyennes n’est pas conservée en cas de valeurs différentes des facteurs de variance. D’autrepart, (para- graphe 3.3)
l’intensitéd’implication
est d’autant moins uneapproximation
fiable del’intensité de
propension
que le facteur de variance est élevé.Il est donc intéressant d’étudier ce facteur dans le cas de données réelles du
questionnaire.
Pour les 17opinions,
les valeurs du facteur de variance sont situées dans l’intervalle[ 1,7 ; 3,3]
avec une moyenne de2,5
et un écarttype
de0,5 (Tableau 8).
La valeur moyenne de
2,5 justifie
l’utilisation de l’intensité depropension, plutôt
que de l’intensitéd’implication.
La relative faiblesse de l’écarttype permet
de penser que l’on est dans uneconfiguration analogue
au cas binaire en cequi
concerne lacompatibilité
de la relation avec l’ordre desmoyennes3 .
Exemples
depropensions
et defiliations
Nous avons choisi un seuil de
risque c
=0, 08.
Ceci apermis
de déterminer 19propensions significatives parmi
les 16 x 17couples
de variables duquestionnaire (Annexe 2,
Tableau9).
Nousprésentons
deuxexemples parmi
lesquatre
filiations déterminées etanalysées
dans(Lagrange
etDrouhard, 1995)
et(Lagrange, 1996).
L’une se
présente
comme unsystème d’explication
d’uneopinion négative
sur3 Une seule propension significative contredit cette compatibilité. Il s’agit de la propension d’intensité voisine de 1 de 16 vers 17. Les facteurs de variance de ces deux variables différent de deux écarts types.
Contrairement aux autres relations, cette propension ne s’intègre pas dans une filiation plausible.
l’emploi
dulogiciel.
L’autre rassemble lesopinions
où l’élèveperçoit
lesapports
lesplus pertinents
dulogiciel
àl’enseignement.
La filiation «Refus
de DERIVE»Cette filiation
(Tableau 4) organise
troisopinions
seulement. Lesopinions
2 et7 entraînent toutes les deux une
propension
àl’opinion 3,
mais n’ont pas entre elles de relation de cetype.
On s’attendait à la
propension
de 7 vers 3 : elleindique
que si un élève considère l’utilisation de DERIVE commemalaisée,
celapeut
le conduire à nier lapertinence
de ce
logiciel.
Nous avons puvérifier,
en croisant avec une autrequestion,
queprès
des trois
quarts
des élèves lesplus
concernés par cettepropension
rencontrent des difficultés d’utilisation dulogiciel.
TABLEAU 4
La
propension
de 2 vers 3 était moinsprévisible. L’opinion
2 est une visionoptimiste
despossibilités
deDERIVE, opposée
àl’opinion
7. Nous constatons que cette visionoptimiste
donne aussi unepropension
à nier lapertinence
dulogiciel.
Cette
propension s’explique
pour des élèvesqui
accordent unegrande importance
àl’aspect technique
ou calculatoire de l’activitémathématique.
Certains ont besoin defaire les calculs eux-mêmes pour bien
comprendre
une notion.D’autres, ayant
des difficultésquand
ils’agit
deraisonner,
s’assurent une réussite minimumgrâce
auxtâches
techniques.
Onpeut
voir dans leur refus tendanciel de DERIVEl’appréhension
de voir
disparaître
les tâchesqu’ils
réussissent.La filiation «Apports positifs
de DERIVE à l’activitémathématique»
Cette filiation
(Tableau 5) organise
5opinions. L’opinion
maximale(n° 16)
estclairement favorable à
l’emploi
dulogiciel
pourl’enseignement
desmathématiques.
Les 4 autres viennent
expliquer
cette visionpositive
dulogiciel.
Les
opinions 5,
15 et 16 forment un chemin depropension.
Pour des élèvesauxquels
DERIVE donne envie de faire desmathématiques,
cettediscipline présente
TAB LEAU 5
alors un intérêt nouveau,
qui
motive leur visionpositive
dulogiciel.
L’attrait de DERIVE résulte donc tendanciellement duchangement
dans la vision de ladiscipline
que
permet
son introduction.Dans cette
organisation linéaire,
lesopinions
6 et 14 introduisent deux ten- dances. Lapremière,
avecl’opinion 6,
insiste surl’apport
de DERIVEà la compréhen-
sion des
mathématiques.
Des élèves ont pu,grâce
à un usagepersonnel
dulogiciel, s’approprier
mieux certaines notions. La secondetendance,
avecl’opinion 14,
meten avant la
pratique
de résolution de «vraisproblèmes»
souvent constatée avec lelogiciel.
Ils’agit
deproblèmes
de modélisation souventinspirés
de situations extra-mathématiques.
DERIVEpermet
que l’élèvepuisse
les aborder en facilitant les nom-breux calculs que,
généralement,
leur résolution entraîne. Ils différent de lapratique
habituelle où l’élève a surtout à résoudre des exercices
d’application.
Un résultat intéressant dans cette filiation est l’absence de lien
significatif
entreles
opinions
6 et 14. Ilsignifie
que,parmi
les raisonsd’apprécier
lelogiciel,
lesdeux tendances sont bien distinctes. Il
permet
de mieuxcomprendre
les attitudes d’élèves vis-à-vis del’emploi
dulogiciel.
Eneffet,
lesprofesseurs
associent recherche de nouveauxproblèmes
et meilleurecompréhension :
ilsproposent
ces tâches de modélisation pour que l’élève comprenne mieux les notions utilisées dans la résolution. Pour lesélèves,
c’est différent.Beaucoup
d’entre euxapprécient
DERIVEpour les nouveaux
problèmes
surlesquels
ils onttravaillé,
mais nepensent
pas que cette nouvellepratique
desmathématiques
améliore defaçon
décisive leurcompréhension
des notions. Les élèvesqui
ont pu améliorer leurcompréhension
des