C HRISTIAN H EUCHENNE
Effet des erreurs de mesure sur l’évaluation de l’efficacité d’un traitement
Mathématiques et sciences humaines, tome 122 (1993), p. 5-19
<http://www.numdam.org/item?id=MSH_1993__122__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1993, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
EFFET DES
ERREURSDE MESURE
SUR
L’ÉVALUATION DE L’EFFICACITÉ
D’UN TRAITEMENT
Christian
HEUCHENNE1
RÉSUMÉ -
L’effet d’un traitement T sur unecompétence
Y peut êtreexprimé
par le coefficient de régressionpartiel 03B2YT
avec contrôle de lacompétence
initiale X.Quand
Y et X sont mesurées avec erreurs par y etx,
cet effetse manifeste par le coefficient
03B2yT
dans larégression
de y sur T etx.
Le biais entre03B2YT
et03B2yT
estexplicité,
discutéet montré
systématique
si X et T sont corrélés.L’importance
de bien spécifier le modèle, dont une condition nécessaire et suffisanted’identification
est donnée, est mise en évidence.SUMMARY - Effect of measurement errors on the efficiency assessment of a treatment.
The effect of a treatment T on a skill can be
conveyed by
the partial regression coefficient03B2YT
withcontrolling
theinitial skill X. Where Y and X are measured with errors
by
y andx,
this effect is revealedby
the coefficient03B2yT
ofthe regression of y onto T and
x.
Bias between03B2yT
and03B2yT
is madeexplicit,
discussed and shown one-sided if Xand T correlate. Importance of
good
specification of the model, of which a neccessary and sufficientidentification
condition is given, is
emphasized.
1.
EXPOSÉ
DUPROBLÈME
Dans la littérature
anglo-saxonne,
les mises engarde
contrel’usage
irréfléchi de latechnique
derégression multiple
pour évaluer l’efficacité d’un traitementpédagogique
sont nombreuses[Cook, Campbell].
Dans un
rapport
fondé sur cette méthode[Mingat],
il est avancé que la rééducation en GAPP(groupes
d’aidepsychopédagogique)
a un effet nocif sur le niveau scolaire. Cette conclusion a été vivement contestée pour des raisonsplus
sentimentales ou sociales quescientifiques [Le
Monde del’Education].
L’article
présent
se veut une mise aupoint
formelle de laquestion.
Il a pourobjectifs
dedémontrer que
a)
pourjuger
correctementl’impact
d’un traitement sur unecompétence imprécisément
mesurée,
il faut soumettre les observations à un modèlequi prend compétences
initiale et finale autitre de variables
latentes ;
b)
l’effetapparent
biaise l’effet réel ainsidégagé
dans un sensprivilégié quand
lacompétence
initiale est entachée d’erreurs dans sa mesure et oriente la sélection des
sujets traités,
cequi
est1 Faculté de Psychologie et des Sciences de l’Éducation de l’Université de Liège.
toujours
le cas si le traitement est une remédiation destinée aux individus lesplus
faibles ou unenrichissement destiné aux individus les
plus
forts.Concrètement nous mettrons en
question, après
biend’autres, l’usage répandu
d’évaluerl’efficacité d’un traitement
spécial
T sur le rendement scolaire par larégression
d’unposttest
y sur T et diversprétests
xi, la conclusion se limitant à peu de chosesprès
àinterpréter
le coefficient brutzist
de y sur T avec contrôle des x;. Ledanger
est tropgrand
en effet que les inévitables erreurs demesure affectant y et les xi
apportent
une distorsionimportante
etsystématique
dezist
parrapport
àun coefficient net reflétant le
gain
ou laperte
dû à T de lacompétence réelle, après
neutralisation de lacompétence initiale,
c’est-à-dire le facteur mesuré par les x;.Nous remercions A.
Grisay,
chercheur enpédagogie expérimentale
à l’Université deLiège,
denous avoir remis sur une
piste
de cet éternelproblème
en sciences humaines.2.
PRÉSENTATION
DUMODÈLE
La
question
est : l’intervention d’un traitement extrascolaire(remédiation
à l’intention desfaibles,
enrichissement à l’intention des
forts)
modifie-t-elle tellecompétence
dessujets ?
Soient T le
traitement,
X lacompétence
avantl’application
deT,
Y lacompétence après
cetteapplication.
Laquestion pourrait
être résolue sansproblème
en effectuant unerégression
de Y surTetX
C’est le coefficient
5yT qui
est au centre de l’intérêt car il évalue l’influencespécifique
de T surY,
lacompétence
initiale X étant neutralisée. Eneffet, quand
on retire de lacompétence
finale Y lapart
évidemment due à lacompétence
initiale(terme 5yx X)
etl’impact
d’autres variablesdéterminantes
qui
sontnégligées,
inconnues ou aléatoires(résidu ~),
il reste l’effet propre de T(terme ~ITT).
Selon que
#yr
estpositif,
nul ounégatif,
on en conclura que le traitement T estfavorable,
indifférent ou défavorable à lacompétence.
En fait - et ceci nuance décidément la netteté de
l’équation (1) -
unecompétence
se révèle sousde
multiples
aspects et est donc mesurée par divers indicateursplus
ou moins faillibles. Dans lecontexte
présent,
X(resp. Y)
se manifeste sous forme deprétests (resp. posttests)
xi(resp. yj)
et lathéorie
classique
des mesurescongénériques [Bollen,
p.208]
pose les relationsLes
âi
etEj
sont les erreurs de mesure de lapsychométrie.
A un niveauplus fin,
rienn’empêche
même que les xi ou yj soient les items d’un test.
Schématiquement,
ce quetrop
d’auteurs se bornent àfaire,
c’est larégression
d’une mesureglobale
de Ysur T et les observations xi
Ils
interprètent
alors le coefficientpop
enignorant
l’existence des erreurs de mesure.Ce n’est pas
5y qu’il
fautregarder,
mais bienPYT
obtenuaprès
avoirdégagé
X et Y de lagangue de leurs mesures faillibles xi et yj. Autrement
dit,
X et Y doivent être considérées commedes variables latentes
(facteurs).
L’étudeprésente
n’a évidemment de sens que si l’ensemble des xi(resp. yj)
ramasse bien l’entièreté de cequ’on
met dans leconcept
decompétence
initiale(resp.
finale) ;
la réalité de la variable construite X(resp. Y)
endépend.
Par contre, on peut croire que T n’est pas affectée d’erreur car cette variable résulte d’une
imposition
humaine volontaire. Tpeut être,
parexemple,
letemps
d’administration du traitement.Une version
plus rudimentaire,
mais encore correcte, code la dichotomie traité ou non par deux valeurs arbitraires(usuellement
1 et0).
On est amené naturellement à combiner trois modèles :
- une
analyse
factorielle des x;qui
en induit leur substancepremière,
lacompétence
initialeX ;
- une
analyse
factorielle des yjqui
en induitY;
- une
régression
de Y sur T et X.On entre alors dans un
modèle,
dit de structure decovariances, qui permet
d’estimernotamment le coefficient net
#yT.
Les seules conditions essentiellesimposées
à ce modèle sontroutinières :
z
1)
non corrélation des erreurs demesure aux
variables fondamentales2)
non corrélation du résidu auxexplicateurs
de Y dans(1)
Cette dernière
exigence
n’est pas innocente. Ellepostule
en somme que tout déterminant de Y autreque T et
X, placé
par définition dans~,
n’est associé ni àX,
ni à T. C’est unesimplification
de laréalité dont il faut avoir conscience pour
apprécier
la démonstrationqui
suit. Leparagraphe
8pallie
cette faiblesse mais est moins décisif.
Notons que sont
permises a priori
des corrélations non nulles entre toutes les erreurs demesure, y
compris
entre lesâi
desprétests
et lesEj
desposttests.
Le réalisme y invite car des traitsdifférents,
ici X etY, peuvent
être mesurés par une méthodeidentique
ou similaire.La
métrique
des variablesY, T,
X(parce qu’elles
sontlatentes)
et y(parce
que lespoids pj
de(4)
ne sont définisqu’à
une constante deproportionnalité près)
doit êtrefixée ;
elle le sera toutbonnement en demandant que ces variables soient
réduites,
c’est-à-dire de moyenne nulle et de variance unité. Uneconséquence agréable
de cette définition d’échelles est lapossibilité
decomparer directement
~yT
etpar.
Enfin,
poursimplifier
les écritures et sans nuire à lagénéralité
duraisonnement,
toutes lesvariables observées xi et yj seront aussi
supposées
réduites. Toutes lescovariances,
àl’exception
de celles
portant
sur une erreur de mesure, seront donc des corrélations.De ces contraintes résulte
déjà
en
posant
puisque,
comme sescomposants E~,
E est non corrélé avec Y de variance unité et que,par
(4)
et(3)
..Dans la théorie
classique
de la mesure,~,2 y
est la fidélité de y vis-à-vis de lacompétence
finale vraie Y.3. RELATION ENTRE COEFFICIENTS BRUT ET NET
Jusqu’ici
on a mis en lumière que l’influence de T et X sur Y passe,dégradée
parl’imprécision
desmesures, dans la
régression
de y sur T et l’ensemble des xi(équation 5). Quelle
est la relation entrele coefficient brut
5y
de(5)
et le coefficient netPyT
de(1),
etquels ingrédients
entrent dans cetterelation ?
La formule bien connue fournit
où
pyT
est la corrélation de y etT,
pxT est le vecteur colonne des corrélations piT entre les xi et
T,
-1 -
pXT est le vecteur
ligne transposé
de pxT,£xx
est la matrice des corrélations pu de xi et Xk,pxy
est le vecteur colonne des corrélationspiy
entre les xi et y.En notant À le vecteur des
saturations %
de(2),
leségalités
se résument en
où,
cela va desoi, pxr est
la corrélation de X et T.Pour le dénominateur de
(6)
on a donc-1 -1
La
quantité ’
1 mérite d’êtrebaptisée,
-appelons
la 2 -, car c’est la fidélité due Laquantité X Xx ,
mérite d’êtrebaptisée,
-appelons
la,2 x
-, car c’est la fidélité de l’ensemble des x; parrapport
à la variable latente X que ces indicateurs sont censés mesurer. En effetd’où l’on tire que le coefficient de détermination de X par les xi est
(variance
de Xprise
encompte
par lesx;)I(variance
deX) =
Poursuivons
l’exploration
de(6).
en notant pxy la corrélation de X et Y.
’
Ecrivant encore 8 le vecteur des erreurs
âi
de(2),
la version vectorielle deséquations précédentes
est-
L’expression
PxT
PxT-1 Y-xx Pxy Pxy
au numérateur de .(6)
est doncReste à
expliciter pyT
de(6), puis
la méchanteexpression
Pour
pyT
il vient immédiatementoù,
cela va desoi,
pyT est la corrélation de Y et T.La dernière démarche est la
plus
subtile. Constatant que lapartie
"nette" ÂX duvecteur X
assemblant les
composantes
de(2)
aété implicitement
résumée enon définira naturellement une erreur scalaire
globale
8 de l’ensemble des indicateurs xi parLes
plus
futés verront que cequi
estévoqué
ainsi est la combinaison linéaire des xiqui
maximise la fidélité(ici ^~)
vis-à-vis de X. En d’autres mots, dupoint
de vuerégressif,
levecteur X
des xi estéquivalent
à cetteunique
variable réduite. D’ailleurs lesincroyants
serontconvaincus par la réussite
technique qui
suit.soit,
en notant8ôô
la matrice des covariances entreSi,
On en déduit successivement
et la variance de
(8) :
En
désignant
par p& la corrélation des erreurs scalaires ô et e,Portant tout cela dans
(6)
et tenantcompte
desexpressions
de pyT, PXY livrées par leséquations,
ditesnormales,
résultant de covariancesprises
en(1) :
il vient finalement
4. DISCUSSION DU BIAIS ENTRE LES DEUX COEFFICIENTS Récrivons
(12)
sous la formecompacte
où
dépend
desparamètres
de mesureÂx, Ây,
p~ et du taux linéaire#yx
de croissance de Y en X.Dans cette formulation de
~iyT,
le termeXy5yT
est clairementinterprétable :
il manifeste uneatténuation de l’effet net
fiyT,
d’autantplus grande
que y mesure mal lacompétence
finale(~
est lafidélité de y par
rapport
àY).
Plus
énigmatique
en( 13)
est le biais additifdont le
signe
est celui de pxj-erpuisque
1à
1 ~ 1(par ( 10)) et 1 pxT
1 1.Ce biais oc est dû à la
conjonction
d’une corrélation pXT entrecompétence
initiale ettraitement,
avec des erreurs dans la mesure de Xzest généralement
non nulquand
la fidélitéÎ~
est inférieure à
1).
Les circonstances où a s’évanouit sont intéressantes à scruter car
(13)
se réduit alors àce
qui
entraîne que coefficients brut et net ont mêmesigne
et que15yTl:g IpyT
1. Cecipermettrait
deconclure sans
ambiguïté
à un effetnocif,
nul oubénéfique
de T sur Y dont lamagnitude
seraitcependant
atténuée par l’infidélité de y.Interprétons
les deux cas où cela arrive.1)
PxT = 0.Compétence
dedépart
et traitement ne seraient pas corrélés. Cephénomène
nes’observe
qu’exceptionnellement
dans un relevépassif
de données naturelles.Dans un contexte de
plan expérimental,
cette situation estcependant
artificiellement créée parassignation
au hasard des modalités du traitement auxindividus,
cequi
rend Tindépendante
de lavariable X
contemporaine.
Ce constat est rassurant car il étaitescompté.
2) ) x
= 1qui
q annule Zut et a.var(8)
= 1-À;
= 0(équation 10) implique 8 = ’1:
ô1 Àx = 0
-+
()
x(q )
pq(équation 8),
donc 8=0.La mesure de X serait réalisée fidèlement par ses indicateurs Xi, avec des erreurs
Si
nulles. Faut-il
ajouter
que c’est un idéal ?Quand pxT ~
0 et~,Z x l, quepeut-on
dire dusigne
du biais additif oc ? Ici seplace
lepoint
crucial de la thèse que nous défendons : T sera le
plus
souventpositif.
T est
négatif,
nul oupositif
selon quePyx
estinférieur, égal
ousupérieur
àOr dans les
faits,
1) #yx
est certainementpositif
et vraisemblablementproche
de 1car, à
T constant, à tout le moins lacompétence
finale Y est fonction croissante du niveau dedépart
X.2)
p8F est bornésupérieurement
par 1 et souvent voisin de0,
car iln’y
aguère
de raisonsque les erreurs de mesure aux
prétests ôi
et auxposttests ~~
soientglobalement
très corrélées entreelles.
En
particulier,
lapositivité
de r sera assuréequand fiyx
> 0 et0,
ou bienquand fiyx
> 1 etles posttests sont au moins aussi fidèles que les
prétests (~y >_ ~,x).
A
présent,
revenons à notre contexte où le traitement est une variable observéequi
s’adresse de manièreprivilégiée
à dessujets
decompétence
extrême. Ils’agit
d’un enrichissementqui
s’adresseaux
plus forts,
cequi implique
certainement pXTpositif,
ou aucontraire,
d’une remédiationqui
s’adresse aux
plus faibles,
cequi implique
sûrement pxTnégatif.
A
priori, PyT devrait pouvoir
de manièreégale
sous-estimer ou surestimerfiyT.
Or lasymétrie théorique
despossibilités
est maintenant rompue enacceptant l’hypothèse
trèsplausible
que r > 0 : oc a le
signe
de pXT et onpeut
avancer raisonnablement que serontplus fréquentes
dans la réalité les situations suivantes.
1) Quand
T est unenrichissement,
ex> 0.Quand PyT
estpositif, PyT
maintient cettepositivité. Quand #yT
estnégatif
ounul,
le surévalue.2) Quand
T est uneremédiation,
a 0.Quand gYT
estpositif
ounul, PyT
le sous-évalue.Quand PyT
estnégatif,
maintient cettenégativité.
,Ceci démontre un
phénomène
pervers relevéempiriquement depuis quelque temps :
1’ A A - A n-a nn
l’interprétation
dePy1’
tend une conclusionpartiale,
pour unaffermissement, pessimiste
pour une remédiation."The
point
to beemphasized
here is that the useof standard regression approaches often
results inunwarranted conclusions
of harmful
treatmenteffects
when"compensatory"
treatments areevaluated where the persons
receiving
the treatment do less well than controls at the pretest.Similarly, they often
lead to unwarranted conclusionsof beneficial impact
when programs are evaluated where theinitially more fortunate
group hasgreater
exposure to the treatment... "[Cook, Campbell,
p.301]
Quand
le traitement est unerépartition
en filières fortes oufaibles,
cephénomène
estégalement
relevé dans
[Slavin].
5. ESTIMATION DU COEFFICIENT NET
Ce
qui précède
montre assezqu’on
nepeut
se satisfaire du coefficient brutPyT
etqu’il
fautpousser
l’analyse jusqu’au
coefficient net#yT.
Le modèle
présenté
ci-avant est un modèle de structure de covariances[Bollen, chap. 8]
car ilcombine
- des mesures des variables latentes
exogènes
X et T par leséquations (2)
et l’identitéqui exprime
que T est à la fois variable observable etfacteur;
- des mesures d’une variable latente
endogène
Y par leséquations (3) ;
- une structure causale linéaire entre
X, T,
Y parl’équation (1).
Dans ce modèle les
paramètres
à estimer sont les saturations~,;
et~,~ ,
les covariances etvariances d’erreurs
la corrélation pXT, les coefficients
#yT
et la variance résiduellevar(~).
Deslogiciels
tirentles estimations de ces
paramètres
de la matrice des covariances entre variables observéesT,
xi,yj.
Différentes méthodes d’estimation
(moindres carrés,
moindres carréspondérés,
maximum devraisemblance, etc)
sontdisponibles
et les programmespermettent
de confronter le modèle auxdonnées par des
épreuves d’ajustement (chi carré).
Voici un
exemple d’application
de cetteprocédure [Meuret].
L’échantillon est constitué de
quelques
milliers d’élèves suivis de 6e en 5e decollèges.
Letraitement T est
l’appartenance
à une ZEP(zone
d’éducationprioritaire); la
variableexogène
X estune
compétence
scolaire initiale PRE mesurée par 4prétests
enfrançais
et 4prétests
enmathématique ;
la variableendogène
Y est lacompétence
scolaire finale POST mesurée par 2posttests
enfrançais
et 2posttests
enmathématique.
Les erreurs de mesure des tests de mêmenature
pouvaient
êtrecorrélées,
ycompris
entreprétests
etposttests.
En outre sont intervenuescomme covariables
explicatives
de POST lacatégorie socio-professionnelle
desparents,
lanationalité et
l’âge,
variables observées identifiées à des facteurs carsupposées
être mesurées sans erreur.Le modèle a été traité par le
logiciel
LISREL[Jôreskog, Sôrbom].
Les coefficientsPyr 5yx
ont été estimés à -0.042 et 0.940. Le coefficient brutPyT
estimé dans unerégression multiple
"naïve" était - 0.130."
6. IDENTIFICATION DU
MODÈLE
Subsiste la
question
de laspécification
du modèle. De cepoint
de vue(mais
nullement de celui del’estimation),
l’identification desparamètres 5yT, 5yx
est visiblementéquivalente
par leséquations (11)
à celle desparamètres
pyT, pxy.Les
équations
reliant lesquantités
observables auxparamètres
sont alors leséquations (7)
et- - -
et les suivantes déduites
immédiatement des équations (2)
et(3)
On reconnaît dans ce
système l’équation
d’uneanalyse
factorielle confirmatoire[Bollen,
equ.(7.5)]
Dans cette
généralité,
le modèle est sous-identifié. Il n’est donc estimable et falsifiablequ’en ajoutant
des contraintes apriori
sur sesparamètres.
PxT, PYT
(ou
et pxY(ou fiyx)
doivent évidemment rester libres car ilsmarquent
les relationsinterrogées
entreT,
X et Y.Puisque
contraindre les fidélités
~;2 ou liÎ
des mesures xi ouyj
revient à contraindre les variances6n
ou8jj.
Les covariances d’erreurs de mesure8;k, Ojk, Ojl
sont donc les seulsparamètres auxquels
des liaisons
puissent
être décemmentimposées.
Celles-ci seront communément des fixations à unevaleur a
priori,
leplus
souvent 0.Dans ce cadre
pratique (ne
fixer que des covariancesd’erreurs),
montrons que pour que le modèle soit identifié il faut et il suffitqu’au
moins un8~k
=cov(ôi,à£
avec piTPkT # 0,
au moinsun
8jk
=COV(F-j,âk)
avecpjT pkT # 0
et au moins un0ji = cov(Ej,Ei)
avecPjT PIT #
0 soientfixés.
Si tout
Oik
est laissélibre,
fixer certains desOik, 8j¡’
voire tous,n’empêche
pas que les transformationsoù laissent invariantes les
équations
Si tout
Ojk
est laissélibre,
fixer certains desOik,Ojl,
voire tous,n’empêche
pas que lestransformations
où laissent invariantes les
équations
Si tout
8jl
est laissélibre,
fixer certains des8ik, Ojk,
voire tous,n’empêche
pas que lestransformations
où laissent invariantes les
équations.
Réciproquement
la fixation d’un d’un8jk
et d’un8jl permet
de tirer une valeur définie pour les autresparamètres.
Pour
6i2=cov(5i,§2),
supposons quePlTP2T:#O-
Une valeur fixée de012
est choisie de tellesorte que
donnent
On obtient alors
Xi=PiT/PXT ,ensuite
les autresAvec une autre
option
est de fixer011=var(âl)
dans]01[ qui
livrera,1= 1-1 , Pxr=P1FÂ1,
le reste étantidentique.
Parallèlement la fixation d’un avec
pjTpiT#0
suffit à fournir successivement lesÂj,
les autres9jl.
Enfin on
peut
fixer032=COV(F-3,82) quand
on a trouvé un y3 et un x2 tels que Les démarchesprécédentes
ontdéjà
donné lesÀj
dont et lesÀk
dont Ilvient fmalement
puis
les autres7. IMPORTANCE DE LA
SPÉCIFICATION DU MODÈLE
Ainsi tout ensemble de données observées laisse au moins trois
degrés
de liberté à laspécification
pour
engendrer
divers modèles identifiéspossibles qui
auront chacun leur propre coefficient net5YT-
Par
(11)
est fonction des corrélations entre variables fondamentales. Un
point important
de laprocédure empirique
sera le choixréalable
de liaisons entre certains6ik, Ojk, 8jl puisque
ce choixconditionne en bout de course la valeur estimée de
L’exemple
suivant est édifiant à cetégard. Supposons
que les observations aientgénéré
lamatrice suivante des corrélations
Ici Y est mesuré par un seul indicateur y3. La variable y construite par
(4)
est forcément y3.Comme
(6)
donne le coefficient brutfiyT*0.
Pour identifier le
modèle, spécifions
d’abord que621,
covariance des erreurs de mesure de X2 et xl, soit nulle. Lescinq équations
fournissent
En fixant ensuite
833
donne
1 donne Une fois que
631
a étéfixé,
les deux dernièreséquations
c’est-à-dire
livrent
... " . n.. n.., .., 1 ...." 1 . 1 - --1 -. - _..OL -- - L - - -- - - - 1-
Les
paramètres 833
et831
sontspécifiés
arbitrairement a ceciprés qu’ils
doiventpréserve
ladéfinie
positivité
des matriceset
On vérifie aisément
qu’il
faut et il suffit pour cela quecondition
qui,
pour833
>0.066,
autoriseet donc des
lfiyTl
aussigrands
que 1Par
exemple,
avec033
=o.l,
onpeut prendre 031 =
± 0.1qui
donnefiyT =
± 6.55Le contraste
possible
entre5yT
= 0 etPvT
vient de la forte corrélation entrecompétence
initiale et traitement
(pXT
=0.99) conjuguée
à une corrélation entrecompétences
initiale et finalemasquée
dans les observations(P31 =
0 =0.8À3
PXY+ 031)
par l’association des erreurs de leursmesures
(831 ).
La
leçon
de cepetit exemple
est dure : avec des donnéesplausibles qui engendrent
uncoefficient brut
nul,
des modèlescompatibles,
exactementajustés, peuvent
fournir des coefficientsnets non nuls extrêmement différents
suivant
laspécification imposée
aux erreurs de mesure(ci-
dessus par le canal de
821,833~831)~
8. EXTENSION
À
D’AUTRES COVARIABLESIl
peut
y avoir des variables autres que T et Xqui
influencent Y. Desexemples
ont été cités dans leparagraphe
5. Tenircompte
du vecteur R de ces covariablessupplémentaires complique
diablementles choses
quand
R estimprécisément
mesuré.On
peut
montrer quePyr
seprésente
encore comme somme deXy5yT et
d’un biais additifqui
est le
produit
scalaire de par un vecteur contenant tous lesparamètres
de mesure et lescoefficients de Y sur X et R. Le
signe
de ce biais devient totalementimprévisible.
Mais supposons seulement que les covariables
supplémentaires
de R soient mesurées sans2013 2013
erreur.
Regroupant
dans le vecteurC=(T,R)
le traitement et ces variablesnouvelles,
simultanément latentes etobservées,
les deuxéquations
derégression
à comparer,correspondant
à(1)
et(5),
sontConduisons alors les calculs comme dans le
paragraphe
3 en lisantsystématiquement
T commele vecteur C. A
(6) correspond
Pcc
est la matrice des corrélations à l’intérieur deC, Pxc
est la matrice des corrélationsentre X
et-c ,
Pyc
est le vecteur des corrélations entre y et C.Tenant
compte
de"
où pxc est le vecteur des corrélations entre : 1 où pyc est le vecteur des corrélations entre et des
équations
normalescorrespondant
à(11)
on obtient la version
plus générale
de(12)
où le dénominateur est
toujours positif
et où r est laquantité critique
discutéedans le
paragraphe
4.entraînent pour la
première
composante del’égalité
ci-avantAdmettant encore que r est
positif,
lesigne
du biais additif est celui de la corrélationpartielle
de X et T avec neutralisation des variables de R :
Ainsi,
si toutes les covariables autres que lacompétence
initiale sont exactementmesurées,
la thèseprécédente peut
être encore soutenue.9. CONCLUSION
Un
phénomène
pervers, observédepuis longtemps,
est icimathématiquement
mis en évidence. Sil’effet
réel d’une remédiation(resp. enrichissement)
est nocif(resp. bénéfique),
le sens de l’effetapparent
est conservé telquel;
par contre, si l’effet réel d’une remédiation(resp. enrichissement)
est
bénéfique (resp. nocif),
l’effetapparent
estatténué,
et son senspeut
être renversé.Cette
perversité
due aux erreurs de mesure ne peut êtrecorrigée
que par unespécification
correcte d’un modèle fondamental où
jouent
deux variables latentes aumoins,
lescompétences
initiale et finale "vraies". Comme celui-ci est
chroniquement sous-identifié,
celaexige
de luiimposer
des contraintes apriori.
La difficulté estdéplacée
auplan théorique.
Le chercheur
devra, préalablement
aux observations et auxcalculs,
décider sur des basesuniquement
substantielles que telles erreurs des mesures ont telles covariances.Entreprise responsable
et délicate car elle est lourde deconséquences
sur l’évaluation de l’efficacité "vraie".Il reste à
escompter
que les indicateurs xi,yj
descompétences
initiale et finale soient assezfamiliers pour
pouvoir
y détecter incontestablement des erreursSi, Ej
non corrélées. A défaut d’un ensemble suffisant de tellesinformations,
et seulement à titreexploratoire,
la moins mauvaisestratégie
semble departir
du modèle leplus
serré où toutes les corrélations d’erreurs soient d’office annulées. Les indices de modification[Bollen,
p.299] pourront
alorsguider
un relâchement deparamètres injustement fixés,
en vue d’améliorerl’adéquation
du modèle.BIBLIOGRAPHIE
BOLLEN K.
A.,
Structuralequations
with latentvariables,
NewYork, Wiley,1989.
COOK T.
D.,
CAMPBELL D.T., Quasi-experimentation, design
andanalysis
issuesfor field settings, Chicago,
Rand McNally, 1979.
JÖRESKOG
K.G., SÖRBOM D.,
LISREL 7 : Aguide
to the program andapplications, Chicago,
SPSS
Inc.,
1989.MEURET
D.,
L’efficacité de lapolitique
des zones d’éducationprioritaires
dans lescollèges,
Revue
française
depédagogie,
àparaître.
MINGAT
A.,
"Les activités de rééducation GAPP à l’écoleprimaire, analyse
du fonctionnement etévaluation des
effets", Revue française de sociologie,
vol. 32(1991),
n° 4.Le Monde de
l’Education,
"Courrier deslecteurs",
nos 180 et181,
mars et avril 1991.SLAVIN R.