M ATHÉMATIQUES ET SCIENCES HUMAINES
H. R OUANET
Note pédagogique. Un théorème de convergence probabiliste et son application à la justification de méthodes statistiques courantes
Mathématiques et sciences humaines, tome 42 (1973), p. 41-47
<http://www.numdam.org/item?id=MSH_1973__42__41_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1973, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme
NOTE PÉDAGOGIQUE
UN THÉORÈME DE CONVERGENCE PROBABILISTE
ET SON APPLICATION A LA JUSTIFICATION
DE MÉTHODES STATISTIQUES COURANTES
par H. ROUANET1
RÉSUMÉ
Dans cette note on
présente
un théorème de convergenceprobabiliste
relativement élémentaire et sonappli-
cation à la
justification
des méthodesstatistiques
suivantes(grands échantillons) : inférence
sur une moyenne,inférence
sur ladifférence
de deux moyennes(groupes indépendants), comparaison partielle
de deuxfré-
quences,
comparaison
de deuxfréquences (groupes appareillés
et groupesindépendants).
SUMMARY
In this note we present a
relatively elementary
theoremof probabilistic convergence and its application to the justification of
thefollowing
statistical methods(large samples) : inference
on a mean,inference
on thedifference of
two means(independent groups), partial comparison of
twofrequencies,
andcomparison of two frequencies (matched
groups andindependent groups).
1. Introduction
L’une des
exigences
d’unenseignement
sérieux d’unediscipline scientifique
est defournir,
pour les méthodesprésentées,
desjustifications adaptées
au niveau desenseignés.
Cetteexigence
estparticu-
lièrement
critique
enstatistique lorsque l’enseignant
s’adresse à unpublic
de niveaumathématique
peu
élevé ; l’enseignant risque
alors d’osciller entre deux écueils : donner de pures « recettes» sansjusti-
fication aucune, ou énoncer des
justifications
au delà du niveau desauditeurs ;
si pourl’enseignant,
la deuxième méthode peut apporter une certaine
sécurité,
pourl’enseigné
elle revient sans doute aumême que la
première.
Pour fixer les
idées,
donnonsl’exemple qui
est àl’origine
de cette note. Ils’agit
des tests usuelsdu x2
dans les cas courants(comparaison
defréquences
pour deux groupesindépendants
ou deuxgroupes
appareillés, etc.).
Dans les ouvrages destatistique élémentaire,
ces tests ne sont pas réellementjustifiés.
Dans les traités destatistique mathématique,
on trouve des résultats trèsgénéraux,
àpartir desquels
on peut retrouver les tests usuels comme casparticuliers,
le résultat fondamental étant le suivant(théorème
de Fisher surl’ajustement
à une distributionparamétrique) :
« Sous des conditions peurestrictives,
lastatistique d’ajustement Q2
suitasymptotiquement,
sousl’hypothèse nulle,
ladistribution
d’un x2
à vdegrés
deliberté,
avec v = L -1-S, où L
est le nombre de classes et S le1. U.E.R. de Mathématique, Logique formelle et Informatique, Université René-Descartes, Paris.
nombre de
paramètres
estimés àpartir
des observations.»(On
trouvera une démonstration de ce théo- rème dansCramér,
p.426,
ou encore dansRao.)
Les « conditions peu restrictives» concernent les fonc- tionsqui expriment
lesfréquences
parentes des classes en fonction desparamètres ;
ellesprésentent
uncaractère
technique
assez rebutant pour un non-mathématicien.C’est
pourquoi
il nousparaît
utile dedisposer également
dejustifications plus
directes des tests courants. Recherchant une tellejustification,
nous avons trouvé un théorème de convergenceprobabi-
liste relativement élémentaire
qui
permet dejustifier
diverses méthodesstatistiques
courantes(pour
de
grands échantillons) lesquelles
ne se limitent d’ailleurs pas à des tests dux2.
Dans cette note, nousprésenterons
ce théorème ainsi que lesjustifications
d’un certain nombre de ces méthodesstatistiques
courantes.
2. Un théorème de convergence
probabiliste ; conséquences
immédiatesNous énoncerons le théorème fondamental de cette note sous la forme du lemme suivant :
Lemme : Soit
(~n) n
=1,2...
une suite de v.a.numériques convergeant (en distribution) 2
vers unedistribution
donnée ; soit qn
une autre suite de v.a.numériques
convergeant enprobabilité
vers 1 ;alors la suite des v.a.
2013
converge en distribution vers la distribution limite de~.
qn
On trouvera une démonstration de ce lemme dans
Cramér,
p. 254.L’enseignant
destatistique
pourra
juger
utile deprésenter
aux étudiants cette démonstration(qui
est un exerciced’analyse) ;
sinonil se trouvera tout de même dans une situation
plus
favorablequ’avec
le théorème de Fisher énoncéplus
haut :1)
l’énoncé du lemme ne nécessite pas de « restrictions mentales» comme cellesévoquées
par la formule « sous des conditions peu
restrictives » ; 2)
il est tout à fait intuitif pourqui
aappréhendé
même de
façon
rudimentaire les deux notions de convergence en distribution et de convergence enprobabilité.
Du lemme
précédent
nous déduirons deux théorèmes que nous utiliserons directement dans lesapplications.
Dupoint
de vue des notations : nousreprésenterons
la convergence en distribution par lesymbole
~. Ainsi siUn
est une suite de v.a. convergeant vers une distribution normale réduite nousécrirons N
(0,1) ;
la suite des carrés convergeant versun x2
à 1 d.l. nous écrironsX2[t].
Enfin,
siXn
est une suite de v.a.d’espérances E(Xn)
et de variances c¡2(Xn)
telles que la suite desv.a. réduites associées converge vers une distribution normale réduite nous écrirons
Xn N N(E(Xn),
0-2
Théorème 1 : Soient
Xn
etZn
deux suites de v.a. telles queEn
effet, posons g
2. Ou : « en loi ».
Théorème 2 : Soient
Xn
etYn
deux suites de v.a. telles queEn
effet,
posons3.
Application
à des méthodesstatistiques
courantesa) Inférence
sur une moyenne,grands
échantillonsSoit un échantillon de n observations extrait d’une distribution parente ayant une moyenne y et une variance
cr2,
et par ailleursquelconque (normale
ounon).
Soit M la moyenne del’échantillon,
S2 savariance-corrigée (somme
des carrés des écarts à la moyenne, divisée parn-1).
Pour l’étude de l’inférencecr
sur la moyenne fl, on part de la v.a. si on la rapporte à son
écart-type 6 on
’v ., obtient une v.a.réduite
asymptotiquement
normale(théorème classique
de convergencenormale) :
En
remplaçant
on obtient la 1 dont nous allons montrerqu’elle
est encore_
’
2
asymptotiquement N(0,1).
Posons =X n, 8/V;’
=Zn.
On aXn
= N0, --- ).
n D’autrepart,
on sait que S est un estimateur convergent de 0’, c’est-à-direS _
Par
application
du théorème De la distributionasymptotique
de cette v.a. onI Y --
déduit le test de
l’hypothèse nufle y
,a(comparaison
à unenorme)
pour degrands
échantillons :sous
Ho,
lastatistique
de test.b) Inférence
sur ladifférence
de deux moyennes, groupesindépendants, grands
échantillonsSoient deux échantillons
indépendants
extraits de distributions parentes de moyennesfl’, fl",
de varian-ces
J’~, a"2,
et par ailleursquelconques (normales
ounon).
Soientn’,
n" les tailles deséchantillons, M’,
M" leurs moyennes,S’~,
S"2 leurs variancescorrigées.
Pour l’étude de l’inférence sur la différence,’
-fl",
on part de la v.a. M’ - M" - -fl") :
si on la rapporte à sonécart-type n , -f - 0, n " , i n n
on obtient une v.a. réduite
asymptotiquement
normale(d’après
une extension du théorème de conver-gence
normale) :
, _..
. En
remplaçant
on obtientdont nous allons montrer
qu’elle
est encoreasymptotiquement N(0,1).
Posons 11
Posons d’autre part n’ = k’ n, n" = k" n ; alors -
Supposons
que les facteurs k’ et k" restantfixes, n
~ oo :S’2
etS"2
sont des estimateursconvergents
de6’2
eta"2.
Doncd’après
lespropriétés
élémentaires de la convergence enprobabilité :
. Par
application
du théorème 1 :distribution
asymptotique
de cette v.a. on déduit le test del’hypothèse
nulleHo : y’ == (1."
pour degrands
échantillons : sousHo :
lastatistique
de testc) Comparaison partielle
de deuxfréquences
Soit un échantillon de n observations à valeurs dans un ensemble de L classes et extrait d’une distri- bution de
fréquences
parentes pi, CP2’ ..., pL. SoientN2,
...,NL
leseffectifs, Fx, F2,
...,FL
lesfréquences
des L classes. Cherchons àéprouver l’hypothèse
nulleH~ :
pi = cp2(comparaison partielle
de deux
fréquences).
On est conduit à considérer lastatistique Fl - F2,
différence desfréquences
dansl’échantillon. La distribution de
(F,, F2,
...,FL)
estmultinomiale,
d’où on déduitE(Fl) ==
~1,-, et
asymptotiquement J
Si on
rapporte (FI - F2)2
à savariance,
on obtient une v.a. distribuéeasymptotiquement
commeRemplaçons
maintenant dans cette v.a.: onobtient la
statistique qu’on
peut encore écrire(
Nous allons mon-trer que
Q2
est encoreasymptotiquement X2[¡].
PosonsDonc par
application
du théorème 2 :
On
prendra
donc pourstatistique
de test.d) Comparaison
dedeux fréquences,
groupesappareillés (test
deMcNemar)
Soit un échantillon de n observations à valeurs dans le carré d’un ensemble binaire
{al’
lesfréquences
parentes
étant données par le tableau :et les effectifs
correspondants
par le tableau :Soit à tester
l’hypothèse
nulleHo : P’ 1
=(égalité
desfréquences marginales correspondant
aux deux groupes
appareillés).
Cettehypothèse
estéquivalente
àl’hypothèse H’o :
- Onest ainsi ramené au
problème
cprécédent : comparaison partielle
des deuxfréquences
et1 7%r 7B.T B9
d’où la
statistique
detest ~
e) Comparaison
de deuxfréquences,
groupesindépendants
Soient deux groupes d’observations considérés comme des échantillons
indépendants
à valeurs dans le même ensemble binaire{a,,
lesfréquences
parentes de ai étantrespectivement CP’I’ CP"1 (et
lesfréquences complémentaires
étantCP2’
= 1 -cp’1, cp"2
= 1 - Soient n’ et n" les tailles des deux groupes,N’~, N"2
les effectifscorrespondant
à ai et a2 dans les deux groupes, confor- mément au tableau :groupe 1
groupe 2
Soit à tester
l’hypothèse
nulled’égalité
desfréquences
parentesHo :
=cp" 1.
On est conduità considérer la
statistique F’’x -
différence desfréquences
de ai dans les deux groupes.D’après
lespropriétés
de la distributionbinomiale, E( F’ 1)
=E(F"i)
=cp" 1
etd’où
(les
v.a.F’l
etF",
étantindépendantes)
(en appelant
CPI la valeur commune de etde Si on rapporte
(Fll - F"1)2
à sa variance on obtient une v.a. distribuéeasymptotiquement
, .
comme
un x2
à 1 d.l. : . SousHo,
,on a un échantillon de taille nN, ,
avec les effectifs
NI
etN2 :
cpl peut donc être estimé par 2qu’on
poseraégal
àFl
et 1 - 1 parn
N2 q u’on
p oseraé g al
àF2,
d’où l’estimation deCP1 (1 - CP1) : Rem p la ç ant
CP1 et 1- CP1 par leursn
estimations dans la v.a.
précédente,
on obtient lastatistique
,laquelle
peut êtremise sous la forme
1 ,
- (sous
cette dernière forme on reconnaît lastatistique classique Q2
associée à un tableau d’effectifs2 X 2).
Montrons que sousHo, Q2
estasymptotiquement
" , ~ B /
.. Donc par
application
du théo-rème