UFR Sciences et Techniques Année 2007-2008
Master 1 de Mathématiques Statistiques
Feuille de TD no2
Le test du chi-deux
Exercice 1 (loi multinomiale)
On dispose de n boîtes numérotées de 1 à n dans lesquelles on veut répartir des boules de k couleurs différentes. Pour chaque couleur j = 1, . . . , k, on dispose d’un nombre de boules supérieur àn. On ne peut mettre qu’une boule par boîte. Une «répartition» est une manière de remplir les boîtes ; autrement dit une «répartition» est entièrement déterminée par la couleur figurant dans chaque boîte.
Mathématiquement une «répartition» est donc une applicationfde l’ensembleB ={b1, . . . , bn} des n boîtes dans l’ensembleC ={1, . . . , k} des k couleurs.
1) Vérifier qu’il y a kn répartitions possibles.
2) On suppose qu’il y ak = 2couleurs et soientn1 etn2 des entiers fixés tels quen1+n2 =n.
Montrer que le nombre de répartitions avecn1 boules de la couleur1 etn2 boules de la cou- leur 2 est égal à nn!
1!n2!.
3) Sikest quelconque et sin1, . . . , nksont des entiers fixés tels quen1+· · ·+nk=n, montrer que le nombre de répartitions avec nj boules de la couleurj (j = 1, . . . , k) est égal à
n!
n1!. . . nk!.
4) Soit (X1, . . . , Xn) un n-échantillon d’une loi discrète p = (p1, . . . , pk) concentrée sur les entiers 1,2, . . . , k etN = (N1, . . . , Nk)le vecteur aléatoire tel que
Nj =
n
X
i=1
1[Xi=j] (nombre d’apparitions de la valeurj dans l’échantillon)
a) Démontrer que Nj est une variable aléatoire binomialeB(n, pj).
b) Démontrer que la loi du vecteur aléatoire N (loi multinomiale de paramètre n et p) est donnée par
P(N1 =n1, . . . , Nk =nk) = n!
n1!. . . nk!pn11. . . pnkk, oùn1, . . . , nk sont des entiers tels que n1+· · ·+nk=n.
Exercice 2 (tester si une pièce est équilibrée)
On peut, bien qu’il y ait des méthodes plus efficaces, utiliser le test du chi-deux pour tester si une pièce est truquée. Par exemple :
On a lancé 200 fois une pièce de monnaie et observé 115 faces et 85 piles. Utiliser le test du chi-deux pour rejeter ou non l’hypothèse que la pièce est équilibrée, au niveau de confiance 1−α= 0,95 puis au niveau de confiance0,99.
Exercice 3 (tester si des dés sont truqués)
Dans la même esprit que l’exercice précédent, on peut en observant seulement certains évé- nements tester si un jeu est est régulier ou non. Par exemple :
Un jeu consiste à lancer une paire de dés (supposés non truqués). Un joueur qui avait parié sur le «sept» et le «onze», a observé que sur 360 lancers, on a eu 74 fois «sept» et 24 fois
«onze». Au niveau de confiance 0,95, peut-on accepter l’hypothèse que les dés ne sont pas truqués ?
Exercice 4 (tester un générateur de nombres au hasard)
Un générateur de nombres au hasard entre 0 et 9 a fourni 250 nombres et on observé les résultats suivants. Etudier si au risque α= 0,05puis0,01, on peut accepter l’hypothèse que le générateur est correct :
nombre 0 1 2 3 4 5 6 7 8 9
fréquence 17 31 29 18 14 20 35 30 20 36
Exercice 5 (convergence vers la loi de Poisson)
Le test du chi-deux est basé sur le fait que pour tout i = 1, . . . , k la variable aléatoire
Ni−npi
√npi ≈ N(0,1−pi)(voir le cours). Pour cela il convient que le produitnpi ne soit pas trop petit. Les statisticiens conviennent qu’il faut que npi ≥ 10 sinon les résultats ne sont pas bons. Considérons le vecteur constitué desk−1premières composantesNe = (N1, . . . , Nk−1) du vecteur multinomial N (noter que la dernière composante est liée aux autres car Nk = n−Pk−1
i=1 Ni).
On suppose que n → +∞ et que npi = λi reste constant et égal à λi > 0. Démontrer que le vecteur aléatoire(N1, . . . , Nk−1) converge en loi vers un vecteur limite(X1, . . . , Xk−1) où les Xi sont des variables aléatoires indépendantes de Poisson de paramètres respectifs λ1, . . . , λk−1.
(indication : on montrera que la fonction caractéristique du vecteur Ne est de la forme ϕNe(t1, . . . , tk−1) = 1 +p1(eit1 −1) +· · ·+pk−1(eitk−1 −1)n
,
pour cela on reviendra à la définition de Nj (Exercice 1, 4)) et on écrira Ne comme somme de n vecteurs aléatoires indépendants et de même loi puis on écrira pi = λni et on passera à la limite).
Remarque : Ce résultat de convergence en loi s’interprête concrètement de la manière suivante : si n est grand et les pi sont très petits de telle sorte que les produits npi = λi soient de taille raisonnable (entre 1 et 9), alors le vecteur Ne a une loi approximativement égale à celle d’un vecteur de lois de Poisson indépendantes et de paramètres respectifs λi, c’est à dire
P(N1 =n1, . . . , Nk−1 =nk−1) = e−λ1λn11
n1!. . . e−λk−1λnk−1k−1 nk−1!.