• Aucun résultat trouvé

Comparaison d’´echantillons appari´es

XII.11 Comparaison d’´echantillons appari´es Exercice XII.11 (Test des signes et test de Wilcoxon).

On consid`ere le r´esultat d’une intervention chirurgicale sur des patients atteints de troubles de la r´etine20. Les donn´ees consistent en des mesures de la fonction r´etinienne `a l’aide d’un ´electro-r´etinogramme 3 mois avant l’op´eration et 3 `a 5 mois apr`es l’op´eration pour n = 10 patients. Pour le patient k, on mod´elise par Xk le r´esultat de la mesure avant l’op´eration et par Yk celui de la mesure apr`es l’op´eration. Les deux variables al´eatoires Xk et Yk sont appari´ees et ne peuvent ˆetre trait´ees s´epar´ement. Le tableau XII.15 donne les mesures effectu´ees sur 10 patients (oeil gauche).

Xk Yk Vk=XkYk Sk= sgn(Vk)Rn(k)

8.12 6.50 1.62 1 10

2.45 2.10 0.35 1 8

1.05 0.84 0.21 1 6

6.86 5.32 1.54 1 9

0.14 0.11 0.03 1 3

0.11 0.17 -0.06 -1 4

0.19 0.16 0.03 1 2

0.23 0.16 0.07 1 5

1.89 1.54 0.35 1 7

0.07 0.05 0.02 1 1

Table XII.15.Mesures en micro Volt avant (Xk) et apr`es (Yk) l’op´eration de l’activit´e r´etinienne de l’oeil gauche par ´electro-r´etinogramme pourn= 10 patients. La variableSkrepr´esente le signe deVk=XkYk etRn(k) le rang de|Vk|(voir la d´efinition dans la partie III).

On consid`ere le mod`ele suivant. Soit X une variable al´eatoire r´eelle de loi in-connue. On suppose que ((Xk, Yk), k ∈ N) est une suite de vecteurs al´eatoires

20. B. Rosner, R. J. Glynn and M.-L. T. Lee. The Wilcoxon signed rank test for paires compa-risons of clustered data.Biometrics, vol. 62, pp. 185-192 (2006).

ind´ependants de mˆeme loi, que Xk etYk sont ind´ependantes, que Xk a mˆeme loi que X et que Yk a mˆeme loi que X−µ o`u µ ∈ R. Le param`etre de d´ecalage µ est a priori inconnu. On d´esire construire un test pour les hypoth`eses suivantes : H0 = {µ = 0} (l’op´eration ne diminue pas la mesure de l’´electro-r´etinogramme) et H1 = {µ > 0} (l’op´eration diminue la mesure de l’´electro-r´etinogramme). On peut construire un test `a partir de la diff´erence des moyennes empiriques avant l’op´eration et apr`es l’op´eration, mais le peu de donn´ees et l’absence d’information sur la loi deX rendent cette approche peu pertinente. On a alors recours soit au test des signes soit au test de Wilcoxon21. Ces deux tests ne d´ependent pas de la loi deX, on parle de tests non-param´etriques. Le test de Wilcoxon est en g´en´eral pr´ef´er´e au test des signes, car plus puissant. Nous ´etudions dans les parties II et III les comportements asymptotiques de ces deux tests. En pratique, les tailles des

´echantillons ´etant faibles, on utilise la loi exacte des statistiques de test obtenue soit par calcul direct soit par simulation.

Les r´esultats de la partie pr´eliminaire I, peuvent ˆetre directement utilis´es dans les parties II et III. Les parties II et III sont ind´ependantes. Dans les parties II et III, on suppose que la fonction de r´epartition de X est continue.

Pourv ∈R, on note sgn(v) =1{v>0}−1{v<0}le signe dev. On poseVk=Xk−Yk etSk= sgn(Vk).

I Pr´eliminaires

Soit X une variable al´eatoire ind´ependante de X et de mˆeme loi que X. On pose V =X−X. On rappelle que la m´ediane deV est son quantile d’ordre 1/2 d´efini par inf{v∈R;P(V ≤v)≥1/2}.

1. Montrer queV et−V ont mˆeme loi et que, pour toutx∈R:

P(V ≤x) = 1−P(V <−x). (XII.9) 2. D´eduire de (XII.9) que 2P(V ≤ 0) = 1 +P(V = 0) et que, pour tout ε > 0,

2P(V ≤ −ε) = 1−P(V ∈]−ε, ε[).

3. Montrer que pour tout ε >0, il existe δ >0 tel que pour tout a∈R, P(V ∈ ]−ε, ε[) ≥ P(X ∈]a−δ, a+δ[, X ∈]a−δ, a+δ[). En d´eduire que pour tout ε >0 :

P(V ∈]−ε, ε[)>0. (XII.10) 4. D´eduire des questions pr´ec´edentes que la m´ediane deV est nulle.

21. F. Wilcoxon. Individual comparisons by ranking methods.Biometrics Bulletin, vol. 1(6), pp. 80-83 (1945).

On admet que si φest une fonction born´ee mesurable d´efinie surR2 alors, siZ et Z sont deux variables al´eatoires r´eelles ind´ependantes, on a :

E[φ(Z, Z)] =E[ϕ(Z)], avec, pourz∈R, ϕ(z) =E[φ(z, Z)]. (XII.11) On suppose que la fonction de r´epartition de X est continue : ∀x ∈ R, P(X=x) = 0.

5. Montrer en utilisant (XII.11) que la fonction de r´epartition deV est continue.

6. Montrer que sgn(V) est de loi uniforme sur{−1,1}.

7. En ´etudiantE[g(sgn(V))f(|V|)], pour des fonctionsf etgmesurables born´ees, montrer que les variables al´eatoires sgn(V) et |V| sont ind´ependantes.

II Test des signes

On rappelle que Sk = sgn(Vk). On consid`ere la statistique de test sur l’´echan-tillon de taille nd´efinie par :

ζn= 1

√n

n

X

k=1

Sk.

1. D´eduire de la question I.6 que, sous H0, la suite (ζn, n ∈ N) converge en loi vers une variable al´eatoire gaussienne de loi N(0,1).

2. D´eduire de (XII.10), que sousH1,E[Sk]>0. En d´eduire que, sousH1, la suite (ζn, n∈N) converge p.s. vers +∞.

3. D´eterminer la r´egion critiqueWndu test pur, construit `a partir de la statistique de testζn, de niveau asymptotiqueα∈]0,1[.

4. V´erifier que le test pur de r´egion critique Wn est convergent.

5. Calculer, `a partir des observations, la p-valeur asymptotique du test pur de r´egion critiqueW10. Rejetez vousH0?

6. Calculer, `a partir des observations, la p-valeur exacte du test pur de r´egion critiqueW10. Commenter alors le r´esultat de la question II.5.

III Test de Wilcoxon

On noteSn l’ensemble des permutations de {1, . . . , n}. On rappelle :

n

X

k=1

k= n(n+ 1)

2 et

n

X

k=1

k2 = n(n+ 1)(2n+ 1)

6 ·

1. Montrer en utilisant la question I.5 que pour k 6= ℓ, P(|Vk| = |V|) = 0. En d´eduire qu’il existe une unique permutation al´eatoireτn∈ Sn telle que p.s. :

|Vτn(1)|<· · ·<|Vτn(n)|. (XII.12) et la statistique de test de Wilcoxon :

ξn= Tnn(n+1)4

o`u les variables al´eatoires (Zn, n∈N) sont ind´ependantes de loi de Bernoulli de param`etre 1/2.

5. Calculer E[Tn] et Var(Tn).

6. Montrer que la fonction caract´eristiqueψn de ξn est : ψn(u) = al´eatoire gaussienne de loiN(0,1).

On admet que sous H1 la suite (ξn, n∈N) converge en probabilit´e22 vers +∞ : pour touta∈R, limn→∞P(ξn≥a) = 1.

8. D´eterminer la r´egion critiqueWn du test pur, construit `a partir de la statistique de testξn, de niveau asymptotiqueα. V´erifier que le test est convergent.

9. Calculer la p-valeur asymptotique du test pur de r´egion critiqueWn. Rejetez-vousH0? Comparer avec la question II.5.

22. P. Cap´era`a et B. Van Custen.M´ethodes et mod`eles en statistique non param´etrique. Dunod (1988).

XII.12 Mod`ele auto-r´egressif pour la temp´erature