• Aucun résultat trouvé

Chapitre III. Tests de comparaison d’´echantillons

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre III. Tests de comparaison d’´echantillons"

Copied!
56
0
0

Texte intégral

(1)

Chapitre III. Tests de comparaison d’´ echantillons

Cours de Tests param´etriques

Deuxi`eme Ann´ee - IUT STID - Olivier Bouaziz

2018-2019

(2)

Introduction

Introduction

I Jusqu’`a pr´esent nous avons ´effectu´e des tests `a partir d’un seul

´

echantillon. On comparait l’esp´erance, la variance ou la proportion d’un caract`ere d’une population `a une valeur de r´ef´erence.

I On souhaite `a pr´esent effectuer des tests de comparaison de deux populations diff´erentes selon un crit`ere quantitatif particulier`a partir de deux ´echantillonsextraits de ces deux populations. Par exemple :

I Comparer le salaire moyen des femmes cadres et celui des hommes cadres.

I Comparer les performances de deux machines au vu de la proportion de pi`eces d´efectueuses qu’elles produisent.

I Comparer l’efficacit´e d’un traitement en comparant des mesures effectu´ees avant traitement `a des mesures faites apr`es traitement.

I Comparer la dur´ee de vie moyenne des PME en 2008 et en 1950.

I La g´en´eralisation `a plus de deux populations sera faite dans le cadre du cours de l’analyse de la variance (mod`ele lin´eaire).

(3)

3.1 Test sur ´echantillons appari´es

On parle de donn´ees appari´ees lorsque les deux ´echantillons consid´er´es sont form´es des individus, pour lesquels on a fait deux mesures d’une mˆeme quantit´e, g´en´eralement avec ´ecart temporel et/ou apr`es l’occurence d’un

´ev´enement. On dispose donc de deux s´eries de donn´ees, de mˆeme taille X1, ...,Xn1 etY1, ...,Yn2, (n1=n2) o`uXjetYj ont toutes deux ´et´e mesur´ees sur lej−i`eme membre de l’´echantillon.

(4)

3.1 Test sur ´echantillons appari´es

Exemple 1

Chez un ´echantillon de 30 sujets extrait d’une population, on mesure le rythme cardiaque (exprim´e en pulsations par minute), not´eX avant, etY apr`es administration d’un m´edicament, car on se demande si l’absorption de ce edicament a un effet sur le rythme cardiaque. On consid`ere donc ici deux

´echantillons appari´es (ou d´ependants) (X1,· · ·,X30) et (Y1,· · ·,Y30). On obtient les r´esultats suivants :

patient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

x 80 80 82 75 80 74 80 72 91 88 70 65 83 74 81

y 85 84 87 81 79 85 87 78 96 80 82 73 89 85 86

patient 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

x 68 69 71 70 73 78 75 76 78 77 75 72 71 75 78

y 72 74 77 75 81 70 77 76 82 83 80 80 81 76 77

L’absorption du m´edicament affecte-t-elle le ryhtme cardiaque de mani`ere significative ?

(5)

I Ici, la mod´elisation est qu’on a d’une partX1, ...,Xn i.i.d distribu´ees selon une loi d’esp´eranceµ1et d’autre part,Y1, . . . ,Yn i.i.d. distribu´ees selon une loi ´eventuellemment diff´erente d’esp´eranceµ2.

I Mais ici, on ne pourra supposer que lesXjsont ind´ependantes desYj

(mˆeme sujet,j, qui influe `a la fois surXjetYj).

I C’est pourquoion s’int´eressera plutˆot aux diff´erences : Zj=XjYj

I Les v.a.Z1, ...,Zn sont i.i.d. selon une loi d’esp´eranceµ=µ1µ2. I Il s’agit alors de testerH0:µ= 0 contre :H1:µ6= 0ouH1:µ >0ou

encoreH1:µ <0, selon le contexte.

I Dans le cas des ´echantillons appari´eson applique les techniques du chapitre pr´ec´edent.

(6)

3.1 Test sur ´echantillons appari´es

Application avec R

>x =c(80,80,82,75,80,74,80,72,91,· · ·,71,75,78)

>y =c(85,84,87,81,79,85,87,78,96,· · ·,81,76,77)

>t.test(x,y,paired =T)

Paired t-test data :x andy

t=−5.327,df = 29,p-value= 1.022e05 alternative hypothesis : true difference in means is not equal to 0 95 percent confidence interval :

−6.319972 2.813362 sample estimates : mean of the differences -4.566667

Conclusion: L’absorption du m´edicament affecte le rythme cardiaque de mani`ere extrˆemement significative.

(7)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants

Exemple 2

Des essais cliniques sont men´es aupr`es de 137 patients atteints d’une maladie pulmonaire sans gravit´e afin de tester l’efficacit´e d’un traitement. Le protocole est le suivant :

I Des exercices respiratoires sont prescrits `a 67 patients choisis au hasard ainsi qu’un placebo (goupe t´emoin (A)).

I Les mˆemes exercices respiratoires sont prescrits aux 70 autres patients ainsi que le traitement (groupe trait´e (B)).

I Au bout de trois mois, l’am´elioration de la capacit´e pulmonaire de chaque patient est mesur´ee. L’am´elioration est mesur´ee (voir tableau suivant) sur une ´echelle de 0 (pas d’am´elioration) `a 10 (r´ecup´eration totale).

(8)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants

Exemple 2 (suite)

Am´elioration Groupe t´emoin (A) Groupe trait´e (B)

0 2 0

1 8 0

2 4 3

3 7 0

4 14 10

5 9 14

6 5 13

7 4 17

8 7 10

9 2 3

10 5 0

Ensemble n1= 67 n2= 70

¯

x= 4,776 y¯= 5,671 s21= 7,479 s22= 2,601

(9)

Exemple 2 (suite)

I L’am´elioration moyenne du groupe trait´e est sup´erieure de 0,9 points `a celle du groupe t´emoin. Le probl`eme est de savoir si cette diff´erence moyenne d’am´elioration entre les deux ´echantillons doit ˆetre attribu´ee aux bienfaits du traitement ou aux fluctuations d’´echantillonnage (le mˆeme protocole sur d’autres individus n’aurait sans doute pas donn´e les mˆemes esultats).

I Autrement dit, la diff´erence observ´ee entre les deux moyennes empiriques est-elle statistiquement significative ?

I Le caract`ere ´etudi´e est l’am´elioration :

I SoitX la v.a. qui associe `a la personne choisie son am´elioration sans traitement. L’esp´eranceµ1et l’´ecart-typeσ1deX sont inconnus.

I SoitY la v.a. qui associe `a la personne choisie son am´elioration apr`es traitement. L’esp´eranceµ2 et l’´ecart-typeσ2 deY sont inconnus.

I Il s’agit de construireun test de comparaisondes deux esp´erancesµ1et µ2.

(10)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants

Exemple 2 (suite)

I Le laboratoire qui veut mettre sur le march´e le traitement tient `a l’hypoth`ese selon laquelle son m´edicament (groupe B) est plus efficace qu’un placebo (groupe A). L’int´erˆet du laboratoire est de contrˆoler l’erreur qui consiste `a d´ecider `a tort que le placebo est plus efficace que le edicament et donc ainsi de poser le test sous la forme :H0:µ1µ2

contreH1:µ1> µ2, ce qui revient `a poser le test : H0:µ1=µ2 contreH1:µ1> µ2.

I En revanche, l’agence de s´ecurit´e sanitaire qui d´elivre l’autorisation de mise sur le march´e du traitement, veut contrˆoler la probabilit´e de d´ecider

`

a tort que le m´edicament est plus efficace que le placebo. Cette agence pose le test sous la forme :H0:µ1µ2contreH1:µ1< µ2, ce qui revient `a poser le test :

H0:µ1=µ2 contreH1:µ1< µ2.

(l’agence cherche `a minimiser la probabilit´e de mettre sur le march´e un nouveau m´edicament qui n’a pas prouv´e son efficacit´e)

(11)

Cadre g´en´eral

On dispose de mesures d’une mˆeme grandeur (salaire, taille, etc.) sur deux

´echantillons extraits ind´ependamment de deux populations diff´erentes : I Population 1 : Le caract`ere est not´e parX. Soitx1, ...,xn1 les r´ealisations

d’un ´echantillon de v.a.(X1, . . . ,Xn1)de taillen1, extrait de cette population et tels queE(Xi) =µ1etVar(Xi) =σ12; on noteX la moyenne empirique etS12la variance empirique de cet ´echantillon c`ad : X = n1

1

Pn1

i=1Xi et S12=n1

1−1

Pn1

i=1(XiX)2.

I Population 2 : Le caract`ere est not´e parY. Soity1, ...,yn2 les r´ealisations d’un ´echantillon de v.a.(Y1,· · ·,Yn2), de taillen2, extrait de la

population 2 avecE(Yi) =µ2, etVar(Yi) =σ22; on noteY la moyenne empirique etS22la variance empirique de cet ´echantillon c`ad :

Y =n1

2

Pn2

i=1Yi et S22=n1

2−1

Pn2

i=1(YiY)2.

I les variablesXi etYj sont suppos´ees ind´ependantes (mesures r´ealis´ees sur des individus n´ecessairement diff´erents).

(12)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants

Probl`eme pos´e

A l’aide des deux ´echantillons on veut comparer ces deux populations. Cel`a revient `a comparer les param`etres des lois de probabilit´es desXi etYj. Pour un test de comparaison sur les esp´erances, on se demande si l’esp´erance de le grandeur consid´er´ee est la mˆeme dans les deux populations. On veut donc tester

H0 : µ1=µ2

I contre l’alternative bilat´eraleH1 : µ16=µ2, I ou contre l’alternative unilat´eraleH1 : µ1< µ2, I ou contre l’autre l’alternative unilat´eraleH1 : µ1> µ2.

(13)

Probl`eme pos´e

I Supposons qu’on s’int´eresse `a la taille des hommes et des femmes d’un pays ; on noteµ1l’esp´erance de la taille des femmes adultes etµ2

l’esp´erance de la taille des hommes adultes. On peut alors chercher `a tester si la taille moyenne des hommes est significativement sup´erieure `a celle des femmes.

I On teste donc :H0 : µ1=µ2 contreH1 : µ1< µ2.

I Il est naturel de fonder les tests deH0sur l’´ecartXY entre les moyennes observ´ees des deux ´echantillons.

I Sous l’hypoth`eseH0, la diff´erence observ´eeXY doit avoir une esp´erance nulle puisqueE(X)E(Y) =µ1µ2= 0.

I Il faut donc connaˆıtre la loi deXY sousH0.

(14)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants

Deux cas `a distinguer

I Cas des grands ´echantillons de loi quelconque I Cas des petits ´echantillons gaussiens.

(15)

3.2.1 Grands ´echantillons de loi quelconque

I Si les tailles d’´echantillonsn1etn2sont grandes, on sait d’apr`es le TLC que, approximativement, on a

X ≈ N

µ1,σ12

n1

et Y ≈ N

µ2,σ22

n2

. I Comme les deux ´echantillons sont ind´ependants,X etY sont

ind´ependantset approximativement sousH0, on a XY ≈ N

0,σ12

n1

+σ22

n2

.

I Soit encore,sousH0:

T = XY qσ21

n1 +σn22

2

≈ N(0,1).

I Maison ne peut utiliser directement la v.a.T comme statistique de test que lorsque les variances des deux populations sont connues.

(16)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.1 Grands ´echantillons de loi quelconque

3.2.1 Grands ´echantillons de loi quelconque

Remarque

Il faut que les tailles desdeux´echantillonsn1etn2soient suffisamment grandes pour pouvoir appliquer le TCL pourX etY. En pratique on consid´erera qu’il faut avoirn1>30etn2>30.

Nous allons distinguer les trois cas suivants : I Cas o`u les variancesσ12etσ22sont connues.

I Cas o`u les variancesσ12etσ22sont inconnues.

I Cas o`u les variancesσ12etσ22sont inconnues mais ´egales.

(17)

a. Cas o`u les variancesσ12etσ22 sont connues (grands ´echantillons)

I Test deH0 : µ1=µ2 contreH1 : µ16=µ2

La statistique de test est

T = XY qσ21

n1 +σn22

2

SousH0,T ≈ N(0,1). SousH1,T a tendance `a prendre desvaleurs plus petites ou plus grandes.

R`egle de d´ecision :

I si|T|>cα on rejetteH0, I si|T| ≤cα, on ne rejette pasH0.

Le seuilcαest tel quePH0(|T|>cα) =α,i.e.tel quePH0(T >cα) =α/2. Le seuilcα est le quantile d’ordre 1α/2 de la loiN(0,1).

(18)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.1 Grands ´echantillons de loi quelconque

a. Cas o`u les variancesσ12etσ22 sont connues (grands ´echantillons)

I Test deH0:µ1=µ2contreH1:µ1> µ2

SousH0,T = XY qσ12

n1 +σn22

2

≈ N(0,1). SousH1,T a tendance a prendre des valeurs plus grandes.

R`egle de d´ecision :

I siT >cα on rejetteH0, I siT cα, on ne rejette pasH0,

o`ucα est tel quePH0(Tn1,n2>cα) =α. Le seuilcαest le quantile d’ordre 1αde la loiN(0,1).

(19)

a. Cas o`u les variancesσ12etσ22 sont connues (grands ´echantillons)

I Test deH0:µ1=µ2contreH1:µ1< µ2

SousH0,T = XY qσ12

n1 +σn22

2

≈ N(0,1). SousH1,T a tendance a prendre des valeurs plus petites.

R`egle de d´ecision :

I siT <cα (cα<0) on rejetteH0, I siT cα, on ne rejette pasH0,

o`ucα est tel quePH0(T <cα) =α. Le seuilcαest le quantile d’ordreαde la loiN(0,1).

(20)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.1 Grands ´echantillons de loi quelconque

b. Cas o`u les variancesσ21 etσ22sont inconnues (grands ´echantillons)

I On remplace respectivementσ21etσ22par leurs estimateurs consistants et sans biais

S12=SX2 = 1 n11

n1

X

i=1

(XiX)2 et S22=SY2 = 1 n21

n2

X

i=1

(YiY)2.

I On utilise alors la statistique de test U= XY

qS2X n1 +SnY2

2

.

I SousH0,U≈ N(0,1) approximativement, et on proc`ede de mˆeme que pr´ec´edemment.

(21)

c. Cas o`u les variancesσ21 etσ22sont inconnues mais ´egales (grands ´echantillons)

I Si les variances sont inconnues mais ´egalesσ21=σ22=σ2, on estime la valeur communeσ2par

S2= (n11)SX2+ (n21)SY2

n1+n22 = 1 n1+n22

n1

X

i=1

(Xi−X)2+

n2

X

i=1

(Yi−Y)2 .

I On montre facilement que l’estimateur obtenuS2 est sans biais. En effet, SX2 est un estimateur sans biais deσ21doncE(SX2) =σ12=σ2, etSY2 est sans biais deσ22doncE(SY2) =σ22=σ2.

I On en d´eduit que :

E(S2) = (n11)E(SX2) + (n21)E(SY2)

n1+n22 = (n11)σ2+ (n21)σ2 n1+n22 =σ2

(22)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.1 Grands ´echantillons de loi quelconque

c. Cas o`u les variancesσ21 etσ22sont inconnues mais ´egales (grands ´echantillons)

I On estime alors σ12 n1

+σ22 n2

=σ2 1

n1

+ 1 n2

parS2

1 n1

+ 1 n2

I On utilise ainsi la statistique de test U= XY

r S2

1 n1 +n1

2

.

I SousH0,U≈ N(0,1) approximativement, et on proc`ede de mˆeme que pr´ec´edemment.

(23)

Exemple 3

Un fabricant de cˆables en acier ´etudie un nouveau traitement de cˆables pour am´eliorer leur r´esistance. Il choisit au hasard 200 cˆables trait´es et 100 cˆables non trait´es. On suppose que la charge de rupture est une variable al´eatoire. On noteXi la charge de rupture du i`eme cˆable trait´e etYi la charge de rupture du i`eme cˆable non trait´e. On observex= 30,82 :y = 29,63 ;

1 199

200

X

i=1

(xix)2= 27,25 et 1 99

100

X

i=1

(yiy)2= 23,99.

Peut-on conclure `a l’efficacit´e du traitement ?

(24)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.1 Grands ´echantillons de loi quelconque

Exemple 3

I Soitµ1(respectivementµ2) la charge de rupture moyenne (dans la population) des cˆables trait´es (respectivement non trait´es),σ12 (respectivementσ2) la variance.

I On suppose que les deux ´echantillonsX1, . . . ,Xn1,n1= 200, et Y1, . . . ,Yn2,n2= 100 sont ind´ependants.

I µ1etµ2sont estim´es parX etY les charges moyennes empiriques des ables trait´es et non trait´es des ´echantillons.

I x = 30.82 (resp.y= 29.63) est la r´ealisation deX (resp.Y).

I Les variancesσ12etσ22sont inconnues et estim´ees par les variances empiriquesSX2 etSY2.

I sX2 = 27.25 (resp.sX2 = 23.99) est la r´ealisation deSX2 (resp.SY2) deSX2 (resp.SY2).

(25)

Exemple 3

I On souhaite tester

H0 : µ1=µ2 contreH1 : µ1> µ2.

I Le TCL s’applique (les deux ´echantillons sont suffisamment grands), et la statistique de test est en l’absence d’information sur les variances

T = XY qS2X

n1 +SnY2

2

≈ N(0,1) sous H0

(26)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.1 Grands ´echantillons de loi quelconque

Exemple 3

R`egle de d´ecision :

I siT >cα on rejetteH0, I siT cα, on ne rejette pasH0,

o`u le seuilcα est tel quePH0(T >cα) =α= 5%. Dans la table de la loi N(0,1), on litcα= 1,645. Si on notet la r´ealisation deT sur les deux

´echantillons, sit>1.645 on rejetteraH0(avec un risque de 5% de se tromper), sit1.645 on ne rejettera pasH0.

Mise en oeuvre: Sur l’´echantillon, on trouvet= 1,94>1,645. On rejetteH0

au risque 5%. Le traitement est donc efficace.

(27)

3.2.2 Petits ´echantillons gausssiens

I On consid`ere `a nouveau deux ´echantillons ind´ependants, le premier (X1, . . . ,Xn1), d’esp´eranceE(Xi) =µ1, de varianceVar(Xi) =σ12, et le second (Y1, . . . ,Yn2), d’esp´eranceE(Yi) =µ2, de varianceVar(Yi) =σ22. I Si l’un des deux effectifsn1oun2 n’est pas assez grand pour appliquer le

TCL, on ne peut pas utiliser les r´esultats de la section pr´ec´edente ! I Cependant, on peut construire un test analogue dans le cas o`u les deux

´

echantillons sontgaussiens.

I On suppose dans la suite queXi ∼ N µ1, σ21

,i = 1, . . . ,n1et Yi ∼ N µ2, σ22

,i = 1, . . . ,n2.

(28)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.2 Petits ´echantillons gausssiens

Supposons qu’on teste :

H0 : µ1=µ2 contreH1 : µ16=µ2

Le test est encore fond´e sur la diff´erenceXn1Yn2. Dans le cas gaussien, on connaˆıt la loi exacte deXn1 etYn2 :

Xn1∼ N

µ1,σ12

n1

et Yn2 ∼ N

µ2,σ22

n2

.

Par ind´ependance des deux ´echantillons, Xn1Yn2∼ N

µ1µ2,σ12

n1

+σ22

n2

.

SousH0,

Xn1Yn2 ∼ N

0,σ21 n1

+σ22 n2

soit encore Xn1Yn2

qσ21 n1 +σn22

2

∼ N(0,1).

(29)

(i) Cas o`u les variancesσ12etσ22sont connues

La statistique de test est

Tn1,n2= Xn1Yn2

qσ12 n1 +σn22

2

.

SousH0,Tn1,n2 ∼ N(0,1) et on proc`ede de la mˆeme mani`ere que pr´ec´edemment.

(30)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.2 Petits ´echantillons gausssiens

(ii) Cas o`u les variancesσ21 etσ22sont inconnues mais ´egales

I On estime la valeur communeσ2par la moyenne pond´er´ee par les effectifs (n11) et (n21) des deux variances d’´echantillonsS12etS22 :

S2= (n11)S12+ (n21)S22

n1+n22

de sorte queσ12/n1+σ22/n2=σ2(1/n1+ 1/n2) est estim´ee par S2(1/n1+ 1/n2).

I On utilise alors la statistique de test

Tn1,n2 = Xn1Yn2

r S2

1 n1+n1

2

.

I On montre que dans le cas gaussien, sousH0, Tn1,n2St(n1+n22).

(31)

(iii) Cas o`uσ12etσ22sont inconnues mais pas forc´ement ´egales

I Les solutions ne sont pas satisfaisantes pour des petits ´echantillons lorsque les variances sont diff´erentes et inconnues.

I eanmoins, lorsque les deux ´echantillons sont gaussiens et que les variances sont inconnues et diff´erentes, on peut montrer que la statistique

Tn1,n2= Xn1Yn2

qS12 n1 +Sn22

2

suit, sousH0, une loi de StudentSt(ν)avecν:l’entier naturel le plus proche du quotient :

s12 n1

+s22 n2

2

(sn12

1)2 n11+ (sn22

2)2 n21

.

(32)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.2 Petits ´echantillons gausssiens

Exemple 4

On cherche `a savoir si le rythme cardiaque d’un individu augmente lorsque l’individu est soumis `a un stress. Pour cela, on mesure le rythme cardiaque de 5 individus avant une s´eance de cin´ema passant un film d’horreur, et le rythme cardiaque de 5 autres individus apr`es la s´eance de cin´ema. On suppose que le rythme cardiaque d’un individu est une variable al´eatoire de loi normale. Les rythmes cardiaques observ´es sont les suivants :

avant la s´eance 90 76 80 87 83 apr`es la s´eance 98 77 88 90 89

1.Le rythme cardiaque augmente t-il de mani`ere significative avec le stress ? 2.Calculer le degr´e de signification du test.

(33)

Exemple 5

On admet que la production de lait d’une vache normande (respectivement hollandaise) est une v.a. de loiN1, σ12) (respectivementN2, σ22)). Un producteur de lait souhaite comparer le rendement des vaches normandes et hollandaises de son unit´e de production. Les relev´es de production de lait (exprim´ee en litres) de 10 vaches normandes et hollandaises ont donn´e les esultats suivants :

vaches normandes 552 464 483 506 497 544 486 531 496 501 vaches hollandaises 487 489 470 482 494 500 504 537 482 526 Les deux races de vaches laiti`eres ont-elles le mˆeme rendement ?

(34)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.2 Petits ´echantillons gausssiens

Application avec R

Si on suppose l’´egalit´e des variances :

>x <−c(552,464,483,506,497,544,486,531,496,501)

>y <−c(487,489,470,482,494,500,504,537,482,526)

>t.test(x,y,var.equal =T)

Two Sample t-test data :x andy

t= 0.8074,df = 18,p-value= 0.43 alternative hypothesis : true difference in means is not equal to 0 95 percent confidence interval :

−14.25774 32.05774 sample estimates : mean of x mean of y

506.0 497.1

(35)

Application avec R

Si on ne suppose pas l’´egalit´e des variances :

>x <−c(552,464,483,506,497,544,486,531,496,501)

>y <−c(487,489,470,482,494,500,504,537,482,526)

>t.test(x,y,var.equal =F)

Welch Two Sample t-test data :x andy

t= 0.8074,df = 16.553,p-value= 0.4309 alternative hypothesis : true difference in means is not equal to 0 95 percent confidence interval :

−14.40370 32.20370 sample estimates : mean of x mean of y

506.0 497.1

Conclusion: Au risque 5%, le test n’est pas significatif.

(36)

3.2 Test de comparaison de deux esp´erances sur ´echantillons ind´ependants 3.2.3 Remarque sur le test de comparaison d’esp´erance de deux ´echantillons

Utilisation en pratique

I En pratique on pr´ef´erera utiliser la version asymptotique du test si la taille d’´echantillon le permet.

I Si l’´echantillon est trop petit on utilisera g´en´eralement un test nonparam´etriquepour compararer les distributions.

I En pratique on ne sait jamais si les variances des deux groupes sont ´egales et donc on utilisera toujours le test de Welch `avariances in´egales! I Il ne faut pas “enchainer” les tests : tester d’abord l’´egalit´e des variances

pour ensuite d´ecider si l’on fait le test de comparaison des esp´erances `a variances ´egales ou non est unemauvaise pratiquecar la d´ecision finale n’aura pas le bon risque de premi`ere esp`ece ! !

Références

Documents relatifs

PROCESSUS GAUSSIENS CENTR ´ ES SUR LEUR MOYENNE Les r´ esultats ci-dessous sont dˆ us ` a Deheuvels et Derzko [5], et cit´ es avec leurs notations... Voir Deheuvels et

Par comparaison entre ce qui est pareil et ce qui est différent, le binôme trouve ce qu’il faut donner à Minibille pour qu’elle ait autant que Maxibille.. Le

[r]

A l’aide d’un tableur, construit les diagrammes représentant la température et les précipitations sur l’ile Heard.. Quelle est l’étendue

4 de la con- vention sur l'interdiction de l'emploi du phos- phore blanc (jaune) dans l'industrie des allumet- tes pour le dépôt des instruments de ratification ayant expiré le

On a récolté deux roches magmatiques au niveau de la croûte océanique : des gabbros et des basaltes. Ces roches se sont formées par refroidissement d’un magma. Elles ont

Nous pr´ esentons deux m´ ethodes de coordination ` a l’aide de deux plans d’´ echantillonnage spatial introduits r´ ecemment : le plan du pivot spatial (en anglais, local

L’int´ erˆ et de la boˆıte ` a moustaches est de proposer un outil visuel d’exploration des donn´ ees, r´ esistant aux effets d’´ ecrantage car bas´ e sur les valeurs