• Aucun résultat trouvé

Test de Kr uskal-W allis

N/A
N/A
Protected

Academic year: 2022

Partager "Test de Kr uskal-W allis"

Copied!
10
0
0

Texte intégral

(1)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Test de Kr uskal-W allis

FrédéricBertrand1 &MyriamMaumy1 1IRMA,UniversitédeStrasbourg France DUS2 20-06-2011 FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testsnonlibresdedistribution Certainstestsstatistiquesnesontvalablesquesouscertaines conditionsconcernantladistributiondelaoulesvariable(s). Exemples LetestdeStudentimposequelesdeuxvariablessontissues d’unedistributionnormale,l’analysedelavarianceégalement. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(2)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testslibresdedistribution D’autrestestsaucontrairesontvalablesindépendammentde toutedistribution.Nouslesappelonslestests«libresde distribution»(distribution-freetests). Exemples C’estlecasdutestduKhi-deux,dutestdessignes,oudutest ducoefficientdeSpearman. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testsparamétriques Certainstestsontpourbutdemontreruneégalitésurcertains paramètres:cesontlestestsparamétriques. Exemplesdeparamètres 1Lamoyenne(testdecomparaisondedeuxmoyennesou plus), 2lavariance(testdecomparaisondedeuxvariancesou plus), 3etc. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testsnonparamétriques D’autresteststestentdeshypothèsesplusgénérales:cesont lestestsnonparamétriques. Exemples 1Uneégalitédelois, 2l’indépendanceentredeuxvariablesqualitatives, 3etc. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Unequestionnaturelle:queltestchoisir? Habituellement,lestestsparamétriquessontpluspuissants. Parconséquent,ilsserontchoisisplutôtquelestestsnon paramétriques. Demêmelestestsnonlibressontgénéralementplusefficaces quelestestslibres.Cependant,ilssontaussiplus contraignants,carilfautvérifierlesconditionsd’applicationqui sontplusnombreusesdanscecas. Onchoisiragénéralementuntestlibreounonparamétrique lorsque 1lesconditionsd’applicationdutestnesontpasvérifiées 2ouilestimpossibledevérifiercesconditions. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(3)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Conditionsd’application

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Conditionsd’application Introduction Nousobservons,demanièreindépendante,unevariable aléatoireXdeloicontinue,surk>3populations,ousurune populationdiviséeenk>3sous-populations. Noussupposonsainsiquenousdisposonsdekéchantillons aléatoiresindépendants(X1,1,...,X1,n1),...,(Xk,1,...,Xk,nk) etdek>3sériesd’observations(x1,1,...,x1,n1)pourla première,...,(xk,1,...,xk,nk)pourladernière.Nousnotons Li(X)laloidelavariablealéatoireXsurla(sous-)population d’ordreiavec16i6k. Sansfaired’hypothèsesspécifiques,letestde Kruskal-Wallisnepermetpasdetesterl’égalitédes moyennesnicelledesmédianes. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Conditionsd’application Hypothèsesdutest LetestdeKruskal-Wallisestutilisépourtesterleshypothèses suivantes: H0:L1(X)=···=Li(X)=···=Lk(X) contre H1:LesloisL1(X),...,Lk(X)nesontpastoutesidentiques. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(4)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest Statistiquedetest Calculons: 1lerangRi,jdeXi,jparmilesnvaleurs; 2puislasommedesrangsassociéeàchaqueéchantillon: Ri,=niX j=1Ri,j; 3lamoyennedesrangsdechaqueéchantillon: Ri,=Ri,/ni. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest Statistiquedetest(suite) LastatistiquedeKruskal-WallisKWnprendencomptel’écart entrelamoyennedesrangsdechaqueéchantillonetla moyennedetouslesrangs,quivaut(n+1)/2: KWn=12 n(n+1)

kX i=1ni Ri,−n+1 2

2 =12 n(n+1)

kX i=1Ri,2 ni−3(n+1). FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest Propriétés Lorsquel’hypothèsenulleH0estvraie,lavariablealéatoire KWnalestroispropriétéssuivantes. 1Pouri=1,...,k,Wi=niRi,estlastatistiquedeWilcoxon quicomparelei−èmetraitementauxk−1autres traitements. Sousl’hypothèsenulleH0,nousendéduisonsque E(Wi)=ni(n+1)/2etVar(Wi)=ni(n−ni)(n+1)/12. Ainsiparconséquent,nousavons: KWn=1 n

kX i=1(n−ni)(Wi−E(Wi))2 Var(WiFrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest Propriétés(suite) 2(Suite)Nouscalculonsalorsl’espéranceetlavariancede KWnsousl’hypothèsenulleH0: E(KWn)=k−1, Var(KWn)=2(k−1)−2 3k2 −6k+n(2k2 −6k+1) 5n(n+1) −6 5

k X i=11 ni· 3IlestpossiblededéterminerladistributiondeKWnbien quelecalculsoitcomplexe.Elleestdonctabuléepourles faiblesvaleursdesni. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(5)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest Règlededécisionetconclusiondutest Premiercas:L’undeseffectifsni,16i6k,estinférieur ouégalà4,.Pourunseuildonnéα,destablesdelaloide Kuskal-Wallisnousfournissentunevaleurcritiquecα.Alors nousdécidons: siKWn(obs)>cαH1estvraie, siKWn(obs)<cαH0estvraie. Leniveaudesignificationréeldutestestgénéralement strictementinférieuràα. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Statistiquedetest Règlededécisionetconclusiondutest Règlededécisionetconclusiondutest(suite) Secondcas:Sini>5,pourtout16i6k,nousutilisons l’approximationKWn≈χ2 (k−1).Pourunseuildonnéα, destablesdelaloiduχ2 nousfournissentunevaleur critiquecαtellequePH0(−cα<Zn1,n2<cα)=1−α.Alors nousdécidons: siKWn(obs)>cαH1estvraie, siKWn(obs)<cαH0estvraie. LorsquenousrejetonsH0,nousdécidonsqueH1estvraie avecunrisqued’erreurdepremièreespèceα. LorsquenousconservonsH0,c’estavecunrisqued’erreur dedeuxièmeespèceβ. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Présenced’exæquodanslesobservations:laméthodedes rangsmoyens Àchaquenombreappartenantàungrouped’exæquonous attribuonslerangmoyendugroupeauquelilappartientpuis nousdéterminonslasommeT=P

h l3 (t−t)oùtdésignelell=1l nombred’élémentsdul−èmegrouped’exæquo.Ilestd’usage ? desubstitueràKWlavariableKWdéfiniepar:nn KWn? KW=.nT 1− 3n−n FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(6)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application TestdeSteel-Dwass-Critchlow-Fligner Wni,ni0estlastatistiquedeWilcoxonquicomparelei−ème traitementaui0 −èmetraitement. Lesobservationsdesdeuxgroupesieti0 sontordonnéespuis regroupéesenhclassesd’exæquoCj,16j6h. Notonsdjlenombred’exæquodelaclasseCjet mi,i0=ni+ni0. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application TestdeSteel-Dwass-Critchlow-Fligner(suite) Nousdécidonsqu’auseuilglobalαdeuxloisLi(X)etLi0(X), parmilesk(k1)comparaisonsquenousallonsfaire,sont significativementdifférentessi:

n(m0+1)ii,i W−n,n0ii2

>q0 (k;+∞;1−α)r nini0(mi,i0+1) 24 ×v u u u t 1−P h j3 d−dj=1j 3 m−m00i,ii,i

  oùq0 (k;+∞;1−α)estlequantiled’ordre1−αpourlaloidu maximumdumodulestudentisépourkmoyenneset+∞ degrésdeliberté. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application TestdeSteel-Dwass-Critchlow-Fligner(suite) Contrairementauxtroisautresapprochesprésentéesci-après, letestSteel-Dwass-Critchlow-Flignern’estpasqu’une procéduredecomparaisonsmultiples:c’estunealternative complèteautestdeKruskal-Wallis. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(7)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Autrestestsdecomparaisonsmultiples Sinousrejetonsl’hypothèsenulleH0,nousnousdemandons quellessontlesloisLi(X)quidiffèrent. Lesformulesci-aprèssontvalablesenabsenceouen présenced’exæquo.Enabsenced’exæquo,leterme 1−T/(n3 −n)estégalà1. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application ApplicationdelaméthodedeSheffé Nousdécidonsqu’auseuilαdeuxloisLi(X)etLi0(X)sont significativementdifférentessi: Ri,−Ri0,>q χ2 (k−1;1−α)s n(n+1) 12

1−T n3 −n

×s 1 ni+1 ni0, oùχ2 (k−1;1−α)estlequantiled’ordre1−αpourlaloiduχ2 àk−1degrésdeliberté. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Applicationdel’inégalitédeBonferroni Nousdécidonsqu’auseuilglobalαdeuxloisLi(X)etLi0(X), parmilesk(k1)comparaisonsquenousallonsfaire,sont significativementdifférentessi: Ri,−Ri0,>u 1−α k(k−1)s n(n+1) 12

1−T n3 −n

×s 1 ni+1 ni0, oùu(1−α/(k(k−1)))estlequantiled’ordre1−α/(k(k−1)) pourlaloinormalecentrée-réduite. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Remarque Ils’agitd’uneapplicationdesinégalitésdeBonferroni.Cette procédureestpluspuissantequelaprécédente. Ilestégalementpossibled’utiliseruneapprocheséquentielle commelaprocéduredeHolm-Bonferroni(testdeDunn)oude Holm-Sidak. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(8)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application AnaloguedelaméthodedeTukey-Kramer Nousdécidonsqu’auseuilglobalαdeuxloisLi(X)etLi0(X), parmilesk(k1)comparaisonsquenousallonsfaire,sont significativementdifférentessi: Ri,−Ri0,>q(k;+∞;1−α)s n(n+1) 12 1−T n3 −n

×s 1 2 1 ni+1 ni0 , oùq(k;+∞;1−α)estlequantiled’ordre1−αpourlaloide l’étenduestudentiséepourkmoyenneset+∞degrésde liberté. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Remarque Ils’agitd’uneprocédureanalogueàcelledeTukey-Kramer danslecasparamétriqueetvalideasymptotiquement.Elleest généralementpluspuissantequelesdeuxapproches précédentes. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application

Sommaire

1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Application Desforestiersontréalisédesplantationsd’arbresentrois endroits. Plusieursannéesplustard,ilssouhaitentsavoirsilahauteur moyennedesarbresestidentiquedanslestroisforêts. Chacunedesforêtsconstitueunepopulationetdanschacune d’entreelles,unéchantillond’arbresesttiréausort.Puisla hauteurdechaquearbreestmesuréeenmètres.Letableau ci-aprèsdonnelesvaleursdesmesuresdehauteurainsique lesmoyennesetlesvariancescorrigéesestiméesdanschacun desgroupes. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(9)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Données Forêt1Forêt2Forêt3 23,418,922,5 Données24,421,122,9 expérimentales24,621,123,7 (enmètres)24,922,124,0 25,022,524,0 26,223,524,5 Moyennes24,75021,53323,600 Variancescorrigées0,8312,4870,568 LaFigure1correspondauxboîtesàmoustachesdelahauteur enfonctiondestroisforêts. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Représentationgraphique 123

20 22 24 26

@ @

@ FIGURE:Boîtesàmoustaches(àgauche)–Comparaisonsmultiples (àdroite) FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Statistiquedutest Noussommesenprésenced’exæquo,nousdevonsdonc utiliserlastatistiquedetestKW? nàlaplacedelastatistiquede testKWn. NouscalculonslavaleurdeKW? nsurl’échantillon: KW? n(obs)=11,51. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Règlededécisionàl’aided’unevaleurcritique Pourunseuilα=5%lavaleurcritiqued’unKhi-deuxà2 degrésdeliberté,estc0,05=5,99.CommeKW? n(obs)6c0,05, nousdécidonsderejeterl’hypothèsenulleH0,etque l’hypothèsealternativeH1estvraie.Ilyauneinfluence significative,auseuilα=5%,delaforêtsurlahauteurdes arbres.Lerisqueassociéàcettedécisionestunrisquede premièreespècequivautα=5%. Remarque LavaleurdeKWn(obs)estégaleà11,48.Nousremarquons ladifférenceapportéeparlacorrectionpourprendreencompte lesexæquo. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

(10)

Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Règlededécisionàl’aided’unep-valeur Enutilisantunlogicieldestatistiquenouscalculonslap-valeur dutestdeKruskal-Wallis.Ilfautbienvérifierqu’elletient comptedesexæquo.Ellevautdanscas0,003. Commelap-valeurest60,05,nousdécidons,auseuil α=5%,derejeterl’hypothèsenulleH0,etquel’hypothèse alternativeH1estvraie.Ilyauneinfluencesignificative,au seuilα=5%,delaforêtsurlahauteurdesarbres.Lerisque associéàcettedécisionestunrisquedepremièreespècequi vautα=5%. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis

Références

Documents relatifs

Au niveau de certaines d’entre elles, des protections localisées (petits murets en maçonnerie) ont été aménagées, mais ces mesures restent insuffisantes pour leur protection.

Helio, je parle français 58 PRISE EN MAiN: Sony Cinescore

Sans porter atteinte au point 3 suivant, cette assurance ne couvrira aucunement la perte, le dommage, la responsabilité et/ou les frais causés directement ou indirectement,

En s’inspirant de la méthode graphique qui précède pour déterminer le nombre de lots à vendre pour réaliser le bénéfice maximal il suffit de faire varier x de 8 à 17 et

1. une contrainte de compression dont la valeur est très inférieure à la résistance en compression du matériau. une contrainte de traction par flexion, dont la valeur peut

Le terme réseau peut également être utilisé pour décrire la façon dont les machines d'un site sont interconnectées.. C'est le cas lorsque l'on dit que les machines d'un site (sur

[r]

Cette fois c'est le circuit de séparation du tweeter doit être suivi ou précédé d'un filtre passe haut équivalent au filtre fictif provoquant l'effet passe haut du boomer.