Q uel qu es te sts no n pa ram ´etri que s.
1 1.Lestestsnonparam´etriquessurun´echantillon Danscettesectionnousnousint´eressons`adeuxtestsnonparam´etriques: –letestdusigneet –letestdesrangssign´es. Nousutiliseronsdepr´ef´erenceletestdesrangssign´esd`esquelesconditionsdesonutili- sationsontremplies,sapuissance´etantalorssup´erieure`acelledutestdusigne. 1.1.Testdusigne Soitun´echantillonind´ependantetidentiquementdistribu´eX1,...,Xnd’uneloicontinue Fdontlavaleurm´edianeestnot´eemeetlamoyenneµ. Letestdusignepermetdetesterleshypoth`esessuivantes. Hypoth`eses: H0:me=0oudefa¸con´equivalenteP[Xi>0]=1 2 contre H1:me6=0oudefa¸con´equivalenteP[Xi>0]6=1 2. Remarque1.1.Laformulationdecetestestbiensˆurlaformulationd’untestbilat´eral. Nouspouvonsenvisagerlesdeuxtestsunilat´erauxcorrespondants.` Acemomentl`a,la formulationdel’hypoth`esealternativeHestdiff´erenteets’´ecritsoit:1 10 H:P[X>0]<i1 2 soit 100 H:P[X>0]>.i1 2 Remarque1.2.Plusg´en´eralementcetestpermetdetesterl’hypoth`esenulle H:m=moudefa¸con´equivalenteP[X>0]=p0e0i contre H:m6=moudefa¸con´equivalenteP[X>0]6=p1e0i o`umestunnombrer´eeletpestuneconstantecompriseentre0et1,0 ouencore,danslaversionunilat´erale,contrel’hypoth`esealternative 1Lesr´ef´erences[2],[3]et[1]ayantservi`al’´elaborationdecedocumentsontmentionn´eesdansla bibliographie. 1
Fr´ed
´eric
BertrandetMyriamMaumy
´ Eco
ledoctoraleSVS-Hiver2010 H0 1:me<m0 ouencore,danslaversionunilat´erale,contrel’hypoth`esealternative H00 1:me>m0. Pourcelailsuffitdeconsid´ererl’´echantillonZ1,...,ZnavecZi=Xi−m0etdelui appliquerletestd´ecritci-dessous. Statistique:Snd´esignelenombredevariablesXi,16i6n,quiprennentunevaleur positive. Propri´et´es1.1.Lorsquel’hypoth`esenulleH0estvraie,lavariableal´eatoireSnsuit exactementuneloibinomialeB(n,p)deparam`etresnetp. Concr`etementcettehypoth`esenulleH0signifiequel’effectifdel’´echantillonconsid´er´eest faibledevantceluidelapopulationdontilestissu. Remarque1.3.Nouspourronsprendrecommetaillelimitedes´echantillonsdontles effectifssontinf´erieurs`aunefractionde1/10delapopulation.Danscecasnouspouvons assimilerlestiragesr´ealis´esici`adestiragesavecremise. Casleplussouventutilis´e:p=1/2.Nousnousproposonsdetester: Hypoth`eses: H0:P[Xi>0]=1 2 contre H1:P[Xi>0]6=1 2. Statistique:Snd´esignelenombredevariablesXi,16i6n,quiprennentunevaleur positive. Propri´et´es1.2.Lorsquel’hypoth`esenulleH0estvraie,lavariableal´eatoireSnalestrois propri´et´essuivantes: 1.Lavariableal´eatoireSnsuituneloibinomialeB(n,1/2)deparam`etresnet1/2.De cefait,d´ecoulelesdeuxpropri´et´essuivantes: 2.E[Sn]=n/2. 3.Var[Sn]=n/4. Cettedistributionbinomialeestsym´etrique.Pourngrand(n>40),nouspouvonsutiliser l’approximationnormaleaveccorrectiondecontinuit´e: PH0[Sn6h]=PH0[Sn>n−h]=Φ(2h+1−n) √ n o`uΦestlafonctionder´epartitiondelaloinormalecentr´eer´eduite. 2
Fr´ed
´eric
BertrandetMyriamMaumy
´ Eco
ledoctoraleSVS-Hiver2010 D´ecision1.1.Pourunseuildonn´eα(=5%=0,05eng´en´eral),nouscherchonsle plusgrandentiers? αtelqueP[Y6s? α]6α/2o`uYsuituneloibinomialeB(n,1/2)de param`etresnet1/2.Alorsnousd´ecidons: H1estvraiesiSn,obs/∈]s? α,n−s? α[ H0estvraiesiSn,obs∈]s? α,n−s? α[. Remarque1.4.Leniveaudesignificationr´eeldutestestalors´egal`a2P[Y6s? α]qui estg´en´eralementdiff´erentdeα. 1.2.Testdesrangssign´esdeWilcoxon Soitun´echantillonind´ependantetidentiquementdistribu´eX1,...,Xnd’uneloicontinue Fdontlavaleurm´edianeestnot´eemeetlamoyenneµ. Letestdesrangssign´espermetdetesterleshypoth`esessuivantes. Hypoth`eses: H0:LaloicontinueFestsym´etriqueen0 contre H1:LaloicontinueFn’estpassym´etriqueen0. Deplus,sinoussavonsquelaloicontinueFestsym´etrique,alorsletestdesrangssign´es deWilcoxondevient H0:µ=µ0 contre H1:µ6=µ0. Iciµ0estunnombrer´eeletcejeud’hypoth`esespermetalorsdes’int´eresser`alamoyenne delaloicontinueF. 1.2.1.Caso`uiln’yapasd’exæquo. Soitx1,...,xnnr´ealisationsdel’´echantillonpr´ec´edent.` Achaquexinousattribuonsle rangra iquicorrespondaurangde|xi|lorsquequelesnr´ealisationssontclass´eesparordre croissantdeleursvaleursabsolues. Statistique:Nousd´eterminonsalorslasommewdesrangsra idesseulesobservations positives.LastatistiqueW+ ndesrangssign´esdeWilcoxonestlavariableal´eatoirequi prendpourvaleurlasommew.Parcons´equent,lastatistiqueW+ ndesrangssign´esde Wilcoxons’´ecrit W+ n=X 16i6n Xi>0
Ra i. 3
Fr´ed
´eric
BertrandetMyriamMaumy
´ Eco
ledoctoraleSVS-Hiver2010 Propri´et´es1.3.Lorsquel’hypoth`esenulleH0estvraie,lavariableal´eatoireW+ nales troispropri´et´essuivantes: 1.W+ nestsym´etriqueautourdesavaleurmoyenneE[W+ n]=n(n+1)/4. 2.Var[W+ n]=n(n+1)(2n+1)/24. 3.Lavariableal´eatoireW+ nesttabul´eepourdefaiblesvaleursden.Pourn>15,nous avonsl’approximationnormaleaveccorrectiondecontinuit´e: P W+ n6w =Φw+0,5−n(n+1)/4 p n(n+1)(2n+1)/24! o`uΦestlafonctionder´epartitiondelaloinormalecentr´eer´eduite. D´ecision1.2. –Premiercas:Pourtesterl’hypoth`esenulle«H0:LaloicontinueFestsym´etrique en0»contrel’hypoth`esealternative«H1:LaloicontinueFn’estpassym´etrique en0»pourunseuildonn´eα,nouscherchonsl’entierwαtelqueP[W+ n6wα]≈α/2. Alorsnousd´ecidons: H1estvraiesiW+ n,obs/∈]wα+1,n(n+1)/2−wα−1[, H0estvraiesiW+ n,obs∈]wα+1,n(n+1)/2−wα−1[. –Secondcas:Pourtesterl’hypoth`esenulle«H0:µ=µ0»,nousintroduisonsl’´echan- tillonZ1,...,ZnavecZi=Xi−µ,16i6n. 1.2.2.Caso`uilyadesexæquo. Lesobservationsx1,...,xnpeuventpr´esenterdesexæquoetafortiorileursvaleurs absolues.Ils’agitenparticulierducaso`ulaloiFestdiscr`ete.Deuxproc´eduressontalors employ´ees. •M´ethodeded´epartitiondesexæquo Nousd´epartageonslesexæquo`al’aided’unetabledenombresal´eatoires.
` Acha- cunedesvaleurs´egalesnousassocionsunentierauhasardpuisnousaffectons,par ordrecroissantdecesentiers,unrangdiff´erent`achaqueobservation.Ainsichacun desrangsdesobservationsestdiff´erentetnouspouvonsdirectementappliquerles r´esultatsduparagraphepr´ec´edent. •M´ethodedesrangsmoyens ?aEnassociant`alavariableXsonrangmoyenRdansleclassementdesvaleursii absoluesetensommanttouslesrangspourlesquelsX>0nousobtenonslai statistique: X +?W=n 16i6n X>0i
Ra? i. Lesvaleursabsoluesobserv´ees|x1|,...,|xn|´etantordonn´eespuisregroup´eesen classesd’exæquo,C0pourlapremi`ereclassequiestconstitu´eedesnombres|xi| 4
Fr´ed
´eric
BertrandetMyriamMaumy
´ Eco
ledoctoraleSVS-Hiver2010 nuls,s’ilenexiste,etCj,16j6hpourlesautresnombres,certainesclassesCj pouvantcomporterunseul´el´ement,sicet´el´ementn’apasd’exæquo,notonsdjle nombred’exæquodelaclasseCj.Nousavons d0+hX j=1dj=n. Sousl’hypoth`esenulleH0etsin>15,ilestd’usaged’utiliserl’approximation normale W+? n−m? σ?≈N(0,1) o`u m?=1 4(n(n+1)−d0(d0+1)) et (σ?)2 =1 24(n(n+1)(2n+1)−d0(d0+1)(2d0+1))−1 48
hX j=1d3 j−dj . Danslecaso`unousutilisonscettem´ethodedesrangsmoyens,nousnepouvonspas utiliserlestablesstatistiquesusuellesquiconcernentladistributiondelavariable al´eatoireW+ n. 2.Lestestsnonparam´etriquessurdeux´echantillons 2.1.Les´echantillonssontind´ependants:TestdeMann-Whi- tney LetestdeMann-Whitneya´et´eintroduiten1947ind´ependammentdutestdeWilcoxon delasommedesrangsquia´et´e´elabor´een1945.Cesdeuxtests,d’uneformulationdif- f´erente,sontenfait´equivalents.Enfonctiondel’outilinformatiquequevousutiliserez, lad´enominationdutestpourraˆetrel’unedessuivantes:TestdeMann-Whitney,Testde WilcoxondelasommedesrangsouencoreTestdeMann-Whitney-Wilcoxon.L’approche deMannetWhitneyparaˆıtsouventplusfacile`amettreenpratique.Sivousdevezutiliser unetable,ilvousfaudrad´eterminerquellea´et´el’approcheutilis´eeparlelogicieletvous servirdelatableappropri´ee. Nousobservons,demani`ereind´ependante,unevariableY,continue,surdeuxpopulations, ousurunepopulationdivis´eeendeuxsous-populations.NousnotonsLilaloideYsur la(sous-)populationd’ordrei. Nousallonspr´esenterletestdeshypoth`esessuivantes. Hypoth`eses: H0:LesdeuxloisLisont´egalesouencoredefa¸con´equivalente:L1=L2 contre H1:LesdeuxloisLinesontpas´egalesouencoredefa¸con´equivalente:L16=L2. 5
Fr´ed
´eric
BertrandetMyriamMaumy
´ Eco
ledoctoraleSVS-Hiver2010 2.1.1.Caso`uiln’yapasd’exaequo. Statistique:Pourobtenirlastatistiquedutestnot´eeUn1,n2eng´en´eral,nousdevons proc´eder`ades´etapessuccessives: 1.Ennouspla¸cantsousl’hypoth`esenulleH0,nousclassonsparordrecroissantl’en- sembledesobservationsdesdeux´echantillons(x1,...,xn1)et(y1,...,yn2)detaille respectiven1etn2. 2.Nousaffectonslerangcorrespondant. 3.Nouseffectuonslasommedesrangspourchacundesdeux´echantillons,not´esR1et R2. 4.Nousend´eduisonslesquantit´esU1etU2quisecalculentainsi: (2.1)U1=n1×n2+n1(n1+1) 2−R1 et (2.2)U2=n1×n2+n2(n2+1) 2−R2=n1×n2−U1. LapluspetitedesdeuxvaleursU1etU2,not´eeUn1,n2,estutilis´eepourtesterl’hypoth`ese nulleH0. Propri´et´es2.1.Lorsquel’hypoth`esenulleH0estvraie,lavariableal´eatoireUn1,n2ales troispropri´et´essuivantes: 1.E[Un1,n2]=(n1×n2)/2. 2.Var[Un1,n2]=(n1×n2)(n1+n2+1)/12. 3.Lavariableal´eatoireUn1,n2esttabul´eepourdefaiblesvaleursden.Pourn>20, nousavonsl’approximationnormale: P[Un1,n26u]=Φu−(n1×n2)/2 p (n1×n2)(n1+n2+1)/12! o`uΦestlafonctionder´epartitiondelaloinormalecentr´eer´eduite. D´ecision2.1. –Premiercas:Silestaillesn1oun2sontinf´erieures`a20,alors,pourunseuildonn´eα (=5%=0,05eng´en´eral),latabledeMann-Whitneynousfournitunevaleurcritique c.Alorsnousd´ecidons: H1estvraiesiUn1,n2,obs6c, H0estvraiesiUn1,n2,obs>c. –Secondcas:Silestaillesn1etn2sontsup´erieures`a20,alorslaquantit´eestd´ecrite approximativementparuneloinormaleetnousutilisonsalorsletestdel’´ecartr´eduit: Zn1,n2=Un1,n2−(n1×n2)/2 p (n1×n2)(n1+n2+1)/12. Pourunseuildonn´eα(=5%=0,05eng´en´eral),latabledelaloinormalecentr´ee r´eduitenousfournitunevaleurcritiquec.Alorsnousd´ecidons: H1estvraiesiZn1,n2,obs>c, H0estvraiesiZn1,n2,obs<c. 6