• Aucun résultat trouvé

Biologie et Mod´elisation Tests d’hypoth`ese Marc Bailly-Bechet, d’apr`es un document de J. R. Lobry

N/A
N/A
Protected

Academic year: 2022

Partager "Biologie et Mod´elisation Tests d’hypoth`ese Marc Bailly-Bechet, d’apr`es un document de J. R. Lobry"

Copied!
32
0
0

Texte intégral

(1)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Biologie et Mod´ elisation

Tests d’hypoth`ese

Marc Bailly-Bechet, d’apr`es un document de J. R. Lobry

Universit´e Claude Bernard Lyon I – France

Document disponible `a :

http://pbil.univ-lyon1.fr/members/mbailly

1 [email protected] Test d’hypoth`ese

(2)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Table des mati` eres

Introduction

Risque de premi`ere et deuxi`eme esp`ece

D´emarche scientifique et effets de taille

2 [email protected] Test d’hypoth`ese

(3)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Objectif

De tr`es nombreux tests d’hypoth`ese sont d´efinis dans :

apropos("test")[1:30]

[1] "ansari.test" "bartlett.test"

[3] "binom.test" "Box.test"

[5] "chisq.test" "cor.test"

[7] "file_test" "fisher.test"

[9] "fligner.test" "friedman.test"

[11] "kruskal.test" "ks.test"

[13] "mantelhaen.test" "mauchly.test"

[15] "mcnemar.test" "mood.test"

[17] "oneway.test" "pairwise.prop.test"

[19] "pairwise.t.test" "pairwise.wilcox.test"

[21] "poisson.test" "power.anova.test"

[23] "power.prop.test" "power.t.test"

[25] "PP.test" "prop.test"

[27] "prop.trend.test" "quade.test"

[29] "shapiro.test" "testPlatformEquivalence"

Ici, on ne cherche pas `a les passer en revue, ni `a donner des recettes de cuisine, mais `a illustrer quelques notions g´en´erales avec des tests na¨ıfs.

3 [email protected] Test d’hypoth`ese

(4)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Une exp´ erience

On jette une pi`ece cent fois :

experience <- sample(c("P","F"), 100, replace = T) experience

[1] "F" "F" "F" "P" "F" "F" "F" "P" "P" "F" "P" "P" "P" "F" "F" "P" "F" "F"

[19] "F" "P" "P" "F" "F" "P" "F" "P" "P" "F" "F" "F" "F" "F" "F" "F" "P" "P"

[37] "F" "F" "P" "P" "P" "F" "F" "P" "F" "P" "P" "F" "P" "F" "F" "P" "P" "F"

[55] "F" "P" "F" "P" "P" "P" "F" "P" "F" "P" "F" "F" "P" "P" "F" "P" "F" "F"

[73] "F" "F" "F" "P" "P" "F" "P" "F" "F" "F" "F" "F" "P" "F" "F" "F" "F" "P"

[91] "F" "P" "F" "F" "P" "P" "P" "F" "P" "F"

Question : la pi`ece est elle truqu´ee ?

4 [email protected] Test d’hypoth`ese

(5)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Hypoth` ese nulle et hypoth` ese alternative

On noteH0 l’hypoth`ese nulle etH1 l’hypoth`ese alternative : H0 La pi`ece n’est pas truqu´ee :P(”P”) = 12

H1 La pi`ece est truqu´ee :P(”P”)6= 12

Un test d’hypoth`ese c’est une r`egle de d´ecision qui permet, au vu des r´esultats d’une exp´erience, de trancher entreH0 etH1.

5 [email protected] Test d’hypoth`ese

(6)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exemple d’un test d’hypoth` ese na¨ıf

R`egle de d´ecision :

I Si le nombre de ”P” est ´egal au nombre de ”F” je d´ecide que H0 est vraie.

I Sinon, je d´ecide queH0 est fausse.

Application `a notre exp´erience simul´ee :

(ndp <- sum(experience == "P")) [1] 42

(ndf <- sum(experience == "F")) [1] 58

resultat <- ifelse(ndp == ndf, TRUE, FALSE) resultat

[1] FALSE

6 [email protected] Test d’hypoth`ese

(7)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exemple de test d’hypoth` ese

Remarques :

I On n’utilise pas en pratique ce test d’hypoth`ese, mais il permet d’illustrer des notions valables pour tousles tests d’hypoth`ese.

I Le r´esultat du test d´epend de l’exp´erience.

I Sous rien n’est plus facile que de simuler des exp´eriences.

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 43

(ndf <- sum(experience == "F")) [1] 57

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] FALSE

7 [email protected] Test d’hypoth`ese

(8)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 3

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 54

(ndf <- sum(experience == "F")) [1] 46

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] FALSE

8 [email protected] Test d’hypoth`ese

(9)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 4

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 53

(ndf <- sum(experience == "F")) [1] 47

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] FALSE

9 [email protected] Test d’hypoth`ese

(10)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 5

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 47

(ndf <- sum(experience == "F")) [1] 53

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] FALSE

10 [email protected] Test d’hypoth`ese

(11)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 6

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 42

(ndf <- sum(experience == "F")) [1] 58

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] FALSE

11 [email protected] Test d’hypoth`ese

(12)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 7

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 51

(ndf <- sum(experience == "F")) [1] 49

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] FALSE

12 [email protected] Test d’hypoth`ese

(13)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 8

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 50

(ndf <- sum(experience == "F")) [1] 50

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] TRUE

13 [email protected] Test d’hypoth`ese

(14)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exp´ erience n ° 9

experience <- sample(c("P","F"), 100, replace = T) (ndp <- sum(experience == "P"))

[1] 50

(ndf <- sum(experience == "F")) [1] 50

(resultat <- ifelse(ndp == ndf, TRUE, FALSE)) [1] TRUE

14 [email protected] Test d’hypoth`ese

(15)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Table des mati` eres

Introduction

Risque de premi`ere et deuxi`eme esp`ece

D´emarche scientifique et effets de taille

15 [email protected] Test d’hypoth`ese

(16)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Un test peut prendre la mauvaise d´ ecision

I Le probl`eme avec notre test d’hypoth`ese est que nous savons (voir la documentation de la fonction sample()) que la pi`ece n’est pas truqu´ee. Nous savons queH0 est vraie et pourtant notre test d´ecide souvent qu’elle est fausse ! ! !

I C’est tout a fait normal, et mˆeme in´evitable : on ne peut pas prendre de d´ecisions sans prendre le risque de se tromper.

I Ce que l’on aime bien c’est quantifier le risque.

16 [email protected] Test d’hypoth`ese

(17)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Probabilit´ e de prise de la mauvaise d´ ecision

Donc notre test se trompe. Mais se trompe-t-il souvent ? Faisons beaucoup d’exp´eriences pour estimer la fr´equence de ces mauvaises d´ecisions :

bcpexp <- function(nexp = 1000, probaP = 0.5){

res <- logical(nexp) for(i in 1:nexp){

x <- sample(c("P","F"), 100, replace = T, prob = c(probaP, 1-probaP)) res[i] <- ifelse(sum(x=="P") == 50, T, F)

}

return(sum(res)) }

(nok <- bcpexp()) [1] 72

Donc, sur 1000 exp´eriences avec une pi`ece non truqu´ee, notre test a d´ecid´e 72 fois avec raison queH0 ´etait vraie, et d´ecid´e 928 fois `a tort queH0 ´etait fausse.On appelle risque de premi`ere esp`ece (souvent not´e α) la probabilit´e de rejet `a tort de l’hypoth`ese nulle.

Ici on aα≈0.93.

17 [email protected] Test d’hypoth`ese

(18)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Et avec une pi` ece truqu´ ee ?

Supposons que notre pi`ece soit l´eg`erement truqu´ee, avec par exempleP(”P”) = 0.55. Comment se comporte notre test ?

(npasok <- bcpexp(probaP = 0.55)) [1] 41

Donc, sur 1000 exp´eriences avec une pi`ece truqu´ee, notre test a d´ecid´e 41 fois `a tort que H0 ´etait vraie, et d´ecid´e 959 fois `a raison queH0 ´etait fausse. On appelle risque de deuxi`eme esp`ece

(souvent not´e β) la probabilit´e d’acceptation `a tort de l’hypoth`ese nulle. Ici on aβ ≈0.04.

18 [email protected] Test d’hypoth`ese

(19)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

L’alternative H

1

est plus complexe que H

0

Pour estimerβ nous avons choisi une alternative particuli`ere telle queP(”P”) = 0.55. MaisH1 englobe beaucoup plus de cas, par exempleP(”P”) = 0.6,P(”P”) = 0.7, etc. AvecP(”P”) = 0.7 :

(npasok <- bcpexp(probaP = 0.7)) [1] 0

Sur 1000 exp´eriences avec une pi`ecetr`estruqu´ee, notre test a d´ecid´e 0 fois `a tort queH0 ´etait vraie, et d´ecid´e 1000 fois `a raison queH0 ´etait fausse. Ici on a β ≈0. Plus la r´ealit´e s’´eloigne de H0, plus il est facile de rejeter l’hypoth`ese nulle. On ne maˆıtrise pas bienβ.

19 [email protected] Test d’hypoth`ese

(20)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Exemples de ”tests” d’hypoth` ese na¨ıfs

R`egles de d´ecision `a la ”Ponce Pilate”1 : PP1 Je d´ecide que la pi`ece n’est pas truqu´ee.

PP2 Je d´ecide que la pi`ece est truqu´ee.

Ce ne sont pas vraiment des tests d’hypoth`ese puisque les

observations ne changent rien `a la d´ecision. Dans ces cas limites on aurait :

PP1 α= 0 β = 1 PP2 α= 1 β = 0

Les tests utilis´es en pratique sont un compromis entre ces deux extrˆemes : on ne peut pas minimiser simultan´ementα et β.

1. Vous pouvez remplacer Ponce Pilate par n’importe quel personnage connu pour ses d´ecisions arbitraires

20 [email protected] Test d’hypoth`ese

(21)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

En r´ esum´ e

r´ ealit´ e inconnue

H

0

H

1

d´ ecision H

0

OK 1 − α Erreur de type II β H

1

Erreur de type I α OK 1 − β

21 [email protected] Test d’hypoth`ese

(22)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

D´ emarche pratique

I On poseH0 et H1.

I On d´ecide de la valeur seuil d’un risque de premi`ere esp`ece

”petit” (par exemple 5 %).

I On consid`ere les r´esultats d’une exp´erience.

I SousH0,l`a ou l’on sait faire des choses, on calcule le risque de premi`ere esp`ece pour le jeu de donn´ees, la fameuse p-value.

I On d´ecide que :

I Si lap-valueest inf´erieure au seuil critique, on rejetteH0

avec un risque de premi`ere esp`ece faible.

I Sinon, on ne rejette pasH0, on l’accepte avec un risque de deuxi`eme esp`ece inconnu.

Notez l’asym´etrie de la d´ecision : les tests ne sont probants qu’au rejet.

22 [email protected] Test d’hypoth`ese

(23)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Table des mati` eres

Introduction

Risque de premi`ere et deuxi`eme esp`ece

D´emarche scientifique et effets de taille

23 [email protected] Test d’hypoth`ese

(24)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Tests et d´ emarche scientifique

Les tests sont utilis´es de mani`ere courante dans les laboratoires scientifiques. Supposons que l’on veuille montrer que les gar¸cons fument plus que les filles.

I On mesure le nombre de cigarettes fum´ees par jour, par des membres des deux sexes.

I Si on observe que, en moyenne, les filles fument plus que les gar¸cons, il ne sert `a rien de faire un test. . .

I Si on observe le contraire, ondoit faire un test, pour v´erifier que l’observation n’est pas dˆue au hasard

24 [email protected] Test d’hypoth`ese

(25)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Le test scientifique

I On pose alors l’hypoth`ese nulleH0 : il n’y a pas de diff´erence entre les deux ´echantillons

I Et l’hypoth`ese alternativeH1 : les gar¸cons fument plus que les filles

I On fait le test.

I Si lap-valueest inf´erieure au seuil de d´ecision α, on va en eduire que la probabilit´e de rejeter `a tortH0 est faible, et on va donc rejeter (`a raison)H0.

I Si lap-valueest trop ´elev´ee, on ne peux pas rejeter H0sans un gros risque de se tromper, donc on ne le fait pas et on accepteH0 par d´efaut.

25 [email protected] Test d’hypoth`ese

(26)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Les effets de taille

Supposons que l’on r´ealise le test mentionn´e pr´ecedemment, sur de fausses donn´ees, pour comprendre un ph´enom`ene int´eressant.

Commen¸cons `a n= 1000

fum_g <- rnorm(mean=3.35,sd=3.12,n=1000) fum_f <- rnorm(mean=2.54,sd=2.34,n=1000) t.test(fum_g,fum_f)

Welch Two Sample t-test data: fum_g and fum_f

t = 6.9494, df = 1819.5, p-value = 5.093e-12

alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

0.6177599 1.1035530 sample estimates:

mean of x mean of y 3.349721 2.489065

26 [email protected] Test d’hypoth`ese

(27)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Les effets de taille

n= 500

fum_g <- rnorm(mean=3.35,sd=3.12,n=500) fum_f <- rnorm(mean=2.54,sd=2.34,n=500) t.test(fum_g,fum_f)

Welch Two Sample t-test data: fum_g and fum_f

t = 6.3419, df = 940.87, p-value = 3.518e-10

alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

0.7651977 1.4509869 sample estimates:

mean of x mean of y 3.713442 2.605350

27 [email protected] Test d’hypoth`ese

(28)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Les effets de taille

n= 100

fum_g <- rnorm(mean=3.35,sd=3.12,n=100) fum_f <- rnorm(mean=2.54,sd=2.34,n=100) t.test(fum_g,fum_f)

Welch Two Sample t-test data: fum_g and fum_f

t = 1.5889, df = 190.6, p-value = 0.1137

alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

-0.1548315 1.4376320 sample estimates:

mean of x mean of y 3.383363 2.741963

28 [email protected] Test d’hypoth`ese

(29)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Les effets de taille

n= 20

fum_g <- rnorm(mean=3.35,sd=3.12,n=20) fum_f <- rnorm(mean=2.54,sd=2.34,n=20) t.test(fum_g,fum_f)

Welch Two Sample t-test data: fum_g and fum_f

t = 0.4211, df = 34.509, p-value = 0.6763

alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

-1.470227 2.239295 sample estimates:

mean of x mean of y 3.067231 2.682697

29 [email protected] Test d’hypoth`ese

(30)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Les effets de taille

Et si la diff´erence est plus grande ?

fum_g <- rnorm(mean=4.35,sd=3.12,n=20) fum_f <- rnorm(mean=2.54,sd=2.34,n=20) t.test(fum_g,fum_f)

Welch Two Sample t-test data: fum_g and fum_f

t = 3.9622, df = 36.943, p-value = 0.0003264

alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:

1.242265 3.842801 sample estimates:

mean of x mean of y 4.627165 2.084632

30 [email protected] Test d’hypoth`ese

(31)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Conclusions

I Un test statistique permet de rejeter ou non une hypoth`ese nulle, c-`a-d. une absence d’effet.

I Deux types d’erreurs sont possibles : l’erreur de type I (rejeter

`

a tort une hypoth`ese simple) et l’erreur de type II (accepter `a tort une hypoth`ese simple).

I Un test statistique ne permet pas toujours de conclure : la taille du jeu de donn´ees, ainsi que lataille de l’effetque l’on cherche `a mesurer, sont des facteurs importants.

31 [email protected] Test d’hypoth`ese

(32)

Introduction Risque de premi`ere et deuxi`eme esp`ece emarche scientifique et effets de taille

Mise en garde

Attention aux situations dans lesquelles vous faˆıtes de nombreux tests – ou dans lesquelles vous v´erifiez une hypoth`ese sur de nombreuses sous-parties de votre ´echantillon : chaque test a des chances de se tromper, donc sur un grand nombre, plusieurs se tromperont !

I Voir par exemple ce qu’il ne faut pas faire :

http://projects.fivethirtyeight.com/p-hacking/

I Pour corriger les erreurs quand on fait de nombreux tests, il existe des m´ethodes : Bonferroni, FDR, FWER.

32 [email protected] Test d’hypoth`ese

Références

Documents relatifs

frequency of learning opportunities. Indeed , visual and statistical analyses indicate an increase in number of learning opportunities offered to children by Educator A

Les résultats de la présente recherche indiquent qu'il semblerait que certains facteurs de la dimension transformationnelle du leadership transformatifjouent un rôle intermédiaire

For instance , the hemibiotrophic rice pathogen M o ry za e accumulates effectors into a lobed structure at the hyphal tip known as a biotrophic interfacial

Premièrement , elle répondra aux intérêts de recherche de notre organisme partenaire , ID Gatineau, qUi sont: I-D'envisager les meilleures pratiques de soutien et

Montrer que la condition initiale et toutes ses d´ eriv´ ees en x = 0 convergent uniform´ ement vers 0, tandis que, pour tout x &gt; 0, la solution trouv´ ee u(x, y) et toutes ses

– Ces réactions sont endergoniques (énergie nécessaire) – La synthèse des protéines et la photosynthèse sont deux – La synthèse des protéines et la photosynthèse sont

Sans pr´ ejuger des sanctions prises ult´ erieurement par le conseil de discipline de l’Universit´ e, toute tentative de copie pendant l’´ epreuve sera sanctionn´ ee par la

Les symptˆ omes de la maladie sont souvent moins importants chez les femmes que chez les hommes, on peut donc estimer que le d´ elai entre l’infection et le traitement est plus