• Aucun résultat trouvé

Introduction `a la biostatistique – Mat 2779

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction `a la biostatistique – Mat 2779"

Copied!
6
0
0

Texte intégral

(1)

L’´et´e 2010

Cours 2 — le 6 mai 2010

2.1. Annonce. Le cours 4 du jeudi 13 mai aura lieu dans la salle de classe usuelle (CBY B202), et pas dans le CUBE.

2.2. Lecture sugg´er´ee. Biostatistique sous la direction de Beauscart, 1.1.6–1.2.4 (pages 20–26). Les notes suivantes sont supplementaires.

2.3. Exemples des ensembles probabilis´es finis.

Exemple 2.1. Si la pi`ece de monnaie est ´equilibr´ee, alors la probabilit´e d’avoir pile est ´egale

`a la probabilit´e d’avoir face, et toutes les deux sont ´egales `a1/2: P(0) =P(1) = 1

2,

et l’espaceS ={0,1}est ´equiprobable. Si la pi`ece est fausse, alors P(0) =p, P(1) =q,

o`u

p+q = 1, et, en g´en´eral,

p6=q.

Exemple 2.2. Pareillement, si le d´e est ´equilibr´e, alors les probabilit´es de tous les chiffres sont ´egales entre eux,

P(i) = 1

6 quel que soiti= 1,2,3,4,5,6, et l’espace fondamental

S ={1,2,3,4,5,6}

est ´equiprobable.

Exemple 2.3. L’ensemble fondamental

S={F, G}

qui correspond `a l’´ev`enement al´eatoire de la naissance d’une fille ou d’un garc¸on, peut ˆetre probabilis´e, par exemple, en posant

P(G) =P(F) = 1 2.

1

(2)

C’est un mod`ele approximatif de la v´erit´e, car d’habitude le nombre des naissances de garc¸ons est sup´erieure au nombre des naissances de filles. Par exemple, en 2005 en France nombre de naissances ´etait 377920 filles et 396680 garc¸ons, c.`a.d., la probabilit´e d’avoir un garc¸on ´etait ´egale `a 51.2 % :

P(G) = 396680

396680 + 377920 ≈0.512...

Exercice 2.4. Soit E = {s1, s2, s3} un ensemble fondamental qui provient d’une certaine exp´erience al´eatoire. Combien d’´ev`enements peut-on envisager sur cet ensemble ?

Il y en a 23 = 8, puisque l’ensemble S contient 3 ´el´ements. Voici la liste compl`ete de toutes les ´ev´enements :

∅,{s1},{s2},{s3},{s1, s2},{s1, s3},{s2, s3},{s1, s2, s3}.

Exercice 2.5. Dans le mˆeme ensemble fondamentalS, d´eterminez les probabilit´es des ´ev`enements

´el´ementairess1, s2, s3 sachant que

P{s1, s2}= 7

12, P{s2, s3}= 3 4.

Le complementaire de{s1, s2}est l’´ev`enement ´el´ementaire{s3}, donc on a P(s3) = 1−P{s1, s2}= 1− 7

12 = 5 12.

Maintenant on a, puisque les ´ev`enementss2 ets3 s’excluent mutuellement, P(s2) =P{s2, s3} −P(s3) = 3

4 − 5 12 = 1

6. Finalement,

P(s1) =P{s1, s2} −P(s2) = 7 12− 1

6 = 5 12.

Remarque 2.6. Si l’ensemble fondamental S est infini, on ne peut pas, en g´en´eral, d´efinir la valeur d’une fonction de probabilit´e pour chaque sous-ensemble de S. Ici, la th´eorie math´ematique devient plus raffin´ee. On sp´ecifie d’abord la famille des sous-ensembles “rai- sonnables” deS(appel´es ensembles bor´eliens),A⊆S, qui joueront le rˆole des ´ev`enements, et la probabilit´e P(A) n’est d´efinie que pour les sous-ensembles bor´eliens de S. Pourtant, en pratique, tous les sous-ensembles qui peuvent ˆetre d´efinis de mani`ere constructive ou lo- gique, sont toujours bor´eliens. Pour cette raison, nous allons travailler avec les ensembles fondamentaux infinis en utilisant le sens commun, tout en ´evitant la th´eorie math´ematique pr´ecise.

2.4. Probabilit´e conditionnelle. SoientSun ensemble probabilis´e,AetEdeux ´ev`enements quelconques. Supposons queP(E)>0.

Si on suppose que l’´ev`enementE s’est d´ej`a produit, alors rien au-dehors deEn’importe.

Sous cette condition, la probabilit´e du complementaireEc devient nulle.

(3)

S

A E

FIG. 1. La probabilit´e conditionnelle deAsiE.

La probabilit´e de A est maintenant ´egale `a la rapport entre la probabilit´e de la partie communeA∩E et la probabilit´e deE. Cette quantit´e s’appelle la probabilit´e conditionnelle deAsiE :

(2.1) P(AkE) = P(A)

P(E).

On note la probaiblit´e conditionnelle aussi parP(A|E),P(A/E), ou bienPE(A).

La probabilit´e conditionnelle poss`ede touts les mˆemes propri´et´es que la probabilit´e usuelle.

Exemple 2.7. Une famille a deux enfants, au moins un parmi lesquelles ´etant une fille. Quelle est la probabilit’´e que la famille ait deux filles ?

Il faut d’abord pr´eciser l’ensemble fondamental. Car il ’sagit d’une famille avec deux enfants, le choix le plus naturel est le suivant :

S ={F F, F G, GF, GG}.

Supposons, pour des raisons de simplicit´e, que

P(G) =P(F) = 1 2. Alors, l’espaceSdevient ´equiprobable :

P(GG) = . . .= 1 4.

L’´ev`enementE, qui s’est d´ej`a produit, c’est que la famille a au moins une fille. Du point de vue ensembliste,E correspond `a l’ensemble

E ={F F, F G, GF}.

L’´ev`enement A, dont la probabilit´e conditionnele si E nous int´eresse, c’est d’avoir deux filles :

A ={F F}.

On a, ´evidemment,

P(E) = 3

4, P(A) = 1 4.

(4)

Maintenant, on utilise la formule (2.1), pour en d´eduire : P(AkE) = 1/4

3/4 = 1 3.

2.5. Th´eor`eme de la multiplication. La formule (2.1) implique

(2.2) P(A∩E) = P(AkE)P(E) = P(E)P(AkE).

Cette formule ´evidemment reste vrai mˆeme sans l’hypoth`ese queP(E)>0.

Pour simplifier la notation, on va ´ecrire

AB =A∩B.

Donc, si Aet B sont deux ´ev`enements, alors AB note l’´ev`enement “A etB” plutˆot que le produit deAetB (qui n’est pas d´efini pour les ensembles quand mˆeme). La mˆeme conven- tion s’applique aux familles `a3ensembles et plus :

ABC =A∩B∩C,

A1A2. . . An =A1∩A2∩. . .∩An.

On peut re-´ecrire (2.2), en remplac¸antAetE parA2etA1respectivement, comme P(A1A2) =P(A1)P(A2kA1).

D’ici, on peut d´eduire par r´ecurrence la r´esultat suivant.

Th´eor`eme 2.8 (Th´eor`eme de la multiplication).

SoientA1, A2, . . . , Andes ´ev`enements quelconques. Alors, on a

P(A1A2. . . An) =P(A1)P(A2kA1)P(A3kA1A2). . . P(AnkA1A2. . . An−1).

Exemple 2.9. L’exemple sur la page 23 de Biostatistique sous la direction de Beauscart.

2.6. Th´eor`eme de Bayes. SoientSun ensemble fondamental, etA1, A2, . . . , Andes ´ev`enements surS. On dit que la collectionA1, A2, . . . , Anforme une partition deSsi

– lesAi s’excluent mutuellement, c.`a.d., sii6=j, on aAi∩Aj =∅, et – lesAi recouvrentS :

A1∪A2∪. . . An=S.

6 S

A 1 A2

A3 A 4

A 5 A

FIG. 2. Une partition deSen six ´ev`enements.

(5)

Remarque 2.10. Si les ´ev`enementsA1, A2, . . . , Anforment une partition deB, alors on a P(B) =P(A1) +P(A2) +. . .+P(An).

La preuve est obtenue par r´ecurrence de la propri´et´e de la fonction de probabilit´e : siAetC s’excluent mutuellement, alors on a

P(A∪C) =P(A) +P(C).

Th´eor`eme 2.11 (Th´eor`eme de Bayes). SoitA1, A2, . . . , Anune partition de l’ensemble pro- babilis´eS, et soitB un ´ev`enement. Alors on a

(2.3) P(AikB) = P(BkAi)P(Ai)

P(B) , ou, de fac¸on ´equivalente,

(2.4) P(AikB) = P(BkAi)P(Ai)

P(BkA1)P(A1) +P(BkA2)P(A2) +. . .+P(BkAn)P(An).

S

A 1 A 2 ... Ai ... A n

B

FIG. 3. Une lllustration au th´eor`eme de Bayes.

D´emonstration. La formule (2.4) est une cons´equence imm´ediat de la d´efinition de la proba- bilit´e conditionnelle combin´e avec la formule de la multiplication. On a

P(AiB) =P(Ai)P(BkAi), d’o`u

P(AikB) = P(AiB)

P(B) = P(BkAi)P(Ai) P(B) . Pour en d´eduire la formule (2.4), veuillez noter que les ensembles

A1B, A2B, . . . , AnB

sont mutuellement exclusifs, en effet ils forment une partition deB, et par cons´quent on a P(B) =P(A1B) +P(A2B) +. . .+P(AnB).

Au mˆeme temps,

P(AiB) =P(BkAi)P(Ai).

(6)

Exemple 2.12. Des essais cliniques montrent que le teste donne un r´esultat positif `a 95 % si la personne est atteinte `a une maladie, et le r´esultat n´egatif `a 99 % quand la personne n’est pas affect´ee. Sur une population avec 10 % des malades, quelle est la probabilit´e qu’une personne test´ee positive soit effectivement malade ? La mˆeme question, avec 1 % des malades dans une population.

La population dont le probl`eme parle forme l’ensemble fondamental, et il est l’hypoth`ese raisonnable, au moins `a la premi`ere approximation, de presumer que l’espace est ´equiprobable, c.`a.d., la probabilit´e de tomber malade est la mˆeme pour tous les individus.

La partition de S consiste de deux ´ev`enements : A1 est l’ensemble des malades, A2 est l’ensembles des personnes saines. C’est bien une partition : elle recouvreS(chaque personne est ou malade, ou saine), et les deux ´ev`enements s’exclue mutuellement.

L’ensembleB est l’´ev´enement “ˆetre test´e positif”.

en deux evenements A 1 :

les malades

A2: les saines testes

positive B:

S, la population specifique

partition de Sune

FIG. 4. L’illustration au probl`eme de l’exemple 2.12.

On a :P(A1) = 0.1, donc P(A2) = 0.9. De plus, on sait les probabilit´es conditionnelles deB siAi, notamment,P(BkA1) = 0.95etP(BkA2) = 0.01.

La formule de Bayes (2.4) nous donne

P(A1kB) = P(BkA1)P(A1)

P(BkA1)P(A1) +P(BkA2)P(A2)

= 0.95×0.1 0.95×0.1 + 0.01×0.9

= 0.9134615. . .

≈ 91.3%.

Cette conclusion est raisonnable.

Au mˆeme temps, le calcul pareil pour la population `a 1 % des malades nous donne la figure de 49 %, donc le test dans ce cas-l`a n’est pas fiable.

Références

Documents relatifs

Quant `1a moi, je pr´ef`ere fortement la d´efinition des quartiles comme dans (7.1), car elle est plus facile `a m´emoriser et `a utiliser.. Quand mˆeme, on a toujours, de

Le test quantile-quantile, ou le test QQ, trace les points x i contre les n-quantiles cor- respondantes y i de la loi normale ayant la mˆeme moyenne et le mˆeme ´ecart-type que

Par contre, les r´esultats pour la distribution de la dur´ee du sommeil sans rˆeve (figure 2) favourisent l’hypoth`ese de normalit´e de la distribution. La normalit´e de

On a besoin d’un objet du type data.frame et pas une matrice parce que la fonction mean calcule la moyenne d’un data.frame colonne par colonne, en d’autres mots, pour

Mais la structure du test d’hypoth`ese, d´etermin´ee par le choix de H 0 et de H 1 , est telle que, mˆeme s’il est vrai que le moyen du tour de taille s’est r´eduit,

On veut rejeter l’hypoth`ese nulle H 0 , et avec ce but on en d´eduit une chose quasi impossible, improbable, en calculant la valeur p, qui est la probabilit´e d’observer une

Notons π 1 la proportion des employ´es qui arrˆetent de fumer chaque an de tous les entreprises (disons nord-am´ericaines) avec l’interdiction de fumer, et π 2 la proportion

Chaque ´echantillon est extrait d’une population dans laquelle la variable qui nous int´eresse a une valeur moyenne (la moyenne de la population) inconnue µ 1 , resp... Comme