• Aucun résultat trouvé

Introduction `a la biostatistique – Mat 2779

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction `a la biostatistique – Mat 2779"

Copied!
6
0
0

Texte intégral

(1)

L’´et´e 2010 Cours 3 — le 11 mai

3.1. Lecture sugg´er´ee. Biostatistique sous la direction de Beauscart, les sous-chapitres 1.2.5, 1.3.1, 1.3.2.

3.2. ´Ev`enements ind´ependants. Soient A, B deux ´ev`enements quelconques. Supposons d’abord queP(A), P(B)>0, c.`a.d., qu’ils ne sont pas impossibles. On dit que AetB sont ind´ependants si la probabilit´e de A n’est pas affect´ee par le fait que l’´ev`enement B s’est produit ou non. L’´ev`enementB n’a aucun effet sur la probabilit´e deA. Math´ematiquement,

P(A) = P(AkB).

En utilisant la d´efinition de la probabilit´e conditionnelle, on re-´ecrit la formule ci-dessus : P(A) = P(AB)

P(B) , ou bien

P(AB) = P(A)P(B).

Sous cette forme, la formule est valable pour tous les ´ev`enements A et B, impossibles ou non.

D´efinition 3.1. Deux ´ev`enementsAetBsont ind´ependants si on a P(AB) = P(A)P(B).

Exemple 3.2. Considerons l’exp´erience al´eatoire o`u on jette deux pi`eces de monnaie ´equilibr´ee.

Alors les r´esultats du jet de la premi`ere pi`ece et de la deuxi`eme sont ind´ependants.

Par exemple, considerons les ´ev´enements

– A: “le r´esultat du jet de 1e pi`ece est une face”

– B “le r´esultat du jet de 2e pi`ece est une pile”.

L’espace fondamental est

S ={00,01,10,11}, est car les pi`eces sont parfaites,Sest ´equiprobable. On a donc :

P(A) =P{10,11}= 1 2, P(B) =P{00,10}= 1

2,

1

(2)

P(AB) =P{10}= 1 4, d’`u

P(AB) = 1 4 = 1

2 × 1

2 =P(A)P(B). sont les ´ev`enements ind´ependants.

Remarque 3.3. Ne confondrez pas les ´ev`enements ind´ependants et les ´ev`enements qui s’ex- cluent mutuellement. Les deux notions sont compl`etement diff´erentes.

Par exemple, les ´ev`enementsAetB dans l’exemple 3.2 sont ind´ependants, mais bien sˆur ils ne s’excluent pas mutuellement. Il peut bien arriver que le r´esultat du jet de 1e pi`ece est une face, et au mˆeme temps le r´esultat du jet de 2e pi`ece est une pile.

Exemple 3.4. SiAetBsont ind´ependants, alors on a, selon le principe d’exclusion/inclusion, P(A∪B) = P(A) +P(B)−P(AB)

= P(A) +P(B)−P(A)P(B).

Au mˆeme temps, si A et B sont mutuellement exclusifs, alors, selon l’axiome 3 d’une fonction de probabilit´e,

P(A∪B) =P(A) +P(B).

Exercice 3.5. SoientAetB deux ´ev`enements quelconques. Supposons queAetB sont `a la fois ind´ependants et disjoints (s’excluants mutuellement). Qu’est-ce qu’on peut dire deAet B?

D´efinition 3.6. SoientA, B, Ctrois ´ev`enements quelconques. On dit queA, B, Csont ind´ependants s’ils sont ind´ependants deux `a deux (c.`a.d.,AetB sont ind´ependants,AetCle sont, etB et C sont ind´ependants aussi), et de plus on a :

P(ABC) =P(A)P(B)P(C).

Plus g´en´eralement, on peut donner :

D´efinition 3.7. Soient A1, A2, . . . , Andes ´ev`enements quelconques en nombre fini. On dit que les ´ev`enements A1, A2, . . . , An sont ind´ependants, s’il sont ind´ependants deux `a deux, trois `a trois, quatre `a quatre, et cetera.

En d’autres mots, pour chaque sous-collection Ai1, Ai2. . . , Aik

on a

P(Ai1Ai2. . . Aik) =P(Ai1)P(Ai2). . . P(Aik).

Exemple 3.8. Au sein d’une population suffisamment grande, 12 % sont atteints d’une mala- dieM. On observe un petit ´echantillon de5sujets tir´es au hasard au sein de cette population.

Quelle est la probabilit´e que les5sujets serons indemnes de la maladieM?

(3)

L’hypoth`ese la plus naturelle est de supposer que les ´ev`enements “le sujet xi num´ero i, i = 1,2,3,4,5, n’est pas atteint de la maladieM” sont ind´ependantes. ´Etant donn´e que la taille de la population est inconnue, c’est la seule hypoth`ese raisonable. Notons donc

Ai =“le sujetxi n’est pas atteint de la maladieM”

On connait :

P(Ai) = 0.88.

L’´ev`enement qui nous int´eresse, c’est que tous les sujets soient sains, c.`a.d., l’´ev`enement A1A2A3A4A5.

Selon la d´efinition de l’ind´ependance, on a

P(A1A2A3A4A5) = P(A1)P(A2)P(A3)P(A4)P(A5)

= (0.88)5

= 0.5277319...

≈ 52.8%.

Exemple 3.9. Le mˆeme probl`eme, en sachat que la population consiste de1,000personnes.

Ici, quand on tire un sujet, la probabilit´e que le sujet `a suivre soit sain, d´epend de l’´etat du sujet pr´ececesseur : quand on enl`eve un sain, la population des saines s’abaisse, et la probabilit´e que le sujet suivant soit sain, se diminue l´eg`erement. Donc, strictement dit, on ne peut pas supposer l’ind´ependence desA1, A2, A3, A4, A5, et il faut utiliser la formule de la multiplication :

P(A1A2A3A4A5) = P(A1)P(A2kA1)P(A3kA1A2)P(A4kA1A2A3)P(A5kA1A2A3A4)

= 880

1000 ×879

999 × 878

998 × 877

997 × 876 996

= 0.5270105...

≈ 52.7%.

La diff´erence est tr`es l´eg`ere. On en conclut : le mod`ele o`u les ´ev`enementsA1, A2, A3, A4, A5

sont presum´es ind´ependants, nous donne une tr`es bonne approximation de la r´eponse exacte.

3.3. Variables al´eatoires. Une variableX prenant des valeurs num´eriques en fonction du r´esultat d’une exp´erience al´eatoire est dite une variable al´eatoire (r´eelle), ou v.a.

Cette notion est, de toute ´evidence, la notion la plus profonde de toute la th´eorie des probabilit´es (incontenstablement plus profonde que la notion de l’ensemble fondamental, par exemple).

Voici la d´efinition plus formelle (et moins r´ev´elatrice).

D´efinition 3.10. Une variable al´eatoire (r´eelle) est une fonction X: S →R

de l’ensemble fondamentalS dans l’ensembleRdes nombres r´eels. N

(4)

Les variables al´eatoires sont not´ees par des lettres majuscules, commeX, Y, Z, . . .

Exemple 3.11. Le r´esultat de jet d’un d´e est une variable al´eatoire, que prend ses valuers dans l’ensemble{1,2,3,4,5,6}.

Une telle v.a. est dite discr`ete.

Exemple 3.12. Le nombre des faces apr`es deux jets d’une pi`ece de monnaie est une v.a. Sur l’ensemble fondamental

S ={00,01,10,11}

cette v.a. prend les valeurs suivantes :

X(00) = 0, X(01) = 1, X(10) = 1, X(11) = 2.

C’est une variable discr`ete.

Exemple 3.13. Taille `a la naissance d’un enfant masculin n´e en 2005 en France. Cette v.a.

peut prendre jusqu’`a 396,680 valeurs distinctes environ.

En termes pratiques, cette v.a. est donc discr`ete, car le nombre de valeurs est fini. Au mˆeme temps, puisque la taille d’un enfant est un nombre r´eel, les valeurs possibles de la taille remplissent un intervalle de la ligne droite. Une telle v.a. est dite continue, car du point de vue th´eorique, on modelise une variable continue par une fonction dont l’ensemble d’arriv´ee est un continu.

Exemple 3.14. La densit´e de singes sur une ˆıle dans le lac reservoir `a Venezuela, comme

´etudi´ee dans l’article (1) Il s’agit de 29 ˆıles de taille moder´ee, ´emergeant dans un lac reservoir de 4,300 km2au Venezuela. L’ensemble fondamentalSconsiste donc de29ˆıles, et la variable al´eatoire X en question donne la densit´e de la population des singes par l’hectar (10,000 m`etres carr´es).

On peut additionner les v.a. :

(X+Y)(s) =X(s) +Y(s), ainsi que les multiplier :

(XY)(s) =X(s)Y(s). Toute constante num´erique,c∈R, est une variable al´eatoire :

c(s) =c.

Par cons´quent,

(cX)(s) = cX(s) et

(X+c)(s) = X(s) +c sont des v.a. aussi.

1Kenneth J. Feeley et John W. Terborgh, Habitat fragmentation and the indirect effects of herbivore (howler monkey) abundances on bird species richness, Ecology 87 (2006), 144-150.

(5)

3.4. La loi de distribution d’une variable al´eatoire.

D´efinition 3.15. SoitX une variable al´eatoire discr`ete. La loi de distribution deX consiste des donn´ees suivantes :

– l’ensemble des valeurs possibles deX,

x1, x2, . . . , xn, – la probabilit´e de chacune :

P[X =xi].

Cette probabilit´e est not´ee

f(xi) =P[X =xi].

La fonctionf s’appelle la densit´e de distribution de la variable al´eatoireX.

Comme le manuel de cours le montre, la densit´e de distribution peut ˆetre repr´esent´ee par un diagramme en bˆatons. Considerons l’exemple suivant tr`es simple mais important.

Exemple 3.16. Considerons la variable al´eatoire X suivante : le nombre des faces apr`es un jet de deux pi`eces de monnaie ´equilibr´ees.

L’espaceSconsiste de tous les r´esultats possibles de jet de deux pi`eces de monnaie : S ={00,01,10,11}.

L’espaceSest ´equiprobable, parce que la pi`ece de monnaie est parfaite. La variableXprend les valeurs suivantes :

X(00) = 0, X(01) = 1, X(10) = 1, X(11) = 2.

L’´ev`enement[X = 0]correspond `a l’ensemble

{s∈S: X(s) = 0}={00}. Pour cette raison, la fonction de densit´ef prend la valeur

f(0) = P[X = 0] =P{00}= 1 4. De mˆeme fac¸on,

f(1) =P[X = 1] =P{01,10}= 1 2, et enfin

f(2) = P[X = 2] =P{11}= 1 4. Voir la figure 1.

A chaque variable al´eatoire` X, on associe des nombreux ´ev`enements, comme suit. Soient a, bdeux nombres r´eels,a < b. Notons

A = [a≤X ≤b] l’´ev`enement suivant :

A={s∈ S: a≤X(s)≤b}.

(6)

0.0 0.5 1.0 1.5 2.0

0.10.20.30.40.50.6

La loi de distribution de la v.a. X

les valeurs de X

les probabilités des valeurs de X

FIG. 1. La loi de distribution de v.a.X de l’exemple 3.16.

Exemple 3.17. Pour la variableXde l’exemple 3.16, sia= 1etb= 2, l’´ev`enement not´e [1≤X ≤2]

est l’´ev`enement “il y a une ou deux faces apr`es deux jets de monnaie”. Il correspond au sous-ensemble

A ={10,01,11}

de l’ensemble fondamentalS. Si la pi`ece de monnaie est parfaite, alors on a P[1≤X ≤2] = P{10,01,11}= 3

4. De m`eme fac¸on, on d´efinit les ´ev`enements

[X ≤b] ={s∈S: X(s)≤b}, [X≥a] ={s∈S: S(x)≥a}, et bien sˆur

[X =a] ={s∈S: X(s) =a}.

Références

Documents relatifs

Par contre, les r´esultats pour la distribution de la dur´ee du sommeil sans rˆeve (figure 2) favourisent l’hypoth`ese de normalit´e de la distribution. La normalit´e de

On a besoin d’un objet du type data.frame et pas une matrice parce que la fonction mean calcule la moyenne d’un data.frame colonne par colonne, en d’autres mots, pour

Mais la structure du test d’hypoth`ese, d´etermin´ee par le choix de H 0 et de H 1 , est telle que, mˆeme s’il est vrai que le moyen du tour de taille s’est r´eduit,

On veut rejeter l’hypoth`ese nulle H 0 , et avec ce but on en d´eduit une chose quasi impossible, improbable, en calculant la valeur p, qui est la probabilit´e d’observer une

Notons π 1 la proportion des employ´es qui arrˆetent de fumer chaque an de tous les entreprises (disons nord-am´ericaines) avec l’interdiction de fumer, et π 2 la proportion

(a) Si une personne est tir´e au hasard de cette population, quelle est la probabilit´e qu’elle soit test´ee positive pour cette type de cancer.. (b) Calculez la probabilit´e que

(a) [1 point] Donner le nombre attendu des grenouilles poss`edant ce trait, ainsi que l’´ecart-type du nombre des grenouilles avec ce trait.. (b) [1 point] Calculer la

(7) Les sequences de boˆıtes `a moustaches, une boˆıte pour chaque ann´ee, montrent les niveaux de la consommation d’alcool dans 26 pays europ´eens depuis 1961 et 1999 (dans