L’´et´e 2010 Cours 3 — le 11 mai
3.1. Lecture sugg´er´ee. Biostatistique sous la direction de Beauscart, les sous-chapitres 1.2.5, 1.3.1, 1.3.2.
3.2. ´Ev`enements ind´ependants. Soient A, B deux ´ev`enements quelconques. Supposons d’abord queP(A), P(B)>0, c.`a.d., qu’ils ne sont pas impossibles. On dit que AetB sont ind´ependants si la probabilit´e de A n’est pas affect´ee par le fait que l’´ev`enement B s’est produit ou non. L’´ev`enementB n’a aucun effet sur la probabilit´e deA. Math´ematiquement,
P(A) = P(AkB).
En utilisant la d´efinition de la probabilit´e conditionnelle, on re-´ecrit la formule ci-dessus : P(A) = P(AB)
P(B) , ou bien
P(AB) = P(A)P(B).
Sous cette forme, la formule est valable pour tous les ´ev`enements A et B, impossibles ou non.
D´efinition 3.1. Deux ´ev`enementsAetBsont ind´ependants si on a P(AB) = P(A)P(B).
Exemple 3.2. Considerons l’exp´erience al´eatoire o`u on jette deux pi`eces de monnaie ´equilibr´ee.
Alors les r´esultats du jet de la premi`ere pi`ece et de la deuxi`eme sont ind´ependants.
Par exemple, considerons les ´ev´enements
– A: “le r´esultat du jet de 1e pi`ece est une face”
– B “le r´esultat du jet de 2e pi`ece est une pile”.
L’espace fondamental est
S ={00,01,10,11}, est car les pi`eces sont parfaites,Sest ´equiprobable. On a donc :
P(A) =P{10,11}= 1 2, P(B) =P{00,10}= 1
2,
1
P(AB) =P{10}= 1 4, d’`u
P(AB) = 1 4 = 1
2 × 1
2 =P(A)P(B). sont les ´ev`enements ind´ependants.
Remarque 3.3. Ne confondrez pas les ´ev`enements ind´ependants et les ´ev`enements qui s’ex- cluent mutuellement. Les deux notions sont compl`etement diff´erentes.
Par exemple, les ´ev`enementsAetB dans l’exemple 3.2 sont ind´ependants, mais bien sˆur ils ne s’excluent pas mutuellement. Il peut bien arriver que le r´esultat du jet de 1e pi`ece est une face, et au mˆeme temps le r´esultat du jet de 2e pi`ece est une pile.
Exemple 3.4. SiAetBsont ind´ependants, alors on a, selon le principe d’exclusion/inclusion, P(A∪B) = P(A) +P(B)−P(AB)
= P(A) +P(B)−P(A)P(B).
Au mˆeme temps, si A et B sont mutuellement exclusifs, alors, selon l’axiome 3 d’une fonction de probabilit´e,
P(A∪B) =P(A) +P(B).
Exercice 3.5. SoientAetB deux ´ev`enements quelconques. Supposons queAetB sont `a la fois ind´ependants et disjoints (s’excluants mutuellement). Qu’est-ce qu’on peut dire deAet B?
D´efinition 3.6. SoientA, B, Ctrois ´ev`enements quelconques. On dit queA, B, Csont ind´ependants s’ils sont ind´ependants deux `a deux (c.`a.d.,AetB sont ind´ependants,AetCle sont, etB et C sont ind´ependants aussi), et de plus on a :
P(ABC) =P(A)P(B)P(C).
Plus g´en´eralement, on peut donner :
D´efinition 3.7. Soient A1, A2, . . . , Andes ´ev`enements quelconques en nombre fini. On dit que les ´ev`enements A1, A2, . . . , An sont ind´ependants, s’il sont ind´ependants deux `a deux, trois `a trois, quatre `a quatre, et cetera.
En d’autres mots, pour chaque sous-collection Ai1, Ai2. . . , Aik
on a
P(Ai1Ai2. . . Aik) =P(Ai1)P(Ai2). . . P(Aik).
Exemple 3.8. Au sein d’une population suffisamment grande, 12 % sont atteints d’une mala- dieM. On observe un petit ´echantillon de5sujets tir´es au hasard au sein de cette population.
Quelle est la probabilit´e que les5sujets serons indemnes de la maladieM?
L’hypoth`ese la plus naturelle est de supposer que les ´ev`enements “le sujet xi num´ero i, i = 1,2,3,4,5, n’est pas atteint de la maladieM” sont ind´ependantes. ´Etant donn´e que la taille de la population est inconnue, c’est la seule hypoth`ese raisonable. Notons donc
Ai =“le sujetxi n’est pas atteint de la maladieM”
On connait :
P(Ai) = 0.88.
L’´ev`enement qui nous int´eresse, c’est que tous les sujets soient sains, c.`a.d., l’´ev`enement A1A2A3A4A5.
Selon la d´efinition de l’ind´ependance, on a
P(A1A2A3A4A5) = P(A1)P(A2)P(A3)P(A4)P(A5)
= (0.88)5
= 0.5277319...
≈ 52.8%.
Exemple 3.9. Le mˆeme probl`eme, en sachat que la population consiste de1,000personnes.
Ici, quand on tire un sujet, la probabilit´e que le sujet `a suivre soit sain, d´epend de l’´etat du sujet pr´ececesseur : quand on enl`eve un sain, la population des saines s’abaisse, et la probabilit´e que le sujet suivant soit sain, se diminue l´eg`erement. Donc, strictement dit, on ne peut pas supposer l’ind´ependence desA1, A2, A3, A4, A5, et il faut utiliser la formule de la multiplication :
P(A1A2A3A4A5) = P(A1)P(A2kA1)P(A3kA1A2)P(A4kA1A2A3)P(A5kA1A2A3A4)
= 880
1000 ×879
999 × 878
998 × 877
997 × 876 996
= 0.5270105...
≈ 52.7%.
La diff´erence est tr`es l´eg`ere. On en conclut : le mod`ele o`u les ´ev`enementsA1, A2, A3, A4, A5
sont presum´es ind´ependants, nous donne une tr`es bonne approximation de la r´eponse exacte.
3.3. Variables al´eatoires. Une variableX prenant des valeurs num´eriques en fonction du r´esultat d’une exp´erience al´eatoire est dite une variable al´eatoire (r´eelle), ou v.a.
Cette notion est, de toute ´evidence, la notion la plus profonde de toute la th´eorie des probabilit´es (incontenstablement plus profonde que la notion de l’ensemble fondamental, par exemple).
Voici la d´efinition plus formelle (et moins r´ev´elatrice).
D´efinition 3.10. Une variable al´eatoire (r´eelle) est une fonction X: S →R
de l’ensemble fondamentalS dans l’ensembleRdes nombres r´eels. N
Les variables al´eatoires sont not´ees par des lettres majuscules, commeX, Y, Z, . . .
Exemple 3.11. Le r´esultat de jet d’un d´e est une variable al´eatoire, que prend ses valuers dans l’ensemble{1,2,3,4,5,6}.
Une telle v.a. est dite discr`ete.
Exemple 3.12. Le nombre des faces apr`es deux jets d’une pi`ece de monnaie est une v.a. Sur l’ensemble fondamental
S ={00,01,10,11}
cette v.a. prend les valeurs suivantes :
X(00) = 0, X(01) = 1, X(10) = 1, X(11) = 2.
C’est une variable discr`ete.
Exemple 3.13. Taille `a la naissance d’un enfant masculin n´e en 2005 en France. Cette v.a.
peut prendre jusqu’`a 396,680 valeurs distinctes environ.
En termes pratiques, cette v.a. est donc discr`ete, car le nombre de valeurs est fini. Au mˆeme temps, puisque la taille d’un enfant est un nombre r´eel, les valeurs possibles de la taille remplissent un intervalle de la ligne droite. Une telle v.a. est dite continue, car du point de vue th´eorique, on modelise une variable continue par une fonction dont l’ensemble d’arriv´ee est un continu.
Exemple 3.14. La densit´e de singes sur une ˆıle dans le lac reservoir `a Venezuela, comme
´etudi´ee dans l’article (1) Il s’agit de 29 ˆıles de taille moder´ee, ´emergeant dans un lac reservoir de 4,300 km2au Venezuela. L’ensemble fondamentalSconsiste donc de29ˆıles, et la variable al´eatoire X en question donne la densit´e de la population des singes par l’hectar (10,000 m`etres carr´es).
On peut additionner les v.a. :
(X+Y)(s) =X(s) +Y(s), ainsi que les multiplier :
(XY)(s) =X(s)Y(s). Toute constante num´erique,c∈R, est une variable al´eatoire :
c(s) =c.
Par cons´quent,
(cX)(s) = cX(s) et
(X+c)(s) = X(s) +c sont des v.a. aussi.
1Kenneth J. Feeley et John W. Terborgh, Habitat fragmentation and the indirect effects of herbivore (howler monkey) abundances on bird species richness, Ecology 87 (2006), 144-150.
3.4. La loi de distribution d’une variable al´eatoire.
D´efinition 3.15. SoitX une variable al´eatoire discr`ete. La loi de distribution deX consiste des donn´ees suivantes :
– l’ensemble des valeurs possibles deX,
x1, x2, . . . , xn, – la probabilit´e de chacune :
P[X =xi].
Cette probabilit´e est not´ee
f(xi) =P[X =xi].
La fonctionf s’appelle la densit´e de distribution de la variable al´eatoireX.
Comme le manuel de cours le montre, la densit´e de distribution peut ˆetre repr´esent´ee par un diagramme en bˆatons. Considerons l’exemple suivant tr`es simple mais important.
Exemple 3.16. Considerons la variable al´eatoire X suivante : le nombre des faces apr`es un jet de deux pi`eces de monnaie ´equilibr´ees.
L’espaceSconsiste de tous les r´esultats possibles de jet de deux pi`eces de monnaie : S ={00,01,10,11}.
L’espaceSest ´equiprobable, parce que la pi`ece de monnaie est parfaite. La variableXprend les valeurs suivantes :
X(00) = 0, X(01) = 1, X(10) = 1, X(11) = 2.
L’´ev`enement[X = 0]correspond `a l’ensemble
{s∈S: X(s) = 0}={00}. Pour cette raison, la fonction de densit´ef prend la valeur
f(0) = P[X = 0] =P{00}= 1 4. De mˆeme fac¸on,
f(1) =P[X = 1] =P{01,10}= 1 2, et enfin
f(2) = P[X = 2] =P{11}= 1 4. Voir la figure 1.
A chaque variable al´eatoire` X, on associe des nombreux ´ev`enements, comme suit. Soient a, bdeux nombres r´eels,a < b. Notons
A = [a≤X ≤b] l’´ev`enement suivant :
A={s∈ S: a≤X(s)≤b}.
0.0 0.5 1.0 1.5 2.0
0.10.20.30.40.50.6
La loi de distribution de la v.a. X
les valeurs de X
les probabilités des valeurs de X
FIG. 1. La loi de distribution de v.a.X de l’exemple 3.16.
Exemple 3.17. Pour la variableXde l’exemple 3.16, sia= 1etb= 2, l’´ev`enement not´e [1≤X ≤2]
est l’´ev`enement “il y a une ou deux faces apr`es deux jets de monnaie”. Il correspond au sous-ensemble
A ={10,01,11}
de l’ensemble fondamentalS. Si la pi`ece de monnaie est parfaite, alors on a P[1≤X ≤2] = P{10,01,11}= 3
4. De m`eme fac¸on, on d´efinit les ´ev`enements
[X ≤b] ={s∈S: X(s)≤b}, [X≥a] ={s∈S: S(x)≥a}, et bien sˆur
[X =a] ={s∈S: X(s) =a}.