L’´et´e 2010
Cours 4 — le jeudi 13 mai
4.1. Lecture sugg´er´ee. Biostatistique sous la direction de Beuscart, 1.3.4, 1.3.5, 1.3.6, 1.3.7 (en partie), 1.3.8.
4.2. L’esperance d’une variable al´eatoire. Voici une petite introduction. Rappellons que la moyenne arithm´etique d’une collection finie des valeurs num´eriques, x1, x2, . . . , xn, est une valeur tr`es bien connue :
µ = 1
n (x1+x2+. . .+xn)
= 1
nx1 + 1
nx2+. . .+ 1 nxn. (4.1)
Maintenant, si on regarde x1, x2, . . . , xn comme des valeurs ´equiprobables d’une variable al´eatoireX, alors la probabilit´e de chacune est1/n, et l’expression (4.1) devient une somme pond´er´ee, o`u chaque valeurxiest assign´ee son poids,1/n.
Vue sous cet angle, la d´efinition se rend facilement `a une g´en´eralisation pour toutes les variables al´eatoires discr`etes qui ne sont plus forc´ement ´equiprobables : on remplace chaque expression1/npar la probabilit´ef(xi)corr´espondante dexi.
D´efinition 4.1. SoitX une variable al´eatoire discr`ete dont les valeurs possibles sont x1, x2, . . . , xn.
Soitfla fonction de densit´e de distribution deX. Alors la moyenne, ou esp´erance math´ematique, deXest la valeur num´erique
EX =f(x1)x1+f(x2)x2+. . .+f(xn)xn. Parfois on note l’esp´erance deXpar
µ=EX, ou bienX.¯
Exemple 4.2. L’esp´erance math´ematique de la variableX de l’exemple 3.16 est ´egale `a EX = 1
4×0 + 1
2 ×1 + 1
4 ×2 = 1.
1
Th´eor`eme 4.3.
E(X+Y) = E(X) +E(Y).
E(kX) =kE(X).
E(k) =k.
Pour une d´emonstration, voir Biostatistique sous la direction de Beuscart.
Remarque 4.4. En g´en´eral,
E(XY)6=EXEY.
Cette observation, et bien d’autres, peuvent ˆetre comprises facilement en vue de l’observation suivante extrˆemement utile : l’esp´erance math´ematique est une esp`ece de l’int´egral. Je dirais que l’int´egral famili`ere,
Z b
a
f(x)dx, et l’esp´erance
EX sont autant pr`es l’une `a l’autre que le chat et le tigre.1
4.3. La variance et l’´ecart-type d’une variable al´eatoire. La variance sert `a caract´eriser la mesure de dispersion d’une variable al´eatoireX autour de sa moyenne.
D´efinition 4.5. SoitX une variable al´eatoire. La variance deXest la valeur num´erique varX = E(X−EX)2
= E(X−µ)2.
Pour comprendre pourquoi il y a un exposant de2, il faut comparer la variance avec son racine carr´ee, l’´ecart-type deX :
σ(X) = p
var(X)
= p
E(X−µ)2. (4.2)
(En anglais : standard deviation).
L’´ecart-type est une vrai distance entre X et sa moyenne, µ. On peut bien sˆur d´efinir beaucoup de distances diff´erentes, mais parmi eux la distance la plus utile et poss´edant les propri´et´es g´eometriquement les plus parfaites est la distance euclidienne. Par exemple, la distance euclidienne entre deux pointsx = (x1, x2, x3)ety= (y1, y2, y3)de l’espaceR3 de dimension trois est donn´ee par
d(x, y) = p
(x1−y1)2+ (x2−y2)2+ (x3 −y3)2.
Nous avons la racine carr´ee d’une somme des carr´es des dif´erences entre les coordonn´ees.
En d’autres mots, on prend la diff´erence de deux vecteurs, x− y, on forme la puissance des toutes les coordinn´ees, on additionne les trois nombres, et extrait la racine carr´ee. La
1Je ne sais pas quelle parmi eux est le chat, ou plutˆot la chatte...
somme sous la racine carr´ee est une analogue de l’int´egrale, c.`a.d. de l’esp´erance E. Donc, l’analogue compl`ete de la distance euclidienne est obtenu en formant la diff´erence entre X −EX, en construisant son carr´e, en prenant l’esp´erance de cette valeur, et en extrayant la racine carr´e. C’est pr´ecisement la d´efinition de l’´ecart-type. Enfin, la variance n’est que l´ecart-type puissance deux. Voil`a une explication intuitive de l’origine de la formule (4.2).
Exemple 4.6. Calculons dir´ectement la variance de la variable al´eatoireXde notre exemple 3.16. La v.a.X−µ=X−1poss`ede la loi suivante : les valeurs possibles sont−1,0,1, et leurs probabilit´es sont 1/4,1/2, et 1/4, respectivement. Par cons´quent, la v.a. (X−µ)2 = (X−1)2a les valeurs possibles0et1, dont les probabilit´es sont
f(0) = 1 2, f(1) = 1
4+ 1 4 = 1
2. On en conclut finalement :
varX =E(X−1)2 = 0×1
2 + 1× 1 2 = 1
2. L’´ecart-type deX :
σ=√
varX = r1
2 =
√2 2 .
N Notons que, quel que soit la variable al´eatoireX, on a
varX = E(X−µ)2
= E(X2−2µX+µ2)
= E(X2)−2µE(X) +µ2
= E(X2)−2µ2+µ2
= E(X2)−µ2.
Donc, on peut re-´ecrire la d´efinition de la variance de fac¸on suivante : varX =E(X2)−µ2.
Les propri´et´es de la variance sont peu usuelles, car la variance n’est une fonction lin´eaire comme par exemple l’esp´erance math´ematique.
Th´eor`eme 4.7. var(X+k) =varX, et var(kX) =k2X.
Corollaire 4.8. σ(X+k) = σ(X)etσ(kX) =kσ(X).
Remarque 4.9. En g´en´eral,
var(X+Y)6=varX+varY.
Voir Biostatistique sous la direction de Beuscartpour les d´emonstrations.
4.4. Les variables al´eatoires ind´ependantes. Soit X une variable al´eatoire quelconque.
SoitA⊆Run sous-ensemble deR. On d´efinit l’´ev`enement[X ∈A]comme suit : [X ∈A] ={s∈S: X(s)∈A},
o`uS, comme toujours, est l’ensemble fondamental : X: S →R.
D´efinition 4.10. SoientXetY deux variables al´eatoires. On dit queXetY sont ind´ependantes si, quels que soientA, B ⊆R, les ´ev`enements
[X∈A]et[Y ∈B]
sont ind´ependants :
P[X ∈A, Y ∈B] =P[X ∈A]P[Y ∈B].
Ici on note
[X ∈A, Y ∈B] = [X ∈AetY ∈B], cette symbole n’a rien `a voir avec la probabilit´e conditionnelle.
On peut montrer la caract´erisation suivante tr`es utile.
Th´eor`eme 4.11. Deux variables al´eatoires X et Y sont ind´ependantes si e seulement si, quels que soienta, b∈R, les ´ev`enements
[X ≤a]et[Y ≤b]
sont ind´ependants.
Pour les variables al´eatoires prenant un nombre fini des valeurs, la caract´erisation devient plus simple encore.
Th´eor`eme 4.12. Soient X etY deux variables al´eatoires telles que l’ensemble des valeurs possible deX,x1, x2, . . . , xm, ainsi que l’ensemble des valeurs possibles deY,y1, y2, . . . , yn, sont finis tous les deux. AlorsXetY sont ind´ependantes si et seulement si, quels que soient ietj, on a
P[X =xi etY =yj] =P[X =xi]P[Y =yj].
Exemple 4.13. SoitX la valeur du premier jet d’une pi`ece de monnaie ´equilibr´ee, et soit Y la valeur du deuxi`eme jet de la pi`ece. AlorsXetY sont ind´ependantes.
L’espace fondamentalSest bien connu `a nous : S ={00,01,10,11}. On a :
X(00) = 0, X(01) = 0, X(10) = 1, X(11) = 1, et pareillement pourY. Alors, sii, j ∈ {0,1}, on a
P[X =i] =P{i0, i1}= 1 2,
P[Y =j] =P{0j,1j}= 1 2, et
P[X =ietY =j] =P{ij}= 1 4.
On en conclut en utilisant le th´eor`eme 4.12 queX etY sont ind´ependantes. N Exemple 4.14. SoitX la valeur du premier jet d’une pi`ece de monnaie ´equilibr´ee, et soit Y le nombre de faces apr`es trois jets de la pi`ece. AlorsXetY ne sont pas ind´ependantes.
Ici l’ensemble fondamental consiste de tous les r´esultats possibles de trois ´epreuves suc- cessives :
S ={000,001,010,011,100,101,110,111}. Posons par exemplei= 1,j = 2. On a
P[X = 1] =P{100,101,110,111}= 1 2, carScontient23 = 8´el´ements. De mˆeme fac¸on,
P[Y = 2] =P{110,101,011}= 3 8. Donc,
P[X = 1]P[Y = 2] = 1 2 × 3
8 = 3 16. Au mˆeme temps,
P[X = 1etY = 2] =P{110,101}= 2 8 = 1
4 6= 3 16.
Les deux v.a. ne sont pas ind´ependantes. N
Th´eor`eme 4.15. SoitX etY deux v.a. ind´ependantes. Alors on a E(XY) = EXEY.
Remarque 4.16. Ce r´esultat est un analogue du r´esultat bien connu suivant pour l’int´egration du produit de deux fonctions qui d´ependent des coordonn´ees diff´erentes :
Z b
a
Z d
c
f(x)g(y)dx dy= Z d
c
f(x)dx Z b
a
g(y)dy.
Th´eor`eme 4.17. SoitX etY deux v.a. ind´ependantes. Alors on a var(X+Y) =varX+varY.
Une fois de plus, les preuves (assez simples) peuvent ˆetre retrouv´ees dans le livre Biosta- tistique sous la direction de Beuscart.