• Aucun résultat trouvé

Introduction `a la biostatistique – Mat 2779

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction `a la biostatistique – Mat 2779"

Copied!
5
0
0

Texte intégral

(1)

L’´et´e 2010

Cours 4 — le jeudi 13 mai

4.1. Lecture sugg´er´ee. Biostatistique sous la direction de Beuscart, 1.3.4, 1.3.5, 1.3.6, 1.3.7 (en partie), 1.3.8.

4.2. L’esperance d’une variable al´eatoire. Voici une petite introduction. Rappellons que la moyenne arithm´etique d’une collection finie des valeurs num´eriques, x1, x2, . . . , xn, est une valeur tr`es bien connue :

µ = 1

n (x1+x2+. . .+xn)

= 1

nx1 + 1

nx2+. . .+ 1 nxn. (4.1)

Maintenant, si on regarde x1, x2, . . . , xn comme des valeurs ´equiprobables d’une variable al´eatoireX, alors la probabilit´e de chacune est1/n, et l’expression (4.1) devient une somme pond´er´ee, o`u chaque valeurxiest assign´ee son poids,1/n.

Vue sous cet angle, la d´efinition se rend facilement `a une g´en´eralisation pour toutes les variables al´eatoires discr`etes qui ne sont plus forc´ement ´equiprobables : on remplace chaque expression1/npar la probabilit´ef(xi)corr´espondante dexi.

D´efinition 4.1. SoitX une variable al´eatoire discr`ete dont les valeurs possibles sont x1, x2, . . . , xn.

Soitfla fonction de densit´e de distribution deX. Alors la moyenne, ou esp´erance math´ematique, deXest la valeur num´erique

EX =f(x1)x1+f(x2)x2+. . .+f(xn)xn. Parfois on note l’esp´erance deXpar

µ=EX, ou bienX.¯

Exemple 4.2. L’esp´erance math´ematique de la variableX de l’exemple 3.16 est ´egale `a EX = 1

4×0 + 1

2 ×1 + 1

4 ×2 = 1.

1

(2)

Th´eor`eme 4.3.

E(X+Y) = E(X) +E(Y).

E(kX) =kE(X).

E(k) =k.

Pour une d´emonstration, voir Biostatistique sous la direction de Beuscart.

Remarque 4.4. En g´en´eral,

E(XY)6=EXEY.

Cette observation, et bien d’autres, peuvent ˆetre comprises facilement en vue de l’observation suivante extrˆemement utile : l’esp´erance math´ematique est une esp`ece de l’int´egral. Je dirais que l’int´egral famili`ere,

Z b

a

f(x)dx, et l’esp´erance

EX sont autant pr`es l’une `a l’autre que le chat et le tigre.1

4.3. La variance et l’´ecart-type d’une variable al´eatoire. La variance sert `a caract´eriser la mesure de dispersion d’une variable al´eatoireX autour de sa moyenne.

D´efinition 4.5. SoitX une variable al´eatoire. La variance deXest la valeur num´erique varX = E(X−EX)2

= E(X−µ)2.

Pour comprendre pourquoi il y a un exposant de2, il faut comparer la variance avec son racine carr´ee, l’´ecart-type deX :

σ(X) = p

var(X)

= p

E(X−µ)2. (4.2)

(En anglais : standard deviation).

L’´ecart-type est une vrai distance entre X et sa moyenne, µ. On peut bien sˆur d´efinir beaucoup de distances diff´erentes, mais parmi eux la distance la plus utile et poss´edant les propri´et´es g´eometriquement les plus parfaites est la distance euclidienne. Par exemple, la distance euclidienne entre deux pointsx = (x1, x2, x3)ety= (y1, y2, y3)de l’espaceR3 de dimension trois est donn´ee par

d(x, y) = p

(x1−y1)2+ (x2−y2)2+ (x3 −y3)2.

Nous avons la racine carr´ee d’une somme des carr´es des dif´erences entre les coordonn´ees.

En d’autres mots, on prend la diff´erence de deux vecteurs, x− y, on forme la puissance des toutes les coordinn´ees, on additionne les trois nombres, et extrait la racine carr´ee. La

1Je ne sais pas quelle parmi eux est le chat, ou plutˆot la chatte...

(3)

somme sous la racine carr´ee est une analogue de l’int´egrale, c.`a.d. de l’esp´erance E. Donc, l’analogue compl`ete de la distance euclidienne est obtenu en formant la diff´erence entre X −EX, en construisant son carr´e, en prenant l’esp´erance de cette valeur, et en extrayant la racine carr´e. C’est pr´ecisement la d´efinition de l’´ecart-type. Enfin, la variance n’est que l´ecart-type puissance deux. Voil`a une explication intuitive de l’origine de la formule (4.2).

Exemple 4.6. Calculons dir´ectement la variance de la variable al´eatoireXde notre exemple 3.16. La v.a.X−µ=X−1poss`ede la loi suivante : les valeurs possibles sont−1,0,1, et leurs probabilit´es sont 1/4,1/2, et 1/4, respectivement. Par cons´quent, la v.a. (X−µ)2 = (X−1)2a les valeurs possibles0et1, dont les probabilit´es sont

f(0) = 1 2, f(1) = 1

4+ 1 4 = 1

2. On en conclut finalement :

varX =E(X−1)2 = 0×1

2 + 1× 1 2 = 1

2. L’´ecart-type deX :

σ=√

varX = r1

2 =

√2 2 .

N Notons que, quel que soit la variable al´eatoireX, on a

varX = E(X−µ)2

= E(X2−2µX+µ2)

= E(X2)−2µE(X) +µ2

= E(X2)−2µ22

= E(X2)−µ2.

Donc, on peut re-´ecrire la d´efinition de la variance de fac¸on suivante : varX =E(X2)−µ2.

Les propri´et´es de la variance sont peu usuelles, car la variance n’est une fonction lin´eaire comme par exemple l’esp´erance math´ematique.

Th´eor`eme 4.7. var(X+k) =varX, et var(kX) =k2X.

Corollaire 4.8. σ(X+k) = σ(X)etσ(kX) =kσ(X).

Remarque 4.9. En g´en´eral,

var(X+Y)6=varX+varY.

Voir Biostatistique sous la direction de Beuscartpour les d´emonstrations.

(4)

4.4. Les variables al´eatoires ind´ependantes. Soit X une variable al´eatoire quelconque.

SoitA⊆Run sous-ensemble deR. On d´efinit l’´ev`enement[X ∈A]comme suit : [X ∈A] ={s∈S: X(s)∈A},

o`uS, comme toujours, est l’ensemble fondamental : X: S →R.

D´efinition 4.10. SoientXetY deux variables al´eatoires. On dit queXetY sont ind´ependantes si, quels que soientA, B ⊆R, les ´ev`enements

[X∈A]et[Y ∈B]

sont ind´ependants :

P[X ∈A, Y ∈B] =P[X ∈A]P[Y ∈B].

Ici on note

[X ∈A, Y ∈B] = [X ∈AetY ∈B], cette symbole n’a rien `a voir avec la probabilit´e conditionnelle.

On peut montrer la caract´erisation suivante tr`es utile.

Th´eor`eme 4.11. Deux variables al´eatoires X et Y sont ind´ependantes si e seulement si, quels que soienta, b∈R, les ´ev`enements

[X ≤a]et[Y ≤b]

sont ind´ependants.

Pour les variables al´eatoires prenant un nombre fini des valeurs, la caract´erisation devient plus simple encore.

Th´eor`eme 4.12. Soient X etY deux variables al´eatoires telles que l’ensemble des valeurs possible deX,x1, x2, . . . , xm, ainsi que l’ensemble des valeurs possibles deY,y1, y2, . . . , yn, sont finis tous les deux. AlorsXetY sont ind´ependantes si et seulement si, quels que soient ietj, on a

P[X =xi etY =yj] =P[X =xi]P[Y =yj].

Exemple 4.13. SoitX la valeur du premier jet d’une pi`ece de monnaie ´equilibr´ee, et soit Y la valeur du deuxi`eme jet de la pi`ece. AlorsXetY sont ind´ependantes.

L’espace fondamentalSest bien connu `a nous : S ={00,01,10,11}. On a :

X(00) = 0, X(01) = 0, X(10) = 1, X(11) = 1, et pareillement pourY. Alors, sii, j ∈ {0,1}, on a

P[X =i] =P{i0, i1}= 1 2,

(5)

P[Y =j] =P{0j,1j}= 1 2, et

P[X =ietY =j] =P{ij}= 1 4.

On en conclut en utilisant le th´eor`eme 4.12 queX etY sont ind´ependantes. N Exemple 4.14. SoitX la valeur du premier jet d’une pi`ece de monnaie ´equilibr´ee, et soit Y le nombre de faces apr`es trois jets de la pi`ece. AlorsXetY ne sont pas ind´ependantes.

Ici l’ensemble fondamental consiste de tous les r´esultats possibles de trois ´epreuves suc- cessives :

S ={000,001,010,011,100,101,110,111}. Posons par exemplei= 1,j = 2. On a

P[X = 1] =P{100,101,110,111}= 1 2, carScontient23 = 8´el´ements. De mˆeme fac¸on,

P[Y = 2] =P{110,101,011}= 3 8. Donc,

P[X = 1]P[Y = 2] = 1 2 × 3

8 = 3 16. Au mˆeme temps,

P[X = 1etY = 2] =P{110,101}= 2 8 = 1

4 6= 3 16.

Les deux v.a. ne sont pas ind´ependantes. N

Th´eor`eme 4.15. SoitX etY deux v.a. ind´ependantes. Alors on a E(XY) = EXEY.

Remarque 4.16. Ce r´esultat est un analogue du r´esultat bien connu suivant pour l’int´egration du produit de deux fonctions qui d´ependent des coordonn´ees diff´erentes :

Z b

a

Z d

c

f(x)g(y)dx dy= Z d

c

f(x)dx Z b

a

g(y)dy.

Th´eor`eme 4.17. SoitX etY deux v.a. ind´ependantes. Alors on a var(X+Y) =varX+varY.

Une fois de plus, les preuves (assez simples) peuvent ˆetre retrouv´ees dans le livre Biosta- tistique sous la direction de Beuscart.

Références

Documents relatifs

Apr`es la variable est centr´ee et r´eduite, la loi de distribution converge vers la fonction N (0, 1) mˆeme dans le cas asym´etrique o`u p 6 = 0.5.. La fogure 8 illustre la loi

Par exemple, si on rajoute `a l’´echantillon des valeurs deux valeurs extrˆemes telles que 50 et 70 par exemple, on peut voir ce qu’on obtiendra comme boˆıte `a moustache sur

Quant `1a moi, je pr´ef`ere fortement la d´efinition des quartiles comme dans (7.1), car elle est plus facile `a m´emoriser et `a utiliser.. Quand mˆeme, on a toujours, de

Le test quantile-quantile, ou le test QQ, trace les points x i contre les n-quantiles cor- respondantes y i de la loi normale ayant la mˆeme moyenne et le mˆeme ´ecart-type que

Par contre, les r´esultats pour la distribution de la dur´ee du sommeil sans rˆeve (figure 2) favourisent l’hypoth`ese de normalit´e de la distribution. La normalit´e de

On a besoin d’un objet du type data.frame et pas une matrice parce que la fonction mean calcule la moyenne d’un data.frame colonne par colonne, en d’autres mots, pour

Mais la structure du test d’hypoth`ese, d´etermin´ee par le choix de H 0 et de H 1 , est telle que, mˆeme s’il est vrai que le moyen du tour de taille s’est r´eduit,

On veut rejeter l’hypoth`ese nulle H 0 , et avec ce but on en d´eduit une chose quasi impossible, improbable, en calculant la valeur p, qui est la probabilit´e d’observer une