• Aucun résultat trouvé

Chapitre 3 : variables aléatoires

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre 3 : variables aléatoires"

Copied!
10
0
0

Texte intégral

(1)

Chapitre 3

Variables aléatoires.

3.1 Notion de variable aléatoire.

Souvent, on s’intéresse à des résultats numériques d’expériences aléatoires. On définit alors des proba- bilités sur l’ensemble des valeurs numériques susceptibles d’être obtenue. Dans ce cas, on utilise la notion devariable aléatoire.

Définition 3.1.1. Soit(Ω,P)un espace de configuration muni d’une probabilité.

1. Unevariable aléatoireX est unefonctionX : (Ω,P)→R. On définit alors une probabilité PX

sur l’ensemble imageX(Ω)⊂R: siAest un événement de1, on pose

PX(A) :=P({ω | X(ω)A}) noté aussi plus simplement PX(A) =P(X∈A}).

Cette dernière notation explique l’utilisation du termevariablealéatoire : comme on ne s’intéresse qu’aux valeurs prises parX et non aux éléments de Ω, on utilise X – au niveau des notations – comme si c’était une variable réelle

2. La probabilitéPX est appeléela loi deX.

Exemples 3.1.2.

Nombre de petits par portée pour une espèce de mammifère (variable aléatoire discrète).

Taille d’un individu adulte d’une espèce animale (variable continue).

Temps d’une réaction chimique...

3.1.1 Cas fini.

Si X prend les valeurs ordonnéesx1 < x2 < . . . < xn (c’est à direX(Ω) ={x1, . . . , xn}, la loi deX est entièrement déterminée par la donnée de :

pi=P(X=xi)∈[0,1], i∈ {1,2,· · ·, n}, p1+p2+· · ·pn = 1.

ou sous forme d’un tableau :

Valeurs deX x1 . . . xi . . . xn Total loi deX p1 . . . pi . . . pn 1

(2)

On est dans une situation semblable au cas d’une variable statistique : les fréquences sont remplacées par des probabilités. La fonction de répartition est la fonction :

F(x) =P(X≤x)

Cette fonction est croissante, constante par morceaux, discontinue enx1, . . . , xn, avec des sautsp1, . . . , pn. Plus précisément :

F(x) =

0 six < x1

p1+· · ·+pi sixix < xi+11≤in−1

1 sixxn

0 x1 x p1

x2

p1+p2

x3

p1+p2+p3

xn−1

p1+· · ·+pn−1

x4· · · xn

1

La fonctionF permet de retrouver la loi deX :

P(X=x) =F(x)− lim

t→xF(t) =

pi six=xi, 1≤in 0 six /∈ {x1, . . . , xn} On retrouve des propriétés analogues au cas des variables statistiques :

— Pour un couple de variables aléatoiresX et Y tel queX(Ω) ={x1, . . . , xn},Y(Ω) ={y1, . . . , ym}, la loi conjointe de (X, Y) est :

P(X =xi, Y =yj) =pij 1≤in, 1≤jm

— Les lois marginales :

P(X =xi) =pi∗=

n

X

j=1

pij P(Y =yj) =p∗j

m

X

i=1

pij

— On dit que X et Y sont indépendantes si :

P(X=xi, Y =yj) =P(X =xi)·P(Y =yj) c’est à direpij=pi×p∗j 1≤in, 1≤jm

— Les espérances :

X¯ =E(X) =

n

X

i=1

pi∗·xi Y¯ =E(X) =

m

X

j=1

p∗j·yj

— Les variances :

V(X) =E(X2)− E(X)2

=

n

X

i=1

pi∗·x2iX¯2 V(Y) =E(Y2)− E(Y)2

=

m

X

j=1

p∗j·y2iY¯2

— Les écarts types :σ(X) =p

V(X) σ(Y) =p V(Y)

(3)

— La covariance et le coefficient de corrélation : Cov(X) =E(XY)−E(X)E(Y) =

n

X

i=1 m

X

j=1

pijxiyiX¯Y¯ ρ(X, Y) =Cov(X, Y) σ(X)σ(Y) Si les variables sont indépendantes alors la covariance et le coefficient de corrélation sont nuls.

— Variables centrées réduites :

X0 =XX¯

σ(X) Y0 =YY¯ σ(Y)

Exemple 3.1.3. Si X est la somme des faces de deux dés lancés simultanément etY le plus grand des deux dés :

X\Y 1 2 3 4 5 6 Loi deX

2 1/36 1/36

3 1/18 1/18

4 1/36 1/18 1/12

5 1/18 1/18 1/9

6 1/36 1/18 1/18 5/36

7 1/18 1/18 1/18 1/6

8 1/36 1/18 1/18 5/36

9 1/18 1/18 1/9

10 1/36 1/18 1/12

11 1/18 1/18

12 1/36 1/36

Loi deY 1/36 1/12 5/36 7/36 1/4 11/36 1

E(X) = 7 E(Y) = 4,472 V(X) = 5,833 V(Y) = 1,971 σ(X) = 2,415 σ(Y) = 1,404

Cov(X, Y) = 2,917 ρ(X, Y) = 0,86

3.1.2 Cas dénombrable.

Toutes ces formules se généralisent au cas de variables qui prennent une infinité dénombrable de valeursx1, x2, . . . , xn, . . .les sommes étant alors entendues comme limites de sommes finies. Dans ce cas comme dans le cas fini, on parle devariable aléatoire discrèteet de loi discrète.

3.1.3 Cas non dénombrable.

Cette fois, comme on le verra plus loin, la fonction de répartition est continue : il n’y a plus de saut dans les valeurs. On parle devariable aléatoire continueet deloi continue. Comme conséquence, la probabilité d’obtenir une valeur donnée est toujours nulle ! Les formules précédentes ne conviennent plus, on va devoir utiliser un outil mathématique plus élaboré qu’une simple somme : l’intégrale remplacera la somme.

3.2 Lois discrètes usuelles.

3.2.1 Loi binomiale (cas fini).

Lors d’une expérience aléatoire, on s’intéresse à la réalisation d’un événementA de probabilitép. On répètenfois dans les mêmes conditions (de façons indépendantes). Le nombre aléatoireXégal au nombre

(4)

de fois queAs’est réalisé suit une loi dite binomiale de taillenet de paramètrep.

On noteX B(n, p).

Modèle : tirage de n fois une boule avec remise dans une urne contenant une proportion p de boules blanches etq= 1−pde noires :X est le nombre de boules blanches tirées.

La variableX peut prendre les valeurs 0,1,2, . . . , n. On a :

— Loi de X : P(X =k) = n

k

pkqn−kq= 1−p et 0≤kn.

— Espérance : E(X) =np

— Variance : V(X) =npq écart type : σ(X) =npq.

3.2.2 Loi hypergéométrique (cas fini).

Dans une population deN individus,N1d’entre eux possèdent un caractère. On prélève au hasard un échantillon denindividus. Le nombre aléatoireX égal au nombre d’individus qui ont ce caractère dans l’échantillon suit une loi dite hypergéométrique noté :X H(N, N1, n).

Modèle : tirage simultané denboules (ou tirage denfois une boule sans remise) dans une urne contenant N1 boules blanches etN2=NN1 de noires :X est le nombre de boules blanches tirées.

La variableX peut prendre les valeurs 0,1,2, . . . , n. En notantp=NN1 et q= 1−p, on a :

— Loi de X : P(X =k) =

N1 k

N−N1

n−k

N n

où 0≤kn.

— Espérance : E(X) =np

— Variance : V(X) =npqNn

N−1 écart type : σ(X) =√ npq

rNn N−1.

3.2.3 Loi géométrique (cas infini dénombrable).

Lors d’une expérience aléatoire , on s’intéresse à la réalisation d’un événementAde probabilitép. On répète l’expérience dans les mêmes conditions (de façons indépendantes) jusqu’à la première réalisation de A. Le nombre aléatoire d’expériences à réaliser X suit une loi géométrique de paramètre p notée N G(p).

Modèle : tirages successifs avec remise d’une boule dans une urne contenant une proportionpde boules blanches etq= 1−pde noires :N est le nombre de tirages pour obtenir la première boule blanche.

La variableN peut prendre toute valeur entière strictement positive 1,2, . . . , n, . . .. On a :

— Loi de N : P(N =k) =pqk−1k∈N.

— Espérance : E(N) = 1 p

— Variance : V(N) = q

p2 écart type : σ(N) =

q p .

3.2.4 Loi de Poisson (cas infini dénombrable).

Une expérience aléatoire a lieu pendant un laps de tempsT. Durant ce laps de tempsT, on s’intéresse au nombre de foisX qu’un événementAse réalise. On suppose qu’en moyenne on amréalisations deA, avec les trois conditions suivantes :

(5)

? Proportionnalité : le nombre moyen de réalisation de Aest proportionnel àT

? Non simultanéité : l’événementA ne peut se produire qu’une seule fois à un instant donné

? Indépendance : les diverses réalisations de Asont indépendantes.

Dans ce cas la variableX suit une loi de Poisson notéeP(m).

La variableX peut prendre toute valeur entière positive 0,1,2, . . . , n, . . .. On a :

— Loi de X : P(X =k) =mk

k! e−mk∈N.

— Espérance : E(X) =m

— Variance : V(X) =m écart type : σ(X) =√ m.

On utilise généralement cette loi pour approximer la loi binomialeB(n, p) : Théorème 3.2.1. Soit(pn)une suite de réels dans]0; 1[ etm >0 tels que lim

n→∞npn=m. Alors B(n;pn) −→

n→∞P(m).

Par conséquent, lorsquen >30 et 0< p≤0,1 etnp≤5, on peut remplacerB(n;p) parP(np).

3.3 Lois à densité usuelles.

Lorsqu’une variable X prend une infinité non dénombrable de valeurs, il se peut que la fonction de répartition :

F(x) =P(X≤x)

n’ait plus de discontinuités mais au contraire soit “régulière” c’est à dire continue, et même dérivable par morceaux. Puisque les discontinuités ont disparu, la probabilité d’obtenir une valeur xdonnée est nulle (cf.paragraphe 3.1.1). On ne mesure plus les probabilités deX valeur par valeur mais par intervalles de valeursa < Xb. Dans ce cas la dérivéef =F0 de la fonction de répartition s’appelle la densité. C’est elle qui définit la loi deX. Les probabilités se calculent avec les intégrales :

P(a < X≤b) = Z b

a

f(x)dx=F(b)−F(a)

La fonctionf est toujours positive etP(a < X≤b) est la surface entre la courbe, l’axe desxet les droites verticales d’équationsx=aet x=b.

0 x

100%

a b P(a < X≤b)

F(x)

0 x

f(x) a b

P(a < X≤b)

Figure3.1 – A gauche la fonction de répartitionF(x), à droite la densitéf(x)

(6)

On autorise éventuellement àaoubd’être infini en posant : Z +∞

a

f(x)dx= lim

b→+∞

Z b a

f(x)dx= 1−F(a) car lim

b→+∞F(b) = 1 Z b

−∞

f(x)dx= lim

a→−∞

Z b a

f(x)dx=F(b)−0 car lim

a→−∞F(a) = 0 L’espérance et la variance se calculent avec :

E(X) = Z +∞

−∞

xf(x)dx Var(X) =E(X2)− E(X)2

= Z +∞

−∞

x2f(x)dx−Z +∞

−∞

xf(x)dx2

Exemple 3.3.1. On se donne une cible de forme triangulaire ci-dessous. On ne s’intéresse qu’aux points d’impact dans la cible, et on noteX l’abscisse du point d’impact.

P(X≤x)

+x

0 +1 2

1+

X+ 1 1

On voit facilement en calculant des surfaces de triangles que :

F(x) =P(X ≤x) =





0 si|x|>1

x2

2 si0≤x≤1

1−(2−x)2 2 si1≤x≤2

F0(x) =f(x) =

0 si|x|>1 x si0≤x≤1 (2−x) si1≤x≤2 En d’autres termes, le graphe de f peut être interprété comme le bord supérieur de la cible. La fonction F est représentée (entre 0 et 1 et entre 1 et 2) par deux arcs de parabole :

+x P(X≤x)+

0 +1 +2

1+ 1

1

Exercice 3.3.2. Calculer l’espérance, la variance et l’cart type deX dans l’exemple 3.3.1.

E(X) = 1, V(X) = 1

6, σ(X) = 1

√6.

3.3.1 Loi uniforme.

Si on a une expérience aléatoireX à valeurs dans un intervalle [m, M] dont les résultats sont réguliè- rement continûment répartis, on dit queX suit une loi uniforme sur [m, M].

On noteµ= M+m2 eta= M−m2 . On a alors :

(7)

? Densité deX: f(x) =



 1

Mm = 1

2a simxM

0 sinon m µ x

1 2a

a M

? Fonction de répartiton deX: F(x) =













0 six < m xm

Mm simxM

1 six > M m µ x

1

a M

? Espérance, variance - écart type : E(X) =µ=M +m

2 V(X) =a2

3 =(M −m)2

12 σ(X) = a

√3 =(M −m) 2√

3 .

3.3.2 Loi exponentielle.

On utilise souvent cette loi pour calculer des durées de vie d’objets non vieillissants (non soumis à l’usure), par exemple les particules atomiques.

SoitT une variable qui suit une loi exponentielle de paramètreλ. On noteT E(λ) (Remarque : si T est ens, alorsλest ens−1).

? Densité deT: f(t) =

0 sit <0 λe−λt sit≥0

0 1 t

λ

λ

? Fonction de répartition deT:F(t) =

0 sit <0 1−e−λt sit≥0

0 t

1

1 λ

? Espérance, variance - écart type : E(T) = 1

λ V(T) = 1

λ2 σ(T) = 1 λ.

Exercice 3.3.3. On s’intéresse à la durée de vie T, exprimée en semaines, d’une LED. On modélise cette situation par une loi E(λ). Une étude statistique portant d’un lot important de ces LED a mis en évidence que 50%sont encore en état de marche au bout de 231 semaines. En d’autres termes, la valeur 231 est la médiane aussi appelée demi-vie.

1. Calculer la valeur de λ. (λ= 3,0·10−3)

2. CalculerE(T)etσ(T)(E(T) = 333,3 =σ(T)).

3. Calculer la probabilité qu’une de ces LED fonctionne encore au bout de 520 semaines (10 ans) (P(T ≥520) = 21%).

(8)

3.3.3 Loi normale.

La loi normaleapparaît dans de nombreux contextes de probabilités et de statistique inférentielle, notamment en raison du théorème de la limite centraleque l’on verra dans le paragraphe suivant.

La loi normale de moyenne µet d’écart type σest notéeN (µ, σ) (ou bienN (µ, σ2) si on considère la varianceσ2). La loi normaleN (µ, σ) se déduit de la loi normale centrée réduiteN (0,1).

Une variableX suit une loiN(µ, σ) – notéX N(µ, σ) – si la variable centrée réduite associée suit une loi normale centrée réduite

Z= Xµ

σ N(0,1).

La loi normale centrée réduite est caractérisée par les données suivantes.

? Densité deZ : f(z) = 1

√2πe−z2/2

? Fonction de répartition de Z : F(z) = 1

√2π Z z

−∞

e−t2/2dt

? Espérance, variance - écart type :

E(Z) = 0 V(Z) = 1 σ(Z) = 1.

Sur les tables statistiques, on donne souvent : ϕ(z) =P(0≤Zz) = 1

√2π Z z

0

e−t2/2dt=F(z)−0,5 et on utilise la parité de la densitéf.

0 z

1

+1 1

−1+ +

+ 2

−2

N(0; 1)

µ + x

µ+σ σ

µ+−σ +

µ+ 2σ µ−+2σ

N (µ;σ)

Exercices 3.3.4. 1. Soit Z une variable qui suit une loi normale centrée réduite. calculer : P(0,53≤Z≤1,34), P(−1,02≤Z ≤2,433), P(Z≥1,96), P(Z≥ −1,645)

z 0,53 1,34 −1,02 0,433 1,96 −1,645 P(Z≤z) 70,19% 90,99% 15,39% 66,75% 97,50% 5,00%

2. La tailleX de la souris de laboratoire (sans la queue), mesurée en cm est régie par une loi normale N(8,7; 0,8).

(a) Calculer les probabilités P(X ≤ 7,7) (10,56%), P(X ≤ 9,4) (80,92%), P(7,7 ≤ X ≤ 9,2) (62,83%),P(X ≥7,0)(98,32%).

(b) Trouver la taille maximale de 5% des souris les plus petites ('7,38mm).

(c) Trouver la taille minimale de 10% des souris les plus grandes ('9,73mm).

(d) Calculer les trois quartiles (Q1= 8,16 Q2= 8,7 Q3= 9,24).

(e) Donner un intervalle de fluctuation de la moyenne avec une confiance de95% ([7,13; 10,26]).

3.3.4 Théorème de la limite centrale.

La loi normale s’utilise comme loi limite en vertu du théorème suivant dit de la limite centrale :

(9)

Théorème 3.3.5 (de la limite centrale).

1. Soit(Xk)k≥1 une suite de variables aléatoires indépendantes de même loi, de moyenneµet d’écart typeσ, alors lorsque ntend vers l’infini

la loi de la sommeΣn=

n

X

k=0

Xk se rapproche de la loiN (nµ,√ n·σ);

La loi de la moyenneMn= 1 n

n

X

k=1

Xk se rapproche de la loiN µ,σn

;

La loi de la centrée réduiteZn= Mnµ σ/

nn σ

n se rapproche de la loiN (0,1).

Plus précisément :

P(Znz) =P

Mnµ+z σ

n

=P Σn+z

n→∞−→

√1 2π

Z z

−∞

e−t2/2dt.

2. En particulier, si une variable Yn suit une loi B(n, p), alors Yn est la somme de n variables X1, . . . , Xn indépendantes de loi de Bernoulli B(p) = B(1, p), de moyenne p et de variance pq (oùq= 1−p). Par conséquent lorsquen tend vers l’infini :

la loiB(n;p)deYn se rapproche de la loiN (np,√ npq).

ou encore : la loi de Ynn se rapproche de la loiN p,ppq

n

.

Remarque 3.3.6. Lorsque l’on fait l’approximation deB(n;p)parN (np,p

np(1p)), on commet des erreurs dues au passage du discrêt au continu. Pour atténuer cette erreur, on fait une correction de continuité:

siX B(n, p), pour chaque entier k entre 0 et n la probabilité P(X =k)peut être reprécentée par la surface du rectangle de base[k−0,5 ;k+ 0,5]et de hauteurP(X =k).

Alors siX0 N (np,p

np(1p))on a :

P(X =k)'P(k−0,5≤X0k+ 0,5) P(X ≤k)'P(X0k+ 0,5) P(X < k)'P(X0k−0,5)

k−1+ +

k +

k+1 +

k+2 x

'

Exercice 3.3.7. Selon l’INED (Institut National d’Etudes Démographiques), 48,8% des nouveaux nés (en France) sont des filles contre 51,2% de garçons. Dans une maternité Dijonnaise, on a observé (en moyenne) n = 170 naissances par mois. On note Xn le nombre aléatoire de filles sur un échantillon théorique de170 nouveaux nés etPn la proportion aléatoire de filles.

(10)

1. Quelle est la loi deXn.

2. Calculer son espérance et son écart type.

(E(Xn) = 82,96 σ(Xn) = 6,52)

3. Par quelle loi peut-on approximer la loi de Xn? (Xn B(170; 48,8%) ' N(82,96; 6,52))

4. CalculerP(Xnk)pour79≤k≤90.

5. Par quelle loi peut-on approximer la loi de Pn? (Pn N (48,8%; 3,83%))

6. Pour une confiance de 95%, déterminer un intervalle de fluctuation du pourcentage de filles pour un échantillon de taille 170 ([41,29%; 56,3%]).

P Xnk

Loi normale k Binomiale Loi normale sans correction

79 29,80% 29,77% 27,17%

80 35,32% 35,29% 32,49%

81 41,16% 41,14% 38,18%

82 47,21% 47,19% 44,14%

83 53,32% 53,30% 50,24%

84 59,36% 59,34% 56,34%

85 65,18% 65,16% 62,29%

86 70,66% 70,65% 67,96%

87 75,70% 75,70% 73,23%

88 80,24% 80,23% 78,03%

89 84,22% 84,22% 82,30%

90 87,63% 87,63% 86,00%

Références

Documents relatifs

On appelle « variable aléatoire discrète », une application qui à chaque événement X fait correspondre un nombre réel noté P(X).. 3- la Loi de probabilité d’une

Combien de chaussettes prendre pour être sûr d'avoir au moins une paire assortie?. Si je prends 18 chaussettes ou moins, je cours le risque qu’elles soient

Beaucoup d'entre vous se demandent comment cela se passe pour le téléchargement d'un fichier… En fait, il faut procéder exactement comme si vous faisiez un lien vers une page web,

[r]

La fonction ϕ est continue sur \ comme différence de deux fonctions continues sur cet intervalle.. Puisqu’elle ne s’annule pas, elle garde un

En reproduisant cependant ce « motif », on peut définir une fonction continue sur \ satisfaisant la contrainte imposée :. Notons ϕ la fonction correspondant à la

• Lorqu’une variable aléatoire réelle prend des valeurs entières ou des valeurs réelles en nombre fini, on dit que la loi de probabilité de cette variable aléatoire est

Le terme de gouvernance renvoie aux fonctions et actions de gouvernement, mais sans l’idée d’uniformisation, de rationalité, de standardisation » (1995 : 60)... Pour terminer