Chapitre 20 : variables aléatoires

(1)

VARIABLES ALÉATOIRES

Ωdésigne toujours un ensemble fini, muni d’une probabilitéP.

I – Variables aléatoires réelles

Définition 1 :

Unevariable aléatoireréelle sur l’universΩest une applicationXdéfinie surΩet à valeurs dansR^. On note {X = x} l’évènement contenant les éventualités de l’univers Ω dont l’image par X est x : {X=x}={ω∈Ω, X(ω)=x}.

Une variable aléatoireXdéfinit un nouvel universΩ⁰(fini lui aussi), appelé univers image, regroupant toutes les images des éléments deΩparX. On peut alors définir une loi de probabilitéP⁰surΩ⁰ parP⁰(x)=P(X=x) pour toutx∈Ω⁰.

Propriété 1 :

Soit X une variable aléatoire surΩ. L’application fX :

¯

X(Ω) −→ [0,1]

x 7−→ fX(x) telle que∀x∈X(Ω), fX(x)=P(X=x)définit une probabilité sur X(Ω). fX est appeléeloi de probabilitéde lavariable aléatoireX .

Démonstration : On utilise le théorème vu dans le chapitre sur les probabilités.

Remarque : – SiX(Ω)=©

x₁,x₂,...,x_nª

, alors©

(X=x₁),...,(X=x_n)ª

est un système complet d’événements pourΩ. – Comme on se limite aux variables aléatoires prenant un nombre fini de valeurs, on peut donc représenter la

loi de probabilité dans un tableau du type : x x₁ x₂ . . . x_n P(X=x) p1 p2 ... pn

– On peut représenter graphiquement une loi de probabilité par un diagramme en bâtons :

0 1 2 3 4 5

−1

−2

−3

−4

−5

0 0.2 0.4 0.6 p_i

xi

Exemple 1 : On jette deux dés équilibrés, etXest l’application qui à tout couple de résultats des deux dés associe leur somme. On peut résumer l’univers dans un tableau, ce qui donneX(Ω)=££

2,12¤¤ . On calcule par exemplef_X(5), et on obtient plus généralement :

x 2 3 4 5 6 7 8 9 10 11 12

P(X=x) 1 36

1 18

1 12

1 9

5 36

1 6

5 36

1 9

1 12

1 18

1 36 Remarque :

– Une variable aléatoire permet donc de « transporter » une loi de probabilité sur un nouvel univers. On constate sur l’exemple précédent que la loi de la variable aléatoire n’est pas forcément uniforme, et ce même si l’on se trouve dans une situation d’équiprobabilité pour l’univers de départ.

– Pour déterminer la loi d’une variable aléatoire : on commence par préciser l’univers image. Puis on a deux possibilités : soit reconnaître une loi usuelle, en le justifiant (voir plus loin), soit calculer pour toutk∈X(Ω), P(X=k) (en présentant éventuellement les résultats dans un tableau, si cela s’y prête).

(2)

Définition 2 :

SoitXune variable aléatoire sur l’universΩ.

On appellefonction de répartitiondeXl’application F_X :

¯

R −→ [0,1]

x 7−→ F_X(x)=P(X≤x) .

Exemple 2 : Représentation graphique de la fonction de répartition associée à la variable aléatoire de l’exemple précédent.

Propriété 2 :

Soit X une variable aléatoire sur l’universΩ, de fonction de répartition F_X. Alors F_X est une fonction en escalier et croissante surR^.

Démonstration : La croissance utilise la propriété de croissance d’une probabilité, et on montre que

∀i∈££

1,n−1¤¤

,FX est constante sur [xi,xi+1[, puis sur ]− ∞,x1] et sur [xn,+∞[.

Remarque : En particulier, on a lim

x→−∞F_X(x)=0 et lim

x→+∞F_X(x)=1. La fonction de répartition correspond aux fréquences cumulées croissantes en statistiques.

Réciproquement, la connaissance de la fonction de répartition permet de remonter à la probabilité dont elle est issue :

Propriété 3 :

Soit X une variable aléatoire sur l’univers Ω de fonction de répartition F_X. On suppose que X(Ω)=©

x₁, x₂, ...,x_nª

, avec x₁<x₂<...<x_n. Pour tout i∈££

2,n¤¤

, P(X=x_i)=F_X(x_i)−F_X(x_i−1) et P(X=x₁)=F_X(x₁). Démonstration : On utilise les résultats trouvés dans la propriété précédente.

II – Moments d’une variable aléatoire

Dans tout ce qui suit,Xdésigne une variable aléatoire réelle surΩ, et on note©

x₁,x₂,...,x_nª

=X(Ω).

1^o) Espérance Définition 3 :

On appelleespérance mathématique(ouespérance) deX le réel E(X)=

n

X

i=1

x_iP(X=x_i) .

Remarque : L’espérance est l’analogue de la moyenne en statistiques. En théorie des jeux, un jeu est dit équitable si l’espérance de la variable aléatoire X qui mesure le gain est nulle. Il est favorable au joueur si E(X)>0, et défavorable au joueur si E(X)<0.

Exemple 3 : On lance trois fois de suite une pièce de monnaie équilibrée. On gagne 2epour chaque résultat « Pile » et on perd 1epour chaque résultat « Face ». On noteGla variable aléatoire qui à chaque éventualité associe le gain en euros : calculons son espérance, et interprétons le résultat trouvé.

Examinons quelques propriétés de l’espérance : Propriété 4 :

Soient X et Y deux variables aléatoires surΩ,(λ,µ)∈R²^. Alors E(λX+µY)=λE(X)+µE(Y) (linéarité de l’espérance).

Démonstration : Admis car très immédiat.

(3)

Propriété 5 :

Soient X et Y deux variables aléatoires surΩ.

Si X(Ω)⊂R⁺^{, alors} ^E(X⁾≥0 (positivité de l’espérance), et si X(ω)≤Y(ω)pour toutω∈Ω(ce que l’on notera plus simplement X≤Y ), alors E(X)≤E(Y) (croissance de l’espérance).

Démonstration : La positivité est une conséquence directe de la définition de l’espérance, et la croissance s’obtient à l’aide de la linéarité et de la positivité en s’intéressant à la variable aléatoireY−X.

Remarque : Une conséquence de cette propriété est que siX(Ω)⊂[a,b], alorsE(X)∈[a,b].

La composée d’une variable aléatoire réelle et d’une fonction numérique donne une nouvelle variable aléa- toire, dont il n’est pas toujours aisé d’expliciter la loi, mais dont on peut calculer l’espérance :

Théorème 1 :

(théorème de transfert)

Soit u une fonction deR^dansR^.

La variable aléatoire Y =u(X)a pour espérance E(Y)=

n

X

i=1

u(xi)P(X=xi) .

Démonstration : Admis.

Exemple 4 :

– Si u est affine, la propriété précédente (et la linéarité de la somme) permet de montrer que E(aX+b)=aE(X)+b.

– On jette deux dés équilibrés, un rouge et un bleu. Xest la variable aléatoire qui à tout couple de dé associe la différence du dé rouge et du dé bleu. On noteY =X², et on calcule l’espérance deY de deux façons.

Définition 4 :

La variable aléatoireXest ditecentréesi E(X)=0 .

Exemple 5 : Pour toute variable aléatoire X, la variable aléatoire Y = X −E(X) est centrée : c’est la variable centrée associée àX.

2^o) Moments Définition 5 :

Soitr un entier naturel.

On appellemoment d’ordrerde la variable aléatoireXle réel mr(X)=

n

X

i=1

P(X=xi)x_i^r .

Exemple 6 : Pourr =0, le moment d’ordre 0 deXvaut 1. Pourr=1, le moment d’ordre 1 deXest l’espérance de X.

Définition 6 :

Soitr un entier naturel.

On appelle moment centré d’ordre r de la variable aléatoire X le réel µr(X)=

n

X

i=1

P(X=xi)¡

xi−E(X)¢r

.

Remarque : Le moment centré d’ordrerde la variable aléatoireX est le moment d’ordrerde la variable centrée associée àX.

Propriété 6 :

Pour tout r∈N^{, m}r(X)=E³ X^r´

et µr(X)=E³

¡X−E(X)¢r´ . Démonstration : On applique directement le théorème de transfert.

Exemple 7 : Le moment centré d’ordre 1 vaut 0.

(4)

3^o) Variance et écart-type Définition 7 :

On appellevariancedeXle moment centré d’ordre 2 deX: V(X)=µ2(X) .

On a donc V(X)=E³

¡X−E(X)¢2´

=

n

X

i=1

¡xi−E(X)¢2

P(X=xi) .

Remarque : D’après la propriété 5,V(X)≥0. De plus,V(X) est nulle si et seulement siX(Ω) est un singleton (la variable n’est plus si aléatoire que ça...).

La variance est l’espérance du carré de l’écart à l’espérance. Elle peut se calculer plus simplement : Propriété 7 :

(Formule de Koenig-Huygens) V(X)=E¡X²¢

−¡E(X)¢2 .

Démonstration : On développe le carré dans la définition, un peu de théorème de transfert et le tour est joué...

Autant l’espérance mathématique est linéaire, autant la variance ne l’est pas, du fait notamment de la présence du carré :

Propriété 8 :

Pour tous réels a et b, V(aX+b)=a²V(X). Démonstration : Un petit calcul mène au résultat.

La variance mesure la dispersion des valeurs deX autour de l’espérance (plus elle est petite, plus les valeurs sont rapprochées de l’espérance). Elle présente l’inconvénient, pour une variable aléatoire exprimée dans une certaine unité, de ne pas avoir la même unité queX. Voilà pourquoi on introduit l’écart-type :

Définition 8 :

L’écart-typedeXest la racine carrée de la variance : σX =p V(X) .

L’écart-type mesure également la dispersion des valeurs de X autour de l’espérance, mais possède la même unité queX.

Exemple 8 : Au jeu de la roulette (non russe), les 37 éventualités {0;1;2;...;36} sont équiprobables. Les numéros impairs sont rouges, les numéros pairs sont noirs (sauf le 0). Lorsqu’on mise 1esur « rouge », on gagne 1e^{si un} numéro rouge sort, sinon on perd sa mise. Lorsqu’on mise 1esur un numéro, on gagne 35esi le numéro sort, sinon on perd sa mise. Comparons ces deux façons de jouer.

Définition 9 :

Si E(X)=0 etσX=1, on dit que la variable aléatoireX estcentrée réduite.

Exemple 9 : Pour toute variable aléatoire X, la variable aléatoire X^∗= X−E(X)

σX est centrée réduite : c’est la variable centrée réduite associée àX.

Un résultat permet de préciser la mesure de dispersion autour de la moyenne : Propriété 9 :

(Inégalité de Bienaymé-Tchebychev) Pour tout réelε>0, on a P¡

|X−E(X)| ≥ε¢

≤σ²_X ε² . Démonstration : On note A=©

|X−E(X)| ≥εª

=©

(X−E(X))²≥ε²ª

=©

X =x_i, i∈Iª

. On décompose alors dans V(X) la somme, eni∈Ieti∉I, que l’on minore ensuite.

Remarque : Ainsi plusσX est faible et plusεest grand, plus la probabilité queX s’éloigne de son espérance de plus deεest faible. L’inégalité ne donne qu’une majoration, pas très précise en général, mais utile pour établir des résultats théoriques.

(5)

III – Lois usuelles

1^o) Loi certaine

Définition 10 :

On dit que la variable aléatoireX suit laloi certainesi X prend une seule valeur : X(Ω)=© αª

et P(X=α)=1 .

Le calcul de l’espérance et de la variance est alors immédiat : Propriété 10 :

Si X suit la loi certaine, avec X(Ω)=©

αª, alors E(X)=α et V(X)=0. Démonstration : Particulièrement évident.

La loi certaine n’étant pas la plus passionnante des lois, nous allons en voir d’autres.

2^o) Loi uniforme

La loi uniforme correspond au cas où les probabilités des différentes valeurs de la variable aléatoire sont égales.

Soit (n,m)∈N²^,^m<n.

On dit que la variable aléatoire X suit la loi uniforme sur££ m,n¤¤

si X(Ω)=££ m,n¤¤

et, pour tout k∈££

m,n¤¤

, P(X=k)= 1

n−m+1 . On note alors X,→U(m,n) . Dans le cas oùm=1 (loi uniforme sur££

1,n¤¤

), on note X,→U(n) : on a alors pour toutk∈££ 1,n¤¤

, P(X=k)= 1

n .

Remarque : SiX,→U(m,n), alors en posantY =X−m+1,Y ,→U(n−m+1).

Exemple 10 : Voir l’exercice 6 de la feuille 13 : parmin objets, un seul est défectueux. On teste les objets les uns après les autres, et on noteX la variable aléatoire qui donne le rang du test où l’objet défectueux est détecté : X,→U(n).

Le calcul de l’espérance est facilité par la remarque précédente : Propriété 11 :

Si X,→U(n)où n∈N^∗, alors E(X)=n+1

2 .

Démonstration : On retrouve des sommes connues.

Remarque : Avec ce qui précède, siX,→U(m,n) oùm<n, alorsY =X−m+1 suit la loiU(n−m+1). À partir de l’espérance deY et de la linéarité de l’espérance, on obtient alors E(X)=m+n

2 .

Pour être complet, on représente la loi de probabilité et la fonction de répartition dans un cas particulier.

3^o) Loi de Bernoulli

La loi de Bernoulli correspond à une variable aléatoire prenant deux valeurs.

Définition 12 : Soitp∈]0,1[.

On dit que la variable aléatoire X suit la loi de Bernoulli de paramètre p si X(Ω)=© 0,1ª

et P(X=1)=p (et donc P(X=0)=1−p ). On note alors X,→B(1,p) ou X,→B(p) .

(6)

Remarque :

– On parle de succès siX=1 et d’échec siX=0.

– Pour toute expérience conduisant à deux résultats (succès ou échec), on peut définir une variable aléatoire X suivant une loi de Bernoulli. Ainsi, dès lors qu’on dispose d’une partition de l’univers n

A; Ao et que l’expérience consiste à choisir hasard un élément de l’univers, on peut définir une loi de Bernoulli. Par exemple, on tire au hasard une boule dans une urne contenant 10 boules dont 6 noires. SiX désigne le nombre de boules noires obtenues,X,→B

µ 1,3

5

¶ .

– Pour tout événementAde probabilitép, la fonction indicatrice1A:

¯

Ω −→ © 0 , 1ª ω 7−→

½ 1, siω∈A; 0, sinon.

est une variable aléatoire suivant une loi de Bernoulli de paramètrep.

Propriété 12 :

Si X,→B(1,p)où p∈]0,1[, alors E(X)=p et V(X)=p(1−p). Démonstration : Immédiat.

On représente à nouveau la loi de probabilité et la fonction de répartition dans un cas particulier.

4^o) Loi binomiale Définition 13 :

Soitpun réel appartenant à [0,1], etn∈N^∗^.

On dit queXsuit laloi binomialede paramètresnetpsi X(Ω)=££ 0,n¤¤

et, pour tout entierkcompris entre 0 etn, on a P(X=k)=

µ n k

¶

p^k(1−p)^n−k . Dans ce cas, on note X,→B(n,p) .

Remarque : Pourn=1, on retombe sur une loi de Bernoulli.

La loi binomiale correspond à une répétition de lois de Bernoulli : Propriété 13 :

Lorsqu’on répète n fois, de façon indépendante, une même expérience associée à une loi de Bernoulli de paramètre p, la variable aléatoire X comptabilisant le nombre de succès suit la loi binomiale de paramètres n et p.

Démonstration : La probabilité de l’événement {X =k} s’exprime à l’aide d’un modèle de tirage successif avec remise.

Remarque : Ainsi dans la loi binomiale, le premier paramètre indique le nombre de répétitions, le second la probabilité de succès à chaque expérience. Les critères pour qu’une variable aléatoire suive la loi binomiale de paramètrenetpsont donc :

– On répètenfois une expérience ;

– On peut regrouper les résultats en deux catégories : succès avec une probabilitépou échec (le contraire) ; – Les expériences successives sont indépendantes.

Le modèle classique conduisant à une telle loi est celui d’un tirage successif avec remise.

Exemple 11 : Un QCM comporte 10 questions offrant chacune 3 réponses possibles, une seule d’entre-elles étant correcte. Un étudiant qui n’a pas révisé répond au hasard aux 10 questions.

Calculer la probabilité d’obtenir 2 réponses exactes (on trouve 0,195), puis la probabilité d’avoir au moins 4 réponses exactes (on trouve 0,432).

(7)

Remarque : Pour une loi de probabilité, la somme de toutes les probabilités doit valoir 1. C’est le cas pour la loi binomiale en raison de la formule du binôme.

Soit X une variable aléatoire suivant la loi binomialeB(n,p).

Alors E(X)=np et V(X)=np(1−p).

Démonstration : Pour l’espérance, on utilise l’égaliték µ n

k

¶

=n µ n−1

k−1

¶

, puis la formule du binôme. Pour la variance, l’astuce consiste à calculer plutôt E¡

X(X−1)¢ que E¡

X²¢

, à l’aide du théorème de transfert et de l’égalité k(k−1)

µ n k

¶

=n(n−1) µ n−2

k−2

¶ .

Exemple 12 : On lance 1200 fois un dé équilibré. X est la variable aléatoire qui comptabilise le nombre de 6 sortis. Déterminer la loi deX, son espérance, son écart-type.

On représente graphiquement la loi de probabilité (et la fonction de répartition) dans quelques cas particuliers (n=6 et les valeurs dep:p=0,25,p=0,5,p=0,75), et on discute des allures obtenues (en prouvant notamment la symétrie pourp=1

2) :

k 0 1 2 3 4 5 6

p=0,25 0,18 0,36 0,3 0,13 0,03 0,004 0,0002 p=0,5 0,02 0,09 0,23 0,31 0,23 0,09 0,01 p=0,75 0,0002 0,004 0,03 0,13 0,3 0,36 0,18 5^o) Loi hypergéométrique

La loi binomiale permet de modéliser des tirages successifs et avec remise. Pour des tirages successifs sans remise ou des tirages simultanés, nous allons tenter et réussir à écrire la loi correspondante.

On considère une urne contenantN boules, donta blanches. On notep= a

N (p représente la proportion de boules blanches dans l’urne). L’expérience consiste à prélever simultanémentn boules de l’urne, etX est la variable aléatoire qui représente le nombre de boules blanches obtenues dans le tirage.

X prend ses valeurs dans££ 0,n¤¤

, mais l’univers image n’est pas££ 0,n¤¤

: sin>a, alorsX(Ω)=££ 0,a¤¤

(on tire plus de boules qu’il n’y a de boules blanches), et sin>N−a, alorsX(Ω)=££

n−N+a,n¤¤

(on tire plus de boules qu’il n’y a de boules non blanches).

Pourk∈X(Ω), on prouve queP(X=k)= µ N p

k

¶ µ N(1−p) n−k

¶

µ N n

¶ .

Remarquons que pour un tirage successif sans remise, on obtient exactement la même probabilité (les com- binaisons deviennent listes sans répétition, et il faut tenir compte du rang desk boules blanches dans le tirage successif, qui donne un facteur

µ n k

¶ ).

SoientN∈N^∗^,ⁿ∈££ 0,N¤¤

etpun réel appartenant à [0;1] tel queN p∈N^.

On dit queX suit laloi hypergéométriquede paramètresN, n etp si X(Ω)⊂££ 0,n¤¤

et, pour tout

entierk∈X(Ω), on a P(X=k)= µ N p

k

¶ µ N(1−p) n−k

¶

µ N n

¶ . Dans ce cas, on note X,→H(N,n,p) .

(8)

Remarque :

– sikn’appartient pas àX(Ω), on obtient bienP(X=k)=0.

– Autre interprétation du modèle de la loi hypergéométrique : une population est constituée deN individus, dont une proportionp présente une certaine caractéristique. Lors d’un échantillonnage de n individus pris au hasard dans la population, on note X le nombre d’individus possédant la caractéristique. Alors X,→H(N,n,p).

– La somme de toutes les probabilités vaut bien 1 grâce à la formule de Vandermonde.

Exemple 13 : Deux situations :

– 10 candidats se présentent à un examen où chacun a 60 % de chances d’être reçu. Quelle est la probabilité d’avoir 5 reçus ? 0,201 environ...

– Dans un concours, 100 candidats se présentent pour 60 places. Si 10 amis se présentent à ce concours, quelle est la probabilité d’avoir 5 reçus ? 0,2076 environ...

Soit X une variable aléatoire telle que X,→H(N,n,p).

Alors E(X)=np .

Démonstration : On utilise l’égaliték µ N p

k

¶

=N p

µ N p−1 k−1

¶

, puis la formule de Vandermonde, et enfin l’égalité N

µ N−1 n−1

¶

=n µ N

n

¶ .

Exemple 14 : Dans une population, on considère qu’il y a 10 % de gauchers, le reste étant des droitiers. Déter- miner la loi deXcomptabilisant le nombre de gauchers dans un groupe de 50 personnes, ainsi que son espérance.

On représente graphiquement la loi de probabilité (et la fonction de répartition) dans quelques cas particuliers (N=20,n=12 et les valeurs dep:p=0,25,p=0,5,p=0,75), et on discute des allures obtenues.

k 0 1 2 3 4 5 6 7 8 9 10 11 12

p=0,25 0,004 0,05 0,24 0,4 0,26 0,05

p=0,5 0,0004 0,01 0,08 0,24 0,35 0,24 0,08 0,01 0,0004

p=0,75 0,05 0,26 0,4 0,24 0,05 0,004

On constate sur le graphique que le diagramme en bâton d’une loi hypergéométrique ressemble fortement à celui d’une loi binomiale : siN est grand par rapport àn, un tirage den boules avec remise dans une urne en contenantNest assimilable à un tirage sans remise, donc les deux lois sont proches. Essayons de quantifier cela : siX,→H(N,n,p), alors on écritP(X=k) en explicitant les factorielles, et en commençant par faire apparaître µ n

k

¶

. En écrivant le reste sous forme de produit, et en divisant chaque terme du numérateur et du dénominateur parN, on prouve que lim

N→+∞P(X=k)=p^k(1−p)^n−k µ n

k

¶

, ce qui correspond à une loi binomiale de paramètres netp. On en déduit la propriété suivante :

Si X,→H(N,n,p)et si N est grand, alors la loi de X peut être approchée par la loi binomialeB(n,p).

Remarque : En pratique, on retient que l’approximation précédente est valable pour N≥10n . L’intérêt de l’approximation réside dans la simplification pour le calcul des probabilités, avec notamment l’abandon de l’un des 3 paramètres intervenant dans la loi hypergéométrique.

Exemple 15 : On teste cette approximation sur un exemple : si X ,→ H(200;15;0,4), on montre que P(X=6)≈0,2147, et siY ,→B(15;0,4), on montre queP(Y =6)≈0,2065. L’approximation est très correcte.