• Aucun résultat trouvé

(M316) de la troisi` eme ann´ ee de licence

N/A
N/A
Protected

Academic year: 2022

Partager "(M316) de la troisi` eme ann´ ee de licence"

Copied!
71
0
0

Texte intégral

(1)

Probabilit´es continues 1

Pascal Maillard 15 d´ ecembre 2017

1. Notes du cours

Probabilit´ es

(M316) de la troisi` eme ann´ ee de licence

Math´ ematiques et

Interactions

` a l’Universit´ e Paris-Sud

(2)
(3)

Table des mati` eres

0 Pr´ eliminaires 5

0.1 Bibliographie conseill´ ee . . . . 5

0.2 Bagage math´ ematique . . . . 5

0.2.1 S´ eries de fonctions et int´ egrales ` a param` etre . . . . 6

0.2.2 Th´ eor` emes de Fubini et Tonelli . . . . 7

0.3 Rappels du cours de probas en L2 . . . . 8

0.3.1 Probabilit´ es . . . . 8

0.3.2 Variables al´ eatoires . . . . 9

0.3.3 Par la suite. . . . . . . 9

1 Variables al´ eatoires r´ eelles 11 1.1 D´ efinition et axiomes . . . . 11

1.2 Ev´ ´ enements . . . . 13

1.2.1 Ind´ ependance d’´ ev´ enements et probabilit´ e conditionelle. . . . 14

1.3 Fonction de r´ epartition . . . . 14

1.4 Classes de variables al´ eatoires . . . . 16

1.5 Quelques variables al´ eatoires discr` etes importantes . . . . 18

1.5.1 Loi de Dirac . . . . 18

1.5.2 Loi uniforme . . . . 19

1.5.3 Loi de Bernoulli . . . . 19

1.5.4 Loi binomiale . . . . 20

1.5.5 Loi de Poisson . . . . 20

1.5.6 Loi g´ eom´ etrique . . . . 21

1.5.7 Autres lois discr` etes . . . . 21

1.6 Quelques variables al´ eatoires continues importantes . . . . 22

1.6.1 Loi uniforme . . . . 22

1.6.2 Loi normale (ou gaussienne) . . . . 22

1.6.3 Loi exponentielle . . . . 23

1.6.4 Autres lois ` a densit´ e . . . . 24

1.7 Loi d’une fonction d’une variable al´ eatoire . . . . 24

2 Esp´ erance et moments 31 2.1 Esp´ erance d’une variable al´ eatoire . . . . 31

2.2 Esp´ erance d’une fonction d’une variable al´ eatoire . . . . 32

2.3 Moments et quantit´ es associ´ ees . . . . 35

2.3.1 Esp´ erance ou moyenne . . . . 35

3

(4)

2.3.2 Variance . . . . 35

2.3.3 Asym´ etrie . . . . 37

2.3.4 Kurtosis . . . . 37

2.4 Fonction g´ en´ eratrice des moments . . . . 38

2.5 In´ egalit´ es . . . . 40

2.5.1 In´ egalit´ e de Markov . . . . 40

2.5.2 In´ egalit´ e de Tchebychev . . . . 41

2.5.3 In´ egalit´ e de Jensen . . . . 41

3 Variables al´ eatoires ind´ ependantes 43 3.1 Variables al´ eatoires simultan´ ees . . . . 43

3.1.1 Variables al´ eatoires discr` etes . . . . 44

3.1.2 Variables al´ eatoires conjointement ` a densit´ e . . . . 45

3.1.3 Fonction de variables al´ eatoires simultan´ ees . . . . 45

3.1.4 Esp´ erance . . . . 45

3.2 Variables al´ eatoires ind´ ependantes . . . . 46

3.3 Fonctions de variables al´ eatoires ind´ ependantes . . . . 48

3.3.1 Maximum et minimum . . . . 48

3.3.2 Somme . . . . 49

4 Suites de variables al´ eatoires et th´ eor` emes limites 53 4.1 Convergence de suites de variables al´ eatoires . . . . 53

4.1.1 Convergence en loi . . . . 53

4.1.2 Convergence en probabilit´ e . . . . 54

4.1.3 Convergence en moyenne quadratique . . . . 56

4.1.4 Convergence presque sˆ ure . . . . 57

4.2 Convergence de couples al´ eatoires . . . . 57

4.3 Loi des grands nombres . . . . 59

4.4 Th´ eor` eme central limite . . . . 60

5 Variables al´ eatoires d´ ependantes 61 5.1 Lois marginales . . . . 61

5.2 Lois conditionnelles . . . . 63

5.3 Covariance et corr´ elation . . . . 64

5.4 Fonction d’un vecteur al´ eatoire . . . . 68

(5)

Chapitre 0

Pr´ eliminaires

0.1 Bibliographie conseill´ ee

Pour le contenu du cours :

— Ross, S. , Initiation aux probabilit´ es, Presses polytechniques et universitaires romandes

— Bogaert, P. , Probabilit´ es pour scientifiques et ing´ enieurs, de boeck

Pour les pr´ eliminaires en math´ ematiques et en probabilit´ es en particulier, voir ci-dessous.

0.2 Bagage math´ ematique

Les probabilit´ es mettent ` a l’œuvre un grand nombre d’outils math´ ematiques, surtout du domaine de l’analyse. Pour profiter pleinement du cours, il est donc imp´ eratif de rafraˆıchir ses connaissances en analyse et d’ˆ etre ` a l’aise en calcul. En particulier, il est important de revoir les sujets suivants qui ont ´ et´ e trait´ es en L1-L2 (liste non exhaustive) :

— suites et limites

— sommes et s´ eries : convergence (absolue ou non), t´ el´ escopage, changement d’indice, double sommes, s´ eries enti` eres, les sommes et s´ eries fondamentales : somme sur les entiers, s´ erie g´ eom´ etrique, . . .

— fonctions : continuit´ e, d´ efinition de la d´ eriv´ ee, d´ erivation de produits et de compos´ ees, DLs, d´ eveloppement de Taylor, propri´ et´ es des fonctions classiques (polynomes, expo- nentielle, logarithme, fonctions trigonom´ etriques), comportement asymptotique

— int´ egration : int´ egrale sur un intervalle born´ e, int´ egrale impropre, int´ egration par par- ties, changement de variables

— s´ eries de fonctions et int´ egrales ` a param` etre : convergence simple/uniforme/normale,

´

echange limite ←→ somme, limite ←→ int´ egrale, d´ erivation sous les signes somme et int´ egrale

Ces sujets sont bien expos´ es dans un grand nombre de livres et de notes de cours. Le dernier sujet (s´ eries de fonctions et int´ egrales ` a param` etre) est peut-ˆ etre moins bien trait´ e, c’est pourquoi nous donnons ci-dessous les r´ esultats ` a retenir.

Nous aurons ´ egalement besoin de r´ esultats sur les sujets suivants trait´ es dans le cours d’Int´ egration en L3 :

— th´ eor` emes de Fubini et Tonelli : interversion s´ erie ←→ s´ erie, s´ erie ←→ int´ egrale, int´ egrale ←→ int´ egrale

— int´ egrales multiples : int´ egration sur un domaine de R d , changement de coordonn´ ees

5

(6)

Nous anticipons d´ ej` a les th´ eor` emes de Fubini et Tonelli que nous donnons ci-dessous. En ce qui concerne les int´ egrales multiples, nous allons patienter.

0.2.1 S´ eries de fonctions et int´ egrales ` a param` etre

R´ ef´ erence pour cette section : Notes de Thierry Ramond du cours

Analyse et Conver- gence 2,

disponible sur Dokeos.

Nous nous int´ eressons ` a des quantit´ es ayant une des formes suivantes : X

k∈ N

f n,k

Z ∞

−∞

f n (y) dy

X

k∈ N

f k (x) Z ∞

−∞

f (x, y) dy

Dans ce tableau, n, k ∈ N , y ∈ R et x ∈ I avec I un intervalle. On peut aussi consid´ erer d’autres int´ egrales telles que R a

−∞ ou R b

a pour a, b ∈ R mais on peut se ramener au cas ci- dessus en posant f n (y) = 0 ou f(x, y) = 0 en dehors du domaine d’int´ egration. Pour les deux quantit´ es de la premi` ere ligne du tableau, on souhaite alors avoir des conditions sous lesquelles on a le droit d’´ echanger le signe somme ou int´ egrale et le signe lim n→∞ , c’est-` a-dire :

Q : a-t-on lim

n→∞

X

k∈ N

f n,k = X

k∈ N

n→∞ lim f n,k ou lim

n→∞

Z ∞

−∞

f n (y) dy = Z ∞

−∞

n→∞ lim f n (y) dy ? De mani` ere analogue, pour les deux quantit´ es de la deuxi` eme ligne du tableau, on souhaite avoir des conditions sous lesquelles on a le droit d’´ echanger le signe somme ou int´ egrale et le signe lim x→x

0

, ou, autrement dit,

Q’ : les quantit´ es X

k∈ N

f k (x) ou Z ∞

−∞

f (x, y) dy sont-elles continues en x ? Pour ces deux derni` eres quantit´ es, on souhaite ´ egalement savoir si on a le droit de d´ eriver (par rapport ` a x) sous les signes somme ou int´ egrale, c’est-` a-dire :

Q” : a-t-on d dx

X

k∈ N

f k (x) = X

k∈ N

d

dx f k (x) ou d dx

Z ∞

−∞

f(x, y) dy = Z ∞

−∞

∂x f(x, y) dy ? La cl´ e pour r´ epondre ` a ces questions est la notion de convergence normale. On l’´ enonce s´ epar´ ement pour les quantit´ es de la premi` ere colonne et celles de la deuxi` eme colonne du tableau ci-dessus.

D´ efinition 0.1 (Convergence normale). On dit que les s´ eries P

k∈ N f n,k ou P

k∈ N f k (x) convergent normalement s’il existe une suite (g k ) k∈ N de nombres positifs telle que

1. P

k∈ N g k < ∞ et

2. |f n,k | < g k pour tout n ∈ N (ou |f k (x)| < g k pour tout x ∈ I).

De mani` ere analogue, on dit que les int´ egrales R ∞

−∞ f n (y) dy ou R ∞

−∞ f (x, y) dy convergent normalement s’il existe une fonction (positive ) g : R → R + telle que

1. R ∞

−∞ g(y) dy < ∞ et

(7)

0.2. BAGAGE MATH ´ EMATIQUE 7 2. |f n (y)| < g(y) pour tout n ∈ N (ou |f (x, y)| < g(y) pour tout x ∈ I).

Les th´ eor` emes suivants donnent alors les r´ eponses aux questions pr´ ec´ edantes :

Theor` eme 0.2. Supposons qu’une des quantit´ es du tableau ci-dessus converge normalement.

Alors la r´ eponse ` a la question Q ou Q’ concernant cette quantit´ e est

oui

.

Theor` eme 0.3. 1. Supposons que f k : I → R est d´ erivable pour tout k. Supposons de plus que

(a) P

n∈ N f k (x) converge simplement (i.e. converge pour tout x ∈ I ), et (b) P

n∈ N d

dx f k (x) converge normalement.

Alors la r´ eponse ` a la question Q” concernant P

n∈ N f k est

oui

.

2. Supposons que f (x, y) : I × R → R admet une d´ eriv´ ee partielle par rapport ` a x pour tout y. Supposons de plus que

(a) R ∞

−∞ f (x, y) dy converge pour tout x ∈ I , et (b) R ∞

−∞ ∂

∂x f (x, y) dy converge normalement.

Alors la r´ eponse ` a la question Q” concernant R ∞

−∞ f (x, y) dy est

oui

. 0.2.2 Th´ eor` emes de Fubini et Tonelli

On s’int´ eresse maintenant ` a des quantit´ es de la forme X

n∈ N

X

m∈ N

f n,m

!

, X

n∈ N

Z ∞

−∞

f n (y) dy

, Z ∞

−∞

Z ∞

−∞

f (x, y) dy

dx.

On souhaite savoir si on a le droit d’intervertir les signes somme et/ou int´ egrale, c’est-` a- dire, on souhaite r´ epondre ` a la question suivante : Les quantit´ es ci-dessus sont-elles ´ egales ` a (respectivement) :

X

m∈ N

X

n∈ N

f n,m

! ,

Z ∞

−∞

X

n∈ N

f n (y) dy

! ,

Z ∞

−∞

Z ∞

−∞

f(x, y) dx

dy ? Un premi` ere r´ eponse est apport´ ee par le th´ eor` eme de Tonelli :

Theor` eme 0.4 (Tonelli, parfois appel´ e Fubini–Tonelli ou Fubini cas positif). Supposons que les nombres f n,m sont positifs : f n,m ≥ 0 pour tout n, m ∈ N. Alors

X

n∈ N

X

m∈ N

f n,m

!

= X

m∈ N

X

n∈ N

f n,m

! . Les r´ esultats analogues pour les autres quantit´ es sont ´ egalement vrais.

Ce th´ eor` eme est tr` es utile pour nous car les probabilit´ es sont justement des quantit´ es positives ! Notons aussi que le th´ eor` eme est vrai mˆ eme si les s´ eries/int´ egrales divergent, il n’y a donc pas besoin de v´ erifier au pr´ ealable qu’elles convergent.

Si les termes ne sont pas positifs, on peut souvent appliquer le th´ eor` eme suivant :

Theor` eme 0.5 (Fubini). Supposons qu’une des conditions ´ equivalentes sont satisfaites :

(8)

— P

n∈ N

P

m∈ N |f n,m |

< ∞ ou

— P

m∈ N

P

n∈ N |f n,m |

< ∞ Alors on a l’´ egalit´ e suivante :

X

n∈ N

X

m∈ N

f n,m

!

= X

m∈ N

X

n∈ N

f n,m

! ,

c’est-` a-dire que les deux s´ eries convergent et ont la mˆ eme limite.

Les r´ esultats analogues pour les autres quantit´ es sont ´ egalement vrais.

0.3 Rappels du cours de probas en L2

On rappelle quelques ´ el´ ements de probabilit´ es vus en L2. R´ ef´ erence : notes de cours d’Anne Broise (disponible sur Dokeos).

0.3.1 Probabilit´ es

On consid` ere une exp´ erience al´ eatoire ayant un nombre fini ou d´ enombrable de r´ esultats possibles. Exemple : jet d’un ou de plusieurs d´ es, r´ ealisation d’un sondage avec un nombre fini de r´ eponses, mesure du nombre de particules ´ emis par une mati` ere radioactive pendant un certain temps, observation du nombre de personnes dans une file d’attente ` a un moment donn´ e, nombre d’enfants d’une personne prise au hasard dans une population. . . On formalise une telle exp´ erience souvent par un ensemble fini ou d´ enombrable Ω qui contient tous les r´ esultats possibles. Un ´ el´ ement de Ω est typiquement not´ e ω et on suppose qu’on peut lui associer une probabilit´ e p(ω) qui est un nombre entre 0 et 1. On suppose de plus que la somme des probabilit´ es de tous les r´ esultats vaut 1 :

X

ω∈Ω

p(ω) = 1.

La fonction p est alors parfois appel´ ee fonction de masse o` u germe de probabilit´ e. Ce dernier nom s’explique par le fait que cette fonction permet de donner une probabilit´ e ` a n’importe quel ´ ev´ enement, un ´ ev´ enement ´ etant un ensemble de r´ esultats poss´ edant une certaine ca- ract´ eristique commune. On penserait par exemple ` a l’´ ev´ enement

nombre pair

lors du lancer d’un d´ e de six faces, qui correspond ` a l’ensemble {2, 4, 6}. Formellement, un ´ ev´ enement n’est alors rien d’autre qu’une partie de Ω. On les note typiquement par des lettres majuscules du d´ ebut de l’alphabet : A, B, C, . . . La probabilit´ e d’un ´ ev´ enement A ⊂ Ω, not´ ee P (A) dans ce cours, est alors la somme des probabilit´ es des r´ esultats que comprend cet ´ ev´ enement :

P (A) = X

ω∈A

p(ω).

La fonction P : P(Ω) → [0, 1] est ´ egalement appel´ ee probabilit´ e (ou mesure de probabilit´ e) sur

Ω et la fonction p est alors appel´ ee sa fonction de masse ou son germe. Par exemple, dans le

cas du d´ e ci-dessus, on prendrait typiquement Ω = {1, . . . , 6} et p(ω) = 1/6 pour tout ω ∈ Ω.

(9)

0.3. RAPPELS DU COURS DE PROBAS EN L2 9 0.3.2 Variables al´ eatoires

Il arrive que l’espace Ω est trop gros pour travailler avec directement ou qu’on ne s’int´ eresse qu’` a certaines propri´ et´ es du r´ esultat de l’exp´ erience. Typiquement, on associe alors un nombre r´ eel ` a un r´ esultat qui contient l’information qu’on cherche. Par exemple, lors d’un sondage on pourrait d´ efinir X comme ´ etant le num´ ero du candidat ayant remport´ e le plus de voix.

X est alors une variable qui peut prendre n’importe quelle valeur dans {1, . . . , n}, o` u n est le nombre de candidats, et sa valeur est al´ eatoire, c’est-` a-dire elle d´ epend du r´ esultat de l’exp´ erience al´ eatoire. On l’appelle alors une variable al´ eatoire r´ eelle ou tout simplement une variable al´ eatoire 1 . On note les variables al´ eatoires typiquement par des lettres majuscules de la fin de l’alphabet : X, Y, Z, . . . Remarquons aussi que formellement, une variable al´ eatoire X n’est rien d’autre qu’une fonction X : Ω → R.

0.3.3 Par la suite. . .

Le moment est venu pour une remarque importante qui va changer notre fa¸ con de penser et de formaliser les exp´ eriences probabilistes.

Il s’est av´ er´ e au fil du temps qu’il est souvent plus commode de travailler enti` erement avec des variables al´ eatoires et d’ignorer compl` etement l’espace Ω. Les avantages sont multiples :

— On peut modifier Ω (par exemple en ajoutant des informations suppl´ ementaires sur le r´ esultat de l’exp´ erience) sans avoir ` a r´ e´ ecrire des calculs, ´ enonc´ es etc. concernant des variables al´ eatoires.

— On n’est pas oblig´ e de pr´ eciser Ω, seulement des ´ el´ ements qui nous int´ eressent.

— On peut plus facilement formuler des ´ enonc´ es g´ en´ eraux ne d´ ependant pas de la d´ efinition pr´ ecise d’un espace Ω.

— Dans le cas ou Ω ne peut pas ˆ etre fini ou d´ enombrable, on n’est pas oblig´ e de consid´ erer des espaces g´ en´ eraux et abstraits, mais seulement des variables al´ eatoires ` a valeurs dans R , donc des probabilit´ es sur R .

— Philosophiquement, cette approche peut ˆ etre consid´ er´ ee plus satisfaisante dans le sens o` u dans une situation r´ eelle on ne connait jamais enti` erement

l’univers

(donc Ω) mais plutˆ ot partiellement ` a partir d’observations (les variables al´ eatoires).

Par cons´ equent, dans la suite du cours, nous n’allons plus entendre parler d’espace Ω, mais tr` es souvent de variables al´ eatoires.

1. On peut consid´ erer des variables al´ eatoires qui ne prennent pas valeurs dans l’ensemble des nombres

r´ eelles mais dans des espaces plus g´ en´ eraux, mais nous n’allons pas consid´ erer ces variables al´ eatoires dans ce

cours.

(10)
(11)

Chapitre 1

Variables al´ eatoires r´ eelles

1.1 D´ efinition et axiomes

On cherche ` a mod´ eliser une exp´ erience ayant un r´ esultat al´ eatoire. On suppose qu’on observe le r´ esultat ` a partir d’une variable al´ eatoire (v.a.) X qui prend valeurs dans les nombres r´ eels. Pr´ ec´ edemment, nous avons toujours suppos´ e qu’une variable al´ eatoire peut prendre seulement un nombre fini ou d´ enombrable de valeurs, on dit dans ce cas que c’est une variable al´ eatoire discr` ete. Maintenant nous souhaitons nous affranchir de cette contrainte. Par contre, nous allons nous faciliter la vie : nous ne cherchons pas ` a d´ efinir formellement ce qu’est cette variable al´ eatoire mais seulement ce qu’on peut faire avec. Concr` etement, on souhaite donner un sens ` a la probabilit´ e que la valeur de cette v.a. X tombe dans un ensemble A ⊂ R donn´ e, c’est-` a-dire, ` a l’expression P (X ∈ A).

On se trouve ici devant un nouveau probl` eme : pr´ ec´ edemment, quand une variable al´ eatoire ne pouvait prendre qu’un nombre fini ou d´ enombrable de valeurs (notons l’ensemble de valeurs S X ), on pouvait toujours ´ ecrire la probabilit´ e P (X ∈ A) comme la somme P

x∈A P (X = x).

Donc il suffisait de donner la valeur de P (X = x) pour tout x ∈ S X pour d´ efinir les probabilit´ es P(X ∈ A) pour tout A ⊂ S X , c’est-` a-dire la loi de la variable al´ eatoire X. Il s’av` ere que cela n’est plus le cas en g´ en´ eral. Par exemple, supposons qu’on souhaite donner un sens ` a un nombre choisi uniform´ ement dans l’intervalle [0, 1]. On va mod´ eliser cela par une variable al´ eatoire X qui prend valeurs dans [0, 1]. Quelle doit ˆ etre la probabilit´ e que la variable al´ eatoire tombe dans un ensemble A ⊂ [0, 1] donn´ e ? Consid´ erons pour l’instant seulement le cas o` u A consiste en exactement un point. Puisque X correspond ` a un nombre choisi uniform´ ement dans l’intervalle [0, 1], on s’attend ` a ce que la probabilit´ e que X est ´ egal ` a un nombre donn´ e ne d´ epend pas de ce nombre, autrement dit :

P (X = x) = P (X = y) pour tout x, y ∈ [0, 1].

Mais puisque l’intervalle [0, 1] contient un nombre infini de points, cela entraine que P (X = x) = 0 pour tout x ∈ [0, 1] (dans le cas inverse, on pourrait d´ eduire que P (X ∈ [0, 1]) = ∞).

La connaissance de P (X = x) pour tout x ne permet donc pas de d´ efinir P (X ∈ A) pour tout ensemble A.

On doit alors trouver un autre moyen pour d´ efinir les probabilit´ es P (X ∈ A) pour des ensembles A ⊂ R . L’observation importante est la suivante : ces probabilit´ es ne peuvent ˆ etre compl` etement arbitraires mais doivent ob´ eir ` a certaines r` egles, par exemple, si A, B ⊂ R sont

11

(12)

disjoints, c’est-` a-dire que leur intersection est vide, alors nous souhaitons que P (X ∈ A ∪ B ) = P (X ∈ A) + P (X ∈ B ).

Pour d´ efinir toutes les lois possibles d’une variable al´ eatoire X ` a valeurs dans R , on com- mence alors par ´ enoncer un certain nombre de r` egles, appel´ es axiomes. Pour simplifier le d´ eveloppement par la suite, nous introduisons ` a ce stade une convention :

Par la suite, chaque ensemble A ⊂ R est suppos´ e ˆ etre de la forme suivante : soit un intervalle, soit la r´ eunion d’un nombre fini d’intervalles disjoints. La notion d’intervalle inclut les intervalles ouverts, semi-ouverts ou ferm´ es, les intervalles finis, semi-infinis ou infinis, et en particulier l’ensemble vide ∅ ainsi que l’ensemble R tout entier.

On note A c = R \A le compl´ ementaire de A. On remarque que si A ⊂ R est de la forme ci- dessus, alors A c l’est aussi (preuve laiss´ ee en exercice). Egalement, si A et B sont de la forme ci-dessus, alors A ∪ B et A ∩ B le sont aussi (exercice). Par contre, si A 0 , A 1 , A 2 , . . . est une suite d’ensembles de la forme ci-dessus, alors S

n∈ N A n et T

n∈ N A n ne sont plus n´ ecessairement de cette forme.

Nous allons pr´ eciser maintenant les r` egles de calcul des quantit´ es P (X ∈ A), c’est-` a-dire les axiomes qu’on suppose ˆ etre valables : on suppose que

1. P (X ∈ A) ≥ 0 pour tout A ∈ R (positivit´ e) 2. P (X ∈ ∅) = 0 et P(X ∈ R ) = 1,

3. Si A, B ⊂ R sont disjoints, alors

P (X ∈ A ∪ B) = P(X ∈ A) + P (X ∈ B) (additivit´ e).

Nous allons tout de suite introduire un quatri` eme axiome, mais tout d’abord, remarquons que ces axiomes entraˆınent les propri´ et´ es suivantes :

— Si A ⊂ B, alors

P(X ∈ A) ⊂ P (X ∈ B) (monotonie de P(X ∈ A) en A).

— P (X ∈ A) ∈ [0, 1] pour tout A ∈ R .

— Si A ⊂ B, alors

P (X ∈ B\A) = P (X ∈ B) − P (X ∈ A).

En particulier (B = R ),

P (X ∈ A c ) = 1 − P (X ∈ A).

En effet, la propri´ et´ e de monotonie et la formule pour P (X ∈ B\A) se montrent ainsi : pour A ⊂ B, on a B = A ∪ (A\B), les deux ensembles ´ etant disjoints. L’axiome 3 donne alors :

P (X ∈ B) = P (X ∈ A) + P (X ∈ B\A).

La propri´ et´ e de monotonie d´ ecoule puisque P (X ∈ B\A) ≥ 0 par l’axiome 1. La formule P(X ∈ B \A) s’obtient en r´ earrangeant. Finalement, le fait que P (X ∈ A) ∈ [0, 1] pour tout A ∈ R est une simple cons´ equence de la monotonie.

On peut finalement pr´ esenter le quatri` eme axiome :

(13)

1.2. ´ EV ´ ENEMENTS 13 4. Si A 0 , A 1 , A 2 , . . . est une suite croissante d’ensembles (c’est-` a-dire A n ⊂ A n+1 pour

tout n ∈ N ) et telle que S

n∈ N A n est encore un ensemble de la forme ci-dessus, alors P X ∈ [

n∈ N

A n

!

= lim

n→∞ P(X ∈ A n ).

Notons que cette limite existe puisque P (X ∈ A n ) est une suite croissante par la monotonie de P (X ∈ A) en A ´ enonc´ ee ci-dessus.

Cet axiome n´ ecessite ´ eventuellement une explication : avec seulement les axiomes 1 ` a 3, on aurait d´ ej` a une partie de l’´ egalit´ e, ` a savoir l’in´ egalit´ e

(exercice). Le vrai ´ enonc´ e de l’axiome 4 est alors qu’on a aussi l’in´ egalit´ e inverse, ` a savoir

. Ceci correspond ` a dire que lors un passage ` a la limite, on ne peut pas cr´ eer de la probabilit´ e ex nihilo.

Remarquons aussi que l’axiome 4 est ´ equivalent ` a l’axiome suivant, comme le d´ emontre un passage au compl´ ementaire :

4’. Si A 0 , A 1 , A 2 , . . . est une suite d´ ecroissante d’ensembles (c’est-` a-dire A n ⊂ A n+1 pour tout n ∈ N ) et telle que T

n∈ N A n est encore un ensemble de la forme ci-dessus, alors P X ∈ \

n∈ N

A n

!

= lim

n→∞ P(X ∈ A n ).

Les axiomes mis en place, on peut passer ` a la d´ efinition d’une variable al´ eatoire : on dit que X est une variable al´ eatoire s’il existe une famille de nombres (P (X ∈ A)) A⊂ R (ou, autrement dit, une fonction A 7→ P(X ∈ A) ` a valeurs dans R) qui satisfait aux axiomes 1 ` a 4 ci-dessus. Cette famille/fonction est appel´ ee la loi de X. On dit ´ egalement que X suit cette loi.

Notons que nous aurons ´ egalement parfois besoin de d´ efinir P (X ∈ A) pour A un en- semble qui n’est pas de la forme ci-dessus, par exemple A = N ou n’importe quel ensemble d´ enombrable. On se bornera aux ensembles A qui sont la limite monotone d’une suite d’en- sembles (A n ) n≥0 ayant la forme ci-dessus (r´ eunion d’un nombre fini d’intervalles). Par li- mite monotone on entend les ensembles S

n A n (ou T

n A n ) pour une suite croissante (ou d´ ecroissante) (A n ) n≥0 , comme dans les axiomes 4 et 4’. On d´ efinit alors P (X ∈ A) = lim n→∞ P (X ∈ A n ), o` u on note que la limite est toujours bien d´ efinie par monotonie de la suite P (X ∈ A n ). Un exemple d’un tel ensemble est l’ensemble des rationnelles Q , ou n’im- porte quel ensemble d´ enombrable D ⊂ R . Pour un tel ensemble, notons qu’avec la d´ efinition ci-dessus, on a P (X ∈ D) = P

x∈D P (X = x).

1.2 Ev´ ´ enements

Nous rappelons qu’un ´ ev´ enement est un ensemble de r´ esultats d’une exp´ erience al´ eatoire

ayant une caract´ eristique commune. Si le r´ esultat de l’exp´ erience fait partie de cette ensemble

on dit alors que cet ´ ev´ enement s’est r´ ealis´ e. Par exemple, lors d’un lancer de d´ e, on pourrait

s’int´ eresser ` a l’´ ev´ enement que le nombre tomb´ e est un nombre pair. Si X est alors la v.a. qui

repr´ esente le nombre tomb´ e, cet ´ ev´ enement s’´ ecrit alors symboliquement E = {X ∈ {2, 4, 6}},

ou encore E = {X pair}. L’´ ev´ enement E se r´ ealise alors avec une certaine probabilit´ e, ` a

savoir P(E) = P (X ∈ {2, 4, 6}) (notez qu’on n’´ ecrit plus les accolades dans cette derni` ere

expression).

(14)

Dans ce cours, nous consid´ erons seulement les ´ ev´ enements qui sont d´ efinies ` a partir de variables al´ eatoires, donc des ´ ev´ enements de la forme E = {X ∈ A} pour X une variable al´ eatoire et A ⊂ R . La probabilit´ e d’un tel ´ ev´ enement est alors d´ efinie comme P (E) = P(X ∈ A). On peut ´ egalement appliquer les op´ erations habituelles pour les ensembles ` a ces

´ ev´ enements, avec les notations ´ evidentes. Par exemple : {X ∈ A} c = {X ∈ A c } {X ∈ A} ∪ {X ∈ B} = {X ∈ A ∪ B}

{X ∈ A} ∩ {X ∈ B} = {X ∈ A ∩ B}

1.2.1 Ind´ ependance d’´ ev´ enements et probabilit´ e conditionelle.

On dit que deux ´ ev´ enements E et F sont ind´ ependants si P (E ∩ F ) = P (E) × P (F ).

Ceci s’interpr` ete comme quoi les deux ´ ev´ enements n’ont aucune influence l’un sur l’autre, c’est-

`

a-dire, sachant que l’un s’est produit, la probabilit´ e que l’autre s’est produit reste la mˆ eme.

Ceci conduit ` a la notion de probabilit´ e conditionnelle : si E est un ´ ev´ enement de probabilit´ e non nulle, alors pour tout autre ´ ev´ enement F on d´ efinit la probabilit´ e de F sachant E par :

P (F | E) = P (F ∩ E) P (E) .

Il d´ ecoule alors imm´ ediatement de la d´ efinition que E et F sont ind´ ependants si et seulement si P (F | E) = P (F ).

On peut ´ egalement introduire la notion de loi conditionnelle : Si X est une variable al´ eatoire et E un ´ ev´ enement de probabilit´ e non nulle, alors on note P(X ∈ A | E) la probabilit´ e de l’´ ev´ enement {X ∈ A} sachant E, pour tout A ⊂ R . On v´ erifie alors ais´ ement (exercice) que l’application A 7→ P(X ∈ A | E) satisfait toujours aux axiomes 1 ` a 4 de la Section 1.1.

On appelle cette application la loi conditionnelle de X sachant E.

La notion d’ind´ ependance se g´ en´ eralise aussi ` a plusieurs ´ ev´ enements, mais c’est un peu plus compliqu´ e et ne sera pas trait´ e ici.

1.3 Fonction de r´ epartition

Nous avons vu dans la Section 1.1 la d´ efinition d’une variable al´ eatoire et de sa loi ` a partir

des axiomes 1 ` a 4. La loi d’une variable al´ eatoire X ´ etait donn´ ee par une famille de nombres

r´ eels index´ ees par les ensembles A ⊂ R . Cette d´ efinition semble ˆ etre assez encombrante si on

veut d´ efinir une loi particuli` ere, car il faudrait prendre en compte tous les ensembles A ⊂ R

qui peuvent avoir des formes assez complexes. Dans le cas d’une v.a. discr` ete X (c’est-` a-

dire o` u X ne prend qu’un nombre fini ou d´ enombrable de valeurs), on peut se ramener aux

valeurs P (X = x) pour tout x (c’est-` a-dire ` a la fonction de masse), ce qui repr´ esente une

grande simplification. Nous avons vu dans la section pr´ ec´ edente que ceci n’est plus possible

dans le cadre g´ en´ eral, car ces valeurs peuvent ˆ etre ´ egales ` a z´ ero pour tout x ∈ R . L’astuce

consiste alors ` a consid´ erer les valeurs de P (X ≤ x) pour tout x ∈ R. Remarquons qu’on

(15)

1.3. FONCTION DE R ´ EPARTITION 15 aurait ´ egalement pu prendre P (X < x), P (X ≥ x) ou P (X > x), mais la convention a retenu P(X ≤ x). Ceci donne lieu ` a une fonction F X : R → [0, 1] d´ efinie par

F X (x) = P (X ≤ x) pour tout x ∈ R .

La fonction F X s’appelle la fonction de r´ epartition de X. Avec cette fonction on a atteint le mˆ eme degr´ e de simplicit´ e qu’avec la fonction de masse dans le cas d’une v.a. discr` ete, car dans les deux cas nous avons r´ eduit la notion de loi ` a la notion d’une fonction sur R , un objet que nous connaissons bien depuis le coll` ege ! Evidemment, dans le cas d’une variable al´ eatoire discr` ete, la fonction de masse de sa loi peut avoir une expression plus simple que sa fonction de r´ epartition, nous allons en voir des examples plus tard.

Il nous reste ` a montrer que la fonction de r´ epartition d’une variable al´ eatoire d´ efinit sa loi et de d´ eterminer quelles fonctions sont des fonctions de r´ epartition d’une variable al´ eatoire.

Theor` eme 1.1.

1. La fonction de r´ epartition F X d’une variable al´ eatoire r´ eelle a les propri´ et´ es suivantes :

— elle est croissante,

— F X (−∞) := lim x→−∞ F X (x) = 0,

— F X (+∞) := lim x→+∞ F X (x) = 1,

— elle est continue ` a droite.

2. La loi d’une variable al´ eatoire r´ eelle X est d´ etermin´ ee de mani` ere unique par sa fonc- tion de r´ epartition F X .

3. Chaque fonction sur R ayant les propri´ et´ es donn´ ees dans 1. est la fonction de r´ epartition d’une v.a. r´ eelle.

D´ emonstration. 1. Montrons les propri´ et´ es ´ enonc´ ees :

— Croissance : Ceci est une cons´ equence imm´ ediate de la monotonie de P (X ∈ A) en A. Plus pr´ ecis´ ement, soient x, y ∈ R avec x < y. Alors ]−∞, x] ⊂ ]−∞, y], si bien que

F X (x) = P (X ∈ ]−∞, x]) ≤ P (X ∈ ]−∞, y]) = F X (y).

— On remarque d’abord que puisque la fonction F X est croissante et born´ ee inf´ erieurement (par 0), la limite F X (−∞) = lim x→−∞ F X (x) existe. En particulier,

F X (−∞) = lim

n→∞ F X (−n) = lim

n→∞ P (X ∈ ]−∞, −n]).

La suite d’ensembles A n = ]−∞, −n] est d´ ecroissante et d’intersection vide. L’axiome 4’ donne donc :

F X (−∞) = P X ∈

\

n=1

]−∞, −n]

!

= P (X ∈ ∅) = 0.

— Pareil que F X (−∞), on utilise le fait que F X est born´ ee par 1 pour montrer l’exis- tence de la limite, puis l’axiome 4 pour l’identifier.

— Continuit´ e ` a droite. Soit x ∈ R . Puisque F X est croissante et born´ ee inf´ erieurement, la limite F X (x+) := lim y↓x F X (y) existe. En particulier,

F X (x+) = lim

n→∞ F X (x + n 1 ) = P(X ∈

\

n=1

]−∞, x + n 1 ]),

(16)

o` u on a encore utilis´ e l’axiome 4’. Le point cl´ e est alors l’´ egalit´ e suivante :

\

n=1

]−∞, x + n 1 ] = ]−∞, x].

Cela donne que F X (x+) = P(X ∈ ]−∞, x]) = F X (x) et donc F X est continue ` a droite en x. Puisque x ∈ R ´ etait arbitraire, F X est continue ` a droite sur R . 2. On veut montrer que pour tout ensemble A qui est une union finie d’intervalles dis-

joints, P (X ∈ A) s’´ ecrit ` a partir de la fonction de r´ epartition F X . On proc` ede cas par cas :

— A = ]−∞, x], x ∈ R : Par d´ efinition, P(X ∈ ]−∞, x]) = P (X ≤ x) = F X (x).

— A = ]−∞, x[, x ∈ R : L’intervalle ouvert ]−∞, x[ s’´ ecrit comme l’union infinie d’intervalles ferm´ es :

]−∞, x[ =

[

n=1

]−∞, x − 1 n ].

L’axiome 4 donne alors P (X < x) = lim

n→∞ P (X ≤ x − n 1 ) = lim

n→∞ F X (x − 1 n ) = F X (x−), o` u F (x−) := lim y↑x F (x).

— A = ]x, ∞[ ou A = [x, ∞[, x ∈ R : On utilise le fait que F(A) = 1 − F (A c ) et on se ram` ene aux deux premiers cas.

— A = ]x, y], x < y : On obtient

P (x < X ≤ y) = P(X ≤ y) − P (X ≤ x) = F(y) − F (x).

— A = [x, y], A = [x, y[ ou A = ]x, y[ : Similaire ` a A = ]x, y], avec ´ eventuellement F (y−) et F (x−) ` a la place de F (y) ou F (x).

— A = I 1 ∪ · · · ∪ I n , avec I 1 , . . . , I n des intervalles disjoints, alors par l’axiome 3, on a P (X ∈ A) = P(X ∈ I 1 ) + · · · + P (X ∈ I n ).

On se ram` ene alors au cas d’un intervalle trait´ e pr´ ec´ edemment.

3. Si F est une fonction avec les propri´ et´ es du th´ eor` eme, on d´ efinit la loi d’une variable al´ eatoire X ` a partir de F en utilisant les formules pour P (X ∈ A) ci-dessus. Il suffit alors de montrer que cette loi satisfait aux axiomes 1 ` a 4. On omet la preuve de se fait qui est laiss´ ee en exercice. La fonction F est alors par d´ efinition la fonction de r´ epartition de cette variable al´ eatoire.

1.4 Classes de variables al´ eatoires

Ayant ´ etabli la forme g´ en´ erale de la loi d’une v.a. r´ eelle ` a travers sa fonction de r´ epartition,

il convient de distinguer plusieurs classes de v.a. ` a l’aide de leurs fonction de r´ epartition. Pour

ce faire, il convient d’introduire la notion d’atome. On dit que x ∈ R est un atome de masse

(17)

1.4. CLASSES DE VARIABLES AL ´ EATOIRES 17 m > 0 de la loi de X si P (X = x) = m. Ceci peut ˆ etre exprim´ e avec la fonction de r´ epartition car pour tout x ∈ R , on a l’´ egalit´ e

P (X = x) = P (X ≤ x) − P(X < x) = F X (x) − F X (x−).

Par cons´ equent, x est un atome de masse m > 0 de la loi de X si et seulement si x est un point de discontinuit´ e de F X et m est la hauteur du saut en x, c’est-` a-dire m = F X (x) − F X (x−). Il d´ ecoule de la d´ efinition qu’une v.a. X n’a pas d’atomes si et seulement si sa fonction de r´ epartition est continue. Notons que puisque la fonction F X est croissante d’apr` es le th´ eor` eme 1.1, elle a au plus un nombre d´ enombrable de sauts (r´ esultat classique en analyse) et donc au plus un nombre d´ enombrable d’atomes. Cela m´ erite d’ˆ etre mis en avant :

Corollaire 1.2. Une variable al´ eatoire X a au plus un nombre d´ enombrable d’atomes.

Concentrons-nous maintenant sur deux classes de variables al´ eatoires, sans doute les plus importantes : les variables al´ eatoires discr` etes et les v.a. ` a densit´ e.

Variables al´ eatoires discr` etes. On dit qu’une variable al´ eatoire r´ eelle X est dite discr` ete si sa fonction de r´ epartition est une fonction en escalier, c’est-` a-dire si elle est constante entre deux sauts successifs. Cette notion co¨ıncide avec la notion de variable al´ eatoire vue en L2.

En effet, soit S l’ensemble des atomes de X, alors S est un ensemble fini ou d´ enombrable d’apr` es le Corollaire 1.2. Puisque F X est constante entre deux sauts successifs, la somme des hauteurs des sauts est ´ egale ` a F (+∞) − F (−∞) = 1, autrement dit, P (X ∈ S) = 1. On dit ` a ce moment-l` a que X est ` a valeurs dans S ou que la loi de X est port´ ee par S. X est alors une variable al´ eatoire discr` ete dans le sens du cours de L2. En particulier, sa loi est d´ etermin´ ee par la fonction de masse x 7→ P (X = x), car

P (X ∈ A) = X

x∈A

P (X = x), pour A ⊂ R ,

o` u la somme se fait sur tous les x ∈ A tels que P (X = x) > 0, c’est-` a-dire sur tous les atomes qui sont contenus dans A. En particulier,

F X (x) = X

y≤x

P (X = y),

avec la mˆ eme convention pour la somme.

Variables al´ eatoires ` a densit´ e. On dit qu’une variable al´ eatoire r´ eelle X est ` a densit´ e ou continue 1 si la fonction de r´ epartition F X admet la forme

F X (x) = Z x

−∞

f X (y) dy, x ∈ R ,

pour une fonction int´ egrable f X : R → R + . On appelle la fonction f X la densit´ e de X (ou de la loi de X). Elle joue le rˆ ole analogue de la fonction de masse du cas discret. La loi de

1. Dans la litt´ erature, ces v.a. sont aussi parfois appel´ ees absolument continues, le terme

continue

ayant

dans ce cas un sens plus g´ en´ eral.

(18)

X s’exprime facilement ` a l’aide de la densit´ e, par exemple, si a, b ∈ R avec a ≤ b, alors par continuit´ e de la fonction de r´ epartition,

P (a < X ≤ b) = F X (b) − F X (a) = Z b

a

f X (x) dx.

Aussi, la fonction F X ´ etant la primitive d’une fonction elle est continue et la loi est sans atomes. Autrement dit,

P (X = x) = 0 pour tout x ∈ R , et donc, pour tout a, b ∈ R avec a ≤ b,

P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X < b) = P (a < X ≤ b) = Z b

a

f X (x) dx.

En g´ en´ eral, on peut ´ ecrire pour un ensemble A ⊂ R : P (X ∈ A) =

Z ∞

−∞

f X (x)1 A (x) dx, o` u 1 A est la fonction indicatrice de l’ensemble A, c’est-` a-dire

1 A (x) =

( 1, x ∈ A 0, x 6∈ A.

Notons que la densit´ e f X n’est pas unique : par exemple, en modifiant sa valeur en un point, la valeur de son int´ egrale est inchang´ ee et donc la loi reste la mˆ eme.

Les autres variables al´ eatoires. Quasiment toutes les variables al´ eatoires que nous allons rencontrer dans ce cours font partie des deux classes ci-dessus. Parmi les autres, on peut mentionner celles qui sont une combinaison de ces deux, cf TD. Il est aussi l´ egitime de se demander s’il existe des fonctions de r´ epartition qui sont continues mais ne s’´ ecrivent pas comme la primitive d’une autre fonction. La r´ eponse est oui, mais la construction d’une telle fonction d´ epasse le contenu de ce cours. Les curieux sont invit´ es ` a googler

l’escalier de Cantor,

´ egalement appel´ e

l’escalier du diable. . .

1.5 Quelques variables al´ eatoires discr` etes importantes

NB : Pour des d´ etails pour cette section, se r´ ef´ erer aux chapitres 4 et 5 du livre de Ross.

1.5.1 Loi de Dirac

La loi de Dirac est la loi la plus simple qui existe : Si x ∈ R , on dit que X suit la loi de Dirac en x (not´ e parfois symboliquement X ∼ δ x ), si

P (X = x) = 1.

Ceci est ´ equivalent (voir preuve ci-dessous) ` a P (X ∈ A) = 1 A (x) =

( 1, si x ∈ A

0, si x 6∈ A.

(19)

1.5. QUELQUES VARIABLES AL ´ EATOIRES DISCR ` ETES IMPORTANTES 19 En particulier, la fonction de r´ epartition est donn´ ee par

F X (y) = 1 ]−∞,y] (x) =

( 1, si y ≥ x 0, sinon.

On note parfois symboliquement : X ∼ δ x , ce qu’on lit

X suit la loi de Dirac en x.

Si X suit la loi de Dirac en x ∈ R , on dit aussi que X est presque sˆ urement (p.s.) ´ egale

`

a x, ou encore que X est presque sˆ urement constante (´ egale ` a x). Inversement, on peut voir n’importe quel nombre x ∈ R comme une variable al´ eatoire de loi de Dirac en x.

Voyons maintenant une preuve compl` ete de la formule pour P(X ∈ A) ci-dessus : on commence par d´ ecomposer

P (X ∈ A) = P(X ∈ A ∩ {x}) + P (X ∈ A\{x}).

Le premier terme est ´ egal ` a P (X ∈ ∅) = 0 si x 6∈ A et ` a P (X = x) = 1 si x ∈ A, donc il est

´ egal ` a 1 A (x). Le second terme est major´ e par P(X ∈ R \{x}) par la monotonie de P (X ∈ A) en A. Mais P(X ∈ R \{x}) = 1 − P (X = x) = 1 − 1 = 0, et donc P (X ∈ A\{x}) = 0. Ceci montre bien que P (X ∈ A) = 1 A (x).

1.5.2 Loi uniforme

La loi uniforme est la loi la plus simple d’une variable al´ eatoire prenant un nombre fini de valeurs. Soit E une partie finie de R , par exemple E = {1, . . . , n} pour n ∈ N . Une v.a. X suit la loi uniforme sur S (symboliquement : X ∼ Unif(S)) si pour tout x ∈ S,

P (X = x) = 1 Card(S) , ce qui implique pour tout A ⊂ R ,

P (X ∈ A) = Card(A ∩ S) Card(S) . La fonction de r´ epartition est

F X (x) = Card(]−∞, x] ∩ S)

Card(S) .

La loi uniforme intervient dans de nombre applications, par exemple dans les jeux de hasard (lancer de d´ es, tirage de cartes,. . . ).

1.5.3 Loi de Bernoulli

On dit que X suit la loi de Bernoulli de param` etre p ∈ [0, 1] (symboliquement : X ∼ Ber(p)), si

P(X = 1) = p, P(X = 0) = 1 − p.

La fonction de r´ epartition s’´ ecrit :

F X (x) =

 

 

0, si x < 0 1 − p, si x ∈ [0, 1[

1, si x ≥ 1.

(20)

Le nom de la loi de Bernoulli vient de l’exp´ erience Bernoulli : c’est une exp´ erience al´ eatoire ayant deux issues possibles : succ` es ou ´ echec. Si on pose alors X = 1 en cas de succ` es et X = 0 en cas d’´ echec, et si p et la probabilit´ e de succ` es de l’exp´ erience, alors X suit la loi de Bernoulli de param` etre p.

1.5.4 Loi binomiale

La loi binomiale est une g´ en´ eralisation importante de la loi de Bernoulli. On dit que X suit la loi binomiale de param` etres n ∈ N et p ∈ [0, 1] (symboliquement : X ∼ Bin(n, p)), si

P (X = k) = n

k

p k (1 − p) n−k , o` u on rappelle la d´ efinition du coefficient binomial :

n k

= n!

k!(n − k)! , si k ∈ {0, . . . , n}, = 0 sinon.

Notons que cela co¨ıncide avec la loi de Bernoulli de param` etre p quand n = 1. La fonction de r´ epartition n’admet pas d’expression plus simple que son expression g´ en´ erale ` a partir de la fonction de masse.

Une variable al´ eatoire X de loi binomiale de param` etres n et p repr´ esente le nombre de succ` es dans n r´ ep´ etitions ind´ ependantes d’une exp´ erience de Bernoulli ayant une probabilit´ e de succ` es p.

1.5.5 Loi de Poisson

On dit que X suit la loi de Poisson de param` etre λ ≥ 0 (symboliquement, X ∼ Poi(λ)), si pour tout k ∈ N ,

P (X = k) = e −λ λ k k! .

Sa fonction de r´ epartition n’admet pas d’expression plus simple que son expression g´ en´ erale

`

a partir de la fonction de masse.

La loi de Poisson de paramˆ etre λ ≥ 0 peut-ˆ etre vu comme une approximation de la loi binomiale de param` etres n et p = λ/n, d` es lors que p est petit. En effet, on peut v´ erifier (exercice) que pour λ ≥ 0 et k ∈ N fix´ es,

n k

λ n

k 1 − λ

n n−k

→ e −λ λ k

k! , n → ∞.

Plus pr´ ecis´ ement, on a le th´ eor` eme suivant :

Theor` eme 1.3 (Prokhorov, Stein,. . . ). Pour tout n ∈ N et p ∈ [0, 1], X

k∈ N

n k

p k (1 − p) n−k − e −np (np) k k!

≤ 2p.

Ce th´ eor` eme montre donc de mani` ere tr` es pr´ ecise que la loi de Poisson de param` etre λ = np est une bonne approximation de la loi binomiale de param` etres n et p d` es lors que p est petit 2 .

2. On voit souvent dans la litt´ erature la contrainte suppl´ ementaire que λ = np ne soit pas trop grand pour

(21)

1.5. QUELQUES VARIABLES AL ´ EATOIRES DISCR ` ETES IMPORTANTES 21 1.5.6 Loi g´ eom´ etrique

On dit que X suit la loi g´ eom´ etrique de param` etre p ∈ ]0, 1] (symboliquement : X ∼ Geo(p)), si

P (X = k) = p × (1 − p) k−1 , k ∈ N = {1, 2, . . .}.

Sa fonction de r´ epartition admet une expression simple (exercice) ; on rappelle que pour x ∈ R , la partie enti` ere bxc est le plus grand entier plus petit ou ´ egal ` a x. On obtient alors :

F X (x) =

( 1 − (1 − p) bxc , si x ≥ 0 0, si x < 0.

En particulier, on peut retenir la formule suivante :

P (X > k) = (1 − p) k , pour tout k ∈ N .

Une v.a. X de loi g´ eom´ etrique de param` etre p repr´ esente le nombre de fois que l’on doit r´ ep´ eter une exp´ erience de Bernoulli de probabilit´ e de succ` es p jusqu’au premier succ` es. En effet, la probabilit´ e d’avoir eu des ´ echecs pendant les k − 1 premiers essais et un succ` es au k-i` eme essai est exactement ´ egal ` a (1 − p) k−1 × p.

La loi g´ eom´ etrique est aussi la seule loi d’une variable al´ eatoire ` a valeurs dans N ayant la propri´ et´ e suivante, dite la propri´ et´ e de perte de m´ emoire :

P (X − k > ` | X > k) = P(X > `), pour tout k, ` ∈ N..

Ceci peut se reformuler de la fa¸ con suivante : pour tout k ∈ N , la loi de X − k conditionnel- lement ` a l’´ ev´ enement {X > k} est la mˆ eme que celle de X.

1.5.7 Autres lois discr` etes

Voici quelques autres lois discr` etes que nous mentionnons bri` evement :

Loi binomiale n´ egative On dit que X suit la loi binomiale n´ egative de param` etres r ∈ N et p ∈ ]0, 1] (symboliquement : X ∼ BN(r, p), si

P (X = n) =

n − 1 r − 1

p r (1 − p) n−r , n ∈ {r, r + 1, . . .}

Ceci correspond au nombre de r´ ep´ etitions d’une exp´ erience de Bernoulli jusqu’au r-i` eme succ` es. En particulier, Geo(p) = BN(1, p).

Loi hyperg´ eom´ etrique On dit que X suit la loi hypergeom´ etrique de param` etres n, N, m ∈ N avec n ≤ N et m ≤ N (symboliquement : X ∼ Hypergeo(n, N, m), si

P (X = k) =

m k

N−m n−k

N m

, k = 0, . . . , n.

Interpr´ etation : on tire sans remise un ´ echantillon de n boules d’une urne en contenant N, dont m blanches et N − m noires. Si X d´ esigne le nombre de boules blanches tir´ ees, alors X ∼ Hypergeo(n, N, m).

que l’approximation soit bonne. Mˆ eme si la preuve est plus facile avec cette contrainte, celle-ci n’est en fait

pas n´ ecessaire, comme le montre le th´ eor` eme 1.3. Ceci dit, quand λ est grand, la loi de Poisson elle-mˆ eme est

souvent approch´ ee par la loi normale (voir Section 1.6.2).

(22)

Loi z´ eta (ou de Zipf ) On dit que X suit une loi z´ eta (ou de Zipf) de param` etre α si P (X = k) = C/k α+1 , k ∈ N ,

pour C = 1/ P ∞

k=1 k −(α+1) = 1/ζ(α + 1), avec ζ la fonction z´ eta de Riemann.

1.6 Quelques variables al´ eatoires continues importantes

1.6.1 Loi uniforme

Soit I ⊂ R un intervalle born´ e et notons |I | sa longueur. On dit que X suit la loi uniforme sur I (symboliquement, X ∼ Unif(I )), si X admet la densit´ e

f X (x) = 1

|I | 1 I (x).

Si on note a = inf I et b = sup I (si bien que |I | = b − a), la fonction de r´ epartition s’´ ecrit

F X (x) =

 

 

0, si x < a

x−a

b−a , si x ∈ [a, b]

1, si x > b.

Notons que la loi ne d´ epend que de a et b et non de la forme exacte de I , ainsi, on voit

´ egalement la notation Unif(a, b) pour cette loi.

Cette loi est l’analogue continu de la loi uniforme discr` ete. En effet, alors que la fonction de masse de cette derni` ere est constante sur l’ensemble des valeurs que prend la variable al´ eatoire, c’est cette fois-ci la densit´ e qui est constante sur I .

1.6.2 Loi normale (ou gaussienne)

On dit que X suit la loi normale (ou gaussienne) de moyenne µ ∈ R et variance σ 2 > 0 (symboliquement, X ∼ N (µ, σ 2 )), si X admet la densit´ e

f X (x) = 1

2πσ 2 e

(x−µ)2 2σ2

. Pour calculer l’int´ egrale R ∞

−∞ f X (x) dx, on se ram` ene par changement de variables ` a l’int´ egrale de Gauss R ∞

−∞ e −t

2

dt (cf exo 9 du TD1) et on montre ainsi que f X est bien une densit´ e de probabilit´ e, c’est-` a-dire son int´ egrale vaut 1.

Si µ = 0, on dit que X est centr´ ee et si de plus σ 2 = 1 on dit que X est centr´ ee r´ eduite.

La fonction de r´ epartition de la loi normale centr´ ee r´ eduite N (0, 1) est not´ ee Φ : Φ(x) =

Z x

−∞

√ 1 2π e

y

2 2

dy.

Des tables de valeurs de Φ seront distribu´ ees en TD.

La forme de la densit´ e f X est la fameuse

courbe en forme de cloche

de Gauss. Elle est

sym´ etrique autour de µ, croissante ` a gauche de µ et d´ ecroissante ` a droite. Plus σ 2 est petit,

plus la densit´ e est resserr´ ee autour de µ.

(23)

1.6. QUELQUES VARIABLES AL ´ EATOIRES CONTINUES IMPORTANTES 23 On peut facilement relier les lois normales pour les diff´ erentes valeurs des param` etres par la formule suivante (plus tard) :

Si N ∼ N (0, 1) et µ, σ ∈ R, σ 6= 0, alors µ + σN ∼ N (µ, σ).

Pour cette raison, on d´ efinit la loi N (µ, 0) comme ´ etant la loi de Dirac en µ, ce n’est donc plus une loi continue mais une loi discr` ete.

La loi normale est omnipr´ esente en sciences. Ceci est dˆ u au fait qu’elle sert comme bonne approximation pour nombre de lois d` es lors qu’un param` etre devient grand. Par exemple, le th´ eor` eme de de Moivre–Laplace dit que la loi binomiale est bien approch´ ee quand n est grand par la loi gaussienne :

Theor` eme 1.4 (de Moivre, Laplace). Soit p ∈ ]0, 1[. Pour tout n ∈ N , soit X n une variable al´ eatoire de loi binomiale de param` etres n et p. Alors, pour tout −∞ ≤ a < b ≤ +∞,

P

np + a × p

p(1 − p)n ≤ X n ≤ np + b × p

p(1 − p)n

→ Φ(b) − Φ(a), n → ∞.

Heuristiquement, ce th´ eor` eme dit que si X ∼ Bin(n, p), alors quand n est grand et p fix´ e, X ≈ np + p

p(1 − p)n × N, avec N ∼ N (0, 1).

Une g´ en´ eralisation significative de ce th´ eor` eme sera apport´ ee par le th´ eor` eme central limite que nous verrons plus tard.

1.6.3 Loi exponentielle

On dit que X suit la loi exponentielle de param` etre λ > 0 (symboliquement, X ∼ Exp(λ)), si X admet la densit´ e

f X (x) = λe −λx 1 R

+

(x)

Sa fonction de r´ epartition admet une expression simple (exercice) : F X (x) =

( 1 − e −λx , si x ≥ 0 0, si x < 0.

En particulier, on peut retenir la formule suivante :

P (X > x) = e −λx , x ≥ 0.

La loi exponentielle est l’analogue continu de la loi g´ eom´ etrique. Comme elle, elle poss` ede une propri´ et´ e de perte de m´ emoire :

P (X − x > y | X > x) = P (X > y), pour tout x, y ≥ 0..

Ceci peut se reformuler de la fa¸con suivante : pour tout x ≥ 0, la loi de X − x condition-

nellement ` a l’´ ev´ enement {X > x} est la mˆ eme que celle de X. Pour cette propri´ et´ e, X peut

repr´ esenter la dur´ ee de vie d’une pi` ece qui ne pr´ esente pas de ph´ enom` ene de vieillissement :

Le temps qu’il lui reste ` a vivre sachant qu’il vit encore au temps t ne d´ epend pas de t (en

loi).

(24)

1.6.4 Autres lois ` a densit´ e

Loi de Weibull. On dit qu’une variable al´ eatoire X suit la loi Weibull de param` etres α, β > 0 si sa fonction de r´ epartition s’´ ecrit

F X (x) =

( 1 − exp(−(x/α) β ), si x ≥ 0

0, si x < 0.

En d´ erivant, on obtient la densit´ e f X (x) =

β α

x α

β−1

exp(−(x/α) β )1 x≥0 .

Cette loi est une g´ en´ eralisation de la loi exponentielle. Elle est utilis´ ee entre autre pour mod´ eliser des lois d’usures de pi` eces.

Loi gamma. On dit qu’une variable al´ eatoire X suit la loi gamma de param` etres α, β > 0 (symboliquement, X ∼ Γ(α, β)) si elle admet la densit´ e

f X (x) = β α

Γ(α) x α−1 e −βx , o` u Γ(α) = R ∞

0 x α−1 e −x dx est appel´ ee la fonction gamma d’Euler. Sa fonction de r´ epartition n’admet pas d’expression simple.

La loi gamma est une autre g´ en´ eralisation de la loi exponentielle. On retrouve cette derni` ere quand α = 1. La loi gamma intervient dans de nombreuses applications.

Loi de Cauchy. On dit qu’une variable al´ eatoire X suit la loi de Cauchy, si elle admet la densit´ e

f X (x) = 1 π(1 + x 2 ) . Sa fonction de r´ epartition vaut (exercice)

F X (x) = 1 2 + 1

π arctan x.

La densit´ e de cette loi est encore en

forme de courbe en cloche

, mais elle d´ ecroit beaucoup moins vite que la densit´ e de la loi normale.

1.7 Loi d’une fonction d’une variable al´ eatoire

Si f : R → R est une fonction et X une variable al´ eatoire, alors f (X) est encore un nombre qui d´ ecrit le r´ esultat d’une exp´ erience al´ eatoire, il est donc naturel de consid´ erer f (X) comme une nouvelle variable al´ eatoire. Plus g´ en´ eralement, si f est seulement d´ efinie sur un ensemble E ⊂ R et si la variable X est ` a valeurs dans E, donc si P(X ∈ E c ) = 0, il y a un sens ` a parler de f(X). Pour d´ efinir f (X) comme une variable al´ eatoire dans le sens de la Section 1.1, il faut alors d´ efinir P (f (X) ∈ A) pour tout ensemble A. La seule d´ efinition naturelle est la suivante : pour tout ensemble A ⊂ R, r´ eunion finie d’intervalles disjoints,

P (f (X) ∈ A) := P (X ∈ f −1 (A)),

(25)

1.7. LOI D’UNE FONCTION D’UNE VARIABLE AL ´ EATOIRE 25 o` u f −1 (A) est la pr´ eimage de A par l’application f . On suppose ici que l’ensemble f −1 (A) est encore une r´ eunion finie d’intervalles disjoints. Ceci est une hypoth` ese sur la fonction f qui est satisfaite par toute fonction

raisonnable

. On peut v´ erifier (exercice), que la fonction A 7→ P (f (X) ∈ A) ainsi d´ efinie satisfait encore aux axiomes 1 ` a 4.

Ayant d´ efini la variable al´ eatoire f (X) et sa loi nous souhaitons maintenant connaˆıtre sa fonction de r´ epartition et/ou sa fonction de masse (quand il s’agit d’une variable al´ eatoire discr` ete) ou sa fonction de densit´ e (quand il s’agit d’une variable al´ eatoire ` a densit´ e).

Calcul de la fonction de r´ epartition. Il est souvent commode d’essayer de calculer la fonction de r´ epartition de f (X). Par d´ efinition, on a

F f(X) (x) = P (f (X) ∈ ]−∞, x]) = P(X ∈ f −1 (]−∞, x]).

Puisque f −1 (]−∞, x]) est par hypoth` ese r´ eunion d’un nombre fini d’intervalles disjoints, cela permet d’exprimer la fonction de r´ epartition de f (X) en fonction de celle de X. Le cas le plus simple est celui ou f est une fonction strictement croissante ou d´ ecroissante, donc injective, et il convient de le formuler comme un ´ enonc´ e :

Corollaire 1.5. Soient I, J ⊂ R des intervalles, f : I → J une fonction continue, strictement croissante ou d´ ecroissante et surjective (donc bijective) et X une v.a. ` a valeurs dans I . Alors la fonction de r´ epartition de f (X) s’´ ecrit :

F f(X) (x) =

 

 

 

 

F X (f −1 (x)), si f est (strictement) croissante et x ∈ J 1 − F X (f −1 (x)−), si f est (strictement) d´ ecroissante x ∈ J

0, si x 6∈ J et x ≤ inf J

1, si x 6∈ J et x ≥ sup J .

D´ emonstration. — f (strictement) croissante : Dans ce cas, f(X) ≤ x si et seulement si X ≤ f −1 , et donc

F f(X ) (x) = P (X ≤ f −1 (x)) = F X (f −1 (x)).

— f (strictement) d´ ecroissante : Dans ce cas, f(X) ≤ x si et seulement si X ≥ f −1 (x), et donc

F f (X ) (x) = P (X ≥ f −1 (x)) = 1 − P (X < f −1 (x)) = 1 − F X (f −1 (x)−).

Exemple 1.6. Soit X une v.a. positive, c’est-` a-dire ` a valeurs dans R + . On consid` ere la fonction

f : R + → R + , f(x) = x 2 .

Alors f est une fonction continue, strictement croissante et surjective avec comme inverse f −1 (x) = √

x. Par le Corollaire 1.5, on a alors F X

2

(x) =

( F X ( √

x), x ≥ 0 0, x < 0.

Si X est une v.a. g´ en´ erale, alors le Corollaire 1.5 ne s’applique pas. On reprend alors la d´ efinition : pour tout x ≥ 0,

F X

2

(x) = P (X 2 ≤ x) = P (− √

x ≤ X ≤ √

x) = F X ( √

x) − F X ((− √

x)−).

(26)

On r´ esume :

F X

2

(x) =

( F X ( √

x) − F X ((− √

x)−), x ≥ 0

0, x < 0.

Calcul de la fonction de masse pour des v.a. discr` etes. Rappelons qu’une variable al´ eatoire est dite discr` ete si elle ne prend qu’un nombre au plus d´ enombrable de valeurs. Sous quelles conditions, f(X) est-elle discr` ete ? Deux conditions sont les plus courantes :

— Si f ne prend qu’un nombre fini ou d´ enombrable de valeurs et X quelconque.

— Si X est une v.a. discr` ete et f quelconque.

Si une de ces deux conditions est v´ erifi´ ee, on peut alors essayer de calculer directement la fonction de masse de f(X). Ceci est souvent plus commode que de calculer la fonction de r´ epartition. On a par d´ efinition, pour tout x ∈ R ,

P (f(X) = x) = P (X ∈ f −1 (x)).

On en d´ eduit les formules suivantes selon que X est discr` ete ou ` a densit´ e :

Corollaire 1.7. Supposons que f(X) est une v.a. discr` ete (par exemple si une des deux conditions suivantes sont v´ erifi´ ees). Alors la fonction de masse de f (X) s’exprime comme suit :

— Si X est discr` ete,

P(f(X) = x) = X

y : f(y)=x

P(X = y).

— Si X admet une densit´ e f X ,

P (f (X) = x) = Z

f

−1

({x})

f X (y) dy.

Exemple 1.8. f : R → {0, 1}, f (x) = 1 x≥0 , X une v.a. quelconque. La fonction f ne prend alors que deux valeurs, 0 ou 1. Par cons´ equent, la v.a. f (X) = 1 X ≥0 est discr` ete. Sa fonction de masse est donn´ ee par :

P (1 X ≥0 = 1) = P (X ≥ 0), P (1 X ≥0 = 0) = P (X < 0).

La v.a. 1 X ≥0 suit alors la loi de Bernoulli de param` etre p = P(X ≥ 0).

Exemple 1.9. f : R + → R + , f (x) = min(x, N ) (avec N ∈ N), X une v.a. ` a valeurs dans N.

Puisque X est une v.a. discr` ete, f (X) l’est aussi. Sa fonction de masse est donn´ ee par P (min(X, N ) = n) =

( P(X = n), n ∈ {0, . . . , N − 1}

P(X ≥ N ) = P ∞

k=N P (X = k), n = N.

Exemple 1.10. f : ]0, 1[ → N , f (x) = bN xc (avec N ∈ N ), X ∼ Unif(0, 1). La fonction f est

`

a valeurs dans {0, . . . , N − 1}, la v.a. f (X) est donc discr` ete. Sa fonction de masse est donn´ ee pour tout n ∈ {0, . . . , N − 1} par :

P (bN X c = n) = P (n/N ≤ X < (n + 1)/N ) =

Z (n+1)/N n/N

1 dx = 1

N .

La v.a. bN X c suit donc la loi uniforme sur {0, . . . , N − 1}.

(27)

1.7. LOI D’UNE FONCTION D’UNE VARIABLE AL ´ EATOIRE 27 Calcul de la densit´ e pour des v.a. ` a densit´ e. Supposons que X soit une v.a. ` a densit´ e.

Alors sous certaines conditions sur f, f(X) sera ´ egalement une v.a. ` a densit´ e et on peut alors calculer facilement la densit´ e de f (X) en fonction de la densit´ e de X et de (la d´ eriv´ ee de) la fonction f. Nous allons d’abord ´ enoncer et d´ emontrer un th´ eor` eme avec des hypoth` eses un peu restrictives, puis un th´ eor` eme avec des hypoth` eses plus g´ en´ erales (sans preuve) :

Theor` eme 1.11. Supposons que X admet une densit´ e f X et est ` a valeurs dans un intervalle I ⊂ R. Supposons en plus que f satisfait aux hypoth` eses suivantes :

— f ∈ C 1 (I)

— f est strictement croissante ou strictement d´ ecroissante (en particulier, f est injective)

— f 0 (x) = 0 pour un nombre fini de x ∈ I.

Alors f (X) est encore une v.a. ` a densit´ e donn´ ee par f f (X) (x) =

( f X (f −1 (x)) |(f −1 ) 0 (x)|, si x ∈ f (I ) et |(f −1 ) 0 (x)| existe.

0, sinon. ,

Remarque 1.12. On rappelle que (f −1 ) 0 (x) = f

0

(f

−1

1 (x)) , d` es lors que f 0 (f −1 (x)) 6= 0. La condition

|(f −1 ) 0 (x)| existe

dans le th´ eor` eme ci-dessus signifie alors que f 0 (f −1 (x)) 6= 0.

D´ emonstration. On peut supposer que I est un intervalle ouvert, car la probabilit´ e que X prenne valeur en un des deux bords de l’intervalle est nulle puisque X est ` a densit´ e. De plus, pour simplifier on suppose que f 0 (x) 6= 0 pour tout x ∈ I, sinon on d´ ecoupe l’intervalle I en les points o` u f 0 s’annulle et on traite chaque morceau s´ epar´ ement. Par le th´ eor` eme des fonctions implicites, f −1 est alors de classe C 1 sur f(I).

On consid` ere d’abord le cas o` u f est croissante, donc f 0 (x) > 0 pour tout x ∈ I . Pour tout x ∈ f (I ), on calcule alors la fonction de r´ epartition comme suit :

F f (X) (x) = F X (f −1 (x)) par le Corollaire 1.5

=

Z f

−1

(x) inf I

f X (y) dy

= Z x

inf f (I)

f X (f −1 (z))(f −1 ) 0 (z) dz chgt de var. z = f (y), dy = (f −1 ) 0 (z) dz.

Ceci montre que f (X) admet la densit´ e valant f X (f −1 (x))|(f −1 ) 0 (x)| sur f (I ) et 0 sinon.

Le cas o` u f est d´ ecroissante est similaire.

R` egle mn´ emotechnique. Pour m´ emoriser la formule du th´ eor` eme 1.11, il convient d’uti- liser la r´ egle mn´ emotechnique suivante. On part de l’expression

f X (x) dx

On effectue alors un changement de variable z = f (x), dx = (f −1 ) 0 (z) dz, comme si l’ex- pression ci-dessus apparaissait dans une int´ egrale. Sauf qu’on prend la valeur absolue de la d´ eriv´ ee pour contrer le fait que les bornes de l’int´ egrale s’inversent quand la fonction f est d´ ecroissante. Ceci donne alors

f X (f −1 (z)) |(f −1 ) 0 (z)| dz Ceci est la densit´ e recherch´ ee. On peut bien sur aussi l’´ ecrire

f X (f −1 (z)) 1

|f 0 (f −1 (z))| dz.

Références

Documents relatifs

1. On lance 5 fois successivement un d´e `a jouer non truqu´e, et on note X la variable al´eatoire ´egale au nombre de 2 obtenus parmi ces lancers... 2. On lance 5 fois

La masse d’un pain fabriqu´ e par la machine peut ˆ etre mod´ elis´ ee par une variable al´ eatoire X suivant la loi normale d’esp´ erance µ = 400 et d’´ ecart-type σ =

Dans l’exp´ erience compl` ete de Mendel, deux attributs des pois ´ etaient consid´ er´ es : la couleur (jaune ou verte, et la forme (ronde ou rid´ ee), avec la triple hypoth`

On note T la variable al´ eatoire prenant pour valeur le nombre de tirages n´ ecessaires jusqu’` a l’obtention d’au moins une boule noire et d’au moins une boule blanche.. On note

Donner un intervalle de confiance de niveau 95% sur la diff´ erence des proportions de pi` eces d´ efectueuses dans les deux proc´ ed´ es.. Statistique 14

Les r´ eponses aux deux parties seront r´ edig´ es sur des copies diff´ erentes.. Toutes les r´ eponses devront ˆ etre

[r]

C’est pourquoi nous appliquons la proc´edure non param´etrique. Les r´esultats sont donn´es dans le tableau suivant :.. La statistique K du test de Kruskal-Wallis doit ˆetre