Probabilités
Chapitre 1 : Fondement des probabilités
Lucie Le Briquer
1 Introduction
Objectif. Trouver un cadre pour modéliser l’aléa, le hasard.
• Jeux de hasards, dés, roulettes
• Sondages, échantillons (on capture 1000 tortues, il y en a 543 bleues, est-ce assez significatif pour conclure qu’il y a une proportion> 12 de tortues bleues)
• Situation où on ne maîtrise pas toutes les interactions (météo, cours de la Bourse, physique statistique)
Cadre. (Axiomatique de Kolmogorov) À un problème impliquant l’aléa, on va construire un espace de probabilité(Ω,A,P)pour modéliser cet aléa.
Remarque.On ne travaille jamais avec plusieurs espaces de probabilités et plus tard on ne précisera pas lequel (sauf pour les chaînes de Markov oùΩest explicite et il y a tout une famille deP).
1. Ωest un ensemble non vide qui représente l’ensemble des possibles. Un élémentω∈Ωest l’aléa. La donnée deω donne toute l’information sur le modèle. Un seulωest réalisé, mais on ne sait pas lequel.
Exemple. On jette 3 dés,Ω ={1, ...,6}3. Tout ce qui dépend deω est aléatoire, le reste est déterministe.
2. A ⊆ P(Ω)qui est une tribu (σ−algèbre) :
• non vide :Ω∈ A
• stable pourS
N: si An∈ A∀n⇒S
n∈NAn∈ A
• stable par complémentarité :A∈ A ⇒A¯∈ A
Les éléments A,B,C,... sont des évènements et représentent des propriétés que l’on peut observer sur l’aléa.
Exemple. A=“Les 3 dés sont pairs”={2,4,6}3 3. P:A →[0,1]est une mesure de probabilité :
• si lesAn sont disjoints :
P G
N
An
!
=X
N
P(An)
• P(Ω) = 1
P(A)représente les chances qu’aω l’aléa d’être dansA(P(A) = 1→sur toutes les obser- vations ω ∈A,P(A) = 0→ sur toutes les observationsω /∈A, P(A) = 13 →une fois sur trois on observera ω∈A).
On pose un problème :
1. onmodélise par le choix d’un (Ω,A,P)adapté 2. on travaille dans cet espace pour résoudre
2 Exemples
2.1 Un premier exemple dans le cadre discret
Problème. on jette 2 dés, quelle est la probabilité que la somme soit paire ?
Modélisation. Ω = {1, ...,6}2, A = P(Ω) (toujours si Ω est fini), P=probabilité uniforme (P(A) =Card(A)36 ).
Résolution. A=“La somme des dés est paire”={2,4,6}2∪ {1,3,5}2, donc : P(A) = Card(A)
36 = 9 + 9 36 =1
2
2.2 Un second exemple dans le cas continu : l’aiguille de Buffon
Problème. On lance une aiguille de 1cm sur un parquet de lattes de 1cm. Quelle est la probabilité que l’aiguille soit à cheval sur 2 lattes ?
Modélisation. On repère l’aiguille par :
• xla distance de son centre au bord de la latte en dessous06x <1
• θ son angleθ∈[0, π[
On pose alors comme cadre :
• Ω ={(x, θ)∈[0,1[×[0, π[}
• A=B([0,1[×[0, π[)
• P=π1Lebesgue|[0,1[×[0,π[
Résolution. A=“L’aiguille touche 2 lattes”
A¯=“L’aiguille ne touche pas 2 lattes”
= ß
(x, θ)∈[0,1[×[0, π[| Å
x6 1
2 et x−1
2sinθ>0 ã
ou Å
x > 1
2 etx+1
2sinθ <1 ã™
P( ¯A) =P Åß
(x, θ)∈Ω|x61
2 etx−1
2sinθ>0
™ã +P
Åß
(x, θ)∈Ω|x > 1
2 et x+1
2sinθ <1
™ã
=
symétrie2P Åß
(x, θ)∈Ω|x61
2 etx−1
2sinθ>0
™ã
= 2 Z
x∈[0,1[
Z
06θ6π
112sinθ6x612
dxdθ π
= 2 Z π
0
1
2(1−sinθ)dθ π
= 1−2 π Donc,
P(A) = 2 π
2.3 Un troisième exemple plus complexe
Problème. On jette des dés à 6 faces (une infinité de fois), quelle est la probabilité que le premier 6 apparaisse au bout d’un nombre pair de lancers ?
Modélisation. Ω ={1, ...,6}N.ω= (ω1, ω2, ....)avecωi le résultat dui−ème lancer. Soit : Ai1,...,ik={ω= (ω1, ω2, ...)∈Ω| ω1=i1, ..., ωk =ik}
où k ∈ N et (i1, ..., ik) ∈ {1, ...,6}k. On veut que les Ai1,...,ik soient des évènements. On pose donc :
A=σ(Ai1,...,ik |k∈N∗,(i1, ..., ik)∈ {1, ...,6}k) (σ= plus petite tribu contenant ...).
etPla mesure de probabilité telle que P(Ai1,...,ik) = 61k. Difficultés.
• Pourquoi ce choix de tribu ?
• Existe-t-il une telle probabilitéP?
• Est-elle unique ?
Résolution.
P(premier 6 au bout d’un nombre pair de lancers)
=P Ñ
G
p∈N∗
le premier 6 est au bout de2plancers é
= X
p∈N∗
X
i1,...,i2p−1∈{1,...,5}2p−1
P(Ai1,...,i2p−1,6)
= X
p∈N∗
X
i1,...,i2p−1∈{1,...,5}2p−1
1 62p
= X
p∈N∗
Å5 6
ã2p
1 5
= 5 62
1 1− 562
= 5 11
Existence de P. Construire une infinité d’évènements indépendants est parfois difficile (on y reviendra). Ici on a une construction directe.
x∈[0,1[a un développement 6-adique unique : x=
+∞
X
i=1
xi
6i avecxi ∈ {0,1, ...,5}non tous égaux à 5 à partir d’un certain rang Soit :
ϕ:
ß [0,1[ → Ω x=Pxi
6i → (x1+ 1, x2+ 2, ...) ϕest mesurable car :
ϕ−1(Ai1,...,ik) =
" k X
j=1
ij−1 6j ;
k
X
j=1
ij+ 1 6j + 1
6k
"
(il suffit de vérifier la mesurabilité sur une partie génératrice carϕ−1( ¯A) =ϕ−1(A)) On posePla mesure image de Lebesgue parϕ:
P(A) =Lebesgue(ϕ−1(A)) etP(Ai1,...,ik) =Lebesgue
"
Pij−1
6j ;Pij−1 6j +61k
"!
. DoncPexiste.
Choix de la tribu. A =σ(Ai1,...,ik | ...). Déraisonnable de ne pas prendre les Ai1,...,ik. Choisir une tribu plus grosse mène aux mêmes difficultés que définir Lebesgue sur + que les boréliens.
CeAest la tribu “cylindrique”.
Unicité de P:∃une unique probabilité sur (Ω,A)telle que P(Ai1,...,ik) = 1
6k ∀i1, ...., ik
La raison vient des classes monotones.
1. une classeC est une partie deA:C ⊆ A
2. c’est une tribu si elle est stable par complémentaire et union dénombrable 3. on appelle
σ(C) =plus petite tribu qui la contient= \
Btribu,C⊆B⊆A
B Rappels 1(classes)
Cest une classe monotone si :
• Ω∈ C
• siA⊆B et A, BdansC alorsB\A
• siAn est une suite croissante dansC (An⊆An+1) alorsS
NAn∈ C Définition 1(classe monotone)
Remarque.Une tribu est une classe monotone.
On définit pour une classeC:
M(C) =plus petite classe monotone contenantC= \
C⊆M⊆A,Mcl. monotone
M
Intérêt de la notion :
• simple à vérifier
• siµetνsont deux mesures de probabilité,{A∈Ω|µ(A) =ν(A)}est une classe monotone (siA⊆B,µ(B\A) =µ(B)−µ(A); siAn suite croissante,µ(SAn) = limµ(An))
S’il existe une autre mesureQtelle queQ(A1, ..., ik) = 61k on a : P|M(Ai
1,...,ik|..)=Q|M(Ai
1,...,ik)|..
Il manque un résultat pour direM(Ai1,...,ik) =σ(Ai1,...,ik) =A
SiC est une classe stable parTfinie alors :
M(C) =σ(C) Lemme 1(lemme des classes monotones)
Ici avecC =
Ai1,...,ik|i1, ..., ik∈ {1, ...,6}k, k∈N∗ S
{∅} on vérifie que le lemme s’applique et on montre alors queP=Q.