Probabilit´es et Statistique pour Informatique et Communications
cA. C. Davison, 2012
http://stat.epfl.ch
1 Introduction 2
1.1 Motivation 3
1.2 Pr´eliminaires 21
1.3 Combinatoire 29
2 Probabilit´e 39
2.1 Espaces de Probabilit´e 41
2.2 Probabilit´e Conditionnelle 64
2.3 Ind´ependance 72
2.4 Exemples Edifiants 80
3 Variables Al´eatoires 87
3.1 Id´ees de Base 89
3.2 Esp´erance 112
3.3 Lois Conditionnelles 120
3.4 Notions de Convergence 124
4 Variables Al´eatoires Continues 131
4.1 Notions de Base 132
4.2 Notions Suppl´ementaires 145
4.3 Loi Normale 152
4.4 Q-Q Plots 164
5. Plusieurs Variables Al´eatoires 170
5.1 Id´ees de Base 172
5.2 D´ependance 184
5.3 Fonctions G´en´eratrices 195
5.4 Loi Normale Multivari´ee 205
5.4 Transformations 214
5.6 Statistiques d’Ordre 221
6. Approximation et Convergence 224
6.1 In´egalit´es 226
6.2 Convergence 229
6.3 Lois des grands nombres 236
6.4 Th´eor`eme central limite 241
6.5 M´ethode delta 247
7 La Statistique 253
7.1 Introduction 254
7.2 Tests Statistiques 259
7.3 Estimation Ponctuelle 284
7.3 Estimation par Intervalle 297
8 Vraisemblance 309
8.1 Motivation 310
8.2 Param`etre scalaire 318
8.3 Param`etre vecteur 329
8.4 Mod´elisation statistique 334
9 Inf´erence Bayesienne 341
9.1 Id´ees de Bayes 342
9.2 Mod´elisation Bay´esienne 358
1 Introduction slide 2
1.1 Motivation slide 3
Motivation
Probabilit´es et statistiques fournissent des outils math´ematiques et des mod`eles pour l’´etude d’´ev`enements ‘al´eatoires’ :
– pr´evisions m´et´eorologiques, finance (Prix Nobel, 2003), . . .; – mod´elisation de r´eseaux ;
– algorithmes stochastiques ; – trafic internet ;
– erreurs dans le codage de signaux ; – traitement d’images ;
– . . .
Ils fournissent des m´ethodes optimales pour pr´evoir, ´eliminer le bruit, pour sugg´erer une mani`ere de traiter le trafic, et pour la reconstruction du vrai signal ou de l’image.
Probabilit´es et Statistique pour SIC slide 4
R´eseaux stochastiques
Graphe de Erd¨os–R´enyi (1960), avec p= 0.01. Les arcs entre chaque pair de sommets apparaissent avec la probabilit´es p, ind´ependamment des autres arcs. Dans ce cas, si p >(1 +ǫ) logn/n,ǫ >0, le graphe sera connect´e (presque sˆurement).
Probabilit´es et Statistique pour SIC slide 5
‘Giant component’
Graphe de Erd¨os–R´enyi (1960), avec n= 150,p= 0.01. Si quandn→ ∞ on anp→c >1, alors il y a (presque sˆurement) un sous-graphe connect´e contenant une fraction positive des sommets. Aucun autre composant contient plus que O(logn) des sommets.
Probabilit´es et Statistique pour SIC slide 6
R´eseaux stochastiques II
Chain network Nearest-neighbour network Scale-free network
Guo et al. (2011,Biometrika)
Probabilit´es et Statistique pour SIC slide 7
Mod´elisation des pages web comme r´eseaux
person
topic
gener interest
parallel
parallel support
instructor
Fig. 3. Common structure in the webpages data. Panel (a) shows the estimated common structure for the four cat- egories. The nodes represent 100 terms with the highest log-entropy weights. The area of the circle representing a node is proportional to its log-entropy weight. The width of an edge is proportional to the magnitude of the associated
partial correlation. Panels (b)–(d) show subgraphs extracted from the graph in panel (a).
Guo et al. (2011,Biometrika)
Probabilit´es et Statistique pour SIC slide 8
Algorithmes al´eatoires
Probabilit´es et Statistique pour SIC slide 9
Traitement de signal
0 200 400 600 800 1000
0204060
NMR data
y
Wavelet Decomposition Coefficients
Daub cmpct on ext. phase N=2 Translate
Resolution Level 987654321
0 128 256 384 512
Donn´ees et coefficients d’une transformation orthogonale
Probabilit´es et Statistique pour SIC slide 10
Traitement de signal
Original coefficients
Daub cmpct on ext. phase N=2 Translate
Resolution Level 987654321
0 128 256 384 512
Shrunken coefficients
Daub cmpct on ext. phase N=2 Translate
Resolution Level 987654321
0 128 256 384 512
Coefficients originaux et ‘thresholded’
Probabilit´es et Statistique pour SIC slide 11
Traitement de signal
0 200 400 600 800 1000
−200204060
NMR data
y
0 200 400 600 800 1000
−200204060
Bayesian posterior median
wr(w)
Donn´ees et signal r´econstruit par une m´ethode statistique
Probabilit´es et Statistique pour SIC slide 12
Donn´ees video
Time
videoVBR
0 200 400 600 800 1000
50100150200250300350400
Amount of coded information (Variable Bit Rate) per frame for a certain video sequence. There were about 25 frames per second.
Probabilit´es et Statistique pour SIC slide 13
Trafic sur LAN
Time
ethernetTraffic
0 1000 2000 3000 4000
02000600010000
S´erie temporelle avec variation bizarre
Probabilit´es et Statistique pour SIC slide 14
S´eries temporelles
0e+006e+04
Number 060000
2010.0 2010.2 2010.4 2010.6 2010.8 2011.0
Value
Time
Nombre et valeur de transactions (unit´es arbitraires) chaque heure pour natels, 2010.
Probabilit´es et Statistique pour SIC slide 15
S´eries temporelles
020004000
Number 020005000
2010.0 2010.2 2010.4 2010.6 2010.8 2011.0
Value
Time
Nombre et valeur de transactions (unit´es arbitraires) chaque heure pour natels, 2010.
Probabilit´es et Statistique pour SIC slide 16
Evaluation de performance
Jean-Yves Le Boudec (2010)
Probabilit´es et Statistique pour SIC slide 17
Motivation pratique
Beaucoup des cours ult´erieurs se basent sur la probabilit´e et la statistique : – Traitement du signal statistique et applications (Vetterli) ;
– Automatic speech processing (Bourlard) ; – Biomedical signal processing (Vesin) ;
– Stochastic models in communication (Le Boudec/Thiran) ; – Signal processing for communications (Urbanke) ;
– Pattern classification and machine learning (Gerstner/Seeger) – Models and methods for random networks (Grossglauser/Thiran) – Performance evaluation (Le Boudec)
– Statistical signal processing and applications (Jovanovic/Ridolfi) – Information theory and coding (Urbanke)
– . . .
Probabilit´es et Statistique pour SIC slide 18
Organisation
– Enseignant :Professor A. C. Davison
– Assistants :Juliette Blanchet, Mine Alsan, Stefan Bucur, Mohammadjavad Faraji, Marc Vuffray – Cours :Lundi 14.15–16.00, CE6 ; Mardi, 13.15–15.00, CE4
– Exercices :Lundi 16.15–18.00, CE6.
– Test :16 avril, 16.15–18.00, sans aucune mati`ere ´ecrite (calculatrice simple authoris´ee)
– Bonus :pour quizzes de 15 minutes les 5 et 19 mars, le 2 avril, et les 7 et 21 mai, sans aucune mati`ere ´ecrite (calculatrice simple authoris´ee)
– TP :avec logicielR(http://stat.ethz.ch/CRAN/), 2 avril, 14 mai
– Page webavec notes de cours, exercices (y compris Random Exercise Generator), probl`emes, etc. :
http://stat.epfl.ch/page-76545.html
Probabilit´es et Statistique pour SIC slide 19
Mat´eriel de cours
Livres : Les probabilit´es constituent `a peu pr`es les deux premiers tiers du cours, et un bon livre est : – Ross, S. M. (1999) Initiation aux Probabilit´es. PPUR : Lausanne.
– Il y a beaucoup d’autres excellents livres d’introduction : regarder au Learning Centre.
Les r´ef´erences en statistiques seront donn´ees ult´erieurement.
Probabilit´es et Statistique pour SIC slide 20
1.2 Id´ ees pr´ eliminaires slide 21
Les ensembles
D´efinition 1. Unensemble A est une collection d’objets, x1, . . . , xn, . . . : A={x1, . . . , xn, . . .}.
On ´ecritx∈Apour dire que ‘xest un ´el´ement de A’, ou ‘xappartient `aA’. La collection de tous les objets possibles dans un contexte donn´e est appel´el’univers Ω.
Exemples :
CH = {Gen`eve,Vaud, . . . ,Grisons} ensemble des cantons suisses {0,1} = ensemble fini constitu´e des ´el´ements 0 et 1
N = {1,2, . . .}, nombres entiers positifs, ensemble d´enombrable Z = {. . . ,−1,0,1,2, . . .}, nombres entiers, ensemble d´enombrable R = nombres r´eels, ensemble non d´enombrable
∅ = { } ensemble vide, n’a pas d’´el´ement
Probabilit´es et Statistique pour SIC slide 22
Sous-ensembles
D´efinition 2. Un ensembleA est unsous-ensemble d’un ensemble B six∈A entraine quex∈B : on noteA⊂B.
– SiA⊂B etB ⊂A, alors chaque ´el´ement de A est contenu dansB et vice versa, ainsiA=B : les deux ensembles contiennent pr´ecis´ement les mˆemes ´el´ements.
– Remarquer que∅ ⊂A pour tout ensemble A. Ainsi,
∅ ⊂ {1,2,3} ⊂N⊂Z⊂Q⊂R⊂C, ∅ ⊂I⊂C
– Les diagrammes de Vennsont utiles pour saisir des relations ´el´ementaires existant entre les ensembles, mais ils peuvent ˆetre trompeurs (toutes les relations ne peuvent ˆetre repr´esent´ees).
Probabilit´es et Statistique pour SIC slide 23
Cardinal d’un ensemble
D´efinition 3. Un ensemble fini Aa un nombre fini d’´el´ements, et ce nombre est appel´e son cardinal: cardA, #A, |A|.
– Evidemment |∅|= 0 et |{0,1}|= 2
– Exercise : Montrer que siAet B sont finis et A⊂B, alors |A| ≤ |B|.
Probabilit´es et Statistique pour SIC slide 24
Op´erations Bool´eennes
D´efinition 4. SoientA, B⊂Ω. Alors on peut d´efinir : – l’unionet l’intersection deAet B, soit
A∪B={x∈Ω :x∈A oux∈B}, A∩B ={x∈Ω :x∈A etx∈B}; – lecompl´ementairedeA dans Ωest Ac ={x∈Ω :x6∈A}.
Evidemment A∩B ⊂A∪B, et si les ensembles sont finis, alors
|A|+|B|=|A∩B|+|A∪B|, |A|+|Ac|=|Ω|. On peut aussi d´efinir ladiff´erence entre A et B, soit
A \ B=A∩Bc={x∈Ω :x∈A etx6∈B}, (noter que A \B 6=B \ A), et la diff´erence sym´etrique
A △B = (A \ B)∪(B \A).
Probabilit´es et Statistique pour SIC slide 25
Op´erations Bool´eennes
Si{Aj}∞j=1 est un ensemble infini de sous-ensembles deΩ, alors [∞
j=1
Aj = A1∪A2∪ · · ·: tout x∈Ωs’il appartient au moins `a un Aj
\∞
j=1
Aj = A1∩A2∩ · · ·: tout x∈Ωs’il appartient `achaque Aj Ce qui suit est facile `a montrer (diagramme de Venn) :
– (Ac)c =A, (A∪B)c=Ac∩Bc, (A∩B)c=Ac∪Bc;
– A∩(B∪C) = (A∩B)∪(A∩C),A∪(B∩C) = (A∪B)∩(A∪C); – (S∞
j=1Aj)c =T∞
j=1Acj, (T∞
j=1Aj)c =S∞ j=1Acj.
Probabilit´es et Statistique pour SIC slide 26
Partition
D´efinition 5. Unepartition deΩest une collection de sous-ensembles non videsA1, . . . , An de Ω tels que
1. lesAj sontexhaustifs, c’est `a dire que A1∪ · · · ∪An= Ω, et 2. lesAj sontdisjoints, c’est `a dire que Ai∩Aj =∅, pour i6=j.
Une partition peut aussi ˆetre compos´ee d’un nombre infini d’ensembles {Aj}∞j=1.
Exemple 6. SoientAj = [j, j+ 1), pourj=. . . ,−1,0,1, . . .. Est ce que les Aj forment une partition deΩ =R?
Exemple 7. Soient Aj l’ensemble des entiers divisibles par j, pour j= 1,2, . . .. Est ce que lesAj forment une partition deΩ =N?
Probabilit´es et Statistique pour SIC slide 27
Produit Cart´esien
D´efinition 8. Leproduit Cart´esien de deux ensemblesA, B est l’ensemble des pairesordonn´ees A×B ={(a, b) :a∈A, b∈B}.
De mˆeme
A1× · · · ×An={(a1, . . . , an) :a1∈A1, . . . , an∈An}. SiA1=· · ·=An=A, alors on ´ecrit A1× · · · ×An=An.
Comme les paires sont ordonn´ees, A×B 6=B×A`a moins que A=B.
SiA1, . . . , An sont tous finis, alors
|A1× · · · ×An|=|A1| × · · · × |An|. Exemple 9. Soit A={a, b}, B={1,2,3}. D´ecrireA×B.
Probabilit´es et Statistique pour SIC slide 28
1.3 Combinatoire slide 29
Combinatoire : Rappels
C’est les math´ematiques du d´enombrement. Deux principes de base :
– multiplication : si j’aim chapeaux et n´echarpes, il y am×n diff´erentes fa¸cons de les combiner ensemble ;
– addition :si j’ai m chapeaux rouges etnchapeaux bleux, alors j’ai m+n chapeaux au total.
En termes math´ematiques, soientA1, . . . , Ak des ensembles, alors
|A1× · · · ×Ak|=|A1| × · · · × |Ak|, (multiplication), et si lesAj sont disjoints, alors
|A1∪ · · · ∪Ak|=|A1|+· · ·+|Ak|, (addition).
Probabilit´es et Statistique pour SIC slide 30
Permutations : S´election ordonn´ee
D´efinition 10. Unepermutationden objets distincts est un ensemble ordonn´e de ces objets.
Th´eor`eme 11. Etant donn´enobjets distincts, le nombre de permutations diff´erentes (sans r´ep´etition) de longueur r≤nest
n(n−1) (n−2) · · · (n−r+ 1) = n!
(n−r)!. Ainsi il y an!permutations de longueur n.
Th´eor`eme 12. Etant donn´en=Pr
i=1ni objets de r types diff´erents, o`u ni est le nombre d’objets de type iindiff´erentiables entre eux, le nombre de permutations (sans r´ep´etition) des nobjets est
n!
n1!n2! · · · nr!.
Probabilit´es et Statistique pour SIC slide 31
Exemple
Exemple 13. Une classe de 20 ´etudiants ´elisent un comit´e de taille 4 pour organiser un voyage d’´etude. De combien de mani`eres diff´erentes peuvent-ils choisir le comit´e si :
(a) il y a 4 rˆoles distincts (pr´esident, secr´etaire, tr´esorier, agent de voyage) ? (b) il y a un pr´esident, un tr´esorier, et deux agents de voyage ?
(c) il y a deux tr´esoriers et deux agents de voyage ? (d) leurs rˆoles sont indiff´erentiables ?
Coefficients multinomial et binomial
D´efinition 14. Soientn1, . . . , nr des entiers compris entre 0,1, . . . , n, ayant pour total n1+· · ·+nr=n. Alors
n n1, n2, . . . , nr
= n!
n1!n2! · · · nr!, est appel´ecoefficient multinomial. Le cas r= 2 est le plus courant :
n k
= n!
k!(n−k)!
=Cnk dans certains livres
est appel´ecoefficient binomial.
Probabilit´es et Statistique pour SIC slide 33
Combinations : S´election non ordonn´ee
Th´eor`eme 15. Le nombre de mani`eres de choisir un ensemble de r objets issus d’un ensemble den objets distinct sans r´ep´etition est
n!
r!(n−r)! = n
r
.
Th´eor`eme 16. Le nombre de mani`eres de r´epartir nobjets distincts en r groupes distincts de taille n1, . . . , nr, o`u n1+· · ·+nr=nest
n!
n1!n2! · · · nr!.
Probabilit´es et Statistique pour SIC slide 34
Propri´et´es des coefficients binomiaux
Th´eor`eme 17. Soient n, m∈ {1,2,3. . .} et r∈ {0, . . . , n}, alors : n
r
= n
n−r
; n+ 1
r
= n
r−1
+ n
r
, (triangle de Pascal); Xr
j=0
m j
n r−j
=
m+n r
, (formule de Vandermonde);
(a+b)n = Xn
r=0
n r
arbn−r, (formule du binˆome de Newton);
(1−x)−n = X∞
j=0
n+j−1 j
xj, |x|<1, (s´eries binomiales n´egatives).
Probabilit´es et Statistique pour SIC slide 35
Partitions d’entiers
Th´eor`eme 18. (a) Le nombre de vecteurs distincts (n1, . . . , nr) d’entiers positifs, n1, . . . , nr>0, satisfaisantn1+· · ·+nr=nest
n−1 r−1
.
(b) Le nombre de vecteurs distincts(n1, . . . , nr)d’entiers non-n´egatifs, n1, . . . , nr≥0, satisfaisant n1+· · ·+nr=n est n+r−1
n
.
Exemple 19. De combien de mani`eres diff´erentes peut on mettre 6 balles identiques dans 3 boˆıtes, de fa¸con `a ce que chaque boˆıtes contienne au moins une balle ?
Exemple 20. De combien de mani`eres diff´erentes peut on mettre 6 balles identiques dans 3 boˆıtes ?
Probabilit´es et Statistique pour SIC slide 36
Rappel : S´erie g´eom´etrique
Th´eor`eme 21. (a) Une s´erie g´eom´etrique est de la formea, aθ, aθ2, . . .; on a Xn
i=0
aθi=
(a1−θ1−θn+1, θ6= 1, a(n+ 1), θ= 1.
Si|θ|<1, alors P∞
i=0θi = 1/(1−θ), et X∞
i=0
i!
(i−r)!θi−r= r!
(1−θ)r+1, r= 1,2, . . . .
Probabilit´es et Statistique pour SIC slide 37
Petit Vocabulaire
Mathematics English Fran¸cais
Ω, A, B . . . set un ensemble
A∪B union l’union
A∩B intersection l’intersection
Ac complement of A (inΩ) le compl´ementaire de A(en Ω)
A \ B difference la diff´erence
A ∆B symmetric difference la diff´erence sym´etrique A×B Cartesian product le produit cart´esien
|A| cardinality le cardinal
{Aj}nj=1 pairwise disjoint {Aj}nj=1 disjoint deux `a deux
partition une partition
permutation une permutation
combination une combinaison
n r
binomial coefficient un coefficient binomial (Cnr)
n n1,...,nr
multinomial coefficient un coefficient multinomial indistinguishable indiff´erentiable
colour-blind daltonien (ienne)
Probabilit´es et Statistique pour SIC slide 38
2 Probabilit´ e slide 39
Petit Vocabulaire Probabiliste
Mathematics English Fran¸cais
one fair die (several fair dice) un d´e juste/´equilibr´e (plusieurs d´es justes/´equilibr´es)
random experiment une exp´erience al´eatoire
Ω sample space l’ensemble fondamental
ω outcome, elementary event une ´epreuve, un ´ev´enement ´el´ementaire
A, B, . . . event un ´ev´enement
F event space l’espace des ´ev´enements
sigma-algebra une tribu
Pr probability distribution/probability function une loi de probabilit´e
(Ω,F,Pr) probability space un espace de probabilit´e
inclusion-exclusion formulae formule d’inclusion-exclusion Pr(A|B) probability ofA given B la probabilit´e deA sachantB
independence ind´ependance
(mutually) independent events les ´ev´enements (mutuellement) ind´ependants pairwise independent events les ´ev´enements ind´ependants deux `a deux conditionally independent events les ´ev´enements conditionellement ind´ependants
Probabilit´es et Statistique pour SIC slide 40
2.1 Espaces de Probabilit´ e slide 41
Les Joueurs de cartes
Paul C´ezanne, 1894–95, Mus´ee d’Orsay, Paris
Probabilit´es et Statistique pour SIC slide 42
Motivation : Jeu de d´e
Deux d´es ´equilibr´es sont lanc´es, un rouge et un vert.
– (a) Quel est l’ensemble des r´esultats possibles ? – (b) Quels r´esultats donnent un total de 6? – (c) Quels r´esultats donnent un total de 12 ? – (d) Quels r´esultats donnent un total impair ?
– (e) Quelles sont les probabilit´es des ´ev´enements (b), (c), (d) ?
Probabilit´es et Statistique pour SIC slide 43
Calcul de probabilit´es
– On peut essayer de calculer les probabilit´es d’´ev´enements tels que (b), (c), (d) en lan¸cant le d´e de nombreuses fois et en posant
probabilit´e d’un ´ev´enement= #de fois o`u l’´ev´enement se produit
#exp´eriences r´ealis´ees .
C’est une r´eponse pratique plutˆot que math´ematique, disponible seulement apr`es beaucoup de travail (combien de fois doit-on lancer le d´e ?), et donnera des r´eponses diff´erentes `a chaque fois—
insatisfaisante !
– Pour des exemples simples, on utilise souvent la sym´etrie pour le calcul des probabilit´es. Ceci n’est plus possible pour des cas plus compliqu´es—on construit des mod`eles math´ematiques, bas´es sur les notions d’exp´erience al´eatoireet d’espace de probabilit´e.
Probabilit´es et Statistique pour SIC slide 44
Exp´erience al´eatoire
D´efinition 22. Une exp´erience al´eatoire est une ‘exp´erience’ dont le r´esultat est (ou peut ˆetre traˆıt´e comme) al´eatoire.
Exemple 23. Je jette une pi`ece.
Exemple 24. Je lance 2 d´es ´equilibr´es, un rouge et un vert.
Exemple 25. Le nombre d’emails que je re¸cois aujourd’hui.
Exemple 26. Le temps d’attente jusqu’`a la fin de ce cours.
Exemple 27. Le temps qu’il fera ici demain `a midi.
Probabilit´es et Statistique pour SIC slide 45
Andrey Nikolaevich Kolmogorov (1903–1987)
Grundbegriffe der Wahrscheinlichkeitsrechnung (1933)
Probabilit´es et Statistique pour SIC slide 46
Espace de probabilit´e (Ω,F,Pr)
Une exp´erience al´eatoire est modelis´ee par un espace de probabilit´e.
D´efinition 28. Unespace de probabilit´e (Ω,F,Pr) est un objet math´ematique associ´e `a une exp´erience al´eatoire, constitu´e de :
1. un ensemble Ω, l’ensemble fondamental, qui contient tous lesr´esultats (´epreuves,
´
ev´enements ´el´ementaires) ω possibles de l’exp´erience ;
2. une collection F de sous-ensembles deΩ. Ces sous-ensembles sont appel´es´ev´enements, et F est appel´el’espace des ´ev´enements;
3. une fonction Pr :F 7→[0,1]appel´eeloi de probabilit´e, qui associe une probabilit´ePr(A) `a chaque A∈ F.
Probabilit´es et Statistique pour SIC slide 47
Ensemble fondamental
– L’ensemble fondamentalΩ est l’ensemble compos´e d’´el´ements repr´esentant tous les r´esultats possibles d’une exp´erience al´eatoire. Chaque ´el´ement ω∈Ω est associ´e `a un r´esultat diff´erent.
– Ωest analogue `a l’ensemble univers. Il peut ˆetre fini, d´enombrable ou non d´enombrable.
– Ωest non-vide. (SiΩ =∅ alors rien d’int´er´essant ne peut arriver.)
Exemple 29. D´ecrire les ensembles fondamentaux pour les Exemples 23–27.
Pour les exemples ´el´ementaires avec Ωfini, on choisit souventΩ de mani`ere `a ce que ω∈Ω soit
´equiprobable :
Pr(ω) = 1
|Ω|, pour chaque ω ∈Ω.
Alors Pr(A) =|A|/|Ω|, pour tout A⊂Ω.
Probabilit´es et Statistique pour SIC slide 48
Espace des ev´enements
F est un ensemble de sous-ensembles deΩqui repr´esente les ´ev´enements d’int´erˆet.
Exemple 30 (Suite de l’exemple 24). Donner les ´ev´enements A le d´e rouge montre 4,
B le total est impair, C le d´e vert montre 2,
A∩B le d´e rouge montre 4 et le total est impair.
Calculer leurs probabilit´es.
Espace des ev´enements F, II
D´efinition 31. Unespace des ´ev´enements F est un ensemble de sous-ensembles deΩtel que : (F1) F est non vide ;
(F2) siA∈ F alors Ac∈ F;
(F3) si{Ai}∞i=1 sont tous des ´el´ements deF, alors S∞
i=1Ai ∈ F. F est aussi appel´eeune tribu.
SoientA, B, C,{Ai}∞i=1 des ´el´ements de F. Alors les axiomes pr´ec´edents impliquent que – Sn
i=1Ai∈ F, – Ω∈ F, ∅ ∈ F,
– A∩B ∈ F, A \ B∈ F, A ∆B ∈ F, – Tn
i=1Ai∈ F.
Probabilit´es et Statistique pour SIC slide 50
Espace des ev´enements F, III
– SiΩest d´enombrable, on prend souvent pour F l’ensemble de tous les sous-ensembles de Ω. C’est le plus grand (et le plus riche) espace des ´ev´enements possibles pourΩ.
– On peut d´efinir des espaces des ´ev´enements diff´erents pour le mˆeme ensemble fondamental.
Exemple 32. Donner la tribu pour l’Exemple 23.
Exemple 33. Je lance deux d´es ´equilibr´es, un rouge et un vert.
(a) Quel est ma tribuF1?
(b) J’informe mon ami seulement du total. Quel est sa tribuF2?
(c) Mon ami regarde lui-mˆeme les d´es, mais il est daltonien. Quel est alors sa tribuF3?
Probabilit´es et Statistique pour SIC slide 51
Espace des ev´enements F, III
– Habituellement l’espace des ´ev´enements est clair d’apr`es le contexte, mais il est important d’´ecrire ΩetF explicitement, afin d’´eviter la confusion.
– Cela peut aussi ˆetre utile lorsque des soi-disant ‘paradoxes’ surviennent (g´en´eralement en raison d’une formulation math´ematique du probl`eme peu claire ou erron´ee).
– Il est essentiel de donner Ωet F lors des exercices, tests et examens.
Probabilit´es et Statistique pour SIC slide 52
Exemples
Exemple 34. Une femme planifiant sa future famille consid`ere les situations suivantes (on suppose que les chances d’avoir un gar¸con ou une fille sont ´egales `a chaque fois) :
(a) avoir trois enfants ;
(b) mettre au monde des enfants jusqu’`a ce que la premi`ere fille naisse, ou jusqu’`a ce que les trois enfants naissent, s’arrˆeter lorsque l’une des 2 situations se r´ealise.
(c) mettre au monde des enfants jusqu’`a ce que il y en ait un de chaque sexe ou jusqu’`a ce qu’il en ait trois, s’arrˆeter lorsque l’une des 2 situations se r´ealise.
SoientGi l’´ev´enement ‘igar¸cons sont n´es’,A l’´ev´enement ‘il y a plus de filles que de gar¸cons’.
CalculerPr(G1) etPr(A) sous (a)–(c).
En fait, le rapport gar¸con/fille est∼105/100 `a naissance.
Exemple 35 (Anniversaires). n personnes sont dans une pi`ece. Quelle est la probabilit´e qu’ils aient tous une date d’anniversaire diff´erente ?
Probabilit´es et Statistique pour SIC slide 53
Anniversaires
0 10 20 30 40 50 60
0.00.20.40.60.81.0
n
Probability
Probabilit´es et Statistique pour SIC slide 54
Galileo Galilei (1564–1642)
Probabilit´es et Statistique pour SIC slide 55
Il Saggiatore, 1623
Probabilit´es et Statistique pour SIC slide 56
Il Saggiatore, 1623
La filosofia `e scritta in questo grandissimo libro che continuamente ci sta aperto innanzi a gli occhi (io dico l’universo), ma non si pu`o intendere se prima non s’impara a intender la lingua, e conoscer i caratteri, ne’ quali `e scritto. Egli `e scritto in lingua matematica, e i caratteri son triangoli, cerchi, ed altre figure geometriche, senza i quali mezi `e impossibile a intenderne umanamente parola ; senza questi `e un aggirarsi vanamente per un oscuro laberinto.
La philosophie est ´ecrite dans ce vaste livre constamment ouvert devant nos yeux (je veux dire l’univers), et on ne peut le comprendre si d’abord on n’apprend `a connaˆıtre la langue et les caract`eres dans lesquels il est ´ecrit. Or il est ´ecrit en langue math´ematique, et ses caract`eres son le triangle et le cercle et autres figures g´eom´etriques, sans lesquels il est humainement impossible d’en comprendre un mot, sans lesquels on erre vainement dans un labyrinthe obscur.
Probabilit´es et Statistique pour SIC slide 57
Probl`eme de trois d´es
Trois d´es ´equilibr´es sont lanc´es. Soient Ti l’´ev´enement ‘le total esti’, pouri= 3, . . . ,18. Quel est le plus probable,T9 ou T10?
T9 peut se produire si les d´es ont les r´esultats suivants
9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3.
T10peut se produire si les d´es ont les r´esultats suivants
10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3.
Ainsi ils sont ´equiprobables.
Vrai ou faux ?
Probabilit´es et Statistique pour SIC slide 58
Loi de probabilit´e Pr
D´efinition 36. Uneloi de probabilit´e Prassocie une probabilit´e `a chaque ´el´ement de l’espace des
´ev´enements F, avec les propri´et´es suivantes : (P1) si A∈ F, alors 0≤Pr(A)≤1; (P2) Pr(Ω) = 1;
(P3) si {Ai}∞i=1 sont disjoints deux `a deux (c’est `a dire que, Ai∩Aj =∅,i6=j), alors Pr
[∞
i=1
Ai
!
= X∞
i=1
Pr(Ai).
Propri´et´es de Pr
Th´eor`eme 37. Soient A, B,{Ai}∞i=1 des ´ev´enements de l’espace de probabilit´e (Ω,F,Pr). Alors (a)Pr(∅) = 0;
(b) Pr(Ac) = 1−Pr(A);
(c) Pr(A∪B) = Pr(A) + Pr(B)−Pr(A∩B). SiA∩B=∅, alors Pr(A∪B) = Pr(A) + Pr(B); (d) si A⊂B, alors Pr(A)≤Pr(B), etPr(B \A) = Pr(B)−Pr(A);
(e) Pr (S∞
i=1Ai)≤P∞
i=1Pr(Ai) (in´egalit´e de Boole) ; (f) si A1⊂A2⊂ · · ·, alorslimn→∞Pr(An) = Pr (S∞
i=1Ai); (g) si A1⊃A2 ⊃ · · ·, alorslimn→∞Pr(An) = Pr (T∞
i=1Ai).
Probabilit´es et Statistique pour SIC slide 60
Continuit´e de Pr
Rappel : Une fonctionf est continue en x si pour toute suite{xn} telle que
n→∞lim xn=x, on a lim
n→∞f(xn) =f(x).
Les parties (f) et (g) du Th´eor`eme 37 peuvent ˆetre ´etendues pour montrer que pour toutes suites d’ensembles pour lesquelles
n→∞lim An=A, on a lim
n→∞Pr(An) = Pr(A).
C’est pourquoiPr est appel´eefonction d’ensembles continue.
Probabilit´es et Statistique pour SIC slide 61
Formules d’inclusion-exclusion
SiA1, . . . , An sont des ´ev´enements de(Ω,F, P), alors
Pr(A1∪A2) = Pr(A1) + Pr(A2)−Pr(A1∩A2) Pr(A1∪A2∪A3) = Pr(A1) + Pr(A2) + Pr(A3)
−Pr(A1∩A2)−Pr(A1∩A3)−Pr(A2∩A3) +Pr(A1∩A2∩A3)
... P
[n
i=1
Ai
!
= Xn
r=1
(−1)r+1 X
1≤i1<···<ir≤n
Pr(Ai1 ∩ · · · ∩Air).
Le nombre de termes dans la formule g´en´erale est n
1
+ n
2
+ n
3
+· · ·+ n
n−1
+ n
n
= 2n−1.
Probabilit´es et Statistique pour SIC slide 62
Exemple 38. Quelle est la probabilit´e d’obtenir au moins un 6 quand je lance 3 d´es ´equilibr´es ? Exemple 39. Une urne contient 1000 tickets de loterie num´erot´es de 1 `a 1000. On tire un ticket au hasard. Auparavant un artiste de foire a offert de payer $3 `a quiconque qui lui donne $2, si le num´ero du ticket est divisible par 2, 3, ou 5. Est ce que vous lui donneriez vos $2 avant le tirage ? (Vous perdez votre argent si le ticket n’est pas divisible par 2, 3, ou 5.)
Probabilit´es et Statistique pour SIC slide 63
2.2 Probabilit´ e Conditionnelle slide 64
Probabilit´e conditionnelle
D´efinition 40. SoientA, B des ´ev´enements de l’espace de probabilit´e(Ω,F,Pr), tel quePr(B)>0.
Alors laprobabilit´e conditionnelle de A sachant B est Pr(A|B) = Pr(A∩B)
Pr(B) .
SiPr(B) = 0, on adopte la convention Pr(A∩B) = Pr(A|B)Pr(B), des deux cˆot´es on a la valeur z´ero. Ainsi
Pr(A) = Pr(A∩B) + Pr(A∩Bc) = Pr(A|B)Pr(B) + Pr(A|Bc)Pr(Bc) mˆeme si Pr(B) = 0 ouPr(Bc) = 0.
Exemple 41. On lance deux d´es ´equilibr´es, un rouge et un vert. Soient A et B les ´ev´enements ‘le total exc`ede 8’, et ‘on a6 sur le d´e rouge’. Si on sait queB s’est produit, comment change Pr(A)?
Probabilit´es et Statistique pour SIC slide 65
Lois de probabilit´e conditionnelle
Th´eor`eme 42. Soit (Ω,F,Pr) un espace de probabilit´e, et soientB ∈ F tel que Pr(B)>0 et Q(A) = Pr(A|B). Alors (Ω,F, Q) est un espace de probabilit´e. En particulier,
1. si A∈ F, alors0≤Q(A)≤1; 2. Q(Ω) = 1;
3. si {Ai}∞i=1 sont disjoints 2 `a 2, alors
Q [∞
i=1
Ai
!
= X∞
j=1
Q(Ai).
Thomas Bayes (1702–1761)
Essay towards solving a problem in the doctrine of chances. (1763/4) Philosophical Transactions of the Royal Society of London.
Probabilit´es et Statistique pour SIC slide 67
Th´eor`eme de Bayes
Th´eor`eme 43 (Loi des probabilit´es totales). Soient{Bi}∞i=1 des ´ev´enements disjoints 2 `a 2 (i.e.
Bi∩Bj =∅,i6=j) de l’espace de probabilit´e(Ω,F,Pr), et soit Aun ´ev´enement satisfaisant A⊂S∞
i=1Bi. Alors
Pr(A) = X∞
i=1
Pr(A∩Bi) = X∞
i=1
Pr(A|Bi)Pr(Bi).
Th´eor`eme 44 (Bayes). Supposons que les conditions ci-dessus soient v´erifi´ees, et que Pr(A)>0.
Alors
Pr(Bj |A) = Pr(A|Bj)Pr(Bj) P∞
i=1Pr(A|Bi)Pr(Bi), j∈N.
Ces r´esultats sont aussi vrais si l’ensemble desBi est finie, et si les Bi partitionent Ω.
Probabilit´es et Statistique pour SIC slide 68
Exemples
Exemple 45. Des voitures sont fabriqu´ees dans les villes de Farad, Gilbert et Henry. Sur 1000 voitures produites `a Farad, 20% sont d´efectueuses, sur 2000 produites `a Gilbert, 10% sont d´efectueuses, et sur 3000 produites `a Henry, 5% sont d´efectueuses. Vous achetez une voiture. Si Dest l’´ev´enement ‘la voiture est d´efectueuse’, calculer (a) Pr(F |Hc), (b)Pr(D|Hc), (c) Pr(D), etPr(F |D). Supposez que vous avez les mˆemes chances d’acheter une des 6000 voitures produites.
Probabilit´es et Statistique pour SIC slide 69
Conditionnement multiple
Th´eor`eme 46 (‘Prediction decomposition’). SoientA1, . . . , An des ´ev´enements d’un espace de probabilit´e. Alors
Pr(A1∩A2) = Pr(A2 |A1)Pr(A1)
Pr(A1∩A2∩A3) = Pr(A3 |A1∩A2)Pr(A2 |A1)Pr(A1) ...
Pr(A1∩ · · · ∩An) = Yn
i=2
Pr(Ai|A1∩ · · · ∩Ai−1)×Pr(A1)
Probabilit´es et Statistique pour SIC slide 70
Exemples
Exemple 47. On lance 2 d´es ´equilibr´es. D´efinir les ´ev´enements A, B, C qui sont ‘le total est au plus 6’, ‘le total est impair’, et ‘on obtient 4 pour le premier d´e ’. (a) Comment la connaissance queB ou C soit r´ealis´e, affecte la probabilit´e de A? (b) CalculerPr(A∩B∩C).
Exemple 48. nhommes vont `a un diner. Chacun laisse son chapeau au vestiaire. Lorsqu’ils repartent, ayant bien ´echantillion´e du vin r´egional, ils choisissent leurs chapeaux de fa¸con al´eatoire.
(a) Quelle est la probabilit´e que personne n’ait son chapeau ?
(b) Quelle est la probabilit´e qu’exactement r hommes choisissent leur propre chapeau ? (c) Que se passe-t-il lorsque nest tr`es grand ?
Probabilit´es et Statistique pour SIC slide 71
2.3 Ind´ ependance slide 72
Ev´enements ind´ependants
Intuitivement, dire que ‘A et B sont ind´ependants’ signifie que la r´ealisation d’un des deux n’affecte pas la r´ealisation de l’autre. C’est `a dire que, Pr(A|B) = Pr(A), donc la connaissance de la r´ealisation de B laissePr(A)inchang´ee.
Exemple 49. Une famille a deux enfants.
(a) On sait que le premier est un gar¸con. Quelle est la probabilit´e que le second soit un gar¸con ? (b) On sait qu’un des deux est un gar¸con. Quelle est la probabilit´e que l’autre soit un gar¸con ?
Probabilit´es et Statistique pour SIC slide 73
Ind´ependance
D´efinition 50. Soit(Ω,F,Pr) un espace de probabilit´e. Deux ´ev´enementsA, B ∈ F sont ind´ependants(que l’on note A⊥⊥B) ssi
Pr(A∩B) = Pr(A)Pr(B).
Conform´ement `a notre intuition, cela implique que Pr(A|B) = Pr(A∩B)
Pr(B) = Pr(A)Pr(B)
Pr(B) = Pr(A), et par sym´etrie Pr(B|A) = Pr(B).
Exemple 51. Un jeu de cartes est bien battu et une carte est tir´ee au hasard. Est ce que les
´ev´enements A ‘la carte est un as’, et C ‘la carte est un coeur’ sont ind´ependants ? Que peut on dire `a propos des ´ev´enements A et R ‘la carte est un roi’ ?
Probabilit´es et Statistique pour SIC slide 74
Types d’ind´ependances
D´efinition 52. (a) Les ´ev´enements A1, . . . , An sont(mutuellement) ind´ependants si pour tout ensemble d’indicesF ⊂ {1, . . . , n}, on a
Pr \
i∈F
Ai
!
=Y
i∈F
Pr(Ai).
(b) Les ´ev´enements A1, . . . , An sontind´ependants 2 `a 2 si
Pr(Ai∩Aj) = Pr(Ai) Pr(Aj), 1≤i < j ≤n.
(c) Les ´ev´enements A1, . . . , An sont conditionnellement ind´ependants sachant B si pour tout ensemble d’indicesF ⊂ {1, . . . , n} on a
Pr \
i∈F
Ai |B
!
=Y
i∈F
Pr(Ai|B).
Probabilit´es et Statistique pour SIC slide 75
Quelques remarques
– L’ind´ependance est un id´ee cl´e qui simplifie consid´erablement des calculs de probabilit´e. En pratique, il est essentiel de v´erifier si les ´ev´enements sont ind´ependants, ´etant donn´e qu’une d´ependance non d´etect´ee peut modifier grandement le calcul des probabilit´es.
– L’ind´ependance mutuelle entraˆıne l’ind´ependance deux `a deux, mais l’inverse est vrai seulement quandn= 2.
– L’ind´ependance mutuelle entraˆıne l’ind´ependance conditionnelle, mais l’inverse est vrai seulement si B = Ω.
Exemple 53. Une famille a deux enfants. Montrer que les ´ev´enements ‘le premier enfant est un gar¸con’, ‘le second enfant est un gar¸con’, et ‘il y a exactement un gar¸con’ sont ind´ependants deux `a deux mais pas mutuellement.
Probabilit´es et Statistique pour SIC slide 76
Exemple 54. Une ann´ee donn´ee, la probabilit´e qu’un conducteur fasse une d´eclaration de sinistre `a son assurance estµ, ind´ependamment des autres ann´ees. La probabilit´e pour une conductrice est de λ < µ. Un assureur a le mˆeme nombre de conducteurs que de conductrices, et en s´electionne un(e) au hasard.
(a) Donner la probabilit´e qu’il (elle) d´eclare un sinistre cette ann´ee ?
(b) Donner la probabilit´e qu’il (elle) d´eclare des sinistres durant 2 ann´ees cons´ecutives ? (c) Si la compagnie s´electionne une personne ayant fait une d´eclaration au hasard, donner la probabilit´e qu’elle fasse une d´eclaration l’ann´ee suivante ?
(d) Montrer que la connaissance qu’une d´eclaration de sinistre ait ´et´e faite une ann´ee augmente la probabilit´e d’une d´eclaration l’ann´ee suivante.
Probabilit´es et Statistique pour SIC slide 77
Syst`emes en s´eries et parall`eles
Un syst`eme ´electrique a des composants 1, . . . , n, qui tombent en panne ind´ependamment. SoientAi l’´ev´enement ‘lei`eme composant est d´efaillant’, avecPr(Ai) =pi. L’´ev´enement B, ‘la d´efaillance du syst`eme’ se produit si le courant ne peut pas passer d’un bout du syst`eme `a l’autre. Si les composants sont arrang´es en parall`ele, alors
PrP(B) = Pr(A1∩ · · · ∩An) = Yn
i=1
pi.
Si les composants sont arrang´es en s´erie, alors
PrS(B) = Pr(A1∪ · · · ∪An) = 1− Yn
i=1
(1−pi).
Fiabilit´e
Exemple 55 (Chernobyl). Une centrale nucl´eaire d´epend d’un syst`eme de s´ecurit´e dont les composants sont arrang´es suivant la figure (tableau noir). Les composants tombent en panne
ind´ependamment avec la probabilit´ep, et le syst`eme devient d´efaillant si le courant ´electrique ne peut pas passer de A `a B.
(a) Quelle est la probabilit´e que le syst`eme devienne d´efaillant ?
(b) Les composants sont fabriqu´es par lots, qui peuvent ˆetre bons ou mauvais. Pour un bon lot, p= 10−6, tandis que pour un lot mauvais p= 10−2. La probabilit´e qu’un lot soit bon est 0.99. Quelle est la probabilit´e que le syst`eme soit d´efaillant (i) si les composants proviennent de diff´erents lots ? (ii) si tous les composants proviennent du mˆeme lot ?
Probabilit´es et Statistique pour SIC slide 79
2.4 Exemples Edifiants slide 80
Les dames et la mort
Probabilit´es et Statistique pour SIC slide 81
Les fumeuses et la mort
Survie apr`es 20 ans pour 1314 femmes dans la ville de Whickham, Angleterre (Appleton et al., 1996, The American Statistician). Les colonnes contiennent : nombre de mortes apr`es 20 ans/nombre de vivantes au debut de l’´etude (%).
Age (ann´ees) Fumeuses Non-fumeuses Total 139/582 (24) 230/732 (31)
18–24 2/55 (4) 1/62 (2)
25–34 3/124 (2) 5/157 (3)
35–44 14/109 (13) 7/121 (6)
45–54 27/130 (21) 12/78 (15) 55–64 51/115 (44) 40/121 (33) 65–74 29/36 (81) 101/129 (78)
75+ 13/13 (100) 64/64 (100)
Selon les totaux, il y a un effet b´en´efique d’avoir fum´e : 24%<31%!
Probabilit´es et Statistique pour SIC slide 82
Paradoxe de Simpson
Definission les ´ev´enements ‘morte apr`es 20 ans’, M, ‘fumeuse’, F, et ‘dans la cat´egorie d’ˆage aau debut’,A=a. Alors pour (presque) chaqueaon a
Pr(M |F, A=a)>Pr(M |Fc, A=a), mais
Pr(M |F)<Pr(M |Fc).
Notons que
Pr(M |F) = X
a
Pr(M |F, A=a)Pr(A=a), Pr(M |Fc) = X
a
Pr(M |Fc, A=a)Pr(A=a),
donc si les probabilit´es Pr(M |F, A=a) etPr(M |Fc, A =a)varient beaucoup avec a, les pond´erer par les Pr(A=a) peut renverser l’ordre des l’in´egalit´es.
C’est un exemple du paradox de Simpson: ‘oublier’ un conditionnement peut changer la conclusion d’une ´etude.
Probabilit´es et Statistique pour SIC slide 83
La triste histoire de Sally Clark
Une avocate anglaise, dont le premier fils est d´ec´ed´e quelques semaines apr`es sa naissance en 1996.
Suite `a la mort de son deuxi`eme fils de la mˆeme mani`ere, elle fut arrˆet´ee en 1998 et accus´ee pour un double meurtre. Son inculpation ´etait controvers´ee car un p´ediatre tr`es distingu´e, Professor Sir Roy Meadow, a temoign´e que la probabilit´e que, dans une famille comme celle de Sally Clark, deux enfants meurent `a cause du Sudden Infant Death Syndrome (SIDS)´etait 1 sur 73 million, chiffre qu’il a obtenu comme1/85002, o`u 1/8500 ´etait la probabilit´e estim´ee d’une seule mort `a cause du SIDS.
Elle fut condamn´ee en novembre 1999, puis lib´er´ee en janvier 2003, parce que certain preuves pathologiques tendant `a la blanchir n’ont pas ´et´e divulgu´ees `a son avocat. Suite `a son cas, le
Procureur-en-Chef a demand´e que des centaines d’autres cas soient revus, et encore deux femmes ont
´et´e lib´er´ees de prison.
Elle est d´ec´ed´ee d’alcoolisme en mars 2007.
Probabilit´es et Statistique pour SIC slide 84
Les taux de SIDS
Donn´ees sur les taux de mortalit´e enfantile, (rapport CESMA SUDI,
http://cemach.interface-test.com/Publications/CESDI-SUDI-Report-(1).aspx)
Probabilit´es et Statistique pour SIC slide 85
Sally Clark : Quatres erreurs tragiques – Probabilit´es estim´ees
– ‘Ecological fallacy’
– Ind´ependance ? Vraiment ? – ‘Prosecutors’ fallacy’
Probabilit´es et Statistique pour SIC slide 86
3 Variables Al´ eatoires slide 87
Petit Vocabulaire Probabiliste
Mathematics English Fran¸cais
one fair die (several fair dice) un d´e juste/´equilibr´e (plusieurs d´es justes/´equilibr´es)
random experiment une exp´erience al´eatoire
Ω sample space l’ensemble fondamental
ω outcome, elementary event une ´epreuve, un ´ev´enement ´el´ementaire
A, B, . . . event un ´ev´enement
F event space l’espace des ´ev´enements
sigma-algebra une tribu
Pr probability distribution/probability function une loi de probabilit´e
(Ω,F,Pr) probability space un espace de probabilit´e
inclusion-exclusion formulae formule d’inclusion-exclusion Pr(A|B) probability ofA given B la probabilit´e de A sachantB
independence ind´ependance
(mutually) independent events les ´ev´enements (mutuellement) ind´ependants pairwise independent events les ´ev´enements ind´ependants deux `a deux conditionally independent events les ´ev´enements conditionellement ind´ependants X, Y, Z, W, . . . random variable/random variate une variable al´eatoire
FX(x) (cumulative) distribution function une fonction de r´epartition
fX(x) (probability) density/mass function (PDF) une fonction de densit´e/masse (fm)
E(X) expectation/mean ofX l’esp´erance de X
var(X) variance ofX la variance de X
fX(x|B) conditional density/mass function une fonction de densit´e/masse conditionnelle
Probabilit´es et Statistique pour SIC slide 88
3.1 Id´ ees de Base slide 89
Variables al´eatoires
Souvent on consid`ere des quantit´es al´eatoires num´eriques.
Exemple 56. Deux d´es ´equilibr´es sont lanc´es, un rouge et un vert. Soit X le total des faces sup´erieures. Trouver les valeurs possibles deX, et les probabilit´es correspondantes.
D´efinition 57. Soit(Ω,F,Pr) un espace de probabilit´e. Unevariable al´eatoire (va)X: Ω7→Rest une application de l’ensemble fondamentalΩdans R.
D´efinition 58. L’ensemble des valeurs prises parX,
DX ={x∈R:∃ω ∈Ωtel queX(ω) =x}
s’appele le supportdeX. Si DX est d´enombrable, alorsX est une variable al´eatoire discr`ete.
La vaX associe des probabilit´es `a des sous-ensembles S inclus dans R, donn´ees par Pr(X∈S) = Pr({w∈Ω :X(w) ∈S}).
En particulier, on poseAx={ω∈Ω :X(ω) =x}. Il est `a noter qu’il faut que Ax∈ F, pour pouvoir calculer Pr(X =x). Si ce n’est pas le cas, on dit queX n’est pasmesurablepar rapport `a(Ω,F,Pr).
Probabilit´es et Statistique pour SIC slide 90
Exemples
Exemple 59. On jette une pi`ece plusieurs fois et ind´ependamment. Soit X la variable al´eatoire repr´esentant le nombre de lanc´es n´ecessaires jusqu’`a ce qu’on obtienne face. Calculer
Pr(X = 3), Pr(X = 15), Pr(X ≤3.5), Pr(X >1.7), Pr(1.7≤X≤3.5).
Exemple 60. Un ensemble Ωnaturel quand je joue aux fl´echettes est le mur sur lequel la cible est fix´ee. La fl´echette att´erit `a un point ω∈Ω⊂R2. Mon score X(ω)∈DX ={0,1, . . . ,60}.
Probabilit´es et Statistique pour SIC slide 91
Jacob Bernoulli (1654–1705)
Ars Conjectandi, Basel (1713)
Probabilit´es et Statistique pour SIC slide 92
Variable al´eatoire de Bernoulli
D´efinition 61. Une variable al´eatoire qui prend comme valeurs seulement 0 et 1 est appel´ee une variable indicatrice, ou unevariable al´eatoire de Bernoulli, ou unessai de Bernoulli.
Exemple 62. Supposons que npi`eces identiques sont lanc´ees ind´ependamment, soitFi l’´ev´enement
‘on obtient face pour la i`eme pi`ece’, et soit Ii=I(Fi) l’indicatrice de cet ´ev´enement. Alors Pr(Ii = 1) = Pr(Fi) =p, Pr(Ii = 0) = Pr(Fic) = 1−p,
o`u p est la probabilit´e d’obtenir face. Sin= 3 et X=I1+I2+I3, d´ecrire Ω,DX et les ensembles Ax. Que repr´esentent
X=I1+· · ·+In, Y =I1(1−I2)(1−I3), Z = Xn
j=2
Ij−1(1−Ij)?
Probabilit´es et Statistique pour SIC slide 93
Fonction de masse
Une variable al´eatoire X associe des probabilit´es `a des sous-ensembles deR. En particulier lorsque X est discr`ete, nous avonsAx={ω ∈Ω :X(ω) =x}, et nous pouvons d´efinir :
D´efinition 63. Lafonction de masse (fm)deX est
fX(x) = Pr(X =x) = Pr(Ax), x∈R.
Elle a deux propri´et´es cl´es :
(i) fX(x)≥0, et est positif seulement pourx∈DX, o`uDX est l’ensemble image de X, c’est `a dire le support defX;
(ii) la probabilit´e totaleP
{i:xi∈DX}fX(xi) = 1.
Quand il n’y a pas de risque de confusion, notonsfX ≡f et DX ≡D.
En anglais la fonction de masse est appel´eeprobability mass function (PMF)ouprobability density function (PDF).
Probabilit´es et Statistique pour SIC slide 94
Variable al´eatoire binomiale
Exemple 64. Donner les fm et supports de Ii, deY et de X.
D´efinition 65. Une variable al´eatoire binomialeX a une fm f(x) =
n x
px(1−p)n−x, x= 0,1, . . . , n, n∈N,0≤p≤1.
On noteX ∼ B(n, p), et appelle nle d´enominateuret pla probabilit´e de succ`es. Avecn= 1, c’est une variable de Bernoulli.
Remarque :on utilise ∼comme abr´eviation de ‘a pour distribution’.
Le mod`ele binomial est utilis´e quand on consid`ere le nombre de ‘succ`es’ d’une ´epreuve r´ep´et´ee de fa¸con ind´ependante un nombre fix´e de fois, et que chaque essai a la mˆeme probabilit´e de succ`es.
Probabilit´es et Statistique pour SIC slide 95
Fonctions de masse binomiale
0 2 4 6 8 10
0.000.150.30
B(10,0.5)
x
f(x)
0 2 4 6 8 10
0.000.150.30
B(10,0.3)
x
f(x)
0 5 10 15 20
0.000.150.30
B(20,0.1)
x
f(x)
0 10 20 30 40
0.000.150.30
B(40,0.9)
x
f(x)
Probabilit´es et Statistique pour SIC slide 96
Exemples
Exemple 66. Un test contient 20 questions, pour chacune d’elles il faut choisir la bonne r´eponse parmi 5 r´eponses possibles. La moyenne est obtenue avec 10 r´eponses justes. Un ´etudiant choisit ses r´eponses au hasard. Donner la loi de son nombre de r´eponses justes. Quelle est la probabilit´e qu’il r´eussisse le test ?
Probabilit´es et Statistique pour SIC slide 97
Loi g´eom´etrique
D´efinition 67. Une variable al´eatoire g´eom´etrique X a pour fm
fX(x) =p(1−p)x−1, x= 1,2, . . . , 0≤p≤1.
On noteX ∼ Geom(p), et on appellep laprobabilit´e de succ`es.
Elle mod´elise le temps d’attente jusqu’`a un premier ´ev´enement, dans une s´erie d’essais ind´ependants ayant la mˆeme probabilit´e de succ`es.
Exemple 68. Pour commencer un jeu de soci´et´e, des joueurs jettent un d´e chacun `a leur tour. Le premier qui obtient six commence. Donner les probabilit´es que le3`eme joueur commence, et d’attendre au moins 6 lanc´es de d´e avant le d´ebut du jeu.
Th´eor`eme 69 (Manque de m´emoire). SiX ∼ Geom(p), alors Pr(X > n+m|X > m) = Pr(X > n).
Probabilit´es et Statistique pour SIC slide 98
FMs g´eom´etrique et binomiale n´egative
0 10 20 30 40
0.00.20.4
Geom(0.5)
x + 1
f(x)
0 10 20 30 40
0.00.20.4
Geom(0.1)
x + 1
f(x)
0 10 20 30 40
0.000.100.20
NegBin(4,0.5)
x + 4
f(x)
0 10 20 30 40
0.000.100.20
NegBin(6,0.3)
x + 6
f(x)
Probabilit´es et Statistique pour SIC slide 99
Loi binomiale n´egative
D´efinition 70. Une variable al´eatoirebinomiale negative X de param`etres net pa pour fonction de masse
fX(x) =
x−1 n−1
pn(1−p)x−n, x=n, n+ 1, n+ 2, . . . , 0≤p≤1.
On noteX ∼ NegBin(n, p). Lorsquen= 1,X ∼ Geom(p).
Elle mod´elise le temps d’attente jusqu’au n`eme succ`es dans une s´erie d’essais ind´ependants ayant la mˆeme probabilit´e de succ`es.
Exemple 71. Deux joueurs lancent successivement une pi`ece. Quelle est la probabilit´e que 2 faces apparaissent avant 5 piles ?
Probabilit´es et Statistique pour SIC slide 100
Loi binomiale n´egative : version alternative
Parfois on ´ecrit les variables g´eom´etriques et binomiale negatives sous une forme plus g´en´erale, prenant Y =X−n, et alors la fonction de masse est
fY(y) = Γ(n+α)
Γ(α)y! pα(1−p)y, y= 0,1,2, . . . , 0≤p≤1, α >0, o`u
Γ(α) = Z ∞
0
uα−1e−udu, α >0 est lafonction Gamma. Ses propri´et´es principales sont :
Γ(1) = 1;
Γ(α+ 1) = αΓ(α), α >0;
Γ(n) = (n−1)!, n= 1,2,3, . . .; Γ(12) = √
π.
Probabilit´es et Statistique pour SIC slide 101
Distribution hyperg´eom´etrique
D´efinition 72. On tire sans remise un ´echantillon de mboules d’une urne contenant bblanches et n noires. SoitX le nombre de boules blanches tir´ees. Alors
Pr(X =x) =
b x
n
m−x
b+n m
, x= max(0, m−n), . . . ,min(b, m), et la loi de X est hyperg´eom´etrique.
Exemple 73. J’ai six boˆıtes, dont 2 contiennent du fruit. Si je choisis 3 des 6 au hasard, trouver la loi du nombre de boˆıtes de fruit parmi les 3.
Probabilit´es et Statistique pour SIC slide 102
Exemples
Exemple 74. Dans le but d’estimer le nombre de poissons N dans un lac, nous attrapons tout d’abord r poissons, les marquons, et les relˆachons. Apr`es avoir attendu assez longtemps pour que la population de poissons soit bien m´elang´ee, nous pr´elevons un autre ´echantillon de tailles, compos´e de 0≤m≤spoissons marqu´es. Trouver la loi du nombre de poissons marqu´es, M, dans cet ´echantillon.
Montrer que la valeur de N qui maximise Pr(M =m)est ⌊rs/m⌋, et calculer la meilleure estimation deN lorsques= 50, r= 40, et m= 4.
L’idee `a la base de cet exemple est utilis´ee pour estimer les tailles des populations des esp`eces en danger, le nombre de toxicomanes, de sans-papiers, etc., dans les populations humaines, etc. Un probl`eme pratique souvent rencontr´e est que certains individus deviennent plus difficile `a recapturer, alors que d’autres l’aiment ; ainsi les probabilit´es de reprise sont h´et´erog`enes.
Probabilit´es et Statistique pour SIC slide 103
Fonction de r´epartition
D´efinition 75. Lafonction de r´epartition (fr) d’une variable al´eatoireX est FX(x) = Pr(X≤x), x∈R.
SiX est discr`ete, on peut ´ecrire
FX(x) = X
{xi∈DX:xi≤x}
Pr(X =xi),
c’est une fonction en escalier avec des sauts aux points du support DX defX(x).
Quand il n’y a pas de risque de confusion, on note F ≡FX.
Exemple 76. Donner le support et les fonctions de masse et de r´epartition d’une variable al´eatoire de Bernoulli.
Exemple 77. Donner la fonction de r´epartition d’une variable al´eatoire g´eom´etrique.
Probabilit´es et Statistique pour SIC slide 104
Exemples
La d´efinition suivante g´en´eralise le r´esultat d’un jet de d´e.
D´efinition 78. Une variable al´eatoire discr`ete uniformeX a pour fm fX(x) = 1
b−a+ 1, x=a, a+ 1, . . . , b, a < b, a, b∈Z.
La loi de Poisson apparaˆıt partout dans la probabilit´e et les statistiques.
D´efinition 79. Une variable al´eatoire dePoisson X a pour fm fX(x) = λx
x!e−λ, x= 0,1, . . . , λ >0.
On noteX ∼ Pois(λ).
Probabilit´es et Statistique pour SIC slide 105
Sim´eon-Denis Poisson (1781–1840)
‘La vie n’est bonne qu’`a deux choses : `a faire des math´ematiques et `a les professer.’
Probabilit´es et Statistique pour SIC slide 106