• Aucun résultat trouvé

Probabilit´es et Statistique pour Informatique et Communications

N/A
N/A
Protected

Academic year: 2022

Partager "Probabilit´es et Statistique pour Informatique et Communications"

Copied!
145
0
0

Texte intégral

(1)

Probabilit´es et Statistique pour Informatique et Communications

cA. C. Davison, 2012

http://stat.epfl.ch

1 Introduction 2

1.1 Motivation 3

1.2 Pr´eliminaires 21

1.3 Combinatoire 29

2 Probabilit´e 39

2.1 Espaces de Probabilit´e 41

2.2 Probabilit´e Conditionnelle 64

2.3 Ind´ependance 72

2.4 Exemples Edifiants 80

3 Variables Al´eatoires 87

3.1 Id´ees de Base 89

3.2 Esp´erance 112

3.3 Lois Conditionnelles 120

3.4 Notions de Convergence 124

4 Variables Al´eatoires Continues 131

4.1 Notions de Base 132

4.2 Notions Suppl´ementaires 145

4.3 Loi Normale 152

4.4 Q-Q Plots 164

5. Plusieurs Variables Al´eatoires 170

(2)

5.1 Id´ees de Base 172

5.2 D´ependance 184

5.3 Fonctions G´en´eratrices 195

5.4 Loi Normale Multivari´ee 205

5.4 Transformations 214

5.6 Statistiques d’Ordre 221

6. Approximation et Convergence 224

6.1 In´egalit´es 226

6.2 Convergence 229

6.3 Lois des grands nombres 236

6.4 Th´eor`eme central limite 241

6.5 M´ethode delta 247

7 La Statistique 253

7.1 Introduction 254

7.2 Tests Statistiques 259

7.3 Estimation Ponctuelle 284

7.3 Estimation par Intervalle 297

8 Vraisemblance 309

8.1 Motivation 310

8.2 Param`etre scalaire 318

8.3 Param`etre vecteur 329

8.4 Mod´elisation statistique 334

9 Inf´erence Bayesienne 341

9.1 Id´ees de Bayes 342

9.2 Mod´elisation Bay´esienne 358

(3)

1 Introduction slide 2

1.1 Motivation slide 3

Motivation

Probabilit´es et statistiques fournissent des outils math´ematiques et des mod`eles pour l’´etude d’´ev`enements ‘al´eatoires’ :

– pr´evisions m´et´eorologiques, finance (Prix Nobel, 2003), . . .; – mod´elisation de r´eseaux ;

– algorithmes stochastiques ; – trafic internet ;

– erreurs dans le codage de signaux ; – traitement d’images ;

– . . .

Ils fournissent des m´ethodes optimales pour pr´evoir, ´eliminer le bruit, pour sugg´erer une mani`ere de traiter le trafic, et pour la reconstruction du vrai signal ou de l’image.

Probabilit´es et Statistique pour SIC slide 4

R´eseaux stochastiques

Graphe de Erd¨os–R´enyi (1960), avec p= 0.01. Les arcs entre chaque pair de sommets apparaissent avec la probabilit´es p, ind´ependamment des autres arcs. Dans ce cas, si p >(1 +ǫ) logn/n,ǫ >0, le graphe sera connect´e (presque sˆurement).

Probabilit´es et Statistique pour SIC slide 5

(4)

‘Giant component’

Graphe de Erd¨os–R´enyi (1960), avec n= 150,p= 0.01. Si quandn→ ∞ on anp→c >1, alors il y a (presque sˆurement) un sous-graphe connect´e contenant une fraction positive des sommets. Aucun autre composant contient plus que O(logn) des sommets.

Probabilit´es et Statistique pour SIC slide 6

R´eseaux stochastiques II

Chain network Nearest-neighbour network Scale-free network

Guo et al. (2011,Biometrika)

Probabilit´es et Statistique pour SIC slide 7

(5)

Mod´elisation des pages web comme r´eseaux

person

topic

gener interest

parallel

parallel support

instructor

Fig. 3. Common structure in the webpages data. Panel (a) shows the estimated common structure for the four cat- egories. The nodes represent 100 terms with the highest log-entropy weights. The area of the circle representing a node is proportional to its log-entropy weight. The width of an edge is proportional to the magnitude of the associated

partial correlation. Panels (b)–(d) show subgraphs extracted from the graph in panel (a).

Guo et al. (2011,Biometrika)

Probabilit´es et Statistique pour SIC slide 8

Algorithmes al´eatoires

Probabilit´es et Statistique pour SIC slide 9

(6)

Traitement de signal

0 200 400 600 800 1000

0204060

NMR data

y

Wavelet Decomposition Coefficients

Daub cmpct on ext. phase N=2 Translate

Resolution Level 987654321

0 128 256 384 512

Donn´ees et coefficients d’une transformation orthogonale

Probabilit´es et Statistique pour SIC slide 10

Traitement de signal

Original coefficients

Daub cmpct on ext. phase N=2 Translate

Resolution Level 987654321

0 128 256 384 512

Shrunken coefficients

Daub cmpct on ext. phase N=2 Translate

Resolution Level 987654321

0 128 256 384 512

Coefficients originaux et ‘thresholded’

Probabilit´es et Statistique pour SIC slide 11

(7)

Traitement de signal

0 200 400 600 800 1000

−200204060

NMR data

y

0 200 400 600 800 1000

−200204060

Bayesian posterior median

wr(w)

Donn´ees et signal r´econstruit par une m´ethode statistique

Probabilit´es et Statistique pour SIC slide 12

Donn´ees video

Time

videoVBR

0 200 400 600 800 1000

50100150200250300350400

Amount of coded information (Variable Bit Rate) per frame for a certain video sequence. There were about 25 frames per second.

Probabilit´es et Statistique pour SIC slide 13

(8)

Trafic sur LAN

Time

ethernetTraffic

0 1000 2000 3000 4000

02000600010000

S´erie temporelle avec variation bizarre

Probabilit´es et Statistique pour SIC slide 14

S´eries temporelles

0e+006e+04

Number 060000

2010.0 2010.2 2010.4 2010.6 2010.8 2011.0

Value

Time

Nombre et valeur de transactions (unit´es arbitraires) chaque heure pour natels, 2010.

Probabilit´es et Statistique pour SIC slide 15

(9)

S´eries temporelles

020004000

Number 020005000

2010.0 2010.2 2010.4 2010.6 2010.8 2011.0

Value

Time

Nombre et valeur de transactions (unit´es arbitraires) chaque heure pour natels, 2010.

Probabilit´es et Statistique pour SIC slide 16

Evaluation de performance

Jean-Yves Le Boudec (2010)

Probabilit´es et Statistique pour SIC slide 17

(10)

Motivation pratique

Beaucoup des cours ult´erieurs se basent sur la probabilit´e et la statistique : – Traitement du signal statistique et applications (Vetterli) ;

– Automatic speech processing (Bourlard) ; – Biomedical signal processing (Vesin) ;

– Stochastic models in communication (Le Boudec/Thiran) ; – Signal processing for communications (Urbanke) ;

– Pattern classification and machine learning (Gerstner/Seeger) – Models and methods for random networks (Grossglauser/Thiran) – Performance evaluation (Le Boudec)

– Statistical signal processing and applications (Jovanovic/Ridolfi) – Information theory and coding (Urbanke)

– . . .

Probabilit´es et Statistique pour SIC slide 18

Organisation

– Enseignant :Professor A. C. Davison

– Assistants :Juliette Blanchet, Mine Alsan, Stefan Bucur, Mohammadjavad Faraji, Marc Vuffray – Cours :Lundi 14.15–16.00, CE6 ; Mardi, 13.15–15.00, CE4

– Exercices :Lundi 16.15–18.00, CE6.

– Test :16 avril, 16.15–18.00, sans aucune mati`ere ´ecrite (calculatrice simple authoris´ee)

– Bonus :pour quizzes de 15 minutes les 5 et 19 mars, le 2 avril, et les 7 et 21 mai, sans aucune mati`ere ´ecrite (calculatrice simple authoris´ee)

– TP :avec logicielR(http://stat.ethz.ch/CRAN/), 2 avril, 14 mai

– Page webavec notes de cours, exercices (y compris Random Exercise Generator), probl`emes, etc. :

http://stat.epfl.ch/page-76545.html

Probabilit´es et Statistique pour SIC slide 19

Mat´eriel de cours

Livres : Les probabilit´es constituent `a peu pr`es les deux premiers tiers du cours, et un bon livre est : – Ross, S. M. (1999) Initiation aux Probabilit´es. PPUR : Lausanne.

– Il y a beaucoup d’autres excellents livres d’introduction : regarder au Learning Centre.

Les r´ef´erences en statistiques seront donn´ees ult´erieurement.

Probabilit´es et Statistique pour SIC slide 20

(11)

1.2 Id´ ees pr´ eliminaires slide 21

Les ensembles

D´efinition 1. Unensemble A est une collection d’objets, x1, . . . , xn, . . . : A={x1, . . . , xn, . . .}.

On ´ecritx∈Apour dire que ‘xest un ´el´ement de A’, ou ‘xappartient `aA’. La collection de tous les objets possibles dans un contexte donn´e est appel´el’univers Ω.

Exemples :

CH = {Gen`eve,Vaud, . . . ,Grisons} ensemble des cantons suisses {0,1} = ensemble fini constitu´e des ´el´ements 0 et 1

N = {1,2, . . .}, nombres entiers positifs, ensemble d´enombrable Z = {. . . ,−1,0,1,2, . . .}, nombres entiers, ensemble d´enombrable R = nombres r´eels, ensemble non d´enombrable

∅ = { } ensemble vide, n’a pas d’´el´ement

Probabilit´es et Statistique pour SIC slide 22

Sous-ensembles

D´efinition 2. Un ensembleA est unsous-ensemble d’un ensemble B six∈A entraine quex∈B : on noteA⊂B.

– SiA⊂B etB ⊂A, alors chaque ´el´ement de A est contenu dansB et vice versa, ainsiA=B : les deux ensembles contiennent pr´ecis´ement les mˆemes ´el´ements.

– Remarquer que∅ ⊂A pour tout ensemble A. Ainsi,

∅ ⊂ {1,2,3} ⊂N⊂Z⊂Q⊂R⊂C, ∅ ⊂I⊂C

– Les diagrammes de Vennsont utiles pour saisir des relations ´el´ementaires existant entre les ensembles, mais ils peuvent ˆetre trompeurs (toutes les relations ne peuvent ˆetre repr´esent´ees).

Probabilit´es et Statistique pour SIC slide 23

Cardinal d’un ensemble

D´efinition 3. Un ensemble fini Aa un nombre fini d’´el´ements, et ce nombre est appel´e son cardinal: cardA, #A, |A|.

– Evidemment |∅|= 0 et |{0,1}|= 2

– Exercise : Montrer que siAet B sont finis et A⊂B, alors |A| ≤ |B|.

Probabilit´es et Statistique pour SIC slide 24

(12)

Op´erations Bool´eennes

D´efinition 4. SoientA, B⊂Ω. Alors on peut d´efinir : – l’unionet l’intersection deAet B, soit

A∪B={x∈Ω :x∈A oux∈B}, A∩B ={x∈Ω :x∈A etx∈B}; – lecompl´ementairedeA dans Ωest Ac ={x∈Ω :x6∈A}.

Evidemment A∩B ⊂A∪B, et si les ensembles sont finis, alors

|A|+|B|=|A∩B|+|A∪B|, |A|+|Ac|=|Ω|. On peut aussi d´efinir ladiff´erence entre A et B, soit

A \ B=A∩Bc={x∈Ω :x∈A etx6∈B}, (noter que A \B 6=B \ A), et la diff´erence sym´etrique

A △B = (A \ B)∪(B \A).

Probabilit´es et Statistique pour SIC slide 25

Op´erations Bool´eennes

Si{Aj}j=1 est un ensemble infini de sous-ensembles deΩ, alors [

j=1

Aj = A1∪A2∪ · · ·: tout x∈Ωs’il appartient au moins `a un Aj

\

j=1

Aj = A1∩A2∩ · · ·: tout x∈Ωs’il appartient `achaque Aj Ce qui suit est facile `a montrer (diagramme de Venn) :

– (Ac)c =A, (A∪B)c=Ac∩Bc, (A∩B)c=Ac∪Bc;

– A∩(B∪C) = (A∩B)∪(A∩C),A∪(B∩C) = (A∪B)∩(A∪C); – (S

j=1Aj)c =T

j=1Acj, (T

j=1Aj)c =S j=1Acj.

Probabilit´es et Statistique pour SIC slide 26

(13)

Partition

D´efinition 5. Unepartition deΩest une collection de sous-ensembles non videsA1, . . . , An de Ω tels que

1. lesAj sontexhaustifs, c’est `a dire que A1∪ · · · ∪An= Ω, et 2. lesAj sontdisjoints, c’est `a dire que Ai∩Aj =∅, pour i6=j.

Une partition peut aussi ˆetre compos´ee d’un nombre infini d’ensembles {Aj}j=1.

Exemple 6. SoientAj = [j, j+ 1), pourj=. . . ,−1,0,1, . . .. Est ce que les Aj forment une partition deΩ =R?

Exemple 7. Soient Aj l’ensemble des entiers divisibles par j, pour j= 1,2, . . .. Est ce que lesAj forment une partition deΩ =N?

Probabilit´es et Statistique pour SIC slide 27

Produit Cart´esien

D´efinition 8. Leproduit Cart´esien de deux ensemblesA, B est l’ensemble des pairesordonn´ees A×B ={(a, b) :a∈A, b∈B}.

De mˆeme

A1× · · · ×An={(a1, . . . , an) :a1∈A1, . . . , an∈An}. SiA1=· · ·=An=A, alors on ´ecrit A1× · · · ×An=An.

Comme les paires sont ordonn´ees, A×B 6=B×A`a moins que A=B.

SiA1, . . . , An sont tous finis, alors

|A1× · · · ×An|=|A1| × · · · × |An|. Exemple 9. Soit A={a, b}, B={1,2,3}. D´ecrireA×B.

Probabilit´es et Statistique pour SIC slide 28

(14)

1.3 Combinatoire slide 29

Combinatoire : Rappels

C’est les math´ematiques du d´enombrement. Deux principes de base :

– multiplication : si j’aim chapeaux et n´echarpes, il y am×n diff´erentes fa¸cons de les combiner ensemble ;

– addition :si j’ai m chapeaux rouges etnchapeaux bleux, alors j’ai m+n chapeaux au total.

En termes math´ematiques, soientA1, . . . , Ak des ensembles, alors

|A1× · · · ×Ak|=|A1| × · · · × |Ak|, (multiplication), et si lesAj sont disjoints, alors

|A1∪ · · · ∪Ak|=|A1|+· · ·+|Ak|, (addition).

Probabilit´es et Statistique pour SIC slide 30

Permutations : S´election ordonn´ee

D´efinition 10. Unepermutationden objets distincts est un ensemble ordonn´e de ces objets.

Th´eor`eme 11. Etant donn´enobjets distincts, le nombre de permutations diff´erentes (sans r´ep´etition) de longueur r≤nest

n(n−1) (n−2) · · · (n−r+ 1) = n!

(n−r)!. Ainsi il y an!permutations de longueur n.

Th´eor`eme 12. Etant donn´en=Pr

i=1ni objets de r types diff´erents, o`u ni est le nombre d’objets de type iindiff´erentiables entre eux, le nombre de permutations (sans r´ep´etition) des nobjets est

n!

n1!n2! · · · nr!.

Probabilit´es et Statistique pour SIC slide 31

Exemple

Exemple 13. Une classe de 20 ´etudiants ´elisent un comit´e de taille 4 pour organiser un voyage d’´etude. De combien de mani`eres diff´erentes peuvent-ils choisir le comit´e si :

(a) il y a 4 rˆoles distincts (pr´esident, secr´etaire, tr´esorier, agent de voyage) ? (b) il y a un pr´esident, un tr´esorier, et deux agents de voyage ?

(c) il y a deux tr´esoriers et deux agents de voyage ? (d) leurs rˆoles sont indiff´erentiables ?

(15)

Coefficients multinomial et binomial

D´efinition 14. Soientn1, . . . , nr des entiers compris entre 0,1, . . . , n, ayant pour total n1+· · ·+nr=n. Alors

n n1, n2, . . . , nr

= n!

n1!n2! · · · nr!, est appel´ecoefficient multinomial. Le cas r= 2 est le plus courant :

n k

= n!

k!(n−k)!

=Cnk dans certains livres

est appel´ecoefficient binomial.

Probabilit´es et Statistique pour SIC slide 33

Combinations : S´election non ordonn´ee

Th´eor`eme 15. Le nombre de mani`eres de choisir un ensemble de r objets issus d’un ensemble den objets distinct sans r´ep´etition est

n!

r!(n−r)! = n

r

.

Th´eor`eme 16. Le nombre de mani`eres de r´epartir nobjets distincts en r groupes distincts de taille n1, . . . , nr, o`u n1+· · ·+nr=nest

n!

n1!n2! · · · nr!.

Probabilit´es et Statistique pour SIC slide 34

Propri´et´es des coefficients binomiaux

Th´eor`eme 17. Soient n, m∈ {1,2,3. . .} et r∈ {0, . . . , n}, alors : n

r

= n

n−r

; n+ 1

r

= n

r−1

+ n

r

, (triangle de Pascal); Xr

j=0

m j

n r−j

=

m+n r

, (formule de Vandermonde);

(a+b)n = Xn

r=0

n r

arbn−r, (formule du binˆome de Newton);

(1−x)−n = X

j=0

n+j−1 j

xj, |x|<1, (s´eries binomiales n´egatives).

Probabilit´es et Statistique pour SIC slide 35

(16)

Partitions d’entiers

Th´eor`eme 18. (a) Le nombre de vecteurs distincts (n1, . . . , nr) d’entiers positifs, n1, . . . , nr>0, satisfaisantn1+· · ·+nr=nest

n−1 r−1

.

(b) Le nombre de vecteurs distincts(n1, . . . , nr)d’entiers non-n´egatifs, n1, . . . , nr≥0, satisfaisant n1+· · ·+nr=n est n+r−1

n

.

Exemple 19. De combien de mani`eres diff´erentes peut on mettre 6 balles identiques dans 3 boˆıtes, de fa¸con `a ce que chaque boˆıtes contienne au moins une balle ?

Exemple 20. De combien de mani`eres diff´erentes peut on mettre 6 balles identiques dans 3 boˆıtes ?

Probabilit´es et Statistique pour SIC slide 36

Rappel : S´erie g´eom´etrique

Th´eor`eme 21. (a) Une s´erie g´eom´etrique est de la formea, aθ, aθ2, . . .; on a Xn

i=0

i=

(a1−θ1−θn+1, θ6= 1, a(n+ 1), θ= 1.

Si|θ|<1, alors P

i=0θi = 1/(1−θ), et X

i=0

i!

(i−r)!θi−r= r!

(1−θ)r+1, r= 1,2, . . . .

Probabilit´es et Statistique pour SIC slide 37

(17)

Petit Vocabulaire

Mathematics English Fran¸cais

Ω, A, B . . . set un ensemble

A∪B union l’union

A∩B intersection l’intersection

Ac complement of A (inΩ) le compl´ementaire de A(en Ω)

A \ B difference la diff´erence

A ∆B symmetric difference la diff´erence sym´etrique A×B Cartesian product le produit cart´esien

|A| cardinality le cardinal

{Aj}nj=1 pairwise disjoint {Aj}nj=1 disjoint deux `a deux

partition une partition

permutation une permutation

combination une combinaison

n r

binomial coefficient un coefficient binomial (Cnr)

n n1,...,nr

multinomial coefficient un coefficient multinomial indistinguishable indiff´erentiable

colour-blind daltonien (ienne)

Probabilit´es et Statistique pour SIC slide 38

(18)

2 Probabilit´ e slide 39

Petit Vocabulaire Probabiliste

Mathematics English Fran¸cais

one fair die (several fair dice) un d´e juste/´equilibr´e (plusieurs d´es justes/´equilibr´es)

random experiment une exp´erience al´eatoire

Ω sample space l’ensemble fondamental

ω outcome, elementary event une ´epreuve, un ´ev´enement ´el´ementaire

A, B, . . . event un ´ev´enement

F event space l’espace des ´ev´enements

sigma-algebra une tribu

Pr probability distribution/probability function une loi de probabilit´e

(Ω,F,Pr) probability space un espace de probabilit´e

inclusion-exclusion formulae formule d’inclusion-exclusion Pr(A|B) probability ofA given B la probabilit´e deA sachantB

independence ind´ependance

(mutually) independent events les ´ev´enements (mutuellement) ind´ependants pairwise independent events les ´ev´enements ind´ependants deux `a deux conditionally independent events les ´ev´enements conditionellement ind´ependants

Probabilit´es et Statistique pour SIC slide 40

2.1 Espaces de Probabilit´ e slide 41

Les Joueurs de cartes

Paul C´ezanne, 1894–95, Mus´ee d’Orsay, Paris

Probabilit´es et Statistique pour SIC slide 42

Motivation : Jeu de d´e

Deux d´es ´equilibr´es sont lanc´es, un rouge et un vert.

– (a) Quel est l’ensemble des r´esultats possibles ? – (b) Quels r´esultats donnent un total de 6? – (c) Quels r´esultats donnent un total de 12 ? – (d) Quels r´esultats donnent un total impair ?

– (e) Quelles sont les probabilit´es des ´ev´enements (b), (c), (d) ?

Probabilit´es et Statistique pour SIC slide 43

(19)

Calcul de probabilit´es

– On peut essayer de calculer les probabilit´es d’´ev´enements tels que (b), (c), (d) en lan¸cant le d´e de nombreuses fois et en posant

probabilit´e d’un ´ev´enement= #de fois o`u l’´ev´enement se produit

#exp´eriences r´ealis´ees .

C’est une r´eponse pratique plutˆot que math´ematique, disponible seulement apr`es beaucoup de travail (combien de fois doit-on lancer le d´e ?), et donnera des r´eponses diff´erentes `a chaque fois—

insatisfaisante !

– Pour des exemples simples, on utilise souvent la sym´etrie pour le calcul des probabilit´es. Ceci n’est plus possible pour des cas plus compliqu´es—on construit des mod`eles math´ematiques, bas´es sur les notions d’exp´erience al´eatoireet d’espace de probabilit´e.

Probabilit´es et Statistique pour SIC slide 44

Exp´erience al´eatoire

D´efinition 22. Une exp´erience al´eatoire est une ‘exp´erience’ dont le r´esultat est (ou peut ˆetre traˆıt´e comme) al´eatoire.

Exemple 23. Je jette une pi`ece.

Exemple 24. Je lance 2 d´es ´equilibr´es, un rouge et un vert.

Exemple 25. Le nombre d’emails que je re¸cois aujourd’hui.

Exemple 26. Le temps d’attente jusqu’`a la fin de ce cours.

Exemple 27. Le temps qu’il fera ici demain `a midi.

Probabilit´es et Statistique pour SIC slide 45

Andrey Nikolaevich Kolmogorov (1903–1987)

Grundbegriffe der Wahrscheinlichkeitsrechnung (1933)

Probabilit´es et Statistique pour SIC slide 46

(20)

Espace de probabilit´e (Ω,F,Pr)

Une exp´erience al´eatoire est modelis´ee par un espace de probabilit´e.

D´efinition 28. Unespace de probabilit´e (Ω,F,Pr) est un objet math´ematique associ´e `a une exp´erience al´eatoire, constitu´e de :

1. un ensemble Ω, l’ensemble fondamental, qui contient tous lesr´esultats (´epreuves,

´

ev´enements ´el´ementaires) ω possibles de l’exp´erience ;

2. une collection F de sous-ensembles deΩ. Ces sous-ensembles sont appel´es´ev´enements, et F est appel´el’espace des ´ev´enements;

3. une fonction Pr :F 7→[0,1]appel´eeloi de probabilit´e, qui associe une probabilit´ePr(A) `a chaque A∈ F.

Probabilit´es et Statistique pour SIC slide 47

Ensemble fondamental

– L’ensemble fondamentalΩ est l’ensemble compos´e d’´el´ements repr´esentant tous les r´esultats possibles d’une exp´erience al´eatoire. Chaque ´el´ement ω∈Ω est associ´e `a un r´esultat diff´erent.

– Ωest analogue `a l’ensemble univers. Il peut ˆetre fini, d´enombrable ou non d´enombrable.

– Ωest non-vide. (SiΩ =∅ alors rien d’int´er´essant ne peut arriver.)

Exemple 29. D´ecrire les ensembles fondamentaux pour les Exemples 23–27.

Pour les exemples ´el´ementaires avec Ωfini, on choisit souventΩ de mani`ere `a ce que ω∈Ω soit

´equiprobable :

Pr(ω) = 1

|Ω|, pour chaque ω ∈Ω.

Alors Pr(A) =|A|/|Ω|, pour tout A⊂Ω.

Probabilit´es et Statistique pour SIC slide 48

Espace des ev´enements

F est un ensemble de sous-ensembles deΩqui repr´esente les ´ev´enements d’int´erˆet.

Exemple 30 (Suite de l’exemple 24). Donner les ´ev´enements A le d´e rouge montre 4,

B le total est impair, C le d´e vert montre 2,

A∩B le d´e rouge montre 4 et le total est impair.

Calculer leurs probabilit´es.

(21)

Espace des ev´enements F, II

D´efinition 31. Unespace des ´ev´enements F est un ensemble de sous-ensembles deΩtel que : (F1) F est non vide ;

(F2) siA∈ F alors Ac∈ F;

(F3) si{Ai}i=1 sont tous des ´el´ements deF, alors S

i=1Ai ∈ F. F est aussi appel´eeune tribu.

SoientA, B, C,{Ai}i=1 des ´el´ements de F. Alors les axiomes pr´ec´edents impliquent que – Sn

i=1Ai∈ F, – Ω∈ F, ∅ ∈ F,

– A∩B ∈ F, A \ B∈ F, A ∆B ∈ F, – Tn

i=1Ai∈ F.

Probabilit´es et Statistique pour SIC slide 50

Espace des ev´enements F, III

– SiΩest d´enombrable, on prend souvent pour F l’ensemble de tous les sous-ensembles de Ω. C’est le plus grand (et le plus riche) espace des ´ev´enements possibles pourΩ.

– On peut d´efinir des espaces des ´ev´enements diff´erents pour le mˆeme ensemble fondamental.

Exemple 32. Donner la tribu pour l’Exemple 23.

Exemple 33. Je lance deux d´es ´equilibr´es, un rouge et un vert.

(a) Quel est ma tribuF1?

(b) J’informe mon ami seulement du total. Quel est sa tribuF2?

(c) Mon ami regarde lui-mˆeme les d´es, mais il est daltonien. Quel est alors sa tribuF3?

Probabilit´es et Statistique pour SIC slide 51

Espace des ev´enements F, III

– Habituellement l’espace des ´ev´enements est clair d’apr`es le contexte, mais il est important d’´ecrire ΩetF explicitement, afin d’´eviter la confusion.

– Cela peut aussi ˆetre utile lorsque des soi-disant ‘paradoxes’ surviennent (g´en´eralement en raison d’une formulation math´ematique du probl`eme peu claire ou erron´ee).

– Il est essentiel de donner Ωet F lors des exercices, tests et examens.

Probabilit´es et Statistique pour SIC slide 52

(22)

Exemples

Exemple 34. Une femme planifiant sa future famille consid`ere les situations suivantes (on suppose que les chances d’avoir un gar¸con ou une fille sont ´egales `a chaque fois) :

(a) avoir trois enfants ;

(b) mettre au monde des enfants jusqu’`a ce que la premi`ere fille naisse, ou jusqu’`a ce que les trois enfants naissent, s’arrˆeter lorsque l’une des 2 situations se r´ealise.

(c) mettre au monde des enfants jusqu’`a ce que il y en ait un de chaque sexe ou jusqu’`a ce qu’il en ait trois, s’arrˆeter lorsque l’une des 2 situations se r´ealise.

SoientGi l’´ev´enement ‘igar¸cons sont n´es’,A l’´ev´enement ‘il y a plus de filles que de gar¸cons’.

CalculerPr(G1) etPr(A) sous (a)–(c).

En fait, le rapport gar¸con/fille est∼105/100 `a naissance.

Exemple 35 (Anniversaires). n personnes sont dans une pi`ece. Quelle est la probabilit´e qu’ils aient tous une date d’anniversaire diff´erente ?

Probabilit´es et Statistique pour SIC slide 53

Anniversaires

0 10 20 30 40 50 60

0.00.20.40.60.81.0

n

Probability

Probabilit´es et Statistique pour SIC slide 54

(23)

Galileo Galilei (1564–1642)

Probabilit´es et Statistique pour SIC slide 55

Il Saggiatore, 1623

Probabilit´es et Statistique pour SIC slide 56

(24)

Il Saggiatore, 1623

La filosofia `e scritta in questo grandissimo libro che continuamente ci sta aperto innanzi a gli occhi (io dico l’universo), ma non si pu`o intendere se prima non s’impara a intender la lingua, e conoscer i caratteri, ne’ quali `e scritto. Egli `e scritto in lingua matematica, e i caratteri son triangoli, cerchi, ed altre figure geometriche, senza i quali mezi `e impossibile a intenderne umanamente parola ; senza questi `e un aggirarsi vanamente per un oscuro laberinto.

La philosophie est ´ecrite dans ce vaste livre constamment ouvert devant nos yeux (je veux dire l’univers), et on ne peut le comprendre si d’abord on n’apprend `a connaˆıtre la langue et les caract`eres dans lesquels il est ´ecrit. Or il est ´ecrit en langue math´ematique, et ses caract`eres son le triangle et le cercle et autres figures g´eom´etriques, sans lesquels il est humainement impossible d’en comprendre un mot, sans lesquels on erre vainement dans un labyrinthe obscur.

Probabilit´es et Statistique pour SIC slide 57

Probl`eme de trois d´es

Trois d´es ´equilibr´es sont lanc´es. Soient Ti l’´ev´enement ‘le total esti’, pouri= 3, . . . ,18. Quel est le plus probable,T9 ou T10?

T9 peut se produire si les d´es ont les r´esultats suivants

9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3.

T10peut se produire si les d´es ont les r´esultats suivants

10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3.

Ainsi ils sont ´equiprobables.

Vrai ou faux ?

Probabilit´es et Statistique pour SIC slide 58

Loi de probabilit´e Pr

D´efinition 36. Uneloi de probabilit´e Prassocie une probabilit´e `a chaque ´el´ement de l’espace des

´ev´enements F, avec les propri´et´es suivantes : (P1) si A∈ F, alors 0≤Pr(A)≤1; (P2) Pr(Ω) = 1;

(P3) si {Ai}i=1 sont disjoints deux `a deux (c’est `a dire que, Ai∩Aj =∅,i6=j), alors Pr

[

i=1

Ai

!

= X

i=1

Pr(Ai).

(25)

Propri´et´es de Pr

Th´eor`eme 37. Soient A, B,{Ai}i=1 des ´ev´enements de l’espace de probabilit´e (Ω,F,Pr). Alors (a)Pr(∅) = 0;

(b) Pr(Ac) = 1−Pr(A);

(c) Pr(A∪B) = Pr(A) + Pr(B)−Pr(A∩B). SiA∩B=∅, alors Pr(A∪B) = Pr(A) + Pr(B); (d) si A⊂B, alors Pr(A)≤Pr(B), etPr(B \A) = Pr(B)−Pr(A);

(e) Pr (S

i=1Ai)≤P

i=1Pr(Ai) (in´egalit´e de Boole) ; (f) si A1⊂A2⊂ · · ·, alorslimn→∞Pr(An) = Pr (S

i=1Ai); (g) si A1⊃A2 ⊃ · · ·, alorslimn→∞Pr(An) = Pr (T

i=1Ai).

Probabilit´es et Statistique pour SIC slide 60

Continuit´e de Pr

Rappel : Une fonctionf est continue en x si pour toute suite{xn} telle que

n→∞lim xn=x, on a lim

n→∞f(xn) =f(x).

Les parties (f) et (g) du Th´eor`eme 37 peuvent ˆetre ´etendues pour montrer que pour toutes suites d’ensembles pour lesquelles

n→∞lim An=A, on a lim

n→∞Pr(An) = Pr(A).

C’est pourquoiPr est appel´eefonction d’ensembles continue.

Probabilit´es et Statistique pour SIC slide 61

Formules d’inclusion-exclusion

SiA1, . . . , An sont des ´ev´enements de(Ω,F, P), alors

Pr(A1∪A2) = Pr(A1) + Pr(A2)−Pr(A1∩A2) Pr(A1∪A2∪A3) = Pr(A1) + Pr(A2) + Pr(A3)

−Pr(A1∩A2)−Pr(A1∩A3)−Pr(A2∩A3) +Pr(A1∩A2∩A3)

... P

[n

i=1

Ai

!

= Xn

r=1

(−1)r+1 X

1≤i1<···<ir≤n

Pr(Ai1 ∩ · · · ∩Air).

Le nombre de termes dans la formule g´en´erale est n

1

+ n

2

+ n

3

+· · ·+ n

n−1

+ n

n

= 2n−1.

Probabilit´es et Statistique pour SIC slide 62

(26)

Exemple 38. Quelle est la probabilit´e d’obtenir au moins un 6 quand je lance 3 d´es ´equilibr´es ? Exemple 39. Une urne contient 1000 tickets de loterie num´erot´es de 1 `a 1000. On tire un ticket au hasard. Auparavant un artiste de foire a offert de payer $3 `a quiconque qui lui donne $2, si le num´ero du ticket est divisible par 2, 3, ou 5. Est ce que vous lui donneriez vos $2 avant le tirage ? (Vous perdez votre argent si le ticket n’est pas divisible par 2, 3, ou 5.)

Probabilit´es et Statistique pour SIC slide 63

2.2 Probabilit´ e Conditionnelle slide 64

Probabilit´e conditionnelle

D´efinition 40. SoientA, B des ´ev´enements de l’espace de probabilit´e(Ω,F,Pr), tel quePr(B)>0.

Alors laprobabilit´e conditionnelle de A sachant B est Pr(A|B) = Pr(A∩B)

Pr(B) .

SiPr(B) = 0, on adopte la convention Pr(A∩B) = Pr(A|B)Pr(B), des deux cˆot´es on a la valeur z´ero. Ainsi

Pr(A) = Pr(A∩B) + Pr(A∩Bc) = Pr(A|B)Pr(B) + Pr(A|Bc)Pr(Bc) mˆeme si Pr(B) = 0 ouPr(Bc) = 0.

Exemple 41. On lance deux d´es ´equilibr´es, un rouge et un vert. Soient A et B les ´ev´enements ‘le total exc`ede 8’, et ‘on a6 sur le d´e rouge’. Si on sait queB s’est produit, comment change Pr(A)?

Probabilit´es et Statistique pour SIC slide 65

Lois de probabilit´e conditionnelle

Th´eor`eme 42. Soit (Ω,F,Pr) un espace de probabilit´e, et soientB ∈ F tel que Pr(B)>0 et Q(A) = Pr(A|B). Alors (Ω,F, Q) est un espace de probabilit´e. En particulier,

1. si A∈ F, alors0≤Q(A)≤1; 2. Q(Ω) = 1;

3. si {Ai}i=1 sont disjoints 2 `a 2, alors

Q [

i=1

Ai

!

= X

j=1

Q(Ai).

(27)

Thomas Bayes (1702–1761)

Essay towards solving a problem in the doctrine of chances. (1763/4) Philosophical Transactions of the Royal Society of London.

Probabilit´es et Statistique pour SIC slide 67

Th´eor`eme de Bayes

Th´eor`eme 43 (Loi des probabilit´es totales). Soient{Bi}i=1 des ´ev´enements disjoints 2 `a 2 (i.e.

Bi∩Bj =∅,i6=j) de l’espace de probabilit´e(Ω,F,Pr), et soit Aun ´ev´enement satisfaisant A⊂S

i=1Bi. Alors

Pr(A) = X

i=1

Pr(A∩Bi) = X

i=1

Pr(A|Bi)Pr(Bi).

Th´eor`eme 44 (Bayes). Supposons que les conditions ci-dessus soient v´erifi´ees, et que Pr(A)>0.

Alors

Pr(Bj |A) = Pr(A|Bj)Pr(Bj) P

i=1Pr(A|Bi)Pr(Bi), j∈N.

Ces r´esultats sont aussi vrais si l’ensemble desBi est finie, et si les Bi partitionent Ω.

Probabilit´es et Statistique pour SIC slide 68

Exemples

Exemple 45. Des voitures sont fabriqu´ees dans les villes de Farad, Gilbert et Henry. Sur 1000 voitures produites `a Farad, 20% sont d´efectueuses, sur 2000 produites `a Gilbert, 10% sont d´efectueuses, et sur 3000 produites `a Henry, 5% sont d´efectueuses. Vous achetez une voiture. Si Dest l’´ev´enement ‘la voiture est d´efectueuse’, calculer (a) Pr(F |Hc), (b)Pr(D|Hc), (c) Pr(D), etPr(F |D). Supposez que vous avez les mˆemes chances d’acheter une des 6000 voitures produites.

Probabilit´es et Statistique pour SIC slide 69

(28)

Conditionnement multiple

Th´eor`eme 46 (‘Prediction decomposition’). SoientA1, . . . , An des ´ev´enements d’un espace de probabilit´e. Alors

Pr(A1∩A2) = Pr(A2 |A1)Pr(A1)

Pr(A1∩A2∩A3) = Pr(A3 |A1∩A2)Pr(A2 |A1)Pr(A1) ...

Pr(A1∩ · · · ∩An) = Yn

i=2

Pr(Ai|A1∩ · · · ∩Ai−1)×Pr(A1)

Probabilit´es et Statistique pour SIC slide 70

Exemples

Exemple 47. On lance 2 d´es ´equilibr´es. D´efinir les ´ev´enements A, B, C qui sont ‘le total est au plus 6’, ‘le total est impair’, et ‘on obtient 4 pour le premier d´e ’. (a) Comment la connaissance queB ou C soit r´ealis´e, affecte la probabilit´e de A? (b) CalculerPr(A∩B∩C).

Exemple 48. nhommes vont `a un diner. Chacun laisse son chapeau au vestiaire. Lorsqu’ils repartent, ayant bien ´echantillion´e du vin r´egional, ils choisissent leurs chapeaux de fa¸con al´eatoire.

(a) Quelle est la probabilit´e que personne n’ait son chapeau ?

(b) Quelle est la probabilit´e qu’exactement r hommes choisissent leur propre chapeau ? (c) Que se passe-t-il lorsque nest tr`es grand ?

Probabilit´es et Statistique pour SIC slide 71

2.3 Ind´ ependance slide 72

Ev´enements ind´ependants

Intuitivement, dire que ‘A et B sont ind´ependants’ signifie que la r´ealisation d’un des deux n’affecte pas la r´ealisation de l’autre. C’est `a dire que, Pr(A|B) = Pr(A), donc la connaissance de la r´ealisation de B laissePr(A)inchang´ee.

Exemple 49. Une famille a deux enfants.

(a) On sait que le premier est un gar¸con. Quelle est la probabilit´e que le second soit un gar¸con ? (b) On sait qu’un des deux est un gar¸con. Quelle est la probabilit´e que l’autre soit un gar¸con ?

Probabilit´es et Statistique pour SIC slide 73

(29)

Ind´ependance

D´efinition 50. Soit(Ω,F,Pr) un espace de probabilit´e. Deux ´ev´enementsA, B ∈ F sont ind´ependants(que l’on note A⊥⊥B) ssi

Pr(A∩B) = Pr(A)Pr(B).

Conform´ement `a notre intuition, cela implique que Pr(A|B) = Pr(A∩B)

Pr(B) = Pr(A)Pr(B)

Pr(B) = Pr(A), et par sym´etrie Pr(B|A) = Pr(B).

Exemple 51. Un jeu de cartes est bien battu et une carte est tir´ee au hasard. Est ce que les

´ev´enements A ‘la carte est un as’, et C ‘la carte est un coeur’ sont ind´ependants ? Que peut on dire `a propos des ´ev´enements A et R ‘la carte est un roi’ ?

Probabilit´es et Statistique pour SIC slide 74

Types d’ind´ependances

D´efinition 52. (a) Les ´ev´enements A1, . . . , An sont(mutuellement) ind´ependants si pour tout ensemble d’indicesF ⊂ {1, . . . , n}, on a

Pr \

i∈F

Ai

!

=Y

i∈F

Pr(Ai).

(b) Les ´ev´enements A1, . . . , An sontind´ependants 2 `a 2 si

Pr(Ai∩Aj) = Pr(Ai) Pr(Aj), 1≤i < j ≤n.

(c) Les ´ev´enements A1, . . . , An sont conditionnellement ind´ependants sachant B si pour tout ensemble d’indicesF ⊂ {1, . . . , n} on a

Pr \

i∈F

Ai |B

!

=Y

i∈F

Pr(Ai|B).

Probabilit´es et Statistique pour SIC slide 75

(30)

Quelques remarques

– L’ind´ependance est un id´ee cl´e qui simplifie consid´erablement des calculs de probabilit´e. En pratique, il est essentiel de v´erifier si les ´ev´enements sont ind´ependants, ´etant donn´e qu’une d´ependance non d´etect´ee peut modifier grandement le calcul des probabilit´es.

– L’ind´ependance mutuelle entraˆıne l’ind´ependance deux `a deux, mais l’inverse est vrai seulement quandn= 2.

– L’ind´ependance mutuelle entraˆıne l’ind´ependance conditionnelle, mais l’inverse est vrai seulement si B = Ω.

Exemple 53. Une famille a deux enfants. Montrer que les ´ev´enements ‘le premier enfant est un gar¸con’, ‘le second enfant est un gar¸con’, et ‘il y a exactement un gar¸con’ sont ind´ependants deux `a deux mais pas mutuellement.

Probabilit´es et Statistique pour SIC slide 76

Exemple 54. Une ann´ee donn´ee, la probabilit´e qu’un conducteur fasse une d´eclaration de sinistre `a son assurance estµ, ind´ependamment des autres ann´ees. La probabilit´e pour une conductrice est de λ < µ. Un assureur a le mˆeme nombre de conducteurs que de conductrices, et en s´electionne un(e) au hasard.

(a) Donner la probabilit´e qu’il (elle) d´eclare un sinistre cette ann´ee ?

(b) Donner la probabilit´e qu’il (elle) d´eclare des sinistres durant 2 ann´ees cons´ecutives ? (c) Si la compagnie s´electionne une personne ayant fait une d´eclaration au hasard, donner la probabilit´e qu’elle fasse une d´eclaration l’ann´ee suivante ?

(d) Montrer que la connaissance qu’une d´eclaration de sinistre ait ´et´e faite une ann´ee augmente la probabilit´e d’une d´eclaration l’ann´ee suivante.

Probabilit´es et Statistique pour SIC slide 77

Syst`emes en s´eries et parall`eles

Un syst`eme ´electrique a des composants 1, . . . , n, qui tombent en panne ind´ependamment. SoientAi l’´ev´enement ‘lei`eme composant est d´efaillant’, avecPr(Ai) =pi. L’´ev´enement B, ‘la d´efaillance du syst`eme’ se produit si le courant ne peut pas passer d’un bout du syst`eme `a l’autre. Si les composants sont arrang´es en parall`ele, alors

PrP(B) = Pr(A1∩ · · · ∩An) = Yn

i=1

pi.

Si les composants sont arrang´es en s´erie, alors

PrS(B) = Pr(A1∪ · · · ∪An) = 1− Yn

i=1

(1−pi).

(31)

Fiabilit´e

Exemple 55 (Chernobyl). Une centrale nucl´eaire d´epend d’un syst`eme de s´ecurit´e dont les composants sont arrang´es suivant la figure (tableau noir). Les composants tombent en panne

ind´ependamment avec la probabilit´ep, et le syst`eme devient d´efaillant si le courant ´electrique ne peut pas passer de A `a B.

(a) Quelle est la probabilit´e que le syst`eme devienne d´efaillant ?

(b) Les composants sont fabriqu´es par lots, qui peuvent ˆetre bons ou mauvais. Pour un bon lot, p= 10−6, tandis que pour un lot mauvais p= 10−2. La probabilit´e qu’un lot soit bon est 0.99. Quelle est la probabilit´e que le syst`eme soit d´efaillant (i) si les composants proviennent de diff´erents lots ? (ii) si tous les composants proviennent du mˆeme lot ?

Probabilit´es et Statistique pour SIC slide 79

2.4 Exemples Edifiants slide 80

Les dames et la mort

Probabilit´es et Statistique pour SIC slide 81

(32)

Les fumeuses et la mort

Survie apr`es 20 ans pour 1314 femmes dans la ville de Whickham, Angleterre (Appleton et al., 1996, The American Statistician). Les colonnes contiennent : nombre de mortes apr`es 20 ans/nombre de vivantes au debut de l’´etude (%).

Age (ann´ees) Fumeuses Non-fumeuses Total 139/582 (24) 230/732 (31)

18–24 2/55 (4) 1/62 (2)

25–34 3/124 (2) 5/157 (3)

35–44 14/109 (13) 7/121 (6)

45–54 27/130 (21) 12/78 (15) 55–64 51/115 (44) 40/121 (33) 65–74 29/36 (81) 101/129 (78)

75+ 13/13 (100) 64/64 (100)

Selon les totaux, il y a un effet b´en´efique d’avoir fum´e : 24%<31%!

Probabilit´es et Statistique pour SIC slide 82

Paradoxe de Simpson

Definission les ´ev´enements ‘morte apr`es 20 ans’, M, ‘fumeuse’, F, et ‘dans la cat´egorie d’ˆage aau debut’,A=a. Alors pour (presque) chaqueaon a

Pr(M |F, A=a)>Pr(M |Fc, A=a), mais

Pr(M |F)<Pr(M |Fc).

Notons que

Pr(M |F) = X

a

Pr(M |F, A=a)Pr(A=a), Pr(M |Fc) = X

a

Pr(M |Fc, A=a)Pr(A=a),

donc si les probabilit´es Pr(M |F, A=a) etPr(M |Fc, A =a)varient beaucoup avec a, les pond´erer par les Pr(A=a) peut renverser l’ordre des l’in´egalit´es.

C’est un exemple du paradox de Simpson: ‘oublier’ un conditionnement peut changer la conclusion d’une ´etude.

Probabilit´es et Statistique pour SIC slide 83

(33)

La triste histoire de Sally Clark

Une avocate anglaise, dont le premier fils est d´ec´ed´e quelques semaines apr`es sa naissance en 1996.

Suite `a la mort de son deuxi`eme fils de la mˆeme mani`ere, elle fut arrˆet´ee en 1998 et accus´ee pour un double meurtre. Son inculpation ´etait controvers´ee car un p´ediatre tr`es distingu´e, Professor Sir Roy Meadow, a temoign´e que la probabilit´e que, dans une famille comme celle de Sally Clark, deux enfants meurent `a cause du Sudden Infant Death Syndrome (SIDS)´etait 1 sur 73 million, chiffre qu’il a obtenu comme1/85002, o`u 1/8500 ´etait la probabilit´e estim´ee d’une seule mort `a cause du SIDS.

Elle fut condamn´ee en novembre 1999, puis lib´er´ee en janvier 2003, parce que certain preuves pathologiques tendant `a la blanchir n’ont pas ´et´e divulgu´ees `a son avocat. Suite `a son cas, le

Procureur-en-Chef a demand´e que des centaines d’autres cas soient revus, et encore deux femmes ont

´et´e lib´er´ees de prison.

Elle est d´ec´ed´ee d’alcoolisme en mars 2007.

Probabilit´es et Statistique pour SIC slide 84

Les taux de SIDS

Donn´ees sur les taux de mortalit´e enfantile, (rapport CESMA SUDI,

http://cemach.interface-test.com/Publications/CESDI-SUDI-Report-(1).aspx)

Probabilit´es et Statistique pour SIC slide 85

Sally Clark : Quatres erreurs tragiques – Probabilit´es estim´ees

– ‘Ecological fallacy’

– Ind´ependance ? Vraiment ? – ‘Prosecutors’ fallacy’

Probabilit´es et Statistique pour SIC slide 86

(34)

3 Variables Al´ eatoires slide 87

Petit Vocabulaire Probabiliste

Mathematics English Fran¸cais

one fair die (several fair dice) un d´e juste/´equilibr´e (plusieurs d´es justes/´equilibr´es)

random experiment une exp´erience al´eatoire

Ω sample space l’ensemble fondamental

ω outcome, elementary event une ´epreuve, un ´ev´enement ´el´ementaire

A, B, . . . event un ´ev´enement

F event space l’espace des ´ev´enements

sigma-algebra une tribu

Pr probability distribution/probability function une loi de probabilit´e

(Ω,F,Pr) probability space un espace de probabilit´e

inclusion-exclusion formulae formule d’inclusion-exclusion Pr(A|B) probability ofA given B la probabilit´e de A sachantB

independence ind´ependance

(mutually) independent events les ´ev´enements (mutuellement) ind´ependants pairwise independent events les ´ev´enements ind´ependants deux `a deux conditionally independent events les ´ev´enements conditionellement ind´ependants X, Y, Z, W, . . . random variable/random variate une variable al´eatoire

FX(x) (cumulative) distribution function une fonction de r´epartition

fX(x) (probability) density/mass function (PDF) une fonction de densit´e/masse (fm)

E(X) expectation/mean ofX l’esp´erance de X

var(X) variance ofX la variance de X

fX(x|B) conditional density/mass function une fonction de densit´e/masse conditionnelle

Probabilit´es et Statistique pour SIC slide 88

(35)

3.1 Id´ ees de Base slide 89

Variables al´eatoires

Souvent on consid`ere des quantit´es al´eatoires num´eriques.

Exemple 56. Deux d´es ´equilibr´es sont lanc´es, un rouge et un vert. Soit X le total des faces sup´erieures. Trouver les valeurs possibles deX, et les probabilit´es correspondantes.

D´efinition 57. Soit(Ω,F,Pr) un espace de probabilit´e. Unevariable al´eatoire (va)X: Ω7→Rest une application de l’ensemble fondamentalΩdans R.

D´efinition 58. L’ensemble des valeurs prises parX,

DX ={x∈R:∃ω ∈Ωtel queX(ω) =x}

s’appele le supportdeX. Si DX est d´enombrable, alorsX est une variable al´eatoire discr`ete.

La vaX associe des probabilit´es `a des sous-ensembles S inclus dans R, donn´ees par Pr(X∈S) = Pr({w∈Ω :X(w) ∈S}).

En particulier, on poseAx={ω∈Ω :X(ω) =x}. Il est `a noter qu’il faut que Ax∈ F, pour pouvoir calculer Pr(X =x). Si ce n’est pas le cas, on dit queX n’est pasmesurablepar rapport `a(Ω,F,Pr).

Probabilit´es et Statistique pour SIC slide 90

Exemples

Exemple 59. On jette une pi`ece plusieurs fois et ind´ependamment. Soit X la variable al´eatoire repr´esentant le nombre de lanc´es n´ecessaires jusqu’`a ce qu’on obtienne face. Calculer

Pr(X = 3), Pr(X = 15), Pr(X ≤3.5), Pr(X >1.7), Pr(1.7≤X≤3.5).

Exemple 60. Un ensemble Ωnaturel quand je joue aux fl´echettes est le mur sur lequel la cible est fix´ee. La fl´echette att´erit `a un point ω∈Ω⊂R2. Mon score X(ω)∈DX ={0,1, . . . ,60}.

Probabilit´es et Statistique pour SIC slide 91

(36)

Jacob Bernoulli (1654–1705)

Ars Conjectandi, Basel (1713)

Probabilit´es et Statistique pour SIC slide 92

Variable al´eatoire de Bernoulli

D´efinition 61. Une variable al´eatoire qui prend comme valeurs seulement 0 et 1 est appel´ee une variable indicatrice, ou unevariable al´eatoire de Bernoulli, ou unessai de Bernoulli.

Exemple 62. Supposons que npi`eces identiques sont lanc´ees ind´ependamment, soitFi l’´ev´enement

‘on obtient face pour la i`eme pi`ece’, et soit Ii=I(Fi) l’indicatrice de cet ´ev´enement. Alors Pr(Ii = 1) = Pr(Fi) =p, Pr(Ii = 0) = Pr(Fic) = 1−p,

o`u p est la probabilit´e d’obtenir face. Sin= 3 et X=I1+I2+I3, d´ecrire Ω,DX et les ensembles Ax. Que repr´esentent

X=I1+· · ·+In, Y =I1(1−I2)(1−I3), Z = Xn

j=2

Ij−1(1−Ij)?

Probabilit´es et Statistique pour SIC slide 93

(37)

Fonction de masse

Une variable al´eatoire X associe des probabilit´es `a des sous-ensembles deR. En particulier lorsque X est discr`ete, nous avonsAx={ω ∈Ω :X(ω) =x}, et nous pouvons d´efinir :

D´efinition 63. Lafonction de masse (fm)deX est

fX(x) = Pr(X =x) = Pr(Ax), x∈R.

Elle a deux propri´et´es cl´es :

(i) fX(x)≥0, et est positif seulement pourx∈DX, o`uDX est l’ensemble image de X, c’est `a dire le support defX;

(ii) la probabilit´e totaleP

{i:xi∈DX}fX(xi) = 1.

Quand il n’y a pas de risque de confusion, notonsfX ≡f et DX ≡D.

En anglais la fonction de masse est appel´eeprobability mass function (PMF)ouprobability density function (PDF).

Probabilit´es et Statistique pour SIC slide 94

Variable al´eatoire binomiale

Exemple 64. Donner les fm et supports de Ii, deY et de X.

D´efinition 65. Une variable al´eatoire binomialeX a une fm f(x) =

n x

px(1−p)n−x, x= 0,1, . . . , n, n∈N,0≤p≤1.

On noteX ∼ B(n, p), et appelle nle d´enominateuret pla probabilit´e de succ`es. Avecn= 1, c’est une variable de Bernoulli.

Remarque :on utilise ∼comme abr´eviation de ‘a pour distribution’.

Le mod`ele binomial est utilis´e quand on consid`ere le nombre de ‘succ`es’ d’une ´epreuve r´ep´et´ee de fa¸con ind´ependante un nombre fix´e de fois, et que chaque essai a la mˆeme probabilit´e de succ`es.

Probabilit´es et Statistique pour SIC slide 95

Fonctions de masse binomiale

0 2 4 6 8 10

0.000.150.30

B(10,0.5)

x

f(x)

0 2 4 6 8 10

0.000.150.30

B(10,0.3)

x

f(x)

0 5 10 15 20

0.000.150.30

B(20,0.1)

x

f(x)

0 10 20 30 40

0.000.150.30

B(40,0.9)

x

f(x)

Probabilit´es et Statistique pour SIC slide 96

(38)

Exemples

Exemple 66. Un test contient 20 questions, pour chacune d’elles il faut choisir la bonne r´eponse parmi 5 r´eponses possibles. La moyenne est obtenue avec 10 r´eponses justes. Un ´etudiant choisit ses r´eponses au hasard. Donner la loi de son nombre de r´eponses justes. Quelle est la probabilit´e qu’il r´eussisse le test ?

Probabilit´es et Statistique pour SIC slide 97

Loi g´eom´etrique

D´efinition 67. Une variable al´eatoire g´eom´etrique X a pour fm

fX(x) =p(1−p)x−1, x= 1,2, . . . , 0≤p≤1.

On noteX ∼ Geom(p), et on appellep laprobabilit´e de succ`es.

Elle mod´elise le temps d’attente jusqu’`a un premier ´ev´enement, dans une s´erie d’essais ind´ependants ayant la mˆeme probabilit´e de succ`es.

Exemple 68. Pour commencer un jeu de soci´et´e, des joueurs jettent un d´e chacun `a leur tour. Le premier qui obtient six commence. Donner les probabilit´es que le3`eme joueur commence, et d’attendre au moins 6 lanc´es de d´e avant le d´ebut du jeu.

Th´eor`eme 69 (Manque de m´emoire). SiX ∼ Geom(p), alors Pr(X > n+m|X > m) = Pr(X > n).

Probabilit´es et Statistique pour SIC slide 98

FMs g´eom´etrique et binomiale n´egative

0 10 20 30 40

0.00.20.4

Geom(0.5)

x + 1

f(x)

0 10 20 30 40

0.00.20.4

Geom(0.1)

x + 1

f(x)

0 10 20 30 40

0.000.100.20

NegBin(4,0.5)

x + 4

f(x)

0 10 20 30 40

0.000.100.20

NegBin(6,0.3)

x + 6

f(x)

Probabilit´es et Statistique pour SIC slide 99

(39)

Loi binomiale n´egative

D´efinition 70. Une variable al´eatoirebinomiale negative X de param`etres net pa pour fonction de masse

fX(x) =

x−1 n−1

pn(1−p)x−n, x=n, n+ 1, n+ 2, . . . , 0≤p≤1.

On noteX ∼ NegBin(n, p). Lorsquen= 1,X ∼ Geom(p).

Elle mod´elise le temps d’attente jusqu’au n`eme succ`es dans une s´erie d’essais ind´ependants ayant la mˆeme probabilit´e de succ`es.

Exemple 71. Deux joueurs lancent successivement une pi`ece. Quelle est la probabilit´e que 2 faces apparaissent avant 5 piles ?

Probabilit´es et Statistique pour SIC slide 100

Loi binomiale n´egative : version alternative

Parfois on ´ecrit les variables g´eom´etriques et binomiale negatives sous une forme plus g´en´erale, prenant Y =X−n, et alors la fonction de masse est

fY(y) = Γ(n+α)

Γ(α)y! pα(1−p)y, y= 0,1,2, . . . , 0≤p≤1, α >0, o`u

Γ(α) = Z

0

uα−1e−udu, α >0 est lafonction Gamma. Ses propri´et´es principales sont :

Γ(1) = 1;

Γ(α+ 1) = αΓ(α), α >0;

Γ(n) = (n−1)!, n= 1,2,3, . . .; Γ(12) = √

π.

Probabilit´es et Statistique pour SIC slide 101

Distribution hyperg´eom´etrique

D´efinition 72. On tire sans remise un ´echantillon de mboules d’une urne contenant bblanches et n noires. SoitX le nombre de boules blanches tir´ees. Alors

Pr(X =x) =

b x

n

m−x

b+n m

, x= max(0, m−n), . . . ,min(b, m), et la loi de X est hyperg´eom´etrique.

Exemple 73. J’ai six boˆıtes, dont 2 contiennent du fruit. Si je choisis 3 des 6 au hasard, trouver la loi du nombre de boˆıtes de fruit parmi les 3.

Probabilit´es et Statistique pour SIC slide 102

(40)

Exemples

Exemple 74. Dans le but d’estimer le nombre de poissons N dans un lac, nous attrapons tout d’abord r poissons, les marquons, et les relˆachons. Apr`es avoir attendu assez longtemps pour que la population de poissons soit bien m´elang´ee, nous pr´elevons un autre ´echantillon de tailles, compos´e de 0≤m≤spoissons marqu´es. Trouver la loi du nombre de poissons marqu´es, M, dans cet ´echantillon.

Montrer que la valeur de N qui maximise Pr(M =m)est ⌊rs/m⌋, et calculer la meilleure estimation deN lorsques= 50, r= 40, et m= 4.

L’idee `a la base de cet exemple est utilis´ee pour estimer les tailles des populations des esp`eces en danger, le nombre de toxicomanes, de sans-papiers, etc., dans les populations humaines, etc. Un probl`eme pratique souvent rencontr´e est que certains individus deviennent plus difficile `a recapturer, alors que d’autres l’aiment ; ainsi les probabilit´es de reprise sont h´et´erog`enes.

Probabilit´es et Statistique pour SIC slide 103

Fonction de r´epartition

D´efinition 75. Lafonction de r´epartition (fr) d’une variable al´eatoireX est FX(x) = Pr(X≤x), x∈R.

SiX est discr`ete, on peut ´ecrire

FX(x) = X

{xi∈DX:xi≤x}

Pr(X =xi),

c’est une fonction en escalier avec des sauts aux points du support DX defX(x).

Quand il n’y a pas de risque de confusion, on note F ≡FX.

Exemple 76. Donner le support et les fonctions de masse et de r´epartition d’une variable al´eatoire de Bernoulli.

Exemple 77. Donner la fonction de r´epartition d’une variable al´eatoire g´eom´etrique.

Probabilit´es et Statistique pour SIC slide 104

(41)

Exemples

La d´efinition suivante g´en´eralise le r´esultat d’un jet de d´e.

D´efinition 78. Une variable al´eatoire discr`ete uniformeX a pour fm fX(x) = 1

b−a+ 1, x=a, a+ 1, . . . , b, a < b, a, b∈Z.

La loi de Poisson apparaˆıt partout dans la probabilit´e et les statistiques.

D´efinition 79. Une variable al´eatoire dePoisson X a pour fm fX(x) = λx

x!e−λ, x= 0,1, . . . , λ >0.

On noteX ∼ Pois(λ).

Probabilit´es et Statistique pour SIC slide 105

Sim´eon-Denis Poisson (1781–1840)

‘La vie n’est bonne qu’`a deux choses : `a faire des math´ematiques et `a les professer.’

Probabilit´es et Statistique pour SIC slide 106

Références

Documents relatifs

Plutˆ ot que n´ ecessiter de recompiler le module pour chaque nouvelle op´ eration, nous d´ esirons exposer une interface ` a l’utilisateur de fa¸ con ` a ce que deux ´

Le syst` eme informatique d’une biblioth` eque enregistre le num´ ero national, le nom, le pr´ enom et l’adresse (rue, num´ ero, code postal, ville) de chacun de ses clients.. Le

boxcox (MASS) transformation de Box-Cox dans le cas d’un LNM bcPower (car) transformation de Box-Cox, Yeo-Johnson ou puissance lm (stats) ajuste un mod` ele de r´ egression lin´

En occultant ensuite cette information, ajuster un ou plusieurs mod` eles (soit de type AR/MA/ARMA/ARIMA/SARIMA, soit de type r´ egression avec tendance et/ou saisonnalit´ e

Il est particuli`erement rassurant de constater que plusieurs auteurs ont d´ej` a observ´e les r´egulations de cer- tains de ces g`enes par ces mˆemes acides gras (Berger et al., 2002

Pour revenir `a notre ´etude, `a partir de chaque mod`ele propos´e dans le paragraphe pr´ec´edent, nous pouvons rechercher les g`enes diff´erentiellement exprim´es entre les

Estimation des param` etres et de l’´ etat cach´ e des mod` eles d’espace d’´ etats: application au mod`

F., A Robbins-Monro procedure for estimation in semiparametric regression models, Annals of