Statistiques et Analyse de Données 3
TD : Autour des tests bayésiens
Exercice 1.
On va étudier le biais prétendu des pièces d’un euro belge orné du portrait du roi Albert II. Pour cela on se réfère à l’expérience relatée dans l’article du New Scientist du 4 janvier 2002(www.newscientist.com/
article/dn1748-euro-coin-accused-of-unfair-flipping/).
Suite à 250 expériences, ils ont obtenu 140 fois face. On noteX la variable correspondant au nombre de face après 250 essais et pla probabilité d’obtenir face lors d’un essai.
1. Calculer le facteur de Bayes des hypothèses
H1 : la pièce est équilibrée et H2 : face sort dans 60% des cas.
Commenter.
2. En utilisant la loi uniforme comme loi a priori deT sous l’hypothèseH2, calculer le facteur de Bayes des hypothèses
H1 : p= 1
2 et H2 : p6= 1 2 Commenter.
3. (*) Proposer une façon de réaliser un test de la forme suivante
H1 : p= 1
2, H2 : p > 1
2, H3 : p < 1 2. 4. Proposer une étude de la situation sans faire appel aux tests.
Exercice 2.
On suppose qu’une valeur,X, est transmise par un moyen de communication. Le récepteur reçoit le message bruitéY =X+W avec W ∼ N(0, σ) indépendant de X. Le message X vaut 1 avec probabilité p∈]0; 1[ et
−1 avec probabilité 1−p.
L’objectif est de décider une fois un message reçu si ce message vaut 1 ou−1.
1. Poser les deux hypothèsesH1 etH2 entre lesquelles il faut choisir.
2. Donner la loi deY sous chacune de ces hypothèses.
3. Exprimer le facteur de Bayes deH1 face à H2.
4. Expliciter la règle de décision entre les deux hypothèses en fonction de la valeur reçuey, ainsi que les paramètresp etσ.
Exercice 3.
Un système de surveillance est en charge de détecter les intrusions dans un lieu. Il doit choisir entre deux hypothèses
H1 : Aucun intrus n’est présent et H2 : Des intrus sont présents.
Le système enverra un message d’alerte s’il décide que c’est l’hypothèseH2 qui est vraie. On suppose que le coût de manquer un intrus est 10 fois plus élevé que celui d’une fausse alerte.
1. Le système analyse ses données et obtient P(H2 |données détectées) = 0.05. Le système doit-il envoyer un message d’alerte ?
2. Quel est le seuil sur la probabilité a posteriori deH2 à partir duquel le système envoie une alerte ?
L3 Économie Université de Tours - 2019-2020
Exercice 4.
1. Exécuter dansRle code suivant.
2. Que représente le graphique produit ?
3. Étudier et essayer de comprendre les commandes utilisées.
library(tidyr) library(ggplot2)
croyH1 <- seq(0,1,0.01) BF <- c(1,3,10,30,100,150)
d <- data.frame(A_priori_H1 = croyH1) for(i in 1:length(BF)){
d[,i+1]<- ( 1 + (1-croyH1)/croyH1 * BF[i]^(-1))^(-1) }
names(d)[2:(1+length(BF))] <- c("1","3","10","30","100","150") d2 <- d %>% pivot_longer(cols = -1, names_to = "Facteur_de_Bayes",
values_to = "A_posteriori_H1")
d2$Facteur_de_Bayes <- ordered(d2$Facteur_de_Bayes, levels = c("1","3","10","30","100","150"))
ggplot(d2) + aes(x = A_priori_H1, y = A_posteriori_H1, color = Facteur_de_Bayes) + geom_line()
L3 Économie Université de Tours - 2019-2020
Statistiques et Analyse de Données 3
Fiche version 2
Le contenu de cette fiche sera joint au sujet du CC3.
1. Lois
• Lois Beta.
Soientαetβ dansR∗+. SoitX ∼Beta(α, β). AlorsX est une variable aléatoire de densité fX(x) =kxα−1(1− x)β−11[0,1](x) aveck= 1
B(α, β)= Γ(α+β)
Γ(α)Γ(β). Sin∈N∗, on a Γ(n) = (n−1)!. Par exemple, on a Γ(5) = 3! = 6.
De plus, on aE(X) = α
α+β et V(X) = αβ
(α+β)2(α+β+ 1).
• Lois Gamma.
SoientαetβdansR∗+. SoitX ∼Γ (α, β). AlorsX est une variable aléatoire de densitéfX(x) =kxα−1e−βx1R+(x) aveck= βα
Γ(α).De plus, on aE(X) = α
β et V(X) = α β2.
• Lois de Poisson.
SoitX ∼ P(λ), avec λ∈R∗+. AlorsX est une variable aléatoire à valeurs dansN telle que, pour tout x∈N, P(X =x) =e−λλx
x!. De plus, on aE(X) = V(X) =λ.
• Lois géométriques
SoitX ∼ G(p), avecp∈]0; 1[. Alors X est une variable aléatoire à valeurs dansN telle que, pour tout x∈N, P(X =x) = (1−p)x−1p. De plus, on aE(X) = 1
p et V(X) = 1−p p2 .
• Lois exponentielles.
SoitX ∼ Exp(λ), avecλ∈R∗+. AlorsX est une variable aléatoire de densitéfX(x) =λe−λx1]0;+∞[(x).De plus, on aE(X) = 1
λ et V(X) = 1 λ2.
• Lois normales.
SoitZ ∼ N(µ, σ), oùσest l’écart type deZ. La densité deZ estfZ(x) = 1
√2πσ2e−(x−µ)22σ2 .
2. Tableau de mises à jour bayésiennes
Hypothèses Données A priori Vraisemblance A posteriori θ x U(]0 ; 1[) Bin(n;θ) Beta (x+ 1 ;n−x+ 1) θ x Beta (α;β) Bin(n;θ) Beta (α+x;β+n−x) θ (xi)i∈J1;nK Γ (α;β)
n
Y
i=1
Exp(θ) Γ α+n;β+
n
X
i=1
xi
!
θ (xi)i∈J1;nK Γ (α;β)
n
Y
i=1
Γ (a;θ) Γ α+na;β+
n
X
i=1
xi
!
θ (xi)i∈J1;nK Γ (α;β)
n
Y
i=1
P(θ) Γ α+
n
X
i=1
xi ;β+n
!
θ (xi)i∈J1;nK N(µ0;σ0)
n
Y
i=1
N(θ;σ) N
µ0 σ02 +nσx2
1 σ20 +σn2
; 1
q 1
σ20 +σn2
θ (xi)i∈J1;nK Γ (α;β)
n
Y
i=1
N
µ;√1 θ
Γ
α+n
2;β+ Pn
i=1(xi−µ)2 2
L3 Économie Université de Tours - 2019-2020