• Aucun résultat trouvé

Examen ` a Blanc : 1 avril 2011

N/A
N/A
Protected

Academic year: 2022

Partager "Examen ` a Blanc : 1 avril 2011"

Copied!
5
0
0

Texte intégral

(1)

Examen ` a Blanc : 1 avril 2011

Probabilit´e et Statistiques SIC

1. (i) Il y a 13 coeurs et 4 rois dont un roi de coeur, donc la probabilit´e d’obtenir un roi ou un coeur vaut (13 + 4−1)/52 = 16/52 = 4/13≈0.3076.

(ii) SoitX1 le r´esultat du premier d´e etX2le r´esultat du deuxi`eme d´e, alors P(X1= 5|X1+X2= 6) = P(X1= 5, X1+X2= 6)

P(X1+X2= 6) =P(X1= 5, X2= 1)

P(X1+X2= 6) =1/36 5/36 = 1/5.

(iii) Si X et Y sont ind´ependants,

var(1 + 2X−3Y) = var(2X) + var(3Y) = 4var(X) + 9var(Y) = 16 + 9 = 25.

(iv)

E(X) = Z 1

0

x×1dx= [x2

2 ]10= 1/2, E(X2) =

Z 1 0

x2×1dx= [x3

3 ]10= 1/3,

var(X) = E(X2)−E(X)2= 1/3−1/4 = 1/12.

(v) PuisqueX et Y sont id´ependants,

cov(2 + 3X+Y, Y −X−2) =−3var(X) + var(Y) =−2.

(vi) Notons par Dle disque de centre O et de rayonr, alors fX,Y(x, y) =

1

aire(D)= πr12, (x, y)∈D,

0, sinon.

(vii) On lit sur la tableq0.95= 1.645.

(viii) D’apr`es le th´eor`eme central limite

P(X1+· · ·+X100≤110) = P(X1+· · ·+X100−100

10 ≤110−100

10 ) = P(N(0,1)≤1) = 0.84.

(ix)

MX3Y = E[et(X3Y)] = E[etX]E[e3tY] =e2(et1)e3(e3t1).

(x) Puisqueσ= 1 est connue, on utilise le test normal dont la statistique est donn´ee par Xσ/¯θn0

avecθ0= 0 etn= 21 :

p−valeur= P(|Z|> zobs) = P(|Z|> 0.2−0

√1/√

21) = P(|Z|>0.9165)∼2(1−0.818)∼0.36 On accepte le test au seuil 100(1−α) siα < 36%, sinon on rejette le test. Siσ est connue alors on utilise un t-test `a la place du test normal. Sa statistique est donn´ee par X¯θ0

s2/ n : p−valeur= P(|t21|> tobs) = P(|t21|> 0.2−0

√1.5/√

21) = P(|t21|>0.75)∼2(1−0.77) = 0.46.

On accepte le test siα <46% et on le rejette sinon.

2. (a) Introduisons les ´ev´enements :

(2)

– P2 =«la pi`ece choisie donne toujours pile»

– P3 =«la pi`ece choisie donne pile avec probabilit´e 2/3»

Si l’on notepp l’´ev´enement «obtenir deux piles en deux lancers», on a d’apr`es la formule des probabilit´es totales,

Pr(pp) = Pr(pp|P1) Pr(P1) + Pr(pp|P2) Pr(P2) + Pr(pp|P3) Pr(P3)

= 1

2·1 2 ·1

3 +1 3 +2

3· 2 3·1

3

= 61

108

≈ 0.56.

(b) On cherche la probabilit´e d’avoir choisi la pi`ece non biais´ee sachant que l’on a obtenu deux piles sur nos deux lancers. On utilise pour cela la formule de Bayes.

Pr(P1|pp) = Pr(pp|P1) Pr(P1) Pr(pp)

=

1 4·13

61 108

= 9

61

≈ 0.15.

(c) Notonsf l’´ev´enement«obtenir une face au troisi`eme lancer avec la mˆeme pi`ece».

Pr(f |pp) = Pr(f∩P1|pp) + Pr(f∩P2|pp) + Pr(f∩P3|pp) On peut ensuite ´ecrire

Pr(f∩P1|pp) = Pr(f∩P1∩pp) Pr(pp)

= Pr(f∩pp|P1) Pr(P1) Pr(pp)

=

1 2·14· 13

61 108

= 9

122.

On trouve de mˆeme Pr(f ∩P2|pp) = 0 et Pr(f∩P3|pp) = 18316. Ainsi, Pr(f |pp) = 59

366≈0.16.

3. Pour quef soit une densit´e, il faut que

1 = c

Z

0

Z

x

exeydydx

= c

Z

0

ex[−ey]x dx

= c

Z

0

e2xdx

= c/2.

Donc

f(x, y) =

2exey, 0< x < y <∞,

0, sinon.

(3)

(a) La loi marginale de X est

fX(x) = Z

x

2exeydy

= 2ex[−ey]x

= 2e2x si 0< x.

La m´edianemest telle que P(X < m) =Rm

0 2e2xdx= 1−e2m= 1/2. Doncm= 1/2 log 2.

E[X] = Z

0

2xe2xdx

= [2x(−1

2e2x)]0 − Z

0

2(−1

2e2x)dx

= Z

0

e2xdx= 1/2.

(b) Le temps d’attente de Xavier estX−Y, donc le temps moyen d’attente est donn´e par E[Y−X].

On a

fY(y) = Z y

0

2exeydx

= 2ey[−ex]y0

= 2ey(1−ey) si 0< y.

E[Y] = Z

0

2y(ey−e2y)dy

= [2y(−ey+1

2e2y)]0 − Z

0

2(−ey+1

2e2y)dy

= Z

0

(2ey−e2y)dy

= [−2ey+1

2e2y]0 = 3/2.

Donc

E[Y −X] = 3/2−1/2 = 1.

4. SoientX1, . . . , Xn

iid∼Pois(λ).

(a) La densit´e de Poisson est donn´ee parf(k) =eλ λk!k, k= 0,1, .... La fonction de log vraisemblance est

l(λ) = Xn

1

log(eλλXi Xi!)

= Xn

1

(−λ+Xilog(λ)−log(Xi!))

= −nλ+ Xn

1

Xilogλ− Xn

1

log(Xi!).

L’estimateur de maximum de vraisemblance est celui qui maximisel(λ), l(λ) =−n+

Xn

1

Xi/λ.

Doncbλn = ¯X. Puisque E[ ¯X] = E[Xi] =λ, alors l’estimateur est non-biais´e.

(4)

(b) On sait que pournassez grand, l’estimateur de maximum de vraisemblance ˆλv´erifie λˆn .

∼ N(λ, J(ˆλn)1), o`u J(ˆλn) est l’information observ´ee ´egale `a −l′′(ˆλn). On a

l′′(ˆλn) =− 1 λˆ2n

Xn

i=1

Xi,

donc

J(ˆλn) = Pn

i=1Xi

λˆ2n = n λˆn

= n X¯, On a donc

ˆλn .

∼ N( ¯X,X¯ n).

Un intervalle de confiance `a 99% est alors (en utilisant quez0.995= 2.58) [ ¯X−2.58p

X/¯ √

n,X¯ + 2.58p X/¯ √

n].

(c) La fonction de log vraisemblance est l(λ) =

Xr

1

log(e(2λ)Yi Yi! ) +

Xn

1

log(eλ(λ)Xi Xi! )

= −2rλ+ Xr

1

Yilog 2λ− Xr

1

log(Yi!)−nλ+ Xn

1

Xilogλ− Xn

1

log(Xi!)

= −(2r+n)λ+ Xr

1

Yilog 2λ+ Xn

1

Xilogλ− Xr

1

log(Yi!)− Xn

1

log(Xi!).

L’estimateur de maximum de vraisemblance est celui qui maximisel(λ), l(λ) =−(2r+n) + (

Xr

1

Yi+ Xn

1

Xi)/λ.

Doncbλ= (Pr

1Yi+Pn

1Xi)/(2r+n).

5. (a) Nous voulons tester si la moyenneµ(estim´ee par ¯X =Pn

i=1xi) du nombre de d´ecilitres par bouteille est (significativement) diff´erente de 2.5 ou non. Ainsi, la situation se formule comme suit :

SoitX1, . . . , Xn

iid∼(µ, σ2) correspondants `a la quantit´e dans lesn= 100 bouteilles (l’ind´ependance paraˆıt cr´edible). Les hypoth`eses nulles et alternatives sont :

H0 : µ= 2.5 H1 : µ6= 2.5

(b) Si les points du graphique ´etaient parfaitement align´es, nous pourrions en conclure imm´ediatement que nos observations sont tr`es probablement issues d’une loi normale (´etant donn´e que les quantiles empiriques correspondraient exactement aux quantiles th´eoriques d’une loi nor- male).

Dans notre cas, comme nous n’avons pas de ligne de r´ef´erence sur notre graphique, il est assez difficile de savoir si les points sont bien align´es ou si une l´eg`ere courbure est pr´esente.

N´eanmoins, il semble que les points ne sont pas loin d’une droite, malgr´e quelques disparit´es au niveau des queues (surtout `a gauche). Ainsi, en tenant compte de la variabilit´e associ´ee aux quantiles empiriques, l’hypoth`ese de normalit´e semble justifi´ee pour cette ´echantillon.

Pour plus de certitude, il faudrait r´ecolter plus de donn´ees.

(5)

(c) Dans le cas o`u les donn´ees sont suppos´ees ind´ependantes et identiquement distribu´ees selon la loiN(µ, σ2), nous savons que :

X¯ −µ

pS2/n∼tn1, pour toutn >1,

o`u tn1 est une loi de Student avecn−1 degr´es de libert´e. Par cons´equent, un intervalle de confiance exacte au niveau 1−2αpourµserait (sous l’hypoth`ese de normalit´e) :

X¯ ±qtn1(α)p S2/n,

o`u qtn1(α) d´enote le quantile de la loitn1 correspondant `a la probabilit´eα. Or, dans le cas o`u le nombre de donn´ees est suffisamment grand (c’est-`a-dire plus que 30 environ), la loi de Student tn1 est bien approxim´ee par une loi normale N(0,1) (avec quantiles zα). Par cons´equent, nous pouvons obtenir un intervalle de confiance approximatif :

X¯ ±zα

pS2/n.

Notons que ce mˆeme intervalle de confiance serait obtenu en relaxant l’hypoth`ese de normalit´e et en appliquant le th´eor`eme central limite pour ¯X.

L’application num´erique donne l’intervalle de confiance suivant au seuil 95% : X¯ ±z0.025

pS2/n= 2.3±1.96·p

0.4/100 = [2.18,2.42].

Comme 2.5 ne fait pas partie de l’intervalle de confiance `a 95%, nous pouvons rejeter l’hy- poth`ese nulleH0 et accepterH1.

Une autre mani`ere d’aborder ce probl`eme est de calculer la probabilit´e sous H0 d’observer une r´ealisation de ¯X correspondant `a 2.3. Pour ce faire, notons que sousH0 nous avons

X¯ ∼N(2.5, σ2/n), et donc

Zn=X¯−2.5

pS2/n ∼tn1≈N(0,1).

L’application num´erique donneZn =−3.16. Puisque sousH0, Pr(|Zn|>3.16) = 0.00157, il est tr`es improbable queH0soit vraie. Par cons´equent, nous pouvons rejeter l’hypoth`ese nulle H0 et accepterH1.

(d) Nous voulons v´erifier si les donn´ees r´ecolt´ees (quantit´es dans les bouteilles) sont conformes avec la valeur standard qu’elles devraient avoir (2.5 dl). En d’autres termes, nous contrˆolons l’ad´equation des donn´ees au mod`ele statistique qui suppose que nos observations doivent avoir une moyenne de 2.5 (l’hypoth`eseH0). Nous supposons donc que la moyenne est r´eellement de 2.5 et v´erifions statistiquement (par la p-valeur) si les donn´ees observ´ees sont conformes avec cette hypoth`ese (si elles sont susceptibles -ou pas- d’avoir ´et´e g´en´er´ees par le mod`ele statistique suppos´e). Si cette probabilit´e est tr`es faible, nous pouvons en conclure avec certitude que l’hypoth`eseH0 est fausse (les donn´ees proviennent d’un autre mod`ele).

Références

Documents relatifs

[r]

— Sinon on place la taille de la ligne de commande dans DI et comme premier octet du tampon COMBUF, on appelle la sous-routine GETBATBYT pour ´ecarter le second caract`ere de passage

Une exp´ erience par coloration a montr´ e qu’une rivi` ere souterraine alimente une r´ esurgence dans la vall´ ee. La rivi` ere souterraine a un d´ ebit tr` es sensible aux

Statistique descriptive mono-vari´ e Bases de R Donn´ ees bi-vari´ ees Tests statistiques.. Objectifs

b - Le fichier ruban-3 initial final.csv contient la longueur de la trajectoire suivie par la pro- cession au d´ ebut (lorsque la tˆ ete atteint le point d’arriv´ e) et ` a la fin de

Pour trouver les coordonn´ ees d’un point dans un rep` ere, on ´ ecrit l’´ equation (vectorielle) caract´ eristique on convertit cette ´ equation en syst` eme num´ erique on

En effet, soit 2p le nombre de tiroirs contenant un nombre impair de cravates: avec p transferts de cravates entre ces tiroirs on obtient que tous les tiroirs ont un nombre pair

Perdre ses photos de vacances : ¸ca n’a pas de