Exercice 1 Le nombre de demandes hebdomadaires d’un certain produit est une variable al´eatoire X de loi de PoissonP(ϑ), o`uϑ >0 est inconnu

(1)

Universit´e de Cergy-Pontoise 2010– 2011 L3 Math´ematiques, Statistiques

I. Ignatiouk, E. L¨ocherbach

Examen. Avril 2011

Les documents ne sont pas autorisés. Durée de l’épreuve : 3 heures.

Exercice 1

Le nombre de demandes hebdomadaires d’un certain produit est une variable aléatoire X de loi de PoissonP(ϑ), oùϑ >0 est inconnu. On note X₁,· · ·, X_nun n−échantillon de loi P(ϑ) et on considèreX= _n¹(X1+. . .+Xn) et s²_n−1 = _n−1¹ ^Pⁿ_i=1(Xi−X)².

1.(QCM) 3 points (un demi point par bonne r´eponse) a) X est un estimateur sans biais deϑ: vrai.

b) s²_n−1 est un estimateur sans biais deϑ: vrai.

c) X est un estimateur convergent de ϑ: vrai, par la loi des grands nombres.

d) s²_n−1 est un estimateur convergent de ϑ: vrai, loi des grands nombres.

e) X est un estimateur de maximum de vraisemblance pour ϑ: vrai.

f) s²_n−1 est un estimateur de maximum de vraisemblance pourϑ: faux.

g) X est une statistique exhaustive pour ϑ: vrai.

h) s²_n−1 est une statistique exhaustive pourϑ: faux.

2.(QCM) 2 points (un par bonne r´eponse)

a) S=X₁+· · ·+X_n suit la loi Binomiale B(n, ϑ): faux.

b) S=X1+· · ·+Xn suit la loi de Poisson de param`etre ϑ: faux.

c) S=X₁+· · ·+X_n suit la loi de Poisson de param`etre nϑ : vrai.

d) S=X₁+· · ·+X_n suit une loi Gaussienne (normale) : faux.

e) Lorsquen→ ∞, on peut approximer la loi deX par la loi Gaussienne N(µ, σ²) avec µ=σ²=ϑ : faux.

f) Lorsquen→ ∞, on peut approximer la loi deX par la loi Gaussienne N(µ, σ²) avec µ=ϑetσ² = ϑ/n: vrai.

g) (n−1)s²_n−1/ϑsuit la loi χ²_n−1 : faux.

h) Y =√

n(X−ϑ)/sn−1 suit la loi de Student an−1 degr´es de libert´e : faux.

On souhaite maintenant estimer la probabilité p =P_ϑ(X_i = 0). On note K le nombre de fois où l’on a observé X= 0 dans l’echantillon:

K =

n

X

i=1

11_{X_i_=0}.

(2)

3. 2 pointsCalculer p en fonction deϑ :

p=e^−ϑ.

4. 1 + 2 points Identifier la loi de Yi = 11_{X_i_=0} et en d´eduire la loi de K :Yi suit une loi de Bernoulli de param`etre pet doncK une loi B(n, p),une loi binomiale.

5. 1 + 2 + 2 pointsMontrer queK/nest un estimateur sans biais :Comme K∼ B(n, p), E(K) =np), doncE(K/n) =p. et convergent :loi forte des grands nombres!, de p, puis que :

V arϑ(K/n) =e^−2ϑ (e^ϑ−1)

n :

V ar_ϑ(K/n) = 1

n²V ar_ϑ(K)

= 1

n²nV arϑ(Y1)

= 1

np(1−p) = 1 np²(1

p −1).

Comme p=e^−ϑ, cela implique le r´esultat.

6. 2 + 2 points Calculer l’information de Fisher contenue dans l’echantillon X1, . . . , Xn

sur ϑ. En d´eduire que l’estimateur K/n n’est pas optimal pour p : On calcule d’abord l’information de Fisher d’un 1−´echantillon. On commence par calculer la log-vraisemblance.

Soit x∈N^.

h(ϑ, x) = logPϑ({x}) = log(e^−ϑϑ^x/x!) =−ϑ+xlogϑ−log(x!).

On d´erive deux foix par rapport `aϑ:

∂²

∂ϑ²h(ϑ, x) =−x ϑ².

On sait que l’information de Fisher du 1−´echantillon est donn´ee par I(1, ϑ) =−E_ϑ ∂²

∂ϑ²h(ϑ, X₁)

!

= 1

ϑ²E_ϑ(X₁) = 1 ϑ. Puis on utilise que l’information dun−´echantillon est donn´ee par

I(n, ϑ) =nI(1, ϑ) = n ϑ.

On calcule maintenant la borne de Cramer-Rao. Attention : on est en train d’estimer p=g(ϑ) =e^−ϑ.La borne de Cramer-Rao est donc

(g⁰(ϑ))²

I(n, ϑ) =e^−2ϑϑ n,

et il est facile de voir queV ar_ϑ(K/n) est plus grand que cette quantit´e.

(3)

7. On va chercher à améliorer cet estimateur en appliquant le théorème de Rao-Blackwell.

On poseT =E(Y₁ |S). Rappelons qu’ étant donné une variable aléatoireZ, E(Z |S) =g◦S

où g(s) = E(Z | S =s) est l’espérance de Z par rapport à la loi conditionnelle sachant S=s.

i) 2 pointsFormuler le th´eor`eme de Rao-Blackwell : Cours!

ii) 2 + 1 pointsCalculer P(X_i = 0 |S=s) pour tout s∈N^{et en d´}^{eduire que} T = E(Yi |S) =

1− 1

n S

, ∀i= 1, . . . , n.

Tout d’abord :

P(Xi = 0|S=s) = P({X_i = 0} ∩ {S=s}) P(S =s) . Puis,

P({X_i = 0} ∩ {S=s}) =P(X_i = 0,

n

X

j=1,j6=i

X_j =s) =P(X_i = 0)P(

n

X

j=1,j6=i

X_j =s).

Or,^Pⁿ_j=1,j6=iX_j suit une loi de Poisson de param`etre (n−1)p,donc P(

n

X

j=1,j6=i

X_j =s) =e^−(n−1)p((n−1)p)^s s! , etP(X_i= 0) =p=e^−ϑ.

De la mˆeme mani`ere,

P(S=s) =e^−np(np)^s s! . Donc on obtient finalement

P(Xi = 0|S=s) =

n−1 n

s

=

1− 1 n

s

. Puis on utilise queYi ne prend que deux valeurs 0 et 1,donc

E(Y_i|S) =P(Y_i= 1|S) =P(X_i = 0|S) =

1− 1 n

S

.

iii) 2 pointsV´erifier que T =E^(K/n ^|^S):

E(K/n|S) =E(1 n

n

X

i=1

Y_i|S) = 1 n

n

X

i=1

E(Y_i|S) = 1 n

n

X

i=1

1− 1

n S

=T.

iv) 4 pointsMontrer que

V arϑ(T) =e^−2ϑe^ϑ/n−1 < V arϑ(K/n).

Tout d’abord,

V ar_ϑ(T) =E_ϑ(T²)−[E_ϑ(T)]².

(4)

Soit

g(t) =E_ϑ(t^S),

la fonction génératrice deS.CommeS suit une loi de Poisson de paramètre nϑ,nous avons que

g(t) =e^nϑ(t−1). (Il faut faire le calcul, mais c’est facile.)

Donc :

E_ϑ(T²) =E_ϑ

(1− 1 n)^2S

=g((1− 1

n)²) =e^nϑ[⁽¹⁻_n¹⁾²⁻¹] =e^nϑ(ⁿ¹²⁻ⁿ²⁾=e^ϑⁿ^−2ϑ. D’autre part,

E_ϑ(T) =g(1− 1

n) =e^nϑ((1−ⁿ¹⁾⁻¹⁾ =e^−ϑ, et donc finalement

V arϑ(T) =e^−2ϑ^he^ϑ/n−1ⁱ. Il est assez facile de voir que

e^−2ϑ^he^ϑ/n−1ⁱ≤e^−2ϑ (e^ϑ−1) n . (On d´eveloppe la fonction exponentielle.)

Exercice 2

Une ´etude portant sur l’IQ d’enfants de cinq ans donne les valeurs suivantes : 103 112 97 98 111 85 113 97 102

On suppose que ces données sont la réalisation d’unn−échantillonX1, . . . , Xnd’une loiN(m, σ²).

On poseX= (X1+· · ·Xn)/nets²_n−1 = _n−1¹ ^Pⁿ_i=1(Xi−X)². Aide au calculs : pour l’´echantillon observ´e,x= (x₁+· · ·x_n)/n = 102 et s²= _n−1¹ ^Pⁿ_i=1(x_i−x)²= 1045/8 = 130,625.

1.(QCM) 2 points

a) La variable al´eatoire X suit la loi N(m, σ²): faux

b) La variable aléatoire Y = _σ/¹^√_n(X−m) suit la loi de Student à ndegrés de liberté : faux.

c) La variable al´eatoire Z = _s^X−m

n−1

√n suit la loi de Student à n−1 degrés de liberté : faux.

d) La variable al´eatoireW = _s^X^−m

n−1/√

n suit la loi de Student àndegrés de liberté : faux, c’est à n−1 degrés de liberté!

e) La variable aléatoire (n−1)s²_n−1/σ² suit la loi deχ² àn−1 degrés de liberté : vrai ! On souhaite estimer le paramètre m par un intervalle de confiance au risque de 5%.

2.(QCM) 1 + 2 points

a) Il s’agit d’un intervalle [a, b] avec a, b ∈ R ^{tels que} P^(m ^∈ [a, b]) = 0,95 : ce n’est pas tout à fait vrai, car tel que la réponse est formulée, a et b sont des constantes, donc déterministes. La réponse serait vrai si on rempla¸cait a, b∈R ^par ^{a, b} âléatoires. 1 point pour ceux qui ont répondu vrai.

(5)

b) On utilisera la table de la loi N(0,1) : faux.

c) On utilisera la table de la loi de Student à 9 degrés de liberté : faux, il faut utiliser celle de 8 ddl.

d) On utilisera la table de la loi de Student à 8 degrés de liberté : vrai !

e) On utilisera la table de la loi χ² à 8 degrés de liberté : faux pour cette question. La table de la loi duχ² sera utilisée pour estimer la variance!

3.(QCM) 1 + 2 pointsOn considère les variables aléatoiresY,Z etW définies dans la question 1.

En utilisant les tables, on cherchera

a) u >0 tel que P^(Y ^≥^{u) =}P^(Y ^{≤ −u) = 0,}025 : vrai (1 points), si on suppose queσ est connu.

b) u >0 tel que P^(Y ^≥^{u) =}P^(Y ^{≤ −u) = 0,}^{05 : faux.}

c) u >0 tel que P^{(|Z| ≤}^{u) = 0,}^{95 : faux,} ^Z n’est pas la bonne variable.

d) u >0 et v >0 tels que P⁽⁽ⁿ⁻^1)s²n−1/σ² ≤u) =P⁽⁽ⁿ⁻^1)s²n−1/σ² ≤v) = 0,025 : faux : on ne veut pas estimer la variance.

e) u >0 tel que P^(W ^≤^{u) = 0,}975 : vrai (2 points)

4.(QCU) 3 pointsOn d´eduit un intervalle de confiance [a, b] pour m au risque de 5%:

a) [a, b] = [102−0,6534σ; 102 + 0,6534σ] : faux.

b) [a, b] = [102−0,5483σ; 102 + 0,5483σ]: faux.

c) [a, b] = [102−6,918s; 102 + 6,918s] :faux.

d) [a, b] = [102−0,754s; 102 + 0,754s] : faux.

e) [a, b] = [102−0,7687s; 102 + 0,7687s] : vrai (3 points).

Preuve de e) : Tout d’abord il faut chercher u tel que P(W > u) = 0,025.

CommeW suit une loi de Student `a 8 ddl, on trouve dans la table : u= 2,31.

Rappelons que

W = X−m sn−1/√

n = 3X¯ −m s . Donc,

W > u⇔X¯ −m > s·u

3 = 0,77·s.

Donce) est vrai, car ¯X = 102.

Maintenant, on veut tester l’hypoth`ese H₀ :m= 100 contre H₁ :m= 108 au risque de premier esp`eceα= 0,1.

1.(QCM) 3 points

a) Le risque de première espèce α est égale à la probabilité de se tromper en rejettant l’hypothèse H₀ : vrai.

(6)

b) Le risque de première espèceαest égale à la probabilité de se tromper lorsqueH0 est vraie : vrai.

c) Le risque de première espèce α est égale à la probabilité de se tromper en acceptant l’hypothèse H0 : faux.

d) Le risque de deuxième espèceβ est égale à la probabilité de se tromper en rejettant l’hypothèse H0 : faux.

e) Le risque de deuxième espèceβ est égale à la probabilité de se tromper en acceptant l’hypothèse H₀ : vrai.

2. 2 points Rappeler la définition de la région critique W d’un test : la décision d’un test se fait usuellement à l’aide d’une statistique de test T et de la région critique W de telle manière à ce que lorsque{T ∈W}alors le test se décide pour H1,sinon pour H0.

3.(QCU) 2 points Pour résoudre le problème du test on utilisera une région critique W du type W ={X−m∈I}

a) avec I =]− ∞, A], A∈R^,^et^m= 102 :faux.

b) avec I =]− ∞, A], A∈R^,^et^m= 100 : faux.

c) avec I =]− ∞, A], A∈R^,^et^m= 108 : faux.

d) avec I = [A,+∞[, A∈R^,^et^m= 100 : vrai.

e) avec I = [A,+∞[, A∈R^,^et^m= 102 : faux.

f) avec I = [A,+∞[, A∈R^,^et^m= 108 : faux.

4.(QCM) 2 + 2 points

a) D’apr`es le test, on doit accepter l’hypoth`eseH₀ au risqueα= 0,1 : vrai.

b) On calcule le risque de deuxi`eme esp`eceβen utilisant la table de la loiN(0,1) : faux.

c) 0,2≤β ≤0,3 : vrai.

d) 0,4≤β ≤0,6 : faux.

e) β <0,2 : faux.

f) Si on change la valeur de α en prenant α = 0,05 alors la valeur de β va diminuer : faux.

Preuve : On cherche donc une région critique du type {X¯ −100> A}.Pour contrôler le risque de premier espèce il faut calculer

P100( ¯X−100> A) =P100

X¯ −100 s/√

n >

√n s A

!

=P(W > 3 sA).

Il faut choisirA tel que

P(W > 3

sA)≤0,1.

D’apr`es la table,

3

sA= 1,4.

Donc

A= s

3·1,4 = 5,334.

(7)

Dans notre cas, ¯x−m= 2 et 2 n’est pas plus grand queA,donc le test ne rejette pasH0. Donc a) est vrai.

On va maintenant calculerβ :

β = P₁₀₈( ¯X−100<5,334)

= P108( ¯X−108<5,334−8)

= P108( ¯X−108<−3,334)

= P(W <−3

s ·3,334)

= P(W >0,875).

Ici, W suit une loi de Student de 8 ddl. Nous avons que d’une part P(W >0,875)≤P(W >0,71) = 0,25 et d’autre part

P(W >0,875)≥P(W >0,89) = 0,2, donc

β ∈[0,2,0,25).

Finalement, pour voir que f) est faux, prenons α= 0,05.Donc d’apr`es la table, 3

sA= 1,86, doncA= 7,086.

Du coup

β=P(W < 3

s(A−8)) =P(W > 3

s·0,91) est plus grand que dans le casα= 0,1.

Exercice 1 Le nombre de demandes hebdomadaires d’un certain produit est une variable al´eatoire X de loi de PoissonP(ϑ), o`uϑ &gt;0 est inconnu

Exercice 1 Le nombre de demandes hebdomadaires d’un certain produit est une variable al´eatoire X de loi de PoissonP(ϑ), o`uϑ >0 est inconnu