• Aucun résultat trouvé

(1)Corrigé de l’interrogation n 2 Question[4]: Supposons qu’on dispose d’un échantillon(X1

N/A
N/A
Protected

Academic year: 2022

Partager "(1)Corrigé de l’interrogation n 2 Question[4]: Supposons qu’on dispose d’un échantillon(X1"

Copied!
8
0
0

Texte intégral

(1)

Corrigé de l’interrogation n 2 Question[4]:

Supposons qu’on dispose d’un échantillon(X1; X2; :::; Xn)tiré de façon i.i.d. dans une loiN(m; 2):

On cherche à déterminer un intervalle bilatéral de con…ance au niveau1 pour l’espérancem (on se restreint aux intervalles bilatéraux symétriques à cause du caractère symétrique de la loi normale).

On noteXn= n1 Xn i=1

Xi la moyenne empirique, qui est un estimateur convergent dem:

1er cas : l’écart-type est connu.

Il est aisé de montrer que Xn N(m; n2); donc la statistiqueUn dé…nie par Un = Xnp m

n

suit la loiN(0;1):Pour déterminer un intervalle bilatéral de con…ance au niveau1 pour le paramètrem, on commence par chercher le nombre utel que P( u Un u) = 1 : Le caractère symétrique (par rapport à 0) de la densité de la loi N(0;1) permet d’a¢ rmer que u n’est autre que le fractile d’ordre 1 2 de la loi N(0;1) (c’est-à-dire que (u) = 1 2 où est la fonction de répartition deN(0;1)). Une fois que uest déterminé en utilisant une table statistique de la loi N(0;1), il su¢ t d’exploiter le fait queP u Xnp m

n

u =P Xn up

n m Xn+up

n pour pouvoir a¢ rmer queP Xn up

n m Xn+up

n = 1 c’est-à-dire queh

Xn up

n; Xn+up n

i

est un intervalle de con…ance au niveau1 pour l’espérancem:

2nd cas: l’écart-type est inconnu.

Dans ce cas, on ne peut plus utiliser la statistiqueUn qui contient, en plus du paramètre inconnum qu’on cherche à estimer, un autre paramètre inconnu, à savoir :Il va donc falloir utiliser un estimateur convergent de :Pour cela, on introduit la variance empirique modi…ée Sn2 = n11

Xn i=1

Xi Xn 2 qui se trouve être un estimateur convergent (et sans biais) de la variance 2: On peut alors déterminer un intervalle de con…ance pour m car on connaît la loi de la statistique Zn = XnSnm

pn

. En e¤et, on sait que : Zn = XnpSnnm

Tn 1où Tn 1 désigne la loi de Student à n 1 degrés de liberté. Le même argument de symétrie que celui invoqué pourN(0;1)permet d’a¢ rmer que le nombrettel que P( t Zn t) = 1 est le fractile d’ordre 1 2 de la loi Tn 1:Une fois que t est déterminé en utilisant une table statistique de la loiTn 1 , il su¢ t d’exploiter le fait que

P t Xn m

Sn

pn

t

!

=P Xn tSn

pn m Xn+tSn pn pour pouvoir a¢ rmer queh

Xn tpSn

n; Xn+tpSn n

i

est un intervalle de con…ance au niveau1 pour l’espérancem:

Remarque importante : Lorsque la taille de l’échantillon estsu¢ samment grande (en pra- tique, on considère que c’est le cas pourn > 30), on peut approcher la loi Tn 1 par la loi N(0;1).

Dans ces conditions, on a approximativement :

Zn =Xn m

Sn

pn

N(0;1)

ce qui implique que le nombrettel que P( t Zn t) = 1 est le fractile d’ordre1 2 de la loi N(0;1); autrement dit ce n’est autre que le nombre qu’on a appeléudans le traitement du cas d’un écart-type connu. Ceci permet d’a¢ rmer que, dans ce cas particulier,h

Xn upSn

n; Xn+upSn n

i est un intervalle de con…ance au niveau1 pour l’espérance m:

(2)

Une autre façon (plus générale) d’aboutir à ce résultat est de dire que pourn"su¢ samment grand"

on peut approcher la loi de XnSnm

pn

par celle de Xnp m

n

(carSnest un estimateur convergent de ). Ceci revient à dire que lorsquenest su¢ samment grand, on peut remplacer parSndans la relation Xnp m

n

N(0;1), obtenant ainsi que XnpSnm n

N(0;1):

Exercice 1[11]:

1.a. Pour touti2 f1; :::; Ng, on aP(Xi= 1) =petP(Xi= 0) = 1 p:On peut regrouper ces deux égalités, en écrivant que pourxi2 f0;1g; P(Xi=xi) =pxi(1 p)1 xi:La fonction de vraisemblance associée à la loi de Bernouilli de paramètrepest donc:

L(p;x1; x2; :::; xn) = Yn i=1

pxi(1 p)1 xi

La log-vraisemblance d’un échantillon(x1; x2; :::; xn)est donc égale à :

lnL(p;x1; x2; :::; xn) = Xn i=1

[xilnp+ (1 xi) ln(1 p)]

= Xn i=1

xi

!

lnp+ n Xn i=1

xi

!

ln(1 p)

1.b. A…n de déterminer l’estimateur du maximum de vraisemblance, il faut maximiser la log- vraisemblance par rapport à la variable p à (x1; x2; :::; xn) donnés. La première étape consiste à résoudre l’équation correspondant à la condition du premier ordre :

@lnL

@p (p; x1; x2; :::; xn) = 0 or

@lnL

@p (p; x1; x2; :::; xn) = 1 p

Xn i=1

xi

1 1 p n

Xn i=1

xi

!

donc : @@plnL(p; x1; x2; :::; xn) = 0() 1p

Pn i=1

xi = 11p n Pn i=1

xi () (1 p) Pn i=1

xi =p n Pn i=1

xi

d’où @@plnL(p; x1; x2; :::; xn) = 0() Pn i=1

xi p Pn i=1

xi =pn p Pn i=1

xi() Pn i=1

xi=pn()p=n1 Pn i=1

xi La fonctionp!lnL(p; x1; x2; :::; xn)atteint donc un extrémum (c’est-à-dire un maximum ou un minimum) au point p^n =n1

Pn i=1

xi. Il s’agit bien d’un maximum car la fonctionp!lnL(x1; x2; :::; xn; p) est concave. En e¤et, pour tout(p;x1; x2; :::; xn);on a :

@2lnL

@p2 (p; x1; x2; :::; xn) = 1 p2

Xn i=1

xi

1 (1 p)2 n

Xn i=1

xi

!

<0

car Pn i=1

xi 0etn Pn i=1

xi 0(du fait quexi2 f0;1gpour touti) et ces deux quantités ne peuvent pas être simultanément nulles. En particulier, la condition du second ordre @2@pln2L(^pn; x1; x2; :::; xn) <0 est satisfaite.

Conclusion: L’estimateur du maximum de vraisemblance du paramètrepestp^n= 1n Pn i=1

Xi.

(3)

1.c. E(^pn) = n1 Pn i=1

E(Xi) =npn =p(l’estimateurp^n est sans biais).

V(^pn) = V 1n Pn i=1

Xi = n12V Pn i=1

Xi or V Pn i=1

Xi =

Pn i=1

V (Xi) car les Xi sont supposés in- dépendants, donc

V(^pn) = n12

Pn i=1

V(Xi) = n12np(1 p) = p(1np) (rappel: V(Xi) = p(1 p)car Xi suit une loi de Bernouilli de paramètrep).

Il est clair que V(^pn) !

n !+10 donc p^n est un estimateur sans biais dont la variance tend vers0 lorsquentend vers+1, ce qui permet d’a¢ rmer quep^n est un estimateur convergent.

1.d. L’expression de la quantité d’information de Fisher est :

In(p) =E @lnL(p; X1; :::; Xn)

@p

2!

= E @2lnL(p; X1; :::; Xn)

@p2

La deuxième égalité est valable sous les conditions de Cramer-Rao : pour les lois usuelles vues dans ce cours, il su¢ t de véri…er que le support de la loi ne dépend pas du paramètre à estimer. Cest le cas pour la loi de Bernouilli puisque son support estf0;1get ne dépend donc pas du paramètrep.

D’après ce qui précède, on a :

@2lnL(p; X1; :::; Xn)

@p2 = 1

p2 Xn i=1

Xi

1 (1 p)2 n

Xn i=1

Xi

!

donc

E @2lnL(p; X1; :::; Xn)

@p2 = 1

p2 Xn i=1

E(Xi) 1

(1 p)2 n Xn i=1

E(Xi)

!

d’où

E @2lnL(p; X1; :::; Xn)

@p2 = np

p2

n(1 p) (1 p)2 = n

p n

1 p = n+np np

p(1 p) = n

p(1 p) donc

In(p) = n p(1 p) L’estimateurp^n est un estimateur sans biais et sa variance véri…e

V(^pn) = 1 In(p) Il s’agit donc d’un estimateur e¢ cace.

2.a. On sait que n^pn = Pn i=1

Xi B(n; p). Sous l’hypothèse de validité de l’approximation nor- male de la loi binômiale, on approcheB(n; p)par N(np; np(1 p)) ce qui permet d’a¢ rmer qu’on a approximativement : n^pn N(np; np(1 p))d’oùp^n N(p;p(1np))et donc :qp^n p

p(1 p) n

N(0;1) Remarque :l’approximation normale de la loi binômiale n’est rien d’autre qu’un cas particulier de l’approximation issue du théorème central limite pourn"su¢ samment grand", appliquée à la loi de Bernouilli (la notion de "su¢ samment grand" est dans ce cas plus précise puisqu’on estime qu’on peut faire l’approximation lorsquenp(1 p)>15)).

^

pnest un estimateur convergent depdonc pournsu¢ samment grand (on estime que c’est le cas ici), les lois de qp^n p

p(1 p) n

et de qp^n p

pn(1^ pn)^ n

sont "proches", ce qui permet de dire qu’on a approximativement :

^ pn p qp^n(1 p^n)

n

N(0;1)

(4)

PosonsUn = qp^n p

pn(1^ pn)^ n

: P( u Un u) = 0:90 = 2F(u) 1 oùF est la fonction de répartition de la loiN(0;1), d’oùF(u) = 0:95. Sur la table statistique deN(0;1);on trouve : F(1:64) = 0:9495et F(1:65) = 0:9505, or il est clair que 0:95 = 12 0:9495 + 12 0:9505 donc par interpolation linéaire u' 12 1:64 +12 1:65 = 1:645. (Vous pouvez utiliseru= 1;64)

P( 1:645 Un 1:645) =P 0

@ 1:645 p^n p qp^n(1 p^n)

n

1:645 1 A'0:90

donc :

P p^n 1:645

rp^n(1 p^n)

n p p^n+ 1:645

rp^n(1 p^n) n

! '0:90

Pour les valeurs observéesp^n = 0;4et n= 400, on obtient l’intervalle de con…ance pour pau seuil de 90%suivant : [0:36; 0:44]:

2.b. Minorerp(c’est-à-dire chercher une borne inférieure pourp) revient à majorerUn puisqueUn

est clairement décroissante enp. On commence donc par chercher le nombre tel queP(Un ) = 0:95c’est-à-dire tels queF( ) = 0:95(Cf. question précédente) = 1:645: On a donc

P 0

@ p^n p qp^n(1 p^n)

n

1:645 1 A'0:95

qu’on peut réécrire sous la forme

P p p^n+ 1:645

rp^n(1 p^n) n

! '0:95 d’où :

P p p^n 1:645

rp^n(1 p^n) n

! '0:95

doncp^n 1:645

qp^n(1 p^n)

n est une borne inférieure de con…ance à95% pour le paramètrep. Pour une taille d’échantillonn= 400et une valeur observée de0:4pourp^n;cette borne prend la valeur0:36:

Remarque : une borne inférieure de con…ance correspond à un intervalle unilatéralà droite.

2.b. Lorsqu’on veut déterminer une borne supérieure de con…ance pourp;on cherche à majorerp, or majorerprevient à minorerUn. On commence donc par chercher le nombre tel queP(Un ) = 0;95:OrP(Un ) = 1 F( ) =F( )doncF( ) = 0:95; par conséquent, = = 1:645(Cf.

question précédente) d’où = 1:645. On a donc:

P 0

@ p^n p qp^n(1 p^n)

n

1:645 1 A'0:95

qu’on peut réécrire sous la forme :

P p p^n 1:645

rp^n(1 p^n) n

! '0:95 d’où :

P p p^n+ 1:645

rp^n(1 p^n) n

! '0:95

(5)

doncp^n+ 1:645

qp^n(1 p^n)

n est une borne supérieure de con…ance à95% pour le paralètrep:Pour une taille d’échantillonn= 400et une valeur observée de0:4pourp^n;cette borne prend la valeur0:44:

Remarque : une borne supérieure de con…ance correspond à un intervalle unilatéral de con…anceà gauche.

3.a. D’après ce qui précède, on sait quep^n N(p;p(1np)):Par analogie, en posantq^m= m1 Pm j=1

Yj , on a : q^m N(q;q(1mq)):Par ailleurs p^n est une combinaison linéaire deX1; X2; :::; Xn etq^mest une combinaison linéaire deY1; Y2; :::; Ym or les variables X1; X2; :::; Xn; Y1; Y2; :::; Ym sont indépendantes donc les estimateurs p^n et q^m sont indépendants. Il s’avère donc que p^n et q^m sont des variables aléatoires normales indépendantes. Ceci implique quep^n q^msuit une loi normale d’espérance

E(^pn q^m) =E(^pn) E(^qm) =p q et de variance

V(^pn q^m) = V(^pn) +V(^qm) 2cov(^pn;q^m)

| {z }

= 0carp^n et q^m sont indépendants

= p(1 p)

n +q(1 q)

m ce qu’on peut résumer par :

^

pn q^m N p q;p(1 p)

n +q(1 q)

m donc en centrant et en réduisant cette variable, on obtient :

^

pn q^m (p q) qp(1 p)

n +q(1mq)

N(0;1)

Or on sait que si une variable aléatoire U suit la loi N(0;1) alorsP(jUj 1:96) = 0:95 (on obtient classiquement la valeur 1:96 en utilisant la formule P(jUj u) = 2F(u) 1 ou un raisonnement graphique exploitant le caractère symétrique de la densité de la loiN(0;1)), donc

P 0

@ p^n q^m (p q) qp(1 p)

n +q(1mq)

1;96 1 A= 0:95

d’où

P 1;96

rp(1 p)

n +q(1 q)

m p^n q^m (p q) 1;96

rp(1 p)

n +q(1 q)

m

!

= 0;95

donc

P (^pn q^m) 1;96

rp(1 p)

n +q(1 q)

m (p q) (^pn q^m) + 1;96

rp(1 p)

n +q(1 q)

m

!

= 0:95 et par conséquent

P p^n q^m 1;96

rp(1 p)

n +q(1 q)

m p q p^n q^m+ 1;96

rp(1 p)

n +q(1 q)

m

!

= 0:95

(6)

Les bornes d’un intervalle de con…ance ne devant pas contenir de paramètre inconnu, on y remplacepet qpar leurs estimateurs respectifsp^netq^m(cette approximation est valable pournetm"su¢ samment grands" carp^n etq^msont des estimateurs convergents de pet q). Ainsi :

P p^n q^m 1;96

rp^n(1 p^n)

n +q^m(1 q^m)

m p q p^n q^m+ 1;96

rp^n(1 p^n)

n +q^m(1 q^m) m

! '0:95

donc p^n q^m 1:96

qp^n(1 p^n)

n +q^m(1mq^m);p^n q^m+ 1:96

qp^n(1 p^n)

n +q^m(1mq^m) est un intervalle bilatéral de con…ance à95%pourp q:

3.b. Notonsnla taille de l’échantillon masculin, mla taille de l’échantillon féminin,p^n la propor- tion empirique de fumeurs dans l’échantillon masculin etq^mla proportion empirique de fumeuses dans l’échantillon féminin. Les tailles des échantillons sontn= 300etm= 200;la valeur observée dep^n est

105

300 = 0:35 et la valeur observée deq^mest 20048 = 0:24. Il est aisé de véri…er que300 0:35 0:65 = 68:25>15et200 0:24 0:76 = 36:48>15, ce qui permet de considérer que l’approximation normale de la loi binômiale est raisonnable pour les deux échantillons. On peut donc appliquer le résultat de la question précédente: l’intervalleh

0:35 0:24 1:96q

0:35 0:65

300 +0:24 0:76200 ;0:35 0:24 + 1:96q

0:35 0:65

300 +0:24 0:76200 i , c’est-à-dire[0:03;0:19];est un intervalle de con…ance à à95%pour p q:

Exercice 2[10]:

1. L’estimation par la méthode des moindres carrés ordinaires se fait à partir de la minimisation de la somme des carrés des résidus

PN i=1

"2i = PN i=1

(yi 1 2xi)2:Les équations normales s’obtiennent à partir des conditions du premier ordre :

@ PN i=1

(yi 1 2xi)2

@ 2 = 0

@ PN i=1

(yi 1 2xi)2

@ 1 = 0

ces deux conditions étant véri…ées pour 2=c2 et 1=c1: Or

@ PN i=1

(yi 1 2xi)2

@ 2 = 2

PN i=1

xi(yi 1 2xi) = 2 PN i=1

xiyi 1xi 2ax2i = 2 PN i=1

xiyi 2 PN i=1

x2i 1 PN i=1

xi

et

@ PN i=1

(yi 1 2xi)2

@ 1 = 2

PN i=1

(yi 1 2xi) = 2 PN i=1

yi 1N 2i

PN i=1

xi donc les estimateurs c1et c2 véri…ent les deux équations suivantes (dites équations normales) :

XN i=1

xiyi c2XN

i=1

x2i c1XN

i=1

xi= 0 (1)

XN i=1

yi c2XN

i=1

xi c1N = 0 (2)

En divisant parN les deux membres de l’équation (2) on obtient l’expression de c1en fonction de c2: c1=y c2x

(7)

et en remplaçantc1dans l’équation (1) par son expression, on obtient : XN

i=1

xiyi c2 XN i=1

x2i y c2x XN i=1

xi= 0

or PN i=1

xi=N xdonc

XN i=1

xiyi c2 XN i=1

x2i N xy+c2N x2= 0 d’où

c2 XN i=1

x2i c2N x2= XN i=1

xiyi N xy et par conséquent :

c2= PN i=1

xiyi N xy

PN i=1

x2i N x2

2. Les estimateurs des MCOc1etc2sont sans biais, linéaires par rapport aux variables dépendantes yi et de variance minimale dans la classe des estimateurs linéaires sans biais. Cette dernière propriété porte sur l’e¢ cacitérelative des estimateurs des MCO par rapport aux autres estimateurs linéaires sans biais (Théorème de Gauss-Markov). En aucun cas, ceci n’implique que les estimateurs c1 et c2 sont e¢ caces au sens où leur variance atteint la borne FDCR.

Le modèleyi= 1+ 2xi+"ipouri= 1; :::; Npeut se réecrire sous la forme vectorielle : y=X +"

(voir TD), les estimateurs de MCO :b= (X0X) 1 X0y= (X0X) 1 [X0X +"] = (X0X) 1X0X + (X0X) 1"= + (X0X) 1"

E b =E + (X0X) 1" =E( ) +E (X0X) 1" = + (X0X) 1E(")or E(") = 0

E b =

2 4 E c1

E c2 3

5= = 1

2

3. La variance du résidu 2 peut être estimée sans biais par ^2 = N12 PN i=1

^"2i où^"i est dé…ni par

^"i=yi c2xi c1:

4.a. On sait que yi = 1+ 2xi+"i pour i = 1; :::; N donc PN i=1

yi = 1N + 2 PN i=1

xi+ PN i=1

"i. En divisant parN les deux membres de cette équation, on obtient

y= 1+ 2x+"

Ainsi :

yi y= 1+ 2xi+"i ( 1+ 2x+") = 2(xi x) +"i "

autrement dit :

qi=api+ui 4.b. Par linéarité de l’espérance on a :

E(ui) = E("i) E(")

= E("i) 1 N

XN j=1

E("j)

= 0

(8)

car par hypothèseE("1) =E("2) =:::=E("N) = 0 4.c. On a :

V(ui) = V("i ")

= V("i) +V(") 2cov("i; ")

or pour tous i; j tels que i 6= j on a par hypothèse cov("i; "j) = 0 donc V(") = N12V PN j=1

"j

!

=

1 N2

PN j=1

V ("j) =NN22 = N2:Par ailleurs,

cov("i; ") = cov("i; 1 N

XN j=1

"j)

= 1

N XN j=1

cov("i; "j)

= 1

N 0

@cov("i; "i) +X

j6=i

cov("i; "j) 1 A

or pour tous i; j tels que i 6=j on a par hypothèse cov("i; "j) = 0donc cov("i; ") = N1cov("i; "i) =

1

NV("i) = N2:Finalement, on obtient :

V(ui) = 2+N 2

N2 2

2

N

= 2 1 1

N

On a pour tousi; jtels que i6=j:

cov(ui; uj) = cov("i "; "j ")

= cov("i; "j) cov("i; ") cov("; "j) +cov("; ")

Tout d’abord, on sait par hypothèse quecov("i; "j) = 0cari6=j:Ensuite, d’après ce qui précède, on a cov("i; ") = N2 , et de même cov("; "j) = cov("j; ") = N2: En…n, cov("; ") = V(") = N2 toujours d’après ce qui précède. Par conséquent, pour tousi; j tels quei6=j:

cov(ui; uj) =

2

N

2

N +

2

N soit :

cov(ui; uj) =

2

N

Références

Documents relatifs

Specification and Estimation. 2) Donnez leur formule algébrique pour un ajustement simple; la formule matricielle pour un ajustement multiple; donnez aussi les formules de

Dans cet article, nous d´erivons de nouvelles propri´et´es asymptotiques pour l’EVD des M -estimateurs pour des donn´ees ayant une distribution complexe elliptique sym´etrique

Comme les estimateurs sont des estimateurs linéaires des Y t [les Y t dépendent des ε t qui sont aléatoires et obéissent à des lois normales], alors les

Au moyen d’une large expérimentation Monte Carlo, nous étudions le biais, la précision et l’efficacité de capture de quatre estimateurs de capacité : MV, BME, EAP,

On suppose que la probabilité qu’un champignon cueilli soit comestible est p, que le fait qu’un champignon cueilli soit comestible est indépendant du fait que les autres le

L’estimateur retenu pour estimer la variance de la population sera celui qui à chaque échantillon associe la somme des carrés des écarts à la moyenne divisée par n-1.. ENFA

Sous l'hypothèse de bruits de mesure statistiquement indépendants, écrire un programme Matlab qui met en œuvre le filtre de Kalman pour estimer l'état x(k) du système

Décrire la méthode employée pour dire, au seuil de signification α = 1%, si le taux d’équipement en accès internet est différent chez les agriculteurs et chez les ouvriers. (On