• Aucun résultat trouvé

R´ egion de confiance pour un param` etre de dimension k > 1

Dans le document Statistique La théorie et ses applications (Page 174-178)

n−t(n−1)0,975 Sn

√n,X¯n+t(n−1)0,975 Sn

√n

de la proc´edure classique pour la moyenne μ de la loi N(μ , σ2) vue en sec-tion 7.4.1. La largeur de l’intervalle est 2t(n−1)0,975 Snn. Comme Sn2 converge en probabilit´e vers σ2, Sn converge vers σ et la largeur converge en probabilit´e vers 0. Par ailleurs ¯Xn converge versμet cet intervalle se r´eduit `a μ`a l’infini.

Cette propri´et´e de convergence est v´erifi´ee pour tous les intervalles classiques que nous avons pr´esent´es. Elle est ´egalement vraie pour la proc´edure asymp-totique par l’EMV (voir section 7.3) dans la mesure o`u I(ˆθMVn ) converge vers I(θ0) o`uθ0 est la vraie valeur deθ.

7.8 egion de confiance pour un param` etre de dimension k > 1

Pour simplifier nous prendrons k = 2, l’extension `a k quelconque ne pr´ e-sentant pas de difficult´es particuli`eres. Soit donc θ = (θ1, θ2) le param`etre inconnu. Le probl`eme est maintenant de d´eterminer une r´egion al´eatoire du plan qui contienneθavec une probabilit´e donn´ee quel que soit θ.

Supposons d’abord que l’on sache construire s´epar´ement pour chaque com-posante une proc´edure d’IC de niveauγet soitI1etI2les intervalles al´eatoires correspondants. Pour tout θ∈Θ⊆R2, on a alors :

Pθj ∈Ij) =γ, j= 1,2,

en admettant, ´egalement pour simplifier, que la probabilit´eγ est exactement atteinte pour chaqueθ. Consid´erons la r´egion al´eatoire constitu´ee du rectangle I1×I2. Pourθfix´e on a :

Pθ(θ∈I1×I2) =Pθ1∈I1, θ2∈I2) =Pθ((θ1∈I1)∩(θ2∈I2))

qui sera toujours inf´erieur `aγ (sauf cas tr`es particulier o`u l’un des ´ev´enements implique l’autre). G´en´eralement ces deux ´ev´enements seront d´ependants (du fait qu’ils reposent sur les mˆemes observations) et il sera difficile de d´eterminer cette probabilit´e et donc, en prenant la valeur minimale quand θ d´ecrit Θ, de connaˆıtre le niveau de confiance exact associ´e `a la proc´edure consistant

`

a prendre le rectangle au croisement de deux intervalles. Toutefois montrons que l’on peut donner une borne inf´erieure pour cette probabilit´e. Pour ce faire, posonsα= 1−γqui correspond au risque d’erreur de la proc´edure pour chaque composante.

SoitE1etE2deux ´ev´enements quelconques. Le compl´ementaire deE1∩E2 est E1∪E2. Par ailleurs (voir section 1.1) :

P(E1∪E2) =P(E1) +P(E2)−P(E1∩E2)≤P(E1) +P E2).

D’o`u l’in´egalit´e g´en´erale :

P(E1∩E2)≥1−

P E1) +P(E2) .

Appliquant celle-ci aux ´ev´enements (θ1∈I1) et (θ2∈I2) on en d´eduit : Pθ((θ1∈I1)∩(θ2∈I2))≥1−2α.

Ainsi, si l’on vise un niveau de confiance 1−α,on peut le garantir en prenant pour chaque composante un niveau de confiance 1−α2. (Pour le niveau courant de 0,95 on utilisera les IC de niveau 0,975 sur chaque composante). Pour une dimensionkquelconque la m´ethode ci-dessus s’applique en prenant un niveau 1−αk sur chaque composante.

Toutefois cette proc´edure peut s’av´erer tr`es conservatrice, au sens o`u le ni-veau r´eel sera sup´erieur et la r´egion du plan sera donc plus vaste que n´ecessaire.

Il n’est donc pas inutile de rechercher de fa¸con directe une r´egion de niveauγ.

Nous illustrons une approche exacte pour le param`etre (μ, σ2) de la loiN(μ , σ2).

Nous avons vu (proposition 5.3) que ¯X et S2 sont ind´ependants, ce qui implique que ( ¯σ/X−μ)n et (n−1)Sσ2 2 le sont ´egalement. Ces deux derni`eres v.a. ´etant, respectivement, de loisN(0 ; 1) etχ2(n−1) on a, quel que soit (μ, σ2) :

P

−2,24< X¯ −μ σ/√

n <2,24

= 0,975 P

χ2 (n−1)0,0125 <(n−1)S2

σ2 < χ2 (n−1)0,9875

= 0,975

et la probabilit´e que ces deux ´ev´enements aient lieu simultan´ement est donc (0,975)20,95. Ainsi une r´egion de confiance de niveau 0,95 est obtenue en

prenant l’ensemble des points (μ, σ2) du plan tels que :

⎧⎪

⎪⎩

−2,24< ¯x−μ σ/√

n <2,24 χ2 (n−1)0,0125 <(n−1)s2

σ2 < χ2 (n−1)0,9875 ou, de fa¸con ´equivalente :

⎧⎪

⎪⎪

⎪⎪

⎪⎩

σ2− n

(2,24)2(μ−x)¯ 2>0 (n−1)s2

χ2 (n−1)0,9875 < σ2< (n−1)s2 χ2 (n−1)0,0125

.

La premi`ere in´egalit´e correspond, en coordonn´ees (x, y),`a l’int´erieur de la pa-raboley=a(x−x)¯ 2centr´ee sur ¯xo`uavautn/(2,24)2. La seconde d´ecoupe une tranche de cet int´erieur entre les droites horizontales d’´equationsy = (n−1)s2

χ2 (n−1)0,9875

ety= (n−1)s2

χ2 (n−1)0,0125 comme indiqu´e sur la figure 7.2 .

Région de confiance à 95%

pour (μ, σ2)

2,24

0,0125

0,9875 (n − 1)

(n − 1)

Figure 7.2 - R´egion de confiance pour le param`etre (μ, σ2) d’une loi de Gauss.

Signalons bri`evement les ´el´ements permettant d’obtenir des r´egions de confi-ance approximatives dansRk `a partir des propri´et´es du vecteur estimateur du MV. Nous avons indiqu´e en fin de section 6.7.4 que√

n(ˆθMV −θ) converge en

loi vers une loi normale `akdimensions de vecteur des moyennes nul et de ma-trice des variances-covariances [I(θ))]−1. Comme la matriceI(θ) est sym´etrique et d´efinie strictement positive il existe une matrice sym´etrique et d´efinie stric-tement positive dont le carr´e est ´egal `a I(θ) et nous la d´esignons par I(θ)12. Ceci est ´egalement applicable `a [I(θ)]−1 et I(θ)12 est l’inverse de I(θ)12, i.e.

I(θ)12I(θ)12 =Ik, la matrice identit´e d’ordrek.

PosonsX =√

n(ˆθMV −θ) et soitY =I(θ)12X. Selon la proposition 3.13, E(Y) =I(θ)12E(X) = 0 et :

V(Y) =I(θ)12V(X)I(θ)12 =I(θ)12I(θ)−1I(θ)12 =Ik. Ainsi √

nI(θ)12(ˆθMV −θ) a une loi asymptotique N(0,Ik), c’est-`a-dire que toutes les composantes de ce vecteur al´eatoire tendent `a ˆetre ind´ependantes et de loi N(0 ; 1) (voir les d´eveloppements analogues en section 3.9). Par cons´ e-quent la somme des carr´es de ses composantes, ´egale `a :

+√

nI(θ)12(ˆθMV −θ) ,t +√

nI(θ)12(ˆθMV −θ) ,

=n(ˆθMV −θ)tI(θ) (ˆθMV −θ), suit approximativement une loi du khi-deux `ak degr´es de libert´e. En

rempla-¸cant, en deuxi`eme approximation,I(θ) parI(ˆθMV) et en passant `a la r´ealisation de ˆθMV, l’in´equation enθ:

n(ˆθMV −θ)tI(ˆθMV) (ˆθMV −θ)≤χ20,95(k)

d´efinit l’int´erieur d’un ellipso¨ıde centr´e sur ˆθMV qui est une r´egion de confiance de niveau approximatif 0,95.

Appliquant ceci `a (μ, σ2) dans le cas gaussien on a (voir exemple 6.18) : I(μ, σ2) =

1

σ2 0 0 14

et [I(μ, σ2)]−1=

σ2 0 0 2σ4

.

D’o`u la r´egion de confiance au niveau 0,95 (o`u ici la substitutionI(¯x,˜s2) pour I(μ, σ2) n’est pas n´ecessaire) :

n

σ2(μ−x)¯ 2+ n

42−s˜2)2≤χ20,95(2) = 5,99

qui correspond `a l’int´erieur d’une ellipse centr´ee sur l’estimation du MV : (¯x,s˜2). En fait, on montre que cette r´egion est plus int´eressante que celle ob-tenue plus haut car elle est (en esp´erance math´ematique, et pour n pas trop petit) de surface inf´erieure.

Grˆace `a la r´esolution num´erique vue en section 7.3 permettant d’acc´eder

`

a I(ˆθMV), les logiciels peuvent, pour k = 2, tracer les ellipses contenant le param`etre `a un niveau de confiance donn´e.

Dans le document Statistique La théorie et ses applications (Page 174-178)