• Aucun résultat trouvé

Exercices sur le chapitre 8

EXERCICE 8.1 Montrer que la densit´e de la loiTn est de la forme (9.5).

EXERCICE 8.2 Approximation des loisχ2n etTn.

Soit (Zn)n une suite de variables al´eaoires r´eelles avecZn de loiχ2n.

8.7 – Exercices sur le chapitre8 173

1. Montrer que ((Zn−n)/√

2n)n converge en loi vers une loi gaussienne centr´ee r´eduite.

2. En d´eduire que (√

2Zn−√

2n−1)n converge en loi vers une loi gaussienne centr´ee r´eduite.

La qualit´e de la seconde approximation est en fait l´eg`erement meilleure que la premi`ere.

Soit (ζn)n une suite de variables al´eatoires r´eelles avecζn de loiTn.

3. Montrer que (ζn)n converge en loi vers une loi gaussienne centr´ee r´eduite.

EXERCICE 8.3 R´eduction de variance dans une m´ethode de Monte Carlo.

Soit g une fonction mesurable telle que 0 ≤ g ≤ 1. On souhaite calculer m = R1

0 g(x)dx. Soient X et Y des variables ind´ependantes et identiquement distribu´ees, de loi uniforme sur [0,1] et

U =1Y≤g(X), V =g(X) et W = g(X) +g(1−X)

2 .

1. Calculer l’esp´erance et la variance deU,V etW.

2. Proposer 3 m´ethodes de type Monte-Carlo pour calculerm.

On suppose dans la suite queg est monotone.

3. Montrer que (g(x)−g(y))(g(1−x)−g(1−y))≤0 pour tousx, y.

4. Soit (Xi)i≥1 une suite de variables al´eatoires ind´ependantes et de mˆeme loi uniforme sur [0,1]. Des estimateurs

An= 1 lequel est le meilleur pour calculerm?

5. Pour g(x) = x2, d´eterminer pour chaque estimateur An et Bn combien de simulations sont n´ecessaires pour obtenir une pr´ecision relative de l’ordre de 1% sur le calcul demavec probabilit´e 95%.

EXERCICE 8.4 Soitm un entier strictement positif fix´e. On consid`ere le mod`ele binomial `a mfix´e,X ={0,1, . . . , m},

P =

B(m, θ), θ∈[0,1] . On observe unn-´echantillon (X1, . . . , Xn).

1. D´eterminer un estimateur deθpar la m´ethode des moments.

2. Donner l’Estimateur du Maximum de Vraisemblance deθ.

EXERCICE 8.5 On mod´elise la hauteur maximale annuelle d’un fleuve (ex-prim´ee en m`etres) par une variable al´eatoire dite de Rayleigh de densit´e p(x, a) =

x

aexp(−x2a2)1]0,+∞[(x) o`u a >0 est un param`etre inconnu.

1. Calculer l’esp´erance Ea(X) d’une variable al´eatoire X de loi de Rayleigh de param`etrea. Calculer aussiEa(X2) etEa(X4).

2. On observe unn-´echantillon (X1, . . . , Xn) suivant cette loi. Donner l’Estima-teur du Maximum de Vraisemblance ˆandea. Cet estimateur est-il sans biais ? convergent ? V´erifier qu’il est asymptotiquement normal et identifier la variance asymptotique.

3. Pendant une p´eriode de huit ans, on a observ´e les hauteurs maximales en m`etres suivantes pour le fleuve : (x1, . . . , x8) = (2,5,1,8,2,9,0,9,2,1,1,7,2,2,2,8). On a P8

i=1x2i = 38,69. Une compagnie d’assurance estime qu’une crue catastro-phique avec une hauteur de 6 m`etres au moins n’arrive au plus qu’une fois tous les mille ans. Est-ce justifi´e ?

Chapitre 9

Statistique : Intervalle de confiance

I only believe in statistics that I doctored myself.

Winston Churchill

9.1 Intervalle de confiance et estimation

L’estimation d’un param`etre, mˆeme dans le cas d’un estimateur convergent, don-nera une valeur diff´erente de la vraie valeur inconnue. Ce qu’on peut dire, c’est que cette valeur inconnue est proche de la valeur estim´ee, mais tout l’art du statisticien est de quantifier cette erreur par nature al´eatoire. Pour r´epondre rigoureusement au probl`eme de l’estimation d’un param`etre, il est agr´eable de pouvoir donner un inter-valle tel que le param`etre inconnu en fasse partie avec une grande probabilit´e donn´ee.

D´efinition 9.1 Soit (X,A,P) un mod`ele statistique, avec P = {Pθ,θ ∈ Θ}. Soit g : Θ → R. Soit α ∈]0,1[. On dit qu’un intervalle IX qui s’exprime en fonction d’un n-´echantillon X est un intervalle de confiance pour g(θ)de niveau 1−α si pour tout θ∈Θ:

Pθ g(θ)∈IX

= 1−α .

Lorsque pour toutθ∈Θ, on aPθ(g(θ)∈IX)≥1−α, on parle d’intervalle de confiance de niveau1−αpar exc`es.

175

x

Figure9.1 – D´etermination du quantileqr d’ordrer= 0,95 d’une loi `a partir de la fonction de r´epartitionF(x) de la loi (gauche) et `a partir de la densit´ef(x) de la loi (droite). Ici on a pris le cas d’une loi gaussienne centr´ee r´eduite.

L’intervalle de confianceIXest donc al´eatoire dans le sens o`u ses bornes d´ependent de l’´echantillon X. Lorsqu’on observe un ´echantillon, on peut affirmer que la vraie valeurg(θ) appartient `a l’intervalleIX construit `a partir de l’´echantillon observ´e avec une certitude (ou niveau de confiance) prescrite `a l’avance.

Les niveaux usuels sont 90%, 95%, et 99% et correspondent respectivement `a α= 0,1,α= 0,05 etα= 0,01.

Pour construire des intervalles de confiance, il est tr`es utile d’introduire la notion de quantile.

D´efinition 9.2 On consid`ere la loi d’une variable al´eatoire r´eelle de fonction de r´epartitionF. Pourr∈]0,1[, on appelle quantile (ou fractile) d’ordrerde la loi le nombre

qr= inf

x∈R, F(x)≥r .

Lorsque la fonction de r´epartition F est continue et strictement croissante (par exemple quand la v.a. poss`ede une densit´e strictement positive, comme sur la figure 9.1), elle est inversible d’inverse F−1 et pour tout r ∈]0,1[, on aqr =F−1(r). Par exemple, la m´ediane est le quantile d’ordre 1/2 : Une v.a. r´eelle a autant de chances d’ˆetre plus petite ou plus grande que la m´ediane. Le premier quartile est le quantile d’ordre 1/4 : Une v.a. r´eelle a une chance sur quatre d’ˆetre plus petite et trois chances sur quatre d’ˆetre plus grande que le premier quartile.

La fonction de r´epartition est toujours croissante, ce qui entraˆıne la croissance de r7→qr. Pour construire des intervalles de confiance et des tests, nous utiliserons les propri´et´es suivantes :

9.1 – Intervalle de confiance et estimation 177

Proposition 9.3 On suppose que la loi de la v.a. r´eelleX de fonction de r´epartition F poss`ede une densit´e. Les quantiles de la loi satisfont alors les propri´et´es suivantes.

1. Pour toutr∈]0,1[,F(qr) =r.

2. Pour toutα∈]0,1[,P(X6∈[qα/2, q1−α/2]) =P(X < qα) =P(X > q1−α) =α.

3. Pour tout α ∈]0,1[, P(X ∈ [qα/2, q1−α/2]) = P(X ≥ qα) = P(X ≤q1−α) = 1−α.

4. Si la loi deX est sym´etrique (i.e. la densit´e est une fonction paire), alors pour toutα∈]0,1[,P(|X|> q1−α/2) =αetP(|X| ≤q1−α/2) = 1−α.

Preuve.1.Pour touty < qr, on aF(y)< ret par croissance deF, pour touty > qr, F(y)≥r. CommeF est continue, on en d´eduit queF(qr) =r.

2. Le r´esultat se d´eduit des ´egalit´es P(X < qr) = P(X ≤ qr) = F(qr) = r et P(X > qr) = 1−F(qr) = 1−r.

3.Ce point s’obtient par passage au compl´ementaire.

4. Lorsque la densit´e deX est une fonction paire, la variable al´eatoire −X a mˆeme loi queX. En outreF(0) = 1/2, ce qui entraˆıne queq1−α/2>0. Donc :

P |X|> q1−α/2

= P X <−q1−α/2

+P X > q1−α/2

= P(−X > q1−α/2) +P(X > q1−α/2

= 2P(X > q1−α/2)

= α ,

et la derni`ere propri´et´e s’en d´eduit par passage au compl´ementaire.

Pour obtenir des intervalles de confiance sur la moyenne et la variance d’une loi inconnue dont on a un ´echantillon, on a besoin de certaines propri´et´es sur des estimateurs, tels que la moyenne empirique, la variance empirique non-biais´ee, la moyenne empirique renormalis´ee par la variance empirique non-biais´ee, etc. Il est

´etabli dans la section pr´ec´edente que, avec probabilit´e 1 : Xnn→+∞−→ µetVnn→+∞−→ σ2,

c’est-`a-dire que la moyenne empirique (8.3) et la variance empirique non-biais´ee (8.7) sont des estimateurs convergents de l’esp´eranceµet de la varianceσ2. Mais on a besoin de plus. Pour r´esumer, il arrive dans certains cas qu’on puisse caract´eriser enti`erement la loi des estimateurs, ce qui permet de construire des intervalles de confiance exacts (et valables pour toutn). Mais le plus souvent la situation est trop compliqu´ee, et on se sert alors des propri´et´es aymptotiques des estimateurs (en particulier, la normalit´e asymptotique) pour construire des intervalles de confiance asymptotiques, qui sont valables pournsuffisamment grand.