EXERCICE 8.1 Montrer que la densit´e de la loiTn est de la forme (9.5).
EXERCICE 8.2 Approximation des loisχ2n etTn.
Soit (Zn)n une suite de variables al´eaoires r´eelles avecZn de loiχ2n.
8.7 – Exercices sur le chapitre8 173
1. Montrer que ((Zn−n)/√
2n)n converge en loi vers une loi gaussienne centr´ee r´eduite.
2. En d´eduire que (√
2Zn−√
2n−1)n converge en loi vers une loi gaussienne centr´ee r´eduite.
La qualit´e de la seconde approximation est en fait l´eg`erement meilleure que la premi`ere.
Soit (ζn)n une suite de variables al´eatoires r´eelles avecζn de loiTn.
3. Montrer que (ζn)n converge en loi vers une loi gaussienne centr´ee r´eduite.
EXERCICE 8.3 R´eduction de variance dans une m´ethode de Monte Carlo.
Soit g une fonction mesurable telle que 0 ≤ g ≤ 1. On souhaite calculer m = R1
0 g(x)dx. Soient X et Y des variables ind´ependantes et identiquement distribu´ees, de loi uniforme sur [0,1] et
U =1Y≤g(X), V =g(X) et W = g(X) +g(1−X)
2 .
1. Calculer l’esp´erance et la variance deU,V etW.
2. Proposer 3 m´ethodes de type Monte-Carlo pour calculerm.
On suppose dans la suite queg est monotone.
3. Montrer que (g(x)−g(y))(g(1−x)−g(1−y))≤0 pour tousx, y.
4. Soit (Xi)i≥1 une suite de variables al´eatoires ind´ependantes et de mˆeme loi uniforme sur [0,1]. Des estimateurs
An= 1 lequel est le meilleur pour calculerm?
5. Pour g(x) = x2, d´eterminer pour chaque estimateur An et Bn combien de simulations sont n´ecessaires pour obtenir une pr´ecision relative de l’ordre de 1% sur le calcul demavec probabilit´e 95%.
EXERCICE 8.4 Soitm un entier strictement positif fix´e. On consid`ere le mod`ele binomial `a mfix´e,X ={0,1, . . . , m},
P =
B(m, θ), θ∈[0,1] . On observe unn-´echantillon (X1, . . . , Xn).
1. D´eterminer un estimateur deθpar la m´ethode des moments.
2. Donner l’Estimateur du Maximum de Vraisemblance deθ.
EXERCICE 8.5 On mod´elise la hauteur maximale annuelle d’un fleuve (ex-prim´ee en m`etres) par une variable al´eatoire dite de Rayleigh de densit´e p(x, a) =
x
aexp(−x2a2)1]0,+∞[(x) o`u a >0 est un param`etre inconnu.
1. Calculer l’esp´erance Ea(X) d’une variable al´eatoire X de loi de Rayleigh de param`etrea. Calculer aussiEa(X2) etEa(X4).
2. On observe unn-´echantillon (X1, . . . , Xn) suivant cette loi. Donner l’Estima-teur du Maximum de Vraisemblance ˆandea. Cet estimateur est-il sans biais ? convergent ? V´erifier qu’il est asymptotiquement normal et identifier la variance asymptotique.
3. Pendant une p´eriode de huit ans, on a observ´e les hauteurs maximales en m`etres suivantes pour le fleuve : (x1, . . . , x8) = (2,5,1,8,2,9,0,9,2,1,1,7,2,2,2,8). On a P8
i=1x2i = 38,69. Une compagnie d’assurance estime qu’une crue catastro-phique avec une hauteur de 6 m`etres au moins n’arrive au plus qu’une fois tous les mille ans. Est-ce justifi´e ?
Chapitre 9
Statistique : Intervalle de confiance
I only believe in statistics that I doctored myself.
Winston Churchill
9.1 Intervalle de confiance et estimation
L’estimation d’un param`etre, mˆeme dans le cas d’un estimateur convergent, don-nera une valeur diff´erente de la vraie valeur inconnue. Ce qu’on peut dire, c’est que cette valeur inconnue est proche de la valeur estim´ee, mais tout l’art du statisticien est de quantifier cette erreur par nature al´eatoire. Pour r´epondre rigoureusement au probl`eme de l’estimation d’un param`etre, il est agr´eable de pouvoir donner un inter-valle tel que le param`etre inconnu en fasse partie avec une grande probabilit´e donn´ee.
D´efinition 9.1 Soit (X,A,P) un mod`ele statistique, avec P = {Pθ,θ ∈ Θ}. Soit g : Θ → R. Soit α ∈]0,1[. On dit qu’un intervalle IX qui s’exprime en fonction d’un n-´echantillon X est un intervalle de confiance pour g(θ)de niveau 1−α si pour tout θ∈Θ:
Pθ g(θ)∈IX
= 1−α .
Lorsque pour toutθ∈Θ, on aPθ(g(θ)∈IX)≥1−α, on parle d’intervalle de confiance de niveau1−αpar exc`es.
175
x
Figure9.1 – D´etermination du quantileqr d’ordrer= 0,95 d’une loi `a partir de la fonction de r´epartitionF(x) de la loi (gauche) et `a partir de la densit´ef(x) de la loi (droite). Ici on a pris le cas d’une loi gaussienne centr´ee r´eduite.
L’intervalle de confianceIXest donc al´eatoire dans le sens o`u ses bornes d´ependent de l’´echantillon X. Lorsqu’on observe un ´echantillon, on peut affirmer que la vraie valeurg(θ) appartient `a l’intervalleIX construit `a partir de l’´echantillon observ´e avec une certitude (ou niveau de confiance) prescrite `a l’avance.
Les niveaux usuels sont 90%, 95%, et 99% et correspondent respectivement `a α= 0,1,α= 0,05 etα= 0,01.
Pour construire des intervalles de confiance, il est tr`es utile d’introduire la notion de quantile.
D´efinition 9.2 On consid`ere la loi d’une variable al´eatoire r´eelle de fonction de r´epartitionF. Pourr∈]0,1[, on appelle quantile (ou fractile) d’ordrerde la loi le nombre
qr= inf
x∈R, F(x)≥r .
Lorsque la fonction de r´epartition F est continue et strictement croissante (par exemple quand la v.a. poss`ede une densit´e strictement positive, comme sur la figure 9.1), elle est inversible d’inverse F−1 et pour tout r ∈]0,1[, on aqr =F−1(r). Par exemple, la m´ediane est le quantile d’ordre 1/2 : Une v.a. r´eelle a autant de chances d’ˆetre plus petite ou plus grande que la m´ediane. Le premier quartile est le quantile d’ordre 1/4 : Une v.a. r´eelle a une chance sur quatre d’ˆetre plus petite et trois chances sur quatre d’ˆetre plus grande que le premier quartile.
La fonction de r´epartition est toujours croissante, ce qui entraˆıne la croissance de r7→qr. Pour construire des intervalles de confiance et des tests, nous utiliserons les propri´et´es suivantes :
9.1 – Intervalle de confiance et estimation 177
Proposition 9.3 On suppose que la loi de la v.a. r´eelleX de fonction de r´epartition F poss`ede une densit´e. Les quantiles de la loi satisfont alors les propri´et´es suivantes.
1. Pour toutr∈]0,1[,F(qr) =r.
2. Pour toutα∈]0,1[,P(X6∈[qα/2, q1−α/2]) =P(X < qα) =P(X > q1−α) =α.
3. Pour tout α ∈]0,1[, P(X ∈ [qα/2, q1−α/2]) = P(X ≥ qα) = P(X ≤q1−α) = 1−α.
4. Si la loi deX est sym´etrique (i.e. la densit´e est une fonction paire), alors pour toutα∈]0,1[,P(|X|> q1−α/2) =αetP(|X| ≤q1−α/2) = 1−α.
Preuve.1.Pour touty < qr, on aF(y)< ret par croissance deF, pour touty > qr, F(y)≥r. CommeF est continue, on en d´eduit queF(qr) =r.
2. Le r´esultat se d´eduit des ´egalit´es P(X < qr) = P(X ≤ qr) = F(qr) = r et P(X > qr) = 1−F(qr) = 1−r.
3.Ce point s’obtient par passage au compl´ementaire.
4. Lorsque la densit´e deX est une fonction paire, la variable al´eatoire −X a mˆeme loi queX. En outreF(0) = 1/2, ce qui entraˆıne queq1−α/2>0. Donc :
P |X|> q1−α/2
= P X <−q1−α/2
+P X > q1−α/2
= P(−X > q1−α/2) +P(X > q1−α/2
= 2P(X > q1−α/2)
= α ,
et la derni`ere propri´et´e s’en d´eduit par passage au compl´ementaire.
Pour obtenir des intervalles de confiance sur la moyenne et la variance d’une loi inconnue dont on a un ´echantillon, on a besoin de certaines propri´et´es sur des estimateurs, tels que la moyenne empirique, la variance empirique non-biais´ee, la moyenne empirique renormalis´ee par la variance empirique non-biais´ee, etc. Il est
´etabli dans la section pr´ec´edente que, avec probabilit´e 1 : Xnn→+∞−→ µetVnn→+∞−→ σ2,
c’est-`a-dire que la moyenne empirique (8.3) et la variance empirique non-biais´ee (8.7) sont des estimateurs convergents de l’esp´eranceµet de la varianceσ2. Mais on a besoin de plus. Pour r´esumer, il arrive dans certains cas qu’on puisse caract´eriser enti`erement la loi des estimateurs, ce qui permet de construire des intervalles de confiance exacts (et valables pour toutn). Mais le plus souvent la situation est trop compliqu´ee, et on se sert alors des propri´et´es aymptotiques des estimateurs (en particulier, la normalit´e asymptotique) pour construire des intervalles de confiance asymptotiques, qui sont valables pournsuffisamment grand.