Exercices sur le chapitre 8 - JosselinGarnier,SylvieMéléard,NizarTouzi Aléatoire

EXERCICE 8.1 Montrer que la densit´e de la loiTn est de la forme (9.5).

EXERCICE 8.2 Approximation des loisχ²_n etTn.

Soit (Zn)n une suite de variables al´eaoires r´eelles avecZn de loiχ²_n.

8.7 – Exercices sur le chapitre8 173

1. Montrer que ((Z_n−n)/√

2n)_n converge en loi vers une loi gaussienne centr´ee r´eduite.

2. En d´eduire que (√

2Z_n−√

2n−1)_n converge en loi vers une loi gaussienne centr´ee r´eduite.

La qualité de la seconde approximation est en fait légèrement meilleure que la première.

Soit (ζn)n une suite de variables al´eatoires r´eelles avecζn de loiTn.

3. Montrer que (ζn)n converge en loi vers une loi gaussienne centr´ee r´eduite.

EXERCICE 8.3 R´eduction de variance dans une m´ethode de Monte Carlo.

Soit g une fonction mesurable telle que 0 ≤ g ≤ 1. On souhaite calculer m = R1

0 g(x)dx. Soient X et Y des variables ind´ependantes et identiquement distribu´ees, de loi uniforme sur [0,1] et

U =1_Y_≤g(X), V =g(X) et W = g(X) +g(1−X)

2 .

1. Calculer l’esp´erance et la variance deU,V etW.

2. Proposer 3 m´ethodes de type Monte-Carlo pour calculerm.

On suppose dans la suite queg est monotone.

3. Montrer que (g(x)−g(y))(g(1−x)−g(1−y))≤0 pour tousx, y.

4. Soit (Xi)_i≥1 une suite de variables aléatoires indépendantes et de même loi uniforme sur [0,1]. Des estimateurs

A_n= 1 lequel est le meilleur pour calculerm?

5. Pour g(x) = x², déterminer pour chaque estimateur An et Bn combien de simulations sont nécessaires pour obtenir une précision relative de l’ordre de 1% sur le calcul demavec probabilité 95%.

EXERCICE 8.4 Soitm un entier strictement positif fixé. On considère le modèle binomial à mfixé,X ={0,1, . . . , m},

P =

B(m, θ), θ∈[0,1] . On observe unn-´echantillon (X1, . . . , Xn).

1. D´eterminer un estimateur deθpar la m´ethode des moments.

2. Donner l’Estimateur du Maximum de Vraisemblance deθ.

EXERCICE 8.5 On modélise la hauteur maximale annuelle d’un fleuve (ex-primée en mètres) par une variable aléatoire dite de Rayleigh de densité p(x, a) =

aexp(−^x_2a²)1_]0,+∞[(x) o`u a >0 est un param`etre inconnu.

1. Calculer l’espérance Ea(X) d’une variable aléatoire X de loi de Rayleigh de paramètrea. Calculer aussiEa(X²) etEa(X⁴).

2. On observe unn-échantillon (X₁, . . . , X_n) suivant cette loi. Donner l’Estima-teur du Maximum de Vraisemblance â_ndea. Cet estimateur est-il sans biais ? convergent ? Vérifier qu’il est asymptotiquement normal et identifier la variance asymptotique.

3. Pendant une période de huit ans, on a observé les hauteurs maximales en mètres suivantes pour le fleuve : (x₁, . . . , x₈) = (2,5,1,8,2,9,0,9,2,1,1,7,2,2,2,8). On a P8

i=1x²_i = 38,69. Une compagnie d’assurance estime qu’une crue catastro-phique avec une hauteur de 6 m`etres au moins n’arrive au plus qu’une fois tous les mille ans. Est-ce justifi´e ?

Chapitre 9

Statistique : Intervalle de confiance

I only believe in statistics that I doctored myself.

Winston Churchill

9.1 Intervalle de confiance et estimation

L’estimation d’un paramètre, même dans le cas d’un estimateur convergent, don-nera une valeur différente de la vraie valeur inconnue. Ce qu’on peut dire, c’est que cette valeur inconnue est proche de la valeur estimée, mais tout l’art du statisticien est de quantifier cette erreur par nature aléatoire. Pour répondre rigoureusement au problème de l’estimation d’un paramètre, il est agréable de pouvoir donner un inter-valle tel que le paramètre inconnu en fasse partie avec une grande probabilité donnée.

Définition 9.1 Soit (X,A,P) un modèle statistique, avec P = {Pθ,θ ∈ Θ}. Soit g : Θ → R. Soit α ∈]0,1[. On dit qu’un intervalle IX qui s’exprime en fonction d’un n-échantillon X est un intervalle de confiance pour g(θ)de niveau 1−α si pour tout θ∈Θ:

Pθ g(θ)∈I_X

= 1−α .

Lorsque pour toutθ∈Θ, on aP^θ(g(θ)∈IX)≥1−α, on parle d’intervalle de confiance de niveau1−αpar exc`es.

175

Figure9.1 – Détermination du quantileqr d’ordrer= 0,95 d’une loi à partir de la fonction de répartitionF(x) de la loi (gauche) et à partir de la densitéf(x) de la loi (droite). Ici on a pris le cas d’une loi gaussienne centrée réduite.

L’intervalle de confianceI_Xest donc aléatoire dans le sens où ses bornes dépendent de l’échantillon X. Lorsqu’on observe un échantillon, on peut affirmer que la vraie valeurg(θ) appartient à l’intervalleI_X construit à partir de l’échantillon observé avec une certitude (ou niveau de confiance) prescrite à l’avance.

Les niveaux usuels sont 90%, 95%, et 99% et correspondent respectivement `a α= 0,1,α= 0,05 etα= 0,01.

Pour construire des intervalles de confiance, il est tr`es utile d’introduire la notion de quantile.

Définition 9.2 On considère la loi d’une variable aléatoire réelle de fonction de répartitionF. Pourr∈]0,1[, on appelle quantile (ou fractile) d’ordrerde la loi le nombre

qr= inf

x∈R, F(x)≥r .

Lorsque la fonction de répartition F est continue et strictement croissante (par exemple quand la v.a. possède une densité strictement positive, comme sur la figure 9.1), elle est inversible d’inverse F⁻¹ et pour tout r ∈]0,1[, on aqr =F⁻¹(r). Par exemple, la médiane est le quantile d’ordre 1/2 : Une v.a. réelle a autant de chances d’être plus petite ou plus grande que la médiane. Le premier quartile est le quantile d’ordre 1/4 : Une v.a. réelle a une chance sur quatre d’être plus petite et trois chances sur quatre d’être plus grande que le premier quartile.

La fonction de répartition est toujours croissante, ce qui entraˆıne la croissance de r7→qr. Pour construire des intervalles de confiance et des tests, nous utiliserons les propriétés suivantes :

9.1 – Intervalle de confiance et estimation 177

Proposition 9.3 On suppose que la loi de la v.a. réelleX de fonction de répartition F possède une densité. Les quantiles de la loi satisfont alors les propriétés suivantes.

1. Pour toutr∈]0,1[,F(qr) =r.

2. Pour toutα∈]0,1[,P(X6∈[q_α/2, q_1−α/2]) =P(X < qα) =P(X > q1−α) =α.

3. Pour tout α ∈]0,1[, P(X ∈ [q_α/2, q_1−α/2]) = P(X ≥ q_α) = P(X ≤q_1−α) = 1−α.

4. Si la loi deX est sym´etrique (i.e. la densit´e est une fonction paire), alors pour toutα∈]0,1[,P(|X|> q_1−α/2) =αetP(|X| ≤q_1−α/2) = 1−α.

Preuve.1.Pour touty < qr, on aF(y)< ret par croissance deF, pour touty > qr, F(y)≥r. CommeF est continue, on en d´eduit queF(qr) =r.

2. Le résultat se déduit des égalités P(X < qr) = P(X ≤ qr) = F(qr) = r et P(X > qr) = 1−F(qr) = 1−r.

3.Ce point s’obtient par passage au compl´ementaire.

4. Lorsque la densité deX est une fonction paire, la variable aléatoire −X a même loi queX. En outreF(0) = 1/2, ce qui entraˆıne queq_1−α/2>0. Donc :

P |X|> q_1−α/2

= P X <−q_1−α/2

+P X > q_1−α/2

= P(−X > q_1−α/2) +P(X > q_1−α/2

= 2P(X > q_1−α/2)

= α ,

et la dernière propriété s’en déduit par passage au complémentaire.

Pour obtenir des intervalles de confiance sur la moyenne et la variance d’une loi inconnue dont on a un échantillon, on a besoin de certaines propriétés sur des estimateurs, tels que la moyenne empirique, la variance empirique non-biaisée, la moyenne empirique renormalisée par la variance empirique non-biaisée, etc. Il est

établi dans la section précédente que, avec probabilité 1 : X_n^n→+∞−→ µetV_n^n→+∞−→ σ²,

c’est-à-dire que la moyenne empirique (8.3) et la variance empirique non-biaisée (8.7) sont des estimateurs convergents de l’espéranceµet de la varianceσ². Mais on a besoin de plus. Pour résumer, il arrive dans certains cas qu’on puisse caractériser entièrement la loi des estimateurs, ce qui permet de construire des intervalles de confiance exacts (et valables pour toutn). Mais le plus souvent la situation est trop compliquée, et on se sert alors des propriétés aymptotiques des estimateurs (en particulier, la normalité asymptotique) pour construire des intervalles de confiance asymptotiques, qui sont valables pournsuffisamment grand.

Dans le document JosselinGarnier,SylvieMéléard,NizarTouzi Aléatoire (Page 172-178)