2 Vraisemblance, EMV, IC, Information de Fisher

(1)

Guillaume Lecué 31 août 2020

Table des matières

1 Rappels de probabilités 1

2 Vraisemblance, EMV, IC, Information de Fisher 13

3 Tests 28

4 Modèle de régression 32

5 Examen du lundi 26 octobre 2015 40

6 Rattrapage 2015-2016 44

7 Examen du lundi 14 novembre 2016 49

8 Rattrapage 2016-2017 55

9 Examen de novembre 2017 60

10 Examen d’octobre 2018 67

11 Examen d’octobre 2019 73

1 Rappels de probabilités

**********************

Exercice 1.1 (Théorème de la limite centrale)

Soit (X_n)_n une suite de variables aléatoires i.i.d. centrées de variance σ² >1. Soit Z_n= 1

σ√ n

n

X

j=1

X_j.

Par le théorème de la limite centrale, cette variable converge en loi vers la loi normale centrée réduite, c’est-à-dire, pour tout t∈ R, on a limn→+∞E[e^itZⁿ] =e⁻^t

2

2 . L’objet de cet exercice est de montrer que la suite Z_n ne peut pas converger en probabilité.

(2)

1. Calculer la fonction caractéristique de Z2n − Zn et montrer que cette différence converge en loi.

2. En étudiantP(|Z_2n−Z_n| ≥), montrer que Z_n ne converge pas en probabilité.

**********************

Correction de l’exercice 1.1 L’objectif de cet exercice est de manipuler les différents types de convergence. On commence donc par rappeler les différentes convergences en probabilités. Soit (Xn) une suite de variables aléatoires et X une autre variable aléatoire. On dit que :

— (X_n)converge presque surement versX quand{ω ∈Ω : limX_n(ω) =X(ω)}est de mesure1(on vérifiera que cet ensemble est bien mesurable).

— (Xn)converge en probabilité vers X quand pour tout >0,P

|X_n−X| ≥

→0 quandntend vers +∞.

— (X_n)converge en loi versXquand pour toute fonction continue bornéef on aEf(X_n)→Ef(X).

— si p ≥ 1, on dit que (X_n) converge dans L_p vers X quand E|X_n−X|^p → 0 quand n tend vers +∞.

On a les implications suivantes :

[cv presque sure] (1)

=⇒

[cv en proba] (2)

=⇒

[cv en loi]

(3)⇑ [cv dansLp] Démo et contre-exemple de “(1)

=⇒

” : Soit >0. On a{X_n→X} ⊂liminf_n{|X_n−X| ≤}. En passant, au complémentaire, on a :

0≤limsup_nP

|X_n−X|>

≤P[limsup_n{|X_n−X|> }]

=P

liminf_n{|X_n−X| ≤}c

≤0.

Il n’y a pas équivalence dans “(1) ⇒”. Voici une exemple d’une suite qui converge en probabilité mais pas presque surement : (X_n) des v.a. indépendantes telles que

P[Xn= 1] = 1

n etP[Xn= 0] = 1− 1 n.

La suite (Xn) converge en probabilité vers0 car pour toutn, onP[|X_n|> ] =P[Xn= 1] = 1/n. Mais elle ne converge pas presque surement vers car on a P

nP({X_n = 1}) = ∞ donc d’après le “second lemme de Borel-Cantelli” (les événements({X_n= 1})sont indépendants), on aP[limsup_n{X_n= 1}] = 1. Notamment,(Xn) ne converge pas presque surement vers0.

Démo et contre-exemple de “(2)

=⇒

” : Soitf une fonction continue bornée. Soit >0etN ∈N tel que P

|f(X_n)−f(X)| ≥

≤ (on rappel que si f est continue et(X_n) converge en probabilité vers X alors(f(X_n))converge en probabilité versf(X)). On a donc

Ef(X_n)−Ef(X) ≤

E(f(X_n)−f(X))I(|f(X_n)−f(X)| ≥) +

E(f(X_n)−f(X))I(|f(X_n)−f(X)|< )

≤2kfk_∞P

|f(Xn)−f(X)| ≥

+≤ 2kfk_∞+ 1 .

(3)

La réciproque est trivialement fausse. Il suffit de prendre la suite stationnaire (X_n) où pour tout n, Xn =g où g est une gaussienne. Comme g est symmétrique,−g est aussi distribuée comme g. Donc (X_n) converge en loi vers g et donc aussi vers−g. Par contre |X_n−(−g)|= 2|g| ne converge pas en probabilité vers 0. Donc (X_n) ne converge par vers−g en probabilité.

Démo et contre-exemple de “(3) ⇑” : D’après l’inégalité de Markov, P

|X_n−X ≥ |

≤ ^−pE|X_n−X|^p. Pour le contre-exemple, on prend X_n de loi (n⁻¹δ_n² + (1−n⁻¹)δ₀). On a P[|X_n| ≥ ]≤n⁻¹ donc (Xn) converge en probabilité mais E|X_n|=ndonc (Xn) ne converge pas dansL1 vers 0.

Correction de l’exercice

1. Pour tout t∈R, on a par indépendance Eexp(it(Z2n−Zn)) =Eexp

it σ√ n

1

√ 2 −1

n

X

j=1

Zj

Eexp

it σ√

2n

X

j=n+1

Zj

.

En appliquant le TCL sur chacun des membres du produit, quandntend vers l’infini, on obtient que(Z_2n−Z_n)_n tend vers une loi dont la fonction caractéristique estt7→exp −t²(2−√

2)/2 , c’est donc une Gaussienne centrée de variancep

2−√ 2.

2. Supposons que (Z_n) converge en probabilité. Alors il existe une variable aléatoire Z telle que pour tout >0, on aP[|Z_n−Z|> ]→0. Soit >0, on a

{|Z_2n−Z_n| ≥2} ⊂ {|Z_n−Z| ≥} ∪ {|Z_2n−Z| ≥}.

Alors, par une borne de l’union : P

|Z_2n−Zn| ≥2

≤P

|Z_n−Z| ≥ +P

|Z_2n−Z| ≥ et donc en passant à la limite, on obtientP

|Z_2n−Zn| ≥2

→0. Donc(Z2n−Zn)nconverge en probabilité vers 0. En particulier, cette suite converge en loi vers 0. Ce qui est en contradiction avec 1..

**********************

Exercice 1.2 (Théorème de Poisson)

Pour tout entier non nul n, on note X_n une variable aléatoire de loi binomiale de paramètre pn∈(0,1). On suppose que quand n tend vers l’infini npn→ λ pour un certain λ >0. En étudiant la convergence de la suite des fonctions caractéristiques desX_nmontrer que (Xn)n converge en loi vers une loi de Poisson de paramètre λ.

**********************

Correction de l’exercice 1.2 Pour tout entier non nul n, la fonction caractéristique de X_n vérifie pour tout t∈R,

ϕ_X_n(t) =Ee^itXⁿ = p_ne^it+ (1−p_n)n

= (1 +p_n(e^it−1))ⁿ. Par ailleurs, on sait que pour tout nombre complexe z, la suite (1 +p_nz)ⁿ

n converge vers e^λz. On a doit (ϕXn) converge ponctuellement versϕ :t→ exp(λ(e^it−1)) qui est la fonction caractéristique

(4)

d’une loi de Poisson de paramètre λ. En effet, siX suit une loi de Poisson de paramètre λalors pour tout t∈R, on a

Ee^itX =

∞

X

k=0

e^itke^−λλ^k

k! =e^−λexp(λe^it) = exp(λ(e^it−1)).

Remarque :Le théorème de Poisson se généralise au théorème des événements rares qui s’énonce de la manière suivante. Soit (Mn)n une suite croissante d’entier tendant vers+∞. Pour tout entiern, soit (A_n,j : 1≤j ≤M_n) une famille d’événements telle que pour p_n,j =P[A_n,j], on a, quandn tends vers +∞,

1≤j≤Mmaxn

pn,j →0 et que

Mn

X

j=1

pn,j →λ.

On pose S_n=P_M_n

j=11An,j. Alors la suite(S_n)_n converge en loi vers une Poisson de paramètreλ.

**********************

Exercice 1.3 (Lemme de Slutsky)

1. Donner un exemple de suites (X_n) et (Y_n) telles que X_n^loi→X et Y_n→^loiY, mais X_n+Y_n ne converge pas en loi vers X+Y.

2. Soient (Xn), (Yn) deux suites de variables aléatoires réelles, X et Y des variables aléatoires réelles, telles que

(i) X_n^loi→X et Y_n→^P Y,

(ii) Y est indépendante de (Xn) et X.

Montrer que le couple (Xn, Yn) converge en loi vers (X, Y).

3. En déduire que si (Xn) et (Yn) sont deux suites de variables aléatoires réelles telles que (X_n) converge en loi vers une limite X et (Y_n) converge en probabilité vers une constante c, alors (Xn+Yn) converge en loi vers X+c et (XnYn) converge en loi vers c X.

**********************

Correction de l’exercice 1.3

1. Soit (δn) une suite de v.a. i.i.d. de Bernoulli de moyenne 1/2 (càd P[δn = 0] = P[δn = 1] = 1/2,∀n). D’après le TCL, on sait que

X_n:= 2

√n

n

X

i=1

δ_i−1/2

N(0,1).

On le démontre facilement, en utilisant le Théorème de Levy et en voyant que quand ntend vers l’infini, pour tout t∈R,

Eexp 2it

√n Xⁿ

i=1

δi−1/2

= 1

2

exp −it

√n

+ exp it

√n n

=

1− t²

2n+O t³ n^3/2

n

−→exp −t²

2

.

(5)

Soitgune variable Gaussienne standard. Commegest symmétrique,−gest aussi une Gaussienne Standard. On a donc, (Xn) converge en loi vers g et aussi (Xn) converge en loi vers −g. Mais (X_n+X_n)converge en loi vers2g6=g+ (−g) = 0. Cet exercice souligne le fait que la convergence en loi est une convergence des lois de distribution et non des variables aléatoires elles mêmes.

2. On note par C_b(R) l’ensemble des fonctions continues bornées surR. Pour montrer que(X_n, Y_n) converge en loi vers(X, Y), il suffit de prouver que pour tout f, g∈ C_b(R), on a Ef(Xn)g(Yn)→ Ef(X)g(Y) quand n tend vers l’infini. Par ailleurs, on sait que si (Y_n) converge en probablité vers Y et si g est continue alors(g(Yn))converge en probabilité versg(Y).

Soit f, g∈ C_b(R) et >0. SoitN ∈Ntel que pour tout n≥N, P

|g(Y_n)−g(Y)| ≥

≤and

Ef(Xn)−Ef(X) ≤. On a pour tout n≥N, par indépendance de g(Y) avec f(X_n) etf(X),

Ef(X_n)g(Y_n)−Ef(X)g(Y) ≤

Ef(X_n)(g(Y_n)−g(Y))I(|g(Y_n)−g(Y)| ≥) +

Ef(X_n)(g(Y_n)−g(Y))I(|g(Y_n)−g(Y)|< ) +

Eg(Y)(f(X_n)−f(X))

≤2kfk_∞kgk_∞P

|g(Y_n)−g(Y)| ≥

+kfk_∞+

Eg(Y)Ef(X_n)−Ef(X)

≤ 2kfk_∞kgk_∞+kfk_∞+kgk_∞ .

3. Comme (Yn) converge en probabilité vers Y = c p.p. qui est indépendante de toutes variables aléatoires, on peut appliquer la question 2. : (Xn, Yn)

converge en probabilité vers (X, c).

Notamment, comme les applications somme et produit sont des fonctions continues de R² dans R, on voit que (Xn+Yn) converge en loi versX+cainsi que (XnYn) converge en loi verscX.

**********************

Exercice 1.4 (Convergence dans L^p)

Soit (Xn) une suite de variables aléatoires réelles bornées par une même constante.

Montrer que si (X_n) converge en probabilité, alors X_n converge dans L^p pour tout p≥1.

**********************

Correction de l’exercice 1.4 Pour cet exercice, on va démontrer un résultat plus fort. On rappel qu’une suite (X_n)est équi-intégrable quand

a→+∞lim sup

n∈N

E

|X_n|I(|X_n|> a)

= 0.

Soit p ≥1 et (Xn) une suite d’éléments de L^p. On montre que les deux assertions suivantes sont équivalentes :

1. la suite (X_n) converge dansL^p.

2. la suite (X_n) converge en probabilité et la suite(|X_n|^p)est équi-intégrable.

b) implique a) : On montre d’abord que si (Y_n) est équi-intégrable alors elle est équi-continue : càd pour tout > 0, il existe η > 0 tel que si P(A) ≤ η alors sup_n∈_NE

|Y_n|1A

≤ . Soit > 0 et

(6)

a₀ > 0 tel que pour tout a ≥ a₀ et tout n ∈ N, E

|X_n|I(|X_n| > a)

≤ . On a pour tout ensemble mesurableA, toutn∈Net touta≥a0,

E

|X_n|1A

=E

|X_n|I(A∩ {|X_n| ≤a}) +E

|X_n|I(A∩ {|X_n|> a})

≤aP(A) +E

|X_n|I(|X_n|> a)

≤aP(A) +. On en déduit que (Yn) est bien équi-continue.

Soit >0. Pour tout q, r∈N, on a E|X_r−Xq|^p ≤E

|X_r−Xq|^pI(|X_r−Xq|^p ≤)

+ 2^p−1E

|X_r|^p+|X_q|^p

I(|X_r−Xq|^p > )

≤+ 2^p−1E

|X_r|^p+|X_q|^p

I(|X_r−Xq|^p > ) .

Comme (|X_n|^p)est équi-continue, il existeη >0 tel que pour toutA tel que P[A]≤η, on a sup

r∈N

E

|X_r|^p1A

+ sup

q∈N

E

|X_q|^p1A

≤/2^p−1.

Comme (Xn) converge en probabilité, il existe un N tel que pour tout r, q ≥ N, P

|X_r−Xq| ≥ ^1/p

≤η. On en déduit, que limsup_r,qE|X_r−X_q|^p ≤2pour tout r, q≥N. Alors(X_n) est une suite de Cauchy dansL^p, qui est complet, donc elle est convergente dans L^p.

a) implique b) :Par Markov, on a pour tout >0, P

|X_n−X| ≥

≤^−pE|X_n−X|^p.

SoitN ∈N tel que pour toutn≥N,E|X_n−X|^p ≤/2^p−1. L’inégalité de Markov donne P

|X_n|^p> a

≤a⁻¹E|X_n|^p≤Ba⁻¹ ≤.

oùB majore uniformément la suite (E|X_n|^p)(qui est bien bornée vue que c’est une suite convergente).

Soit a0 >0 tel quesup_n∈_NP[|X_n|^p > a0]≤η où η est tel queE

|X|^p1A

≤/2^p−1 pour toutA tel que P(A)≤η (par définition X∈L^p). On a donc pourn≥N et tout a≥a₀,

E

|X_n|^pI(|X_n|^p > a)

≤2^p−1E

|X_n−X|^pI(|X_n|^p > a)

+ 2^p−1E

|X|^pI(|X_n|^p > a)

≤. De plus, il est facile de voir que toute famille finie de variables aléatoires est équi-intégrable. C’est le cas pour (X_n: 1≤n≤N).

**********************

Exercice 1.5 (Lemme de Fatou)

si(f_n) est une suite de fonctions measurables alors Z

liminf_nf_n≤liminf_n Z

f_n.

En déduire que si (A_n) est une suite d’événements alors limsup_nP(An)≤P(limsup_nAn), où on rappelle que limsup_nAn=∩_N ∪_n≥N An.

(7)

**********************

1. Pour toutn∈N, on notegn= infp≥nfp. La suite(gn)est monotone et converge presque surement vers liminf_nf_n. Le théorème de convergence monotone donne :

limn

Z g_n=

Z

limn g_n= Z

liminf_nf_n. Par ailleurs, on a pour toutn∈N,

Z g_n=

Z

p≥ninf f_p≤ inf

p≥n

Z

p≥ninf f_p.

Par convergence des deux membres, on peut passer à la limite et obtenir le résultat.

2. On utilise le lemme de Fatou pour fn = 1−1An = 1A^c_n. On a liminfnfn = 1liminfnA^c_n et liminf_nA^c_nc

= limsup_nA_n donc

1−P[limsup_nAn] =P[liminfnA^c_n]≤liminfnP[A^c_n].

**********************

Exercice 1.6 (lemmes de Borel-Cantelli)

1. Le premier lemme de Borel-Cantelli dit que si(A_n) est une suite d’événements telle que P

nP[An]<∞ alors P[limsup_nAn] = 0.

2. Le deuxième lemme de Borel-Cantelli dit que si (An) est une suite d’événements indépendants tels que P

nP[A_n] =∞ alors P[limsup_nA_n] = 1.

**********************

1. On note B_n=∪_p≥nA_p. On a P[B_n]≤P

p≥nP[A_p]. Alors par hypothèse, P[B_n]

tend vers 0 en décroissant. Par convergence monotone, limnP[Bn] = P[limnBn] = P[infnBn] = P[liminfnAn].

Donc P[liminfA_n] = 0.

2. Comme limsup_nAn = liminfnA^c_nc

, il suffit de montrer que P[liminfnA^c_n] = 0. On note Bn =

∩_p≥nA_p. La suite (B_n) est croissante et converge presque surement vers liminf_nA^c_n. Alors, par convergence monotone, P[Bn]

converge versP[liminfnA^c_n]. Par ailleurs, commelog(1−x)≤ −x pour x∈[0,1),

P[Bn] =P[∩_p≥nA^c_p] = Πp≥nP[A^c_p] = Πp≥n 1−P[Ap]

= exp X

p≥n

log 1−P[Ap]

≤exp

−X

p≥n

P[Ap]

= 0.

On en déduit le résultat.

**********************

(8)

Exercice 1.7 (la loi du 0−1 de Kolmogorov)

Soit(σn)une suite de tribus indépendantes. La tribu asymptotique estσ∞=∩_nσ

∪p≥nσp

. La loi du 0−1 de Kolmogorov dit que pour tout A∈σ∞, P[A]∈ {0,1}.

**********************

Correction de l’exercice 1.7 On noteαn=σ

∪_p≥nσp

etβn=σ

∪_p<nσp

. Les deux tribusαnet β_nsont indépendantes. Comme σ∞⊂α_n alorsσ∞ est indépendantes de β_n pour tout n. Notamment, σ∞ est indépendante de ∪n∈Nβ_n et donc de σ

∪_nβ_n

=σ

∪_nσ_n

=α₀. Or σ∞ ⊂α₀ donc σ∞ est indépendante d’elle même. En particulier, si A∈σ∞ alorsP[A] =P[A]P[A]donc P[A]∈ {0,1}.

**********************

Exercice 1.8 (convergence en loi vers une constante)

La convergence en loi vers une constante implique la convergence en proba : On suppose X_n c alors (X_n) converge en probabilité vers c.

**********************

Correction de l’exercice 1.8 On peut démontrer que(Yn) converge en loi versY si et seulement si pour tout Borélien A P^Y-continue (càdP[∂A] = 0), on a P^Yⁿ[A]→P^Y[A].

Soit >0. On aδc B(c, )

= 1. AlorsP^Xⁿ

B(c, )

→δc(B(c, )) = 1. Donc P[|X_n−c| ≤]→1.

C’est donc une convergence en probabilité vers c.

**********************

Exercice 1.9 (convergence en probabilité et convergence p.s.)

Soit (X_n)_n une suite de variables aléatoires réelles et X une variable aléatoire réelle.

L’objectif de cet exercice est de montrer le lien suivant entre convergence en probabilité et convergence presque sure : il y a équivalence entre :

a) (X_n)_n converge en probabilité vers X,

b) toute sous-suite de (X_n)_n admet une sous-suite qui converge p.s. versX.

Pour démontrer ce résultat, on va d’abord montrer l’équivalence suivante c) (Xn)n converge en probabilité,

d) (X_n)_nest une suite de Cauchy en probabilité ; càd(X_n−X_m)_n,mconverge en probabilité vers 0 quand n et m tendent vers +∞.

Pour démontrer que c) et d) sont équivalents, on procéde par étapes : 1) Montrer que c) implique d)

2) On suppose d).

2.1) En utilisant de lemme de Borel-Cantelli montrer qu’il existe une sous-suite de (Xn)n qui converge p.s.. On note par X sa limite.

2.2) En déduire que (Xn)n converge en probabilité vers X.

(9)

On montre maintenant l’équivalence entre c) et d).

3) On suppose a). En utilisant 2.1) montrer b).

4) On suppose b) et on raisonne par contraposé : on suppose que a) n’est pas vrai.

4.1) Ecrire la contraposé.

4.2) Obtenir une contradiction.

**********************

1) On suppose quec) est vrai. Pour tout >0 etn, m, on a

P[|X_n−Xm| ≥]≤P[|X_n−X| ≥/2] +P[|X_m−X| ≥/2].

Comme le membre de droite tend vers 0 quand n et m tendent vers +∞, on en déduit que le membre de droite tend aussi vers0 dans ce cas là, càd,d) est vrai.

2.1) Comme (Xn)n est une suite de Cauchy en probability, on peut construire par récurrence en commençant àn₁ = 1, une suite strictement croissante d’entiers (n_j)_j telle que

P[|X_n_j −Xnj+1|>2^−j]<2^−j. Comme P

jP[|X_n_j−X_n_j+1|>2^−j]<∞, le lemmes de Borel-Cantelli dit queP[Ω₀] = 0où Ω0 = lim sup

j→∞

{|X_n_j−Xnj+1|>2^−j}=∩_j ∪_k≥j

|X_n_k−Xnk+1|>2^−j .

Soit ω ∈ Ω^c₀. La suite (X_n_j(ω))_j est une suite (de nombres réels) de Cauchy car pour tout j suffisament grand et toutk > j, on a

|X_n_k(ω)−X_n_j(ω)| ≤X

p≥j

|X_n_p(ω)−X_n_p+1(ω)| ≤X

p≥j

1

2^p = 2^j−1.

Ainsi, par complétude de R, on en déduit qu’il existe X(ω) tel que (Xnj(ω))j converge vers X(ω). Ceci étant vrai pour toutω ∈Ω^c₀ etP[Ω^c₀] = 1, on en déduit que(X_n_j)_j converge presque surement.

2.2) On note par X la limite p.s. de (Xnj)j. Soit >0. On a

P[|X_n−X| ≥]≤P[|X_n−X_n_j| ≥/2] +P[|X_n_j−X| ≥/2].

Comme(Xnj)jconverge presque surement versX, elle converge aussi en probabilité doncP[|X_n_j− X| ≥/2]tends vers 0quandj tends vers+∞. Par ailleurs,(X_n)_nest de Cauchy en probability donc quand n et j tendent vers +∞, P[|X_n −X_n_j| ≥ /2] tends vers 0. En en déduit que P[|X_n−X| ≥]tends vers0quandntends vers+∞, càd(Xn)n converge versXen probabilité.

3) On suppose que(Xn)n converge en probabilité versX. Soit(Xnj)j une sous suite. Elle converge donc aussi en probabilité versX. D’après 2.1), c’est aussi une suite de Cauchy en probabilité et donc elle admet une sous-suite qui converge presque surement vers X. Doncb) est vrai.

(10)

4.1) Dire que a) n’est pas vrai, c’est dire qu’il existe un > 0 et un δ > 0 et une sous-suite (n_k)_k d’entiers tels que pour tout k,

P[|X_n_k−X| ≥]≥δ. (1) 4.2) D’un autre côté, b) est vrai donc (Xn_k)_k admet une sous-suite qui converge presque surement

vers X. Ceci contredit (1).

**********************

Exercice 1.10 (L’asymptotique normalité implique la converge en probabilité)

Soit (r_n) une suite de réels positifs tendant vers +∞. Soit (ζ_n) une suite de v.a.r. telle que rn(ζn−µ) ζ. Alors (ζn) converge en probabilité vers µ.

**********************

Correction de l’exercice 1.10 On dit qu’une suite de v.a.r.(ζ_n) est tendue quand pour tout >0, il existe M >0 tel que pour tout n,P[|ζ_n| ≥M]≤. Si une suite converge en probabilité alors elle est tendue. (Car on peut approcher la fonction I(· ∈[−M, M])par une suite croissante de fonctions continues bornées). Alors (rn(ζn−µ)) est tendue. Soit > 0 etM >0 tels que sup_n∈_NP[|ζ_n−µ| ≥ M/r_n]≤. Ce qui implique la convergence en probabilité car (r_n) tend vers+∞.

**********************

Exercice 1.11 (Loi conditionnelle)

Soit X une variable aléatoire qui suit une loi Gamma (2, λ) de densité f(x) =λ²xe^−λx1[0,+∞)(x)

et soit Y une variable aléatoire dont la loi conditionnelle à X=x est uniforme sur [0, x]. 1. Donner la loi jointe de (X, Y).

2. Donner la loi marginale de Y et montrer que Y est indépendant de X−Y.

**********************

1. Soit f une fonction continue bornée sur R². On a Ef(X, Y) =

Z

R

Z

R

f(x, y)dP^Y^|X^=x(y)

dP^X(x)

= Z ∞

0

Z _x

0

f(x, y)dy x

λ²xe^−λxdx= Z

R²

f(x, y)1[0,x](y)1_R⁺(x)λ²e^−λxdxdy.

Donc la loi jointe du couple (X, Y) a une densité donnée pour toutx, y∈Rpar f^(X,Y⁾(x, y) =1[0,x](y)1_R⁺(x)λ²e^−λx

2. La loi marginale de Y a pour densité : pour tout y∈R, f^Y(y) =

Z

R

f^(X,Y⁾(x, y)dx=1y≥0

Z ∞ y

λ²e^−λxdx=λe^−λy1y≥0.

(11)

Soit f etg deux fonctions continues bornée. Un changement de variablex−y →tdonne Ef(Y)g(X−Y) =

Z

R²

f(y)g(x−y)1[0,x](y)1_R⁺(x)λ²e^−λxdxdy

= Z

R

f(y)1y≥0

Z ∞ y

g(x−y)λ²e^−λxdx dy=

Z

R

f(y)1y≥0

Z ∞ 0

g(t)λ²e^−λ(t+y)dt dy

= Z

R

f(y)1y≥0λe^−λydy Z

R

g(t)1t≥0λe^−λtdt

=Ef(Y)Eg(X−Y)

(pour avoir la loi deX−Y, il suffit de prendref ≡1dans le calcul précédent). DoncY etX−Y sont bien indépendants.

**********************

Exercice 1.12 (quartile)

Soit la loi de probabilité de densité f(x) = 2xI{0≤x≤1}.

1. Trouver les quartiles (y compris la médiane) de cette loi.

2. Considérons un échantillon i.i.d. (X₁, . . . , X_n) de cette loi. Soit Fb_n la fonction de répartition empirique associée. Donner la loi limite de√

n(Fbn(1/2)−1/4)/Fbn(3/4)quand n→ ∞., où Fb_n est la fonction de répartition empirique.

**********************

Correction de l’exercice 1.12 1. q_1/4 = 1/2,q_1/2= 1/√

2etq_3/4 =√ 3/2 2. Le tCL donne :

√n Fb_n(1/2)−F(1/2)

N(0, F(1/2)(1−F(1/2)))

et la LFGN : Fb_n(3/4)−→^p.s. F(3/4). Comme F(1/2) = 1/4 etF(3/4) = 9/16, on obtient

√n Fb_n(1/2)−F(1/2)

Fbn(3/4) N 0,16 27

**********************

Exercice 1.13 (Médiane et moyenne)

Soit X une variable aléatoire réelle. On rappelle que la médiane de X est définie par med(X) = inf (t∈R:P(X≥t)≥1/2).

L’objectif de cet exercice est de montrer que si X∈Lp pour un certain p≥1 alors

|med(X)−EX| ≤(2E|X−EX|^p)^1/p. (2) 1) Montrer que

min (P(X≥med(X)),P(X ≤med(X)))≥1/2.

(12)

2) On suppose que X∈L_p pour un certain p≥1. Montrer que pour tout β ∈R,

|med(X)−β|^p

2 ≤ |med(X)−β|^pmin (P(X≥med(X)),P(X≤med(X)))≤E[|X−β|^p].

En déduire le résultat annoncé dans (2).

**********************

Correction de l’exercice 1.13 1) On montre d’abord que P[X ≥med(X)] ≥1/2. Par définition de med(X) il existe un suite (t_n)_n décroissante vers med(X) telle que pour tout n,P[X ≥ t_n]≥1/2.

On note An = (−∞, t_n] pour tout n. La suite (An)n est une suite d’événements décroissante vers (−∞,med(X)] alors (PX[An])n décroît vers PX[(−∞,med(X)]] =F_X(med(X)) où on note PX la loi de X etF_X sa fonction de répartition. On a alors par passage à limite F_X(med(X))≥1/2.

Montrons queP[X≤med(X)]≥1/2. Par définition demed(X), on sait que pour toutt <med(X), on aF_X(t)<1/2et doncPX[[t,+∞)]≥1/2. Si(t_n)_nest une suite croissante versmed(X)alors(B_n)_n, où B_n = [t_n,+∞), est une suite décroissante vers B = [med(X),+∞) ainsi (PX[B_n])_n décroît vers PX[B]et par passage à la limite PX[B]≥1/2. Autrement ditP[X≥med(X)]≥1/2.

2)L’inégalité de gauche est une application directe de 1). Pour l’inégalité de droite, on a E|X−β|^p=

Z ∞ 0

P[|X−β|^p ≥t]dt≥

Z |med(X)−β|^p 0

P[|X−β|^p≥t]dt

≥ |med(X)−β|^pP

|X−β| ≥ |med(X)−β| .

On voit que |X−β| ≥ |med(X)−β| si et seulement si X ≥ max(med(X),2β−med(X)) ou X ≤ min(med(X),2β−med(X)). On étudie ensuite les deux cas2β−med(X)≥med(X)ou2β−med(X)≤ med(X)et on voit que dans chaque cas on a bien

P

|X−β| ≥ |med(X)−β|

≥min (P(X ≥med(X)),P(X≤med(X))).

**********************

Exercice 1.14 (fonction quantile pour v.a. à densité)

Si X est une variable aléatoire réelle et α ∈ (0,1). Le quantile de X d’ordre α est défini par

Q_X(α) = inf x∈R:P[X≤x]≥α

(3) et la fonction Q_X : (0,1)7→R est appelée fonction quantile.

1) Montrer que le quantile d’ordre α de X vérifie

P[X≤Q_X(α)]≥α. (4)

2) Soit X est une variable aléatoire réelle admettant une densité fX, par rapport à la mesure de Lebesgue, portée par un intervalle I de R: i.e.f_X est strictement positive sur I et nulle en dehors de I. Montrer que :

2.1) la fonction de répartition FX de X est inversible sur I,

(13)

2.2) sa fonction réciproque F_X⁻¹ est continue sur (0,1), 2.3) et Q_X(α) =F_X⁻¹(α) pour tout α∈(0,1).

**********************

Correction de l’exercice 1.14 1) On pose F_X : t ∈ R → P[X ≤ t] la fonction de réparti- tion de X. Soit (q_n)_n une suite décroissante convergeant vers Q_X(α) telle que F_X(q_n) ≥ α pour tout entier n. On pose An = (−∞, q_n]. On a (An)n est une suite décroissante d’événements telle que ∩_nA_n = (−∞, Q_X(α)] et donc (P^X[A_n])_n décroît vers P^X((−∞, Q_X(α)]). Comme pour tout n,P^X[An] =FX(qn)≥α, on a aussiFX(QX(α))≥α.

2.1)CommeX admet une densité par rapport à la mesure de Lebesgue, sa fonction de répartition F_X est continue sur R, de classe C¹ sauf en un nombre fini de points et F_X⁰ = f_X en dehors de ces points. CommefX(x)>0pour toutx∈I, queF_X⁰ est continue et coïncide avecfX sauf en un nombre fini de point, on a que F_X est strictement croissante sur I et elle y est donc inversible.

2.2)Montrons que F_X⁻¹ est continue sur (0,1). On montre qu’elle est continue à droite (la preuve de la continuité à gauche est identique). Soit α ∈ (0,1) et (αn)n une suite d’éléments de (0,1) qui décroît vers α. Montrons que (F_X⁻¹(α_n))_n tends vers F_X⁻¹(α). On posex_n=F_X⁻¹(α_n) etx =F_X⁻¹(α).

On aFX(xn) =αnetFX(x) =α, alors(FX(xn))ndécroît versFX(x). CommeFX est croissante, on a que (x_n)est une suite d’éléments du compact [x, x₀], elle admet donc une sous-suite qui converge. On note (xφn)n une sous-suite convergeant vers x⁰. Par continuité de FX, on a (FX(xφn))n qui converge vers F_X(x⁰). Mais on sait aussi que (F_X(x_φ_n))n converge vers F_X(x) donc F_X(x) = F_X(x⁰) alors par injectivité, on a x⁰ =x. Ceci étant vrai pour toute sous-suite convergente de (x_n), on en déduit que (xn)n converge vers xet donc F_X⁻¹ est continue à droite. De mêmeF_X⁻¹ est continue à gauche et donc F_X⁻¹ est continue.

2.3)Soit α ∈ (0,1). Montrons que Q_X(α) = F_X⁻¹(α). On sait déjà que F_X(Q_X(α)) ≥ α d’après (25). Comme FX est croissante et queFX(F_X⁻¹(α)) =α, on en déduit que QX(α)≥F_X⁻¹(α). Comme F_X(F_X⁻¹(α)) =αon a par définition deQ_X(α)queQ_X(α)≤F_X⁻¹(α). On en déduit donc queQ_X(α) = F_X⁻¹(α).

2 Vraisemblance, EMV, IC, Information de Fisher

**********************

Exercice 2.1 (Les statistiques d’ordre)

Soient X1, . . . , Xn des variables aléatoires i.i.d. de fonction de répartition F. On suppose que F admet une densité f par rapport à la mesure de Lebesgue. On note X₍₁₎ ≤X₍₂₎ ≤ . . .≤X_(n) les variables aléatoires X1, . . . , Xn réordonnées par ordre croissant.

1. Donner l’expression de la loi de la statistique d’ordre (X₍₁₎, . . . , X_(n)) en fonction de f.

2. Déterminer la fonction de répartitionFk(x) puis la densité fk(x) de X_(k).

3. Sans utiliser les résultats des questions précédentes, calculer les fonctions de répar- tition de X₍₁₎, X_(n), du couple (X₍₁₎, X_(n))et la loi de la statistique W =X_(n)−X₍₁₎ (on

(14)

appelle W étendue). Les variables X₍₁₎ et X_(n) sont–elles indépendantes ?

**********************

1. Comme les X_i ont des densités par rapport à Lebesgues, on aX_i6=X_j λ−p.p.. Alors p.p.

f(X₍₁₎, . . . , X_(n)) = X

σ∈P(n)

f(X_σ(1), . . . , X_σ(n))I(X_σ(1)<· · ·< X_σ(n)).

Soitσ∈ P(n). Comme lesXi sont i.i.d., on voit que(X_σ(1), . . . , X_σ(n))^>∼(X1, . . . , Xn)^>. Alors, pour tout f ∈ C_b(Rⁿ),

Ef(X_σ(1), . . . , X_σ(n))I(X_σ(1) <· · ·< X_σ(n)) =Ef(X1, . . . , Xn)I(X1<· · ·< Xn)

= Z

Rⁿ

f(x₁, . . . , x_n)

Πⁿ_i=1f(x_i)

I(x₁<· · ·< x_n)dx₁· · ·dx_n.

On en déduit que la loi de (X₍₁₎, . . . , X_(n)) admet une densité par rapport à Lebesgue donnée par

f(x1, . . . , xn) =n!

Πⁿ_i=1f(xi)

I(x1 <· · ·< xn).

2. On calcul la fonction de répartition de X_(k). Soit t∈ R, P[X_(k)≤t] =P

∃I ⊂ {1, . . . , n}:|I| ≥k,∀i∈I, Xi ≤t

=P[M ≥k]

où M =P_n

i=1I(X_i ≤t) est une multinomiale de paramétren etP[X₁≤t] =F(t). On a donc P[X_(k) ≤t] =

n

X

j=k

n j

!

F(t)^j(1−F(t))^n−j.

Comme F est absoluement continue la cdf de X_(k) l’est aussi. DoncX_(k) admet une densité par rapport à Lebesgues donnée par :

f(t) =

n

X

j=k

n j

!

jf(t)F(t)^j−1(1−F(t))^n−j+ (n−j)F(t)^j(−f(t))(1−F(t))^n−j−1

= n!

(k−1)!(n−k)!F(t)^k−1(1−F(t))^n−k. 3. La fonction de répartition de X₍₁₎ vérifie :

1−F_X₍₁₎(t) =P[X₍₁₎> t] =P[X1 > t, . . . , Xn> t] =

P[X1 > t]n

= 1−F(t)n

. La fonction de répartition de X_(n) est donnée par :

F_X_(n)(t) =P[X_(n) ≤t] =P[X₁ ≤t, . . . , X_n≤t] =

P[X₁ ≤t]n

= F(t)n

.

Pour la fonction de répartition du couple(X₍₁₎, X_(n)), on calcul la répartition du couple(X₍₁₎, X_(n)) dans le quadrant inférieur droit. On a pour toutx, y réels :

P[X₍₁₎ > x, X_(n)≤y] =P[x < X₁ ≤y, . . . , x < X_n≤y]

=

P[x < X1≤y]

n

=I(x≤y) F(y)−F(x)n

.

(15)

On a :

P[X₍₁₎ > x, X_(n)≤y] +P[X₍₁₎≤x, X_(n) ≤y] =P[X_(n)≤y] =F(y)ⁿ. Alors,

F(x, y) =P[X₍₁₎≤x, X_(n) ≤y] =F(y)ⁿ−I(x≤y) F(y)−F(x)n

. La densité de (X₍₁₎, X_(n)) est donnée par

f(x, y) = ∂²F

∂x∂y(x, y) =n(n−1)I(x≤y)f(x)f(y) F(y)−F(x)n−2

.

La loi de la statistique W =X_(n)−X₍₁₎ est donnée par ce qui suit. Soit f ∈ C_b(R), on a Ef(W) =

Z

R²

f(y−x)dP^(X⁽¹⁾^,X⁽ⁿ⁾⁾(x, y)

=n(n−1) Z

R²

f(y−x)I(x≤y) F(y)−F(x)n−2

dxdy

= Z ∞

0

f(u)

n(n−1) Z

R

F(u+x)−F(x)n−2

dx

du.

AlorsW a pour densité

u7→I(u≥0)n(n−1) Z

R

F(u+x)−F(x)n−2

dx.

Les variables X₍₁₎ etX_(n) sont indépendantes si et seulement si pour tout x ety, on a F(y)ⁿ−I(x≤y) F(y)−F(x)n

=P[X₍₁₎ ≤x, X_(n)≤y]

=P[X₍₁₎ ≤x]P[X_(n)≤y] =

1−(1−F(x))ⁿ F(y)ⁿ. Il faut doncI(x≤y) F(y)−F(x)n

= F(y)−F(y)F(x)n

pour toutx, y. Ce qui n’est pas vrai en générale.

**********************

Exercice 2.2 (Estimateur de la variance)

Soient X₁, . . . , X_n des variables aléatoires i.i.d., X_i ∼ f(· −θ), où f est une densité de probabilité sur R symétrique dont on note µ_k =R

Rx^kf(x)dx les moments d’ordre k= 2 et k = 4. On note X¯_n = _n¹ Pn

i=1X_i. Montrer que l’estimateur _n¹Pn

i=1(X_i−X¯_n)² de la variance des Xi vérifie un théorème central limite.

Indication : on montrera d’abord que l’on peut se ramener au cas où θ = 0, puis on exprimera l’estimateur comme une transformation de Sn= ¹_nPn

i=1X_i² et de X¯n.

**********************

Correction de l’exercice 2.2 On commence par quelques remarques préliminaires : a) Commen⁻¹Pn

i=1(Xi−X¯n)²est invariant par translation desXiet que siX∼f(·−θ)etY ∼f(·) alors X ∼Y +θ, on peut donc supposer que θ= 0. Notamment comme f est symmétrique, on a EXi = 0,∀i.

(16)

b) On note ˆσ_n² :=n⁻¹Pn

i=1(X_i−X¯_n)². On a : ˆ

σ_n² = 1 n

n

X

i=1

X_i²−1 n

n

X

i=1

X_i2

=X²_n−X_n.

(On écrit σˆ_n² =EI X_I−EIX_I2

.)

c) On remarque d’abord queσˆ_n² n’est pas un estimateur sans biais de la variance : Eˆσ_n² =EX²−E

1 n

n

X

i=1

Xi

2

=EX²− 1 n²

X

i,j

EXiXj

=

1− 1 n

EX²− EX2

= n−1

n var(X).

Par la LFGN, la suite (ˆσ²_n) converge presque surement vers σ². On considère la décomposition suivante :

√n σˆ_n²−σ²

=√

n X²_n−EX²

−√

n X¯_n2

.

Par le TCL, on a :

√n X²_n−EX²

N 0,E X²−EX²2

etE X²−EX²2

=µ₄−µ²₂. Par ailleurs, √

nX¯n

converge en loi vers une Gaussienne et( ¯Xn)converge en probabilité vers0. Alors d’après Slutsky, √

n X¯_n2

converge en loi vers 0, elle converge donc aussi en probabilité vers 0. On applique une seconde fois Slutsky : √

n X²n−EX²

converge en loi vers N 0,E X²−EX²2

√ et

n X¯_n2

converge en probabilité vers0. On en déduit que

√n σˆ²_n−σ²

N 0,E X²−EX²2 .

**********************

Exercice 2.3 (Stabilisation de la variance)

On dispose d’un échantillon X1, . . . , Xn i.i.d. de loi de Bernoulli de paramètre 0< θ <1.

1. On note X¯_n la moyenne empirique des X_i. Appliquer la loi forte des grands nombres et le TCL dans ce modèle.

2. Cherchez une fonctiongtelle que√

n(g( ¯Xn)−g(θ))converge en loi versZ de loi N(0,1).

3. On note zα le quantile d’ordre 1−α/2 de la loi normale standard. En déduire un intervalle de confiance Iˆ_n,α fonction de z_α, n,X¯_n tel que limn→∞P(θ∈Iˆ_n,α) = 1−α.

**********************

Correction de l’exercice 2.3 1. La LFGN dit que X¯_n

converge presque surement versEX₁=θ. Le TCL dit que (√

n/σ) ¯X_n− EX

converge en loi vers une Gaussienne centrée réduite où σ =p

θ(1−θ).

(17)

2. D’après le TCL :

√n X¯n−θ σg.

On dit que X¯_n est asymptotiquement normale de moyenne θ et de variance asymptotique σ². On peut alors appliquer la Proposition 1.10 (Méthode delta) du cours (en fait, on applique une version plus faible de ce résultat qu’on peut trouver page 26 au théorème 3.1 de [van der Vaart, asymptotic Statistics]) : si(ζn)est asymptotiquement normale de moyenne asymptotiqueθet de variance asymptotique σ² et si g:D ⊂R7→Rest une fonction différentiable en θ, alors (g(ζ_n)) est aussi asymptotiquement normale et on a :

√n g(ζn)−g(θ)

N(0, σ² g⁰(θ)2

). (5)

Dans notre cas, on cherche à trouvergtel que(g( ¯X_n))est asymptotiquement normal de moyenne asymptotique0et de variance asymptotiqueθ(1−θ) g⁰(θ)2

= 1. On est donc amener à résoudre l’équation :

∀θ∈(0,1), g⁰(θ) = 1 pθ(1−θ).

L’ensemble des solutions de cette équation est donnée, à une constante absolue additive près, par g :θ ∈ [0,1] 7→ 2arcsin(√

x) (on rappel que (arcsinx)⁰ = (1−x²)^−1/2,∀x ∈ [−1,1]). Cette fonction est continûment différentiable en tout θ ∈ (0,1), alors d’après Proposition 1.10 (voir (5)), on a

√n g( ¯X_n)−g(θ)

N(0,1).

(On rappelle que g a été choisit tel que θ(1−θ) g⁰(θ)2

= 1 pour toutθ∈(0,1)).

3. Pour tout α[0,2], le quantile d’ordre 1−α/2 de la gaussienne est l’unique réel tel que P[g ∈ (−∞, q_α] = 1−α/2. On a

P

θ∈Iˆ_n,α

=P h

√n g( ¯X_n)−g(θ) ≤z_αi

−→P[g∈[−z_α, z_α]] = 1−α pour

Iˆ_n,α =h sin²

g( ¯X_n)− z_α

√n

,sin²

g( ¯X_n) + z_α

√n i

**********************

Exercice 2.4 (Modèle probit)

Nous disposons d’une information relative au comportement de remboursement ou de non-remboursement d’emprunteurs :

Y_i =

( 1 si l’emprunteur irembourse, 0 si l’emprunteur i est défaillant.

Afin de modéliser ce phénomène, on suppose l’existence d’une variable aléatoire Y_i^∗ normale, d’espérance m et de variance σ², que l’on appellera « capacité de remboursement de l’individu i», telle que :

Yi =

( 1 si Y_i^∗>0, 0 si Y_i^∗≤0.

On note Φ la fonction de répartition de la loi normale N(0,1).

(18)

1. Exprimer la loi deY_i en fonction de Φ.

2. Les paramètres m et σ² sont-ils identifiables ?

**********************

1. On calcul la loi de Y tel queY = 1quand Y^∗ ≥0 et Y = 0 quand Y^∗ <0 où Y^∗ ∼ N(m, σ²).

La loi deY est donnée parP[Y^∗≥0]δ1+P[Y^∗ <0]δ0. On note parϕla densité d’une gaussienne N(0,1), en particulier, on aΦ(x) =R_x

−∞ϕ(t)dt. Le changement de variable(x−m)/σ→tdonne P[Y^∗ <0] =

Z 0

−∞

ϕx−m σ

dx σ =

Z −m/σ

−∞

ϕ(t)dt= Φ−m σ

.

La loi deY est donc(1−Φ(−m/σ²))δ₁+ Φ(−m/σ²)δ₀.

2. Les paramétres m et σ² ne sont pas identifiable vu que n’importe quels couples (m₁, σ²₁) et (m₂, σ²₂) tels quem₁/σ₁² =m₂/σ₂² donne la même loi pourY.

**********************

Exercice 2.5 (Répartition de génotypes dans une population)

Quand les fréquences de gènes sont en équilibre, les génotypes AA, Aa et aa se mani- festent dans une population avec probabilités (1−θ)², 2θ(1−θ) et θ² respectivement, où θ est un paramètre inconnu. Plato et al. (1964) ont publié les données suivantes sur le type de haptoglobine dans un échantillon de 190 personnes :

Type de haptoglobine Hp-AA Hp-Aa Hp-aa

effectifs 10 68 112

1. Comment interpréter le paramètre θ? Proposez un modèle statistique pour ce pro- blème.

2. Calculez l’estimateur du maximum de vraisemblance θˆ_n de θ.

3. Donnez la loi asymptotique de √

n(ˆθ_n−θ).

4. Proposez un intervalle de confiance de niveau asymptotique 95% pour θ.

**********************

1. On propose deux modèlisations pour ces données. Seule la deuxième sera utilisée pour le traite- ment mathématique du problème.

Modèle 1 : On modèlise ce problème par une famille de ncouples(δ₁⁽¹⁾, δ₁⁽²⁾), . . . ,(δn⁽¹⁾, δn⁽²⁾) où les δ_i^(j), i= 1, . . . , n, j = 1,2 sont i.i.d. Bernoulli sur {A, a} de paramétre θ. On dit queδ^(j)_i =a quand l’alléle a est présent chez l’individu i au gène numéro 2. On a donc bien le probabilités du génotype AA qui est (1−θ)², Aa qui est de probabilité 2θ(1−θ) et aa qui est θ². Dans ce modèle θest la probabilité d’avoir l’alléle apour chacun des deux gènes.

(19)

Modèle 2 : On peut modèliser ce problème par une famille denvariables aléatoiresX₁, . . . , X_n i.i.d. à valeurs dans {AA, Aa, aa} telles que P[X =AA] = (1−θ)², P[X =Aa] = 2θ(1−θ) et P[X =aa] =θ². On choisit ce modèle pour la suite. On peut voir que X ={δ⁽¹⁾, δ⁽²⁾}. Donc θ s’interprète comme étant la probabilité d’avoir l’alléle apour chacun des deux gènes.

2. Dans le modèle 2, la loi de X est Pθ = (1−θ)²δ_AA + 2θ(1−θ)δ_Aa +θ²δ_aa, elle admet une densité fθ par rapport à la mesureδAA+δAa+δaa qui est définie sur {AA, Aa, aa} donnée par f_θ(AA) = (1−θ)²,f_θ(Aa) = 2θ(1−θ) etf_θ(aa) =θ². La Log-vraisemblance est donnée par

L:θ∈(0,1)7−→

n

X

i=1

logfθ(Xi)

=Nn(AA) log[(1−θ)²] +Nn(Aa) log[2θ(1−θ)] +Nn(aa) log[θ²]

oùN_n()est le nombre de génotypesdans l’échantillon{X₁, . . . , X_n}. On a pour toutθ∈(0,1), L⁰(θ) = 2n

θ − 1

θ(1−θ)

2N_n(AA) +N_n(Aa) .

Alors l’estimateur du maximum de vraisemblance est donné par θˆn= 1− 1

2n

2Nn(AA) +Nn(Aa) .

Ici, on a θˆ_n= 1−22/95≈0.77.

3. On peut appliquere le TCL ou la méthode générale du cours sur la normalité asymptpotique des EMV. Pour le TCL, on a directement que

√n θ−θˆn

=√ n1

n

X

i=1

I(Xi =AA) + (1/2)I(Xi=Aa)

−(1−θ)

N

0,θ−θ² 2

car

E I(X =AA) + (1/2)I(Z =Aa)

= (1−θ)²+θ(1−θ) = 1−θ et

E I(X=AA) + (1/2)I(Z =Aa)2

= 1− 3θ 2 +θ²

2 alors

var(I(X=AA) + (1/2)I(Z =Aa)) = θ−θ² 2 .

4. On applique la méthode Delta. On chercher une fonction g telle que pour toutθ∈(0,1), on a : g⁰(θ)²θ−θ²

2 = 1 alorsg(θ) = 2√

2arcsin(√

θ). On applique la méthode Delta :(√

n(g(ˆθn)−g(θ))) converge en loi versN(0,1). Alors siP[|G| ≤zα] = 1−α, oùGest Gaussienne Standard, on aura, quandntend vers ∞,

P

hθˆn∈g⁻¹

g(θ)−zα/√

n, g(θ) +zα/√ ni

→1−α.

**********************