1 Mod` ele statistique

(1)

Cours de Statistiques Inf´erentielles

P. Ribereau

I Echantillonage

1 Mod` ele statistique

On suppose que les variables al´ eatoires X

₁

, . . . , X

_n

sont ind´ ependantes et identiquement distribu´ ees (i.i.d.). tq X

_i

∼ P

θ

On note le mod ‘ele statistique

( R , B

_R

, (P

_θ

, θ ∈ Θ ⊂ R

^p

))

ⁿ

.

En dehors de ce cadre, on parle de mod` ele non param´ etrique ou semi-param´ etrique si Θ ⊂ R

^k

× U o` u U est non param´ etrique.

a. Mod` ele domin´ e, vraisemblance

Consid´ erons un mod` ele statistique ( R

ⁿ

, B

_Rⁿ

, Q ∈ Q ). Le mod` ele est domin´ e par une mesure σ-finie µ sur ( R

ⁿ

, B

_Rⁿ

) si pour tout Q ∈ Q , Q est absolument continue par rapport ` a µ. Alors il existe une fonction de densit´ e f

Q

telle que Q = f

Q

µ (i.e Q(A) =

Z

A

f

Q

(x)dµ(x) pour tout A ∈ C). La fonction f

Q

est la vraisemblance (Li- kelihood en anglais) du mod` ele not´ ee L

_Q

(x) = f

_q

(x). On note `

_Q

(x) = log L

_Q

(x) la log vraisemblance.

Dans le cas d’un mod` ele d’´ echantillonage r´ eel, la vraisemblance vaut L

_θ

(x

₁

, . . . , x

_n

) = f

θ

(x

1

) × · · · × f

θ

(x

n

).

2 D´ efinition d’une statistique

— On appelle statistique toute variable al´ eatoire d´ efinie sur ( R

ⁿ

, B

_Rⁿ

) ` a valeurs dans ( R

^k

, B

_Rk

).

— On utilisera la notation T

_n

pour une statistique. Elle ne d´ epend pas de la

famille de lois de probabilit´ e Q . En particulier, dans un mod` ele param´ etrique,

une statistique T

_n

ne d´ epend pas de θ. C’est la loi de probabilit´ e de T

_n

qui

d´ epend de θ.

(2)

Remarque.

On distingue :

— la statistique T

n

qui est une variable al´ eatoire sur ( R

ⁿ

, B, Q ). Dans l’exemple pr´ ec´ edent, c’est l’application moyenne empirique (on est ici au niveau concep- tuel, math´ ematique).

— la variable al´ eatoire T

n

(X

1

, . . . , X

n

) qui est une variable al´ eatoire sur (Ω, B).

Dans l’exemple pr´ ec´ edent, c’est la variable al´ eatoire X

_n

(on est ici au niveau de la statistique inf´ erentielle).

— la valeur observ´ ee de cette variable al´ eatoire : T

n

(x

1

, . . . , x

n

) ∈ R

^k

. Dans l’exemple pr´ ec´ edent, c’est le nombre r´ eel ¯ x

_n

, moyenne empirique de la s´ erie statistique x

₁

, . . . , x

_n

(on est au niveau de la statistique descriptive).

3 Quelques notions de base sur les estimateurs

On consid` ere dans cette section un mod` ele param´ etrique r´ eel d’´ echantillonage ind´ ependant :

( R , B, (P

_θ

, θ ∈ Θ ⊂ R

^p

))

ⁿ

. a. D´ efinition d’un estimateur

Soit g une fonction d´ efinite sur Θ, ` a valeur dans R

^p

.

— On appelle estimateur d’un param` etre g(θ) toute statistique ` a valeur dans ( R

^k

, B

_R^k

), il sera g´ en´ eralement not´ e T

_n

.

— On appelle estimation la valeur observ´ ee de T

_n

sur l’´ echantillon, elle sera not´ ee T

_n

(x

₁

, . . . , x

_n

).

b. Notion de biais

— On appelle biais de l’estimateur T

_n

pour le param` etre g(θ) la quantit´ e B

_θ

(T

_n

) = IE

_θ

[T

_n

] − g(θ).

— On appelle estimateur sans biais de g(θ) un estimateur T

_n

tel que B(T

_n

) = 0.

— Si B(T

_n

) → 0 quand n → +∞, on dit que T

_n

est asymptotiquement sans biais pour g(θ).

c. Convergence d’un estimateur

On dit que T

_n

est convergent pour g(θ) s’il converge en probabilit´ e vers g(θ) :

∀ε > 0, P (|T

_n

− g(θ)| < ε) −→ 1 quand n → +∞.

Crit` eres de convergence d’un estimateur

(i) Si T

_n

est un estimateur (asympt.) sans biais de g(θ) et si V (T

_n

) −→ 0 quand n → +∞, alors

T

_n

est un estimateur convergent pour g(θ).

(3)

d. Comparaisons des estimateurs

On utilise le risque quadratique pour comparer deux estimateurs du mˆ eme para- m` etre g(θ). Pour l’estimateur T

_n

de g(θ), il est d´ efini par :

R(T

_n

, g(θ)) = IE[(T

_n

− g(θ))

²

].

Propri´ et´ e. R(T

n

, g(θ)) = (B(T

n

))

²

+ V (T

n

).

e. Moyenne al´ eatoire, variance al´ eatoire Soit un mod` ele param´ etrique r´ eel d’´ echantillonage

( R , B

_R

, (P

_θ

, θ ∈ Θ ⊂ R

^p

))

ⁿ

tel que la loi de probabilit´ e P

_θ

admette pour esp´ erance µ < ∞ et pour variance 0 < σ

²

< ∞.

Soit X = (X

₁

, . . . , X

_n

) un vecteur al´ eatoire associ´ e de ce mod` ele.

On appelle moyenne al´ eatoire la statistique X

_n

= 1

n

X

i=1

X

_i

. On appelle variance al´ eatoire la statistique

V

n

= 1 n

n

X

i=1

(X

i

− X

n

)

²

,

on verra ci-dessous que cet estimateur de la variance est biais´ e, on lui pr´ ef´ erera la variance estim´ ee :

S

_n²

= 1 n − 1

n

X

i=1

(X

i

− X

n

)

²

.

Proposition I.1 1. X

_n

est un estimateur sans biais et convergent pour µ.

2. V

_n

est un estimateur biais´ e mais asymptotiquement sans biais de σ

²

. 3. S

_n²

= 1

n − 1

n

X

i=1

(X

_i

− X

_n

)

²

est un estimateur sans biais de σ

²

. 4. V

_n

et S

_n²

sont des estimateurs convergent de σ

²

.

II Estimation

— On reste dans le cadre du mod` ele :

( R , B

_R

, (P

_θ

, θ ∈ Θ ⊂ R ))

ⁿ

.

— Soit f(x, θ) la densit´ e de la loi des X

_i

.

(4)

— Soit L la vraisemblance. On a : L(x

₁

, . . . , x

_n

, θ) = Q

n

i=1

f (x

_i

, θ).

— Soit X ⊂ R le support de f (x, θ) o` u

X = {x ∈ R | f(x, θ) > 0}.

1 Hypoth` eses fondamentales sur la densit´ e f (x, θ)

(H1) X est ind´ ependant de θ.

(H2) Θ est un ouvert.

(H3)

_∂θ^∂

f(x, θ) et

_∂θ^∂²2

f (x, θ) sont d´ efinies ∀(x, θ) ∈ X × Θ.

(H4) On suppose que les d´ eriv´ es et d´ eriv´ es secondes de f par rapport ` a θ sont domin´ ees par des fonctions µ-int´ egrables sur tout compact inclu dans Θ : pour tout compact K ⊂ Θ, il existe deux fonctions positive µ-int´ egrables φ(x) et ψ (x) telles que pour tout θ ∈ K et presque tout x ∈ X ,

∂

∂θ f (x, θ)

≤ φ(x) et

∂

²

∂θ

²

f (x, θ)

≤ ψ(x).

2 Information

a. Information de Fisher

D´ efinition II.1 On appelle fonction score ou score la fonction S d´ efinie par : S : X × Θ −→ R

(x, θ) 7−→ S(x, θ) =

_∂θ^∂

ln(f (x, θ)) Remarques.

— Le score n’est d´ efini que si (H1), (H2) et (H3) sont vraies.

— On peut d´ efinir de mˆ eme le score ` a partir de la vraisemblance.

S

_n

(x, θ) = ∂

∂θ ln(L(x, θ)) avec ici x ∈ R

ⁿ

. Dans le mod` ele d’´ echantillonage, on a : S

n

(x, θ) = P

n

i=1

S(x

i

, θ).

Propri´ et´ es.

Supposons (H4) vraie, on a alors :

IE[S(X, θ)] = 0 et IE[S

_n

(X, θ)] = 0.

Information au sens de Fisher

D´ efinition II.2 On appelle information de Fisher la fonction I d´ efinie par : I : Θ −→ R

⁺

θ 7−→ I(θ) = IE

(S(X, θ))

²

(5)

Remarques. On peut aussi poser (en terme de vraisemblance) : I

_n

(θ) = IE

(S

_n

(X, θ))

²

. b. Propri´ et´ es.

Si (H4) est vraie, alors

I(θ) = V (S(X, θ)) = −IE ∂

²

∂θ

²

ln(f (X, θ))

et I

_n

(θ) = V (S

_n

(X, θ)) = −IE ∂

²

∂θ

²

ln(L(X, θ))

. Dans le mod` ele d’´ echantillonage, on a donc :

I

_n

(θ) = nI (θ).

3 In´ egalit´ e de Cramer-Rao

a. Hypoth` eses suppl´ ementaires

(H5) 0 < I

_n

(θ) < +∞ ou 0 < I(θ) < +∞.

Soit T

n

un estimateur. Posons IE

θ

[T

n

] = g(θ).

Th´ eor` eme II.1 (In´ egalit´ e de Cramer-Rao.) Si les hypoth` eses (H1), (H2), (H3), (H4) et (H5) sont v´ erifi´ ees, si de plus la fonction g est d´ erivable, alors on a :

V (T

_n

) ≥ [g

⁰

(θ)]

²

I

_n

(θ) .

La partie de droite est appel´ ee borne inf´ erieure de l’in´ egalit´ e de Cramer-Rao.

Nous la noterons K

_T_n

(θ).

D´ efinition II.3 — On dit que l’estimateur T

_n

est efficace s’il v´ erifie V (T

_n

) = K

Tn

(θ).

— Si T

_n

n’est pas efficace mais que K

_T_n

(θ)

V (T

_n

) → 1 quand n → +∞, on dit que l’estimateur T

_n

est asymptotiquement efficace.

b. Relation entre estimateurs efficaces

Propri´ et´ es.

(P1) Si T

n

est un estimateur efficace de θ, alors kT

n

+ b est aussi un estimateur efficace de θ, ∀k ∈ R

^∗

, ∀b ∈ R .

(P2) Soient T

_1n

et T

_2n

deux estimateurs sans biais du param` etre θ. S’ils sont

tous les deux efficaces, alors T

1n

= T

2n

presque sˆ urement.

(6)

c. D´ egradation de l’information

Si h(t, θ) est la vraissemblance de T , on note I

_T

(θ) l’information relative ` a T : I

_T

(θ) = IE(S(T , θ)

²

) o` u S(T , θ) = ∂ ln h(t, θ)

∂θ .

I

_T

(θ) v´ erifie les mˆ emes propri´ et´ es (centr´ ee, relation avec

_∂θ^∂²2

h, in´ egalit´ e de Cramer- Rao) que I(θ).

Proposition II.1 Soit T une statistique, on a I

_T

(θ) ≤ I

_n

(θ) avec ´ egalit´ e si et seulement si la statistique T est exhaustive pour le param` etre θ.

4 Notion d’exhaustivit´ e

D´ efinition II.4 (Principe de factorisation) La statistique T

n

est ici une variable al´ eatoire d´ efinie sur (X , B

X

, (P

_θ

, θ ∈ Θ ⊂ R ))

ⁿ

` a valeurs dans (Θ, B

_Θ

).

On consid` ere :

— la vraisemblance (fonction de densit´ e ou probabilit´ e) de T

n

que l’on va noter h(t, θ),

— la densit´ e conjointe de l’´ echantillon (X

₁

, . . . , X

_n

) not´ ee L(x

₁

, . . . , x

_n

, θ), On dira que la statistique T

n

est exhaustive pour θ s’il existe une fonction k sur X

ⁿ

telle que

L(x

1

, . . . , x

n

, θ) = h(t, θ)k(x

1

, . . . , x

n

).

Th´ eor` eme II.2 (de factorisation) Pour qu’une statistique T soit exhaustive, il suffit que la vraissemblance s’´ ecrive :

L(x

₁

, . . . , x

_n

, θ) = φ(t, θ)ψ(x

₁

, . . . , x

_n

).

5 Exhaustivit´ e et estimateurs efficaces ; la famille exponentielle

a. Le mod` ele exponentiel

D´ efinition II.5 On appelle famille exponentielle ` a param` etre unidimensionnel θ toute loi de probabilit´ e (discr` ete ou continue) dont la vraissemblance peut se mettre sous la forme :

f(x, θ) =

exp[α(θ)β(x) + γ(θ) + δ(x)] si x ∈ X

0 si x 6∈ X ,

avec, α et γ des fonctions deux fois diff´ erentiables.

Proposition II.2 Dans la famille exponentielle, toute statistique de la forme T

_n

= k P

n

i=1

β(X

i

) est exhaustive pour θ.

Th´ eor` eme II.3 (Th´ eor` eme de Darmois) Lorsque X est ind´ ependant de θ, le

mod` ele admet une statistique exhaustive ssi le mod` ele est exponentiel.

(7)

b. Th´ eor` eme sur l’efficacit´ e

Th´ eor` eme II.4 Si X ne d´ epend pas de θ et que le mod` ele admette un estimateur efficace alors le mod` ele est exponentiel car l’estimateur est n´ ecessairement exhaustif.

Dans un mod` ele exponentiel, alors ` a une transformation lin´ eaire pr` es, il existe un unique estimateur efficace qui v´ erifie :

T = 1 n

n

X

i=1

β(X

i

), g(θ) = − γ

⁰

(θ)

α

⁰

(θ) , g(θ) = IE

_θ

(T ), et V

θ

(T ) =

_nα^g⁰^(θ)0(θ)

.

6 Quelques m´ ethodes usuelles d’estimation

a. M´ ethode empirique

Si le param` etre θ consid´ er´ e repr´ esente une quantit´ e particuli` ere pour le mod` ele (par exemple, l’esp´ erance ou la variance), on peut naturellement choisir comme estimateur la quantit´ e empirique correspondante pour l’´ echantillon X

₁

, . . . , X

_n

. b. M´ ethode des moindres carr´ es

D´ efinition II.6 On appelle estimateur des moindres carr´ es de θ la statistique θ ˆ

_n

= arg min

θ∈Θ n

X

i=1

(X

_i

− h(θ))

²

.

c. M´ ethode des moments On note

— Soit X une variable al´ eatoire r´ eelle.

On appelle moment (th´ eorique) d’ordre r : M

_r

= IE[X

^r

].

On appelle moment (th´ eorique) centr´ e d’ordre r : M

r

= IE[(X − IE[X])

^r

].

— Soit (x

₁

, . . . , x

_n

) les valeurs observ´ ees d’un ´ echantillon de taille n.

On appelle moment empirique d’ordre r : m

r

=

_n¹

P

n

i=1

(x

i

)

^r

. On appelle moment empirique centr´ e d’ordre r : m

_r

=

¹_n

P

n

i=1

(x

_i

− x ¯

_n

)

^r

.

Principe. Supposons le param` etre θ de dimension p. La m´ ethode consiste ` a poser

un syst` eme d’´ equations en ´ egalant moments th´ eoriques (centr´ es ou non) et moments

empiriques :

(8)



 

 

M

₁

(θ) = m

₁

.. . M

_p

(θ) = m

_p

d. M´ ethode du maximum de vraisemblance : principe

D´ efinition II.7 On appelle estimateur du maximum de vraisemblance (EMV) du param` etre θ la statistique θ ˆ

n

rendant maximale, selon θ, la fonction de vraisemblance du mod` ele L(X

₁

, . . . , X

_n

, θ), soit :

θ ˆ

n

= arg max

θ∈Θ

L(X, θ).

Propri´ et´ e.

Si le mod` ele v´ erifie les propri´ et´ es (H1), (H2) et (H3), alors pour que ˆ θ

_n

soit un EMV de θ il est n´ ecessaire que

• ∂ ln L(X, θ)

∂θ

_θ=ˆ_θ

n

= 0 soit S

n

(X, θ ˆ

n

) = 0 (´ equation de vraisemblance),

• ∂

²

ln L(X, θ)

∂θ

²

θ=ˆθn

< 0.

Propri´ et´ e (lien avec l’exhaustivit´ e).

S’il existe une statistique exhaustive T

_n

pour θ, alors l’EMV de θ ne d´ epend que de T

n

.

7 Exercices

Exercice 1. On consid` ere la loi normale N (µ, σ

²

).

a) On suppose σ

²

connue et l’on consid` ere le mod` ele param´ etrique r´ eel d’´ echantillonnage suivant

R , B

_R

, (N (µ, σ

²

), µ ∈ Θ = R )

n

. L’estimateur X

_n

est-il un estimateur efficace de µ ?

b) Sans supposer µ connue, on pose θ = σ

²

et l’on consid` ere le mod` ele param´ e- trique r´ eel d’´ echantillonnage suivant

R , B

_R

, (N (µ, σ

²

), σ

²

∈ Θ = R

^∗+

)

n

. L’estimateur S

_n²

est-il un estimateur efficace de σ

²

? Exercice 2.

a) Montrer que la loi de Poisson appartient ` a la famille exponentielle.

b) Montrer que la loi de Cauchy n’appartient pas ` a la famille exponentielle.

(9)

Exercice 3. D´ eterminer l’EMV du param` etre λ d’une loi de Poisson. En ´ etudier les propri´ et´ es (biais, convergence, efficacit´ e, exhaustivit´ e).

Exercice 4. Ecrire la vraisemblance d’une loi de Bernoulli de param` etre p ∈]0, 1[.

D´ eterminer l’EMV de p. Etudier ses propri´ et´ es (biais, convergence, efficacit´ e, exhaustivit´ e).

Exercice 5.

a) D´ eterminer l’EMV ˆ θ

_n

du param` etre θ de la loi uniforme sur [0, θ] avec θ ∈ R

^∗+

. b) D´ eterminer la densit´ e de probabilit´ e de ˆ θ

n

.

c) Calculer IE[ˆ θ

_n

] et V (ˆ θ

_n

).

d) Etudier les propri´ et´ es de ˆ θ

_n

(biais, convergence, efficacit´ e).

e) Proposer un estimateur T

n

de θ sans biais et convergent.

f) Choisir entre ˆ θ

_n

et T

_n

au moyen du risque quadratique.

g) Montrer que l’estimateur de θ obtenu par la m´ ethode des moindres carr´ es est identique ` a l’estimateur des moments. On notera U

n

cet estimateur.

h) Etudier les propri´ et´ es de U

_n

(biais et convergence) et le comparer ` a T

_n

. i) Commenter.

8 G´ en´ eralisation au cas d’un param` etre multidimensionnel

On consid` ere dans ce chapitre un mod` ele param´ etrique r´ eel d’´ echantillonnage : ( R , B

_R

, (P

_θ

, θ ∈ Θ ⊂ R

^p

))

ⁿ

, avec p ≥ 2.

a. G´ en´ eralisation des d´ efinitions sur les estimateurs Estimateurs

Un estimateur est une statistique T

_n

d´ efinie sur ( R , B

_R

, (P

_θ

, θ ∈ Θ ⊂ R

^p

))

ⁿ

` a valeurs dans (Θ, B

_Θ

). C’est donc un vecteur al´ eatoire de dimension p : T

_n

= (T

_n,1

, . . . , T

_n,p

).

Estimateur sans biais.

— Biais de T

_n

: B(T

_n

) = IE(T

_n

) − θ ∈ R

^p

.

— On dit que T

_n

est sans biais pour θ si B(T

_n

) = 0

_p

,

— On dit que T

_n

est asymptotiquement sans biais pour θ si B(T

_n

) −→ 0

_p

pour n → +∞,

autrement dit si ∀j = 1, . . . , p, IE[T

_n,j

] −→ θ

_j

pour n → +∞.

Estimateur convergent.

— T

_n

est convergent pour θ si et seulement si T

_n

−→

_proba

θ pour n → +∞, c’est ` a dire : ∀j = 1, . . . , p, T

_n,j

−→

_proba

θ

_j

.

— Conditions n´ ecessaires et suffisantes de convergence :

||T

_n

− θ|| −→

_proba

0 pour n → +∞ ⇐⇒ T

_n

est convergent pour θ o` u ||.|| d´ esigne toute norme de R

^p

.

Risque quadratique.

(10)

— Il est d´ efini par : R(T

_n

, θ) = IE [(T

_n

− θ)

⁰

(T

_n

− θ)] =

p

X

j=1

IE

(T

_n,j

− θ

_j

)

²

.

— Propri´ et´ e :

R(T

_n

, θ) = B(T

_n

)

⁰

B(T

_n

) +

p

X

j=1

V (T

_n,j

).

On peut r´ e´ ecrire ceci sous la forme : R(T

_n

, θ) =

p

X

j=1

(IE[T

_n,j

] − θ

_j

)

²

+

p

X

j=1

V (T

_n,j

).

b. G´ en´ eralisation de l’in´ egalit´ e de Cramer-Rao On continue ` a noter

— f (x, θ) la vraisemblance du mod` ele de dimension 1, ici x ∈ R et θ ∈ R

^p

;

— L(x, θ) la vraisemblance du mod` ele de dimension n, ici x ∈ R

ⁿ

et θ ∈ R

^p

;

— X le support de f et X

ⁿ

celui de L.

G´ en´ eralisation des hypoth` eses de r´ egularit´ e

Les hypoth` eses (H1) et (H2) ne sont pas modifi´ ees mais seront ici not´ ee (H1

⁰

) et (H2

⁰

).

(H1

⁰

) X est ind´ ependant de θ.

(H2

⁰

) Θ est un ouvert.

On a f (x, θ) > 0, ∀(x, θ) ∈ X × Θ.

(H3

⁰

) ∀j = 1, . . . , p, ∂

∂θ

_j

f(x, θ) est d´ efinie ∀(x, θ) ∈ X × Θ.

∀(j, k) ∈ {1, . . . , p}, ∂

²

∂θ

_j

∂θ

_k

f (x, θ) est d´ efinie ∀(x, θ) ∈ X × Θ.

(H4

⁰

) ∀(j, k) ∈ {1, . . . , p}

∂

∂θ

_j

f(x, θ) et ∂

²

∂θ

_j

∂θ

_k

f (x, θ)

v´ erifient la propri´ et´ e de domination sur tout compact de Θ (par des fonctions de x µ-int´ egrables).

Fonction de score (ou score)

On suppose les hypoth` eses (H1

⁰

), (H2

⁰

) et (H3

⁰

) v´ erifi´ ees.

D´ efinition. La fonction score est d´ efinie par :

S : X × Θ −→ R

^p

(x, θ) 7−→ S(x, θ) = grad

_θ

ln(f(x, θ) =







∂

∂θ1

ln(f (x, θ)) .. .

∂

∂θp

ln(f (x, θ))







Remarques et propri´ et´ es.

— On peut aussi d´ efinir le score du mod` ele de dimension n : S

_n

(x, θ) = grad

_θ

ln(L(x, θ)).

— Sous (H4

⁰

), on peut montrer que : IE[S(X, θ)] = 0

_p

= IE[S

_n

(x, θ)].

(11)

Matrice d’information de Fisher

D´ efinition. La matrice d’information de Fisher est une matrice carr´ ee p×p d´ efinie par :

I(θ) = IE [S(X, θ)(S(X, θ))

⁰

] , l’´ el´ ement (j, k) de la matrice I(θ) est donn´ ee par IE

h

∂

∂θj

ln(f (x, θ))

_∂θ^∂

k

ln(f(x, θ)) i

. Remarques et propri´ et´ es.

— On peut aussi d´ efinir la matrice d’information de Fisher par rapport du mo- d` ele de dimension n :

I

_n

(x, θ) = IE [S

_n

(X, θ)(S

_n

(X, θ))

⁰

] .

— Dans un mod` ele d’´ echantillonnage, on a : I

_n

(x, θ) = nI (θ).

G´ en´ eralisation de l’in´ egalit´ e de Cramer-Rao

— Soit T

_n

un estimateur de θ. On pose IE[T

_n

] = g(θ).

La fonction g d´ efinie sur Θ est ` a valeurs dans R

^p

, sa j` eme coordonn´ ee est g

_j

(θ) = IE[T

_n,j

].

— Soit D

_g

(θ) la matrice jacobienne de g.

— Notons V

_T_n

(θ) la matrice de variances-covariances de T

_n

. Consid´ erons l’hypoth` ese suppl´ ementaire suivante :

(H5

⁰

) I

_n

(θ) est une matrice d´ efinie positive.

In´ egalit´ e de Cramer-Rao. Sous les hypoth` eses (H1

⁰

) ` a (H5

⁰

), la matrice V

_T_n

(θ) − D

_g

(θ) [I

_n

(θ)]

⁻¹

(D

_g

(θ))

⁰

est semi-d´ efinie positive.

D´ efinitions.

— La matrice D

_g

(θ) [I

_n

(θ)]

⁻¹

(D

_g

(θ))

⁰

s’appelle la borne inf´ erieure de l’in´ egalit´ e de Cramer-Rao.

— On dit que T

_n

est efficace pour θ s’il v´ erifie V

_T_n

(θ) = D

_g

(θ) [I

_n

(θ)]

⁻¹

(D

_g

(θ))

⁰

. Forme g´ en´ erale de la famille exponentielle

D´ efinition. On dit qu’une loi de probabilit´ e appartient ` a la famille exponentielle (` a param` etre multidimensionnel) si sa vraisemblance peut s’´ ecrire sous la forme :

f(x, θ) =



 

  exp

"

_p

X

j=1

α

_j

(θ)β

_j

(x) + γ(θ) + δ(x)

#

si x ∈ X ,

0 sinon,

avec X ind´ ependant de θ. Les applications α

_j

et γ vont de R

^p

dans R .

Les applications β

_j

et δ vont de R dans R .

(12)

c. G´ en´ eralisation de la m´ ethode du maximum de vraisemblance

D´ efinition. L’estimateur du maximum de vraisemblance (EMV) de θ est d´ efinie par :

θ ˆ

_n

= arg max

θ∈Θ

L(X

₁

, . . . , X

_n

, θ).

Caract´ erisation de l’EMV ˆ θ

_n

. Si les hypoth` eses (H1

⁰

), (H2

⁰

) et (H3

⁰

) sont v´ e- rifi´ ees, alors pour d´ eterminer ˆ θ

_n

,

i) on r´ esoud S

_n

(X, θ ˆ

_n

) = 0 (´ equations de vraisemblance),

ii)) on v´ erifie que la matrice hessienne de ln L (matrice carr´ ee d’ordre p de terme g´ en´ eral

_∂θ^∂²

j∂θ_k

ln(L(x, θ)) calcul´ ee en ˆ θ

_n

est d´ efinie n´ egative, iii) on v´ erifie que le maximum local est un maximum.

III Comportement asymptotique des estimateurs

1 Propri´ et´ es asymptotiques de l’EMV

a. En dimension 1

Deux hypoth` eses suppl´ ementaires sont n´ ecessaires : (H6) θ 6= θ

⁰

= ⇒ P

_θ

6= P

_θ⁰

.

(H7) ∂

²

∂θ

²

ln f(x, θ) est continue en θ, uniform´ ement en x.

Th´ eor` eme III.1 Si les hypoth` eses (H1), (H2), (H3), (H4) et (H6)sont v´ erifi´ ees, alors il existe une suite θ ˆ

_n

d’estimateurs du maximum de vraissemblance qui converge presque sˆ urement vers θ.

Th´ eor` eme III.2 Sous les hypoth` eses (H1) ` a (H7), on a :

√ n

θ ˆ

_n

− θ

−→

_loi

N (0, I

⁻¹

(θ)) quand n → +∞.

b. En dimension sup´ erieure

Les r´ esultats de convergence pour l’EMV en dimension sup´ erieure restent va- lables :

Th´ eor` eme III.3 Si les hypoth` eses (H1

⁰

) ` a (H7

⁰

) sont toutes v´ erifi´ ees, alors on a :

√ n(ˆ θ

_n

− θ) −→

_loi

N

_p

(0

_n

, I

⁻¹

(θ)).

(13)

2 D´ efinitions / outils

a. Normalit´ e et efficacit´ e asymptotique Soit T

_n

un estimateur de θ.

— Si √

n(T

_n

− θ) −→

_loi

N

_p

(0

_p

, Σ),

alors on dit que T

_n

est asymptotiquement normal. La matrice Σ est appel´ ee matrice de variances-covariances aymptotique de T

_n

. (Cela n’implique pas que n V (T

_n

) → Σ.)

— Si √

n(T

_n

− θ) −→

_loi

N

_p

(0

_p

, I

⁻¹

(θ)),

alors on dit que T

_n

est asymptotiquement efficace.

— L’EMV est asymptotiquement normal et efficace.

b. M´ ethode Delta

Soit g une fonction C

¹

. On suppose que T

_n

est un estimateur de θ tel que a

_n

(T

_n

− θ) −→ N

^L

(0, σ

²

(θ))

avec a

_n

→ ∞. Alors, g(T

_n

) converge en probabilit´ e vers g(θ) et a

_n

(g(T

_n

) − g(θ)) −→ N

^L

(0, g

⁰

(θ)

²

σ

²

(θ)).

En dimension sup´ erieure, on consid` ere T

_n

un vecteur al´ eatoire de R

^k

, Σ une matrice de covariance. On suppose que

a

_n

(T

_n

− θ) −→ N

^L

(0, Σ)

avec a

n

→ ∞. Alors, pour toute fonction g de classe C

¹

, g(T

n

) converge en probabilit´ e vers g(θ) et

a

n

(g(T

n

) − g(θ)) −→ N

^L

(0, D

g

ΣD

^t_g

) o` u D

_g

est la matrice Jacobienne de g calcul´ ee en θ.

3 Exercices

Exercice 1. On consid` ere le mod` ele d’´ echantillonnage normal avec P

_θ

= N (µ, σ

²

).

a) D´ eterminer l’EMV de θ = (µ, σ

²

).

b) Etudier ses propri´ et´ es (biais, convergence, efficacit´ e).

c) Quelle fonction h(θ) peut-on estimer par un estimateur sans biais et efficace ? Exercice 2. On consid` ere le mod` ele d’´ echantillonnage multinomial ` a k ≥ 3 cat´ e- gories :

R , B( R ), B(p

₁

, . . . , p

_k

), p

_i

∈ [0, 1],

k

X

i=1

p

_i

= 1

!

ⁿ

avec X B(p

₁

, . . . , p

_k

), P (X = a

_i

) = p

_i

. a) D´ eterminer l’EMV de θ = (p

₁

, . . . , p

k−1

).

b) Montrer qu’il est sans biais, convergent et efficace.

(14)

IV Estimation par intervalle de confiance

1 Introduction

On va consid´ erer dans ce chapitre un mod` ele statistique r´ eel param´ etrique (avec un param` etre unidimensionnel) :

( R , B

_R

, (P

_θ

, θ ∈ Θ ⊂ R ))

ⁿ

. D´ efinition.

Soit α ∈ [0, 1]. On appelle intervalle de confiance du param` etre θ de niveau (de confiance) 1 − α la donn´ ee de deux statistiques A

_n

et B

_n

v´ erifiant

P (A

_n

≤ θ ≤ B

_n

) = 1 − α.

2 Intervalles de confiance pour les param` etres de la loi normale

On suppose ici que l’on dispose d’un ´ echantillon (X

₁

, . . . , X

_n

) o` u les X

_i

sont ind´ ependants et identiquement distribu´ es selon la loi N (µ, σ

²

).

Intervalle de confiance pour µ lorsque σ

²

est connue

L’intervalle de confiance pour µ de niveau de confiance 1−α lorsque σ

²

est connue est :

X

_n

− z

_1−α/2

σ

√ n ≤ µ ≤ X

_n

+ z

_1−α/2

σ

√ n

o` u z

1−α/2

est le fractile d’ordre 1 − α/2 de la loi normale centr´ ee r´ eduite N (0, 1).

Intervalle de confiance pour µ lorsque σ

²

est inconnue

L’intervalle de confiance pour µ de niveau de confiance 1 − α lorsque σ

²

est inconnue est :

X

_n

− t

1−α/2

S

_n

√ n ≤ µ ≤ X

_n

+ t

1−α/2

S

_n

√ n

o` u t

1−α/2

est le fractile d’ordre 1− α/2 de la loi de Student T (n −1) et S

n

= p S

_n²

. Intervalle de confiance pour σ

²

lorsque µ est connue

On se donne ici α

₁

> 0 et α

₂

> 0 v´ erifiant α

₁

+ α

₂

= α.

L’intervalle de confiance pour σ

²

de niveau de confiance 1−α lorsque µ est connue est :

P

n

i=1

(X

i

− µ)

²

˜ k

₂

≤ σ

²

≤ P

n

i=1

(X

i

− µ)

²

k ˜

₁

o` u ˜ k

₁

(resp. ˜ k

₂

) est le fractile d’ordre α

₁

(resp. 1− α

₂

) de la loi du chi-deux χ

²

(n).

Intervalle de confiance pour σ

²

lorsque µ est inconnue

On se donne ici ` a nouveau α

₁

> 0 et α

₂

> 0 v´ erifiant α

₁

+ α

₂

= α.

L’intervalle de confiance pour σ

²

de niveau de confiance 1 − α lorsque µ est

inconnue est :

(15)

P

n

i=1

(X

i

− X

n

)

²

k

₂

≤ σ

²

≤

P

n

i=1

(X

i

− X

n

)

²

k

₁

o` u k

₁

(resp. k

₂

) est le fractile d’ordre α

₁

(resp. 1 − α

₂

) de la loi du chi-deux χ

²

(n − 1).

3 Construction d’intervalles de confiance asymptotiques

D´ efinition IV.1 Un intervalle de confiance [A

_n

, B

_n

] est de niveau asymptotique 1 − α si

P (A

_n

≤ θ ≤ B

_n

)

^n→∞

−→ 1 − α.

a. Utilisation de la convergence de l’EMV

Supposons v´ erifi´ ees les hypoth` eses de r´ egularit´ e (H1) ` a (H7).

Soit I

_n

(θ) l’information de Fisher du mod` ele consid´ er´ e. Soit θ b

_n

l’EMV de θ. On a vu que :

p I

_n

(θ)

θ b

_n

− θ

−→

_Loi

N (0, 1) pour n → +∞.

donc

P

−z

1−α/2

≤ p

I

_n

(θ)

θ b

_n

− θ

≤ z

1−α/2

' 1 − α.

4 Exercices

Exercice 1. Soient X

₁

, . . . , X

₁₀

dix variables al´ eatoires i.i.d. de loi N (µ, σ

²

). On dispose des observations suivantes :

6 8 1 5 6 7 6 6 5 9

Calculer les intervalles de confiance de niveau 95% suivants : - pour µ, sachant que σ

²

= 4 ;

- pour µ, ne connaissant pas σ

²

;

- pour σ

²

, puis pour σ, ne connaissant pas µ.

Exercice 2.

Dans une fabrication en s´ erie, on cherche ` a estimer le taux de pi` eces d´ efectueuses.

Pour cela, on a r´ ealis´ e, ` a quatre p´ eriodes diff´ erentes, quatre pr´ el` evements. Les r´ esultats sont les suivants :

6 pi` eces d´ efectueuses sur 30, 10 pi` eces d´ efectueuses sur 50, 20 pi` eces d´ efectueuses sur 100, 40 pi` eces d´ efectueuses sur 200.

D´ eterminer, dans chaque cas, l’intervalle de confiance de niveau 95% de ce taux.

Exercice 3.

(16)

D´ eterminer l’intervalle de confiance de niveau 95% de la proportion p d’un ´ ev´ e- nement E , lorsque sur 80 exp´ eriences (ind´ ependantes), l’´ ev´ enement s’est produit 45 fois.

Exercice 4.

En utilisant le th´ eor` eme central limite, construire un intervalle de confiance de niveau asymptotiquement ´ egal ` a 1 − α pour le param` etre λ d’une loi de Poisson.

Application num´ erique : On compte le nombre de parasites par fruit dans un lot de fruits parasit´ es et on obtient :

x

_i

: nombre de parasites par fruit 0 1 2 3 4 5 n

_i

: nombre de fruits contenant x

_i

parasites 11 29 27 19 10 4 Si l’on suppose que le nombre de parasites suit une loi de Poisson de param` etre λ,

donner l’intervalle de confiance de niveau asymptotiquement ´ egal ` a 99% pour le param` etre λ.

Exercice 5.

On consid` ere une variable al´ eatoire r´ eelle continue de densit´ e : f(x) =

0 si x < 2,

θ exp(−θ(x − 2)) si x ≥ 2, avec θ > 0.

1. V´ erifier que cette loi appartient ` a la famille exponentielle.

2. En utilisant les propri´ et´ es de l’EMV de θ, construire un intervalle de confiance pour θ de niveau asymptotiquement ´ egal ` a 1 − α.

3. Application num´ erique : Calculer cet intervalle de confiance pour n = 200, ¯ x

_n

= 6, 68 et α = 5%.

Exercice 6.

On consid` ere n

₁

variables al´ eatoires r´ eelles X

_1,1

, . . . , X

_1,n₁

i.i.d. de loi N (µ

₁

, σ

²

) et

n

₂

variables al´ eatoires r´ eelles X

_2,1

, . . . , X

_2,n₂

i.i.d. de loi N (µ

₂

, σ

²

). On suppose de plus les variables X

_k,i

(k = 1, 2 et i = 1, . . . , n

_k

) mutuellement ind´ ependantes.

1. Soient X

₁

= 1 n

₁

n1

X

i=1

X

_1,i

et X

₂

= 1

n

₂

n2

X

i=1

X

_2,i

. Quelle est la loi de X

₁

− X

₂

?

2. Soit S

²

= 1 n

₁

+ n

₂

− 2

"

_n₁

X

i=1

(X

_1,i

− X

₁

)

²

+

n2

X

i=1

(X

_2,i

− X

₂

)

²

# . Quelle est la loi de (n

₁

+ n

₂

− 2) S

²

σ

²

?

3. En d´ eduire un intervalle de confiance de niveau 1 − α pour le param` etre

µ

₁

− µ

₂

.

(17)

4. Application num´ erique : On a observ´ e n

₁

= 10 et n

₂

= 8 observations dans chacune des deux populations consid´ er´ ees. Les donn´ ees obtenues sont les suivantes :

x

_1,i

: 1,36 2,66 2,05 1,85 2,28 1,71 0,75 1,97 1,70 1,68 x

_2,i

: 1,91 2,03 1,31 1,33 2,68 2,04 0,40 3,31

Calculer l’intervalle de confiance de niveau 95% pour le param` etre µ

₁

− µ

₂

.

V G´ en´ eralit´ es sur les tests

1 Probl` emes de test

Le but d’un test statistique est de donner un crit` ere permettant de retenir l’hypoth` ese H

₀

: θ ∈ Θ

₀

ou de retenir une hypoth` ese alternative H

₁

: θ ∈ Θ

₁

, avec Θ

₁

⊂ Θ

^c₀

.

La mise en œuvre du crit` ere du test d´ etermine une zone de rejet ou zone critique W , W

^c

est la zone d’acceptation ou zone de confiance. On appelle risque de premi` ere esp` ece, not´ ee α, la probabilit´ e de rejeter l’hypoth` ese H

0

alors qu’elle est vraie, α = P (W |H

₀

). La probabilit´ e, not´ ee 1 − β, de retenir l’hypoth` ese H

₀

alors qu’elle est fausse s’appelle risque de deuxi` eme esp` ece, 1 − β = P (W

^c

|H

₁

). La probabilit´ e β s’appelle puissance du test.

D´ efinition V.1 Un test est donn´ e par une fonction Φ : E

ⁿ

−→ {0, 1}, on retiendra H

₀

si Φ(X

₁

, . . . , X

_n

) = 0, on rejette H

₀

si Φ(X

₁

, . . . , X

_n

) = 1. On appelle zone de rejet l’ensemble R = {Φ(X

₁

, . . . , X

_n

) = 1}. ´ Evidemment, ´ etant donn´ ee une zone de rejet R ⊂ E

ⁿ

, on d´ efinit un test en posant Φ = 1I

_R

.

Lorsque Θ

₀

= {θ

₀

} et Θ

₁

= {θ

₁

}, on parle d’hypoth` eses simples.

D´ efinition V.2 Le niveau du test - ou sa sensibilit´ e - est la probabilit´ e de rejeter H

0

` a tort :

α = sup

θ∈Θ₀

P

θ

((X

₁

, . . . , X

_n

) ∈ R)).

La puissance du test est la fonction β : Θ

₁

−→ [0, 1] d´ efinie par β(θ) = P

^θ

((X

1

, . . . , X

n

) ∈ R). Le test est dit sans biais si β(θ) ≥ α ∀θ ∈ Θ

1

.

2 Tests uniform´ ement plus puissants

D´ efinition V.3 Etant donn´ ´ es deux tests Φ

₁

et Φ

₂

de niveau ≤ α pour tester l’hy-

poth` ese H

₀

: θ ∈ Θ

₀

contre H

₁

: θ ∈ Θ

₁

. Le test Φ

₁

est uniform´ ement plus puissant

(u.p.p.) que Φ

₂

ssi ∀θ ∈ Θ

₁

, β

₁

(θ) ≥ β

₂

(θ). Dans le cas o` u Θ

₁

= {θ

₁

} et Θ

₀

= {θ

₀

},

on parle de test plus puissant (p.p.).

(18)

Dans un premier temps, on supposera que H

₀

et H

₁

sont des hypoth` eses simples : H

0

: θ = θ

0

, H

1

: θ = θ

1

.

Soit L(x

₁

, . . . , x

_n

, θ) la fonction de vraisemblance de (X

₁

, . . . , X

_n

).

D´ efinition V.4 On consid` ere des hypoth` eses simples Θ

₀

= {θ

₀

} et Θ

₁

= {θ

₁

}. Soit V

_θ₀_,θ₁

(x) = L(x, θ

1

)

L(x, θ

₀

)

le rapport de vraissemblance. On consid` ere la famille de tests Φ

_k

dont la r´ egion critique R

_k

est de la forme :

V

_θ₀_,θ₁

(x) > k.

On appellera test de Neyman et Pearson tout test de cette forme.

Th´ eor` eme V.1 (Lemme de Neyman-Pearson)

1. Soit α > 0, si Φ

_k

est un test de niveau α alors il est p.p. que tout autre test de niveau ≤ α, de plus il est sans biais.

2. Si α ∈]0, 1[,si les lois P

θ

sont absoluement continues, il existe k

_α

∈ R tel que Φ

_k_α

est de niveau α. Si les lois P

θ

sont discr` etes alors il existe un plus petit k

_α

tel que Φ

_k_α

est de niveau ≤ α.

3. Soit Φ un test p.p. de niveau α alors ∀θ ∈ {θ

₀

, θ

₁

},

P

θ

(Φ(X) 6= Φ

_k_α

(X) et V (X) 6= k) = 0.

Ce r´ esultat permet de construire des tests optimisant la puissance dans le cas d’hypoth` eses simples. Le point 3. montre que les tests de Neymann et Pearson sont les seuls tests p.p. (dans le cas absoluement continu). Dans le cas d’hypoth` eses composites (par exemple H

₁

n’est pas r´ eduite ` a un point), le lemme de Neyman et Pearson permet d’obtenir des tests u.p.p., si les rapports de vraisemblance sont monotones.

Proposition V.1 Si T est une statistique exhautive dont la fonction de vraissemblance g(t, θ) v´ erifie : pour θ > θ

₀

,

g(t, θ)

g(t, θ

₀

) est une fonction croissante de t.

Alors le test de zone de rejet R f

_k

= {T > k} est u.p.p. pour tester θ = θ

₀

contre

θ > θ

0

.

(19)

3 Tests fond´ es sur le rapport du maximum de vraisemblance

D´ efinition V.5 On appellera test du maximum de vraisemblance tout test fond´ e sur la r´ egion critique

W =

x ∈ R

ⁿ

/ sup

_θ∈Θ₁

L(x, θ) sup

_θ∈Θ₀

L(x, θ) > k

α

, o` u k

_α

est choisit tel que sup

θ∈Θ0

P

^θ

(W ) = α.

Dans le cas o` u Θ

₁

= Θ

^c₀

, on consid` erera le test de r´ egion critique : R =

x ∈ R

ⁿ

/ λ(x) = sup

_θ∈Θ

L(x, θ) sup

_θ∈Θ₀

L(x, θ) > k

_α

.

D´ ecision et “p-value”

Lorsqu’on proc` ede ` a un test, on fixe l’hypoth` ese H

₀

, par exemple θ = θ

₀

, on choisit une hypoth` ese alternative H

₁

:

H

₁

: θ 6= θ

₀

hypoth` ese bilat´ erale

H

₁

: θ < θ

₀

ou H

₁

: θ > θ

₀

hyoth` eses unilat´ erale.

On se fixe un risque de premi` ere esp` ece α, on d´ etermine la r´ egion critique (i.e.

pour un test bas´ e sur le rapport de vraissemblance, la valeur de k

_α

), on calcule la valeur exp´ erimentale de la statistique du test Z

_exp

, si Z

_exp

est dans la r´ egion critique, on rejette H

₀

(et on retient H

₁

), sinon on retient H

₀

.

La plupart des logiciels de statistique permettent de calculer la valeur de k

_α

mais fournissent aussi un autre renseignement : la “p-value” p. Si le test est de r´ egion critique f(Z ) > k o` u Z est la statistique du test (f(x) = x ou f(x) = |x|), la p-value est la probabilit´ e : p value = sup

^θ∈Θ⁰

P

^θ

(f (T ) > Z exp), on remarque que Z exp ≥ k ⇔ p value ≤ α.

Si p < α, on rejette H

₀

(et on retient H

₁

), sinon, on retient H

₀

. On prendra garde que certains logiciels ne fournissent la valeur de p que pour des hypoth` eses alternatives bilat´ erales. Dans le cas de distributions sym´ etriques (normale, Student), on passe du p bilat´ eral au p unilat´ eral en divisant par 2.

4 Tests asymptotiques

D´ efinition V.6 On consid´ ere une suite (E

^(N)

, B

^(N)

, ( P

^(Nθ ⁾

)

θ∈Θ

) de mod` eles d’´ echan- tillonages param´ etriques ayant le mˆ eme espace de param` etres Θ. On note X

^(N)

le vecteur al´ eatoire correspondant.

Le niveau asymptotique d’une suite de tests de Θ

₀

contre Θ

₁

, de r´ egion de rejet

R

^(N⁾

est la limite (lorsqu’elle existe)

(20)

α = lim

N→∞

sup

θ∈Θ₀

P

θ

(X

^(N⁾

∈ R

_(N)

).

On dit que la suite de tests est convergente si

∀θ ∈ Θ

₁

lim

N→∞

P

θ

(X

^(N)

∈ R

_(N)

) = 1.

a. Propri´ et´ es asymptotiques des tests du maximum de vraissemblance On se place dans le cas o` u Θ

₀

= {θ

₀

} et Θ

₁

= {θ 6= θ

₀

}. On consid` ere alors

λ

_n

(X) = sup

_θ∈Θ

L

_n

(X, θ) L

_n

(X, θ

₀

) .

Th´ eor` eme V.2 On suppose que les hypoth` eses de r´ egularit´ e du mod` ele (H1)−(H7) sont satisfaites et que Θ ⊂ R (param` etre de dimension 1). La suite de test de r´ egion critique :

R

_n

= {2 ln λ

_n

> K},

o` u K est le 1 − α quantile d’une loi χ

²

(1) est de sensibilit´ e asymptotique α et convergente.

b. Tests de Wald et du score

Proposition V.2 On consid` ere θ e

_n

une suite d’estimateurs asymptotiquement efficace d’un param` etre θ ∈ R

^d

, on suppose de plus que I(e θ

_n

) −→

^P^θ

I(θ). Soit g : Θ −→ R

^k

une fonction C

¹

de matrice jacobienne D(θ) de rang k. On consid` ere Θ

₀

= {θ ∈ Θ / g(θ) = 0}. Le test de Wald de r´ egion de rejet :

R

_n

: ξ

_n

> χ

²_1−α

(k) avec ξ

_n

= ng(e θ

_n

)

^t

D(e θ

_n

)I(e θ

_n

)

⁻¹

D(e θ

_n

)

^t

−1

g (e θ

_n

).

est de sensibilit´ e asymptotique α et convergent pour Θ

₁

= {θ ∈ Θ / g(θ) 6= 0}.

Lemme V.3 Soit X un vecteur al´ eatoire gaussien de R

^d

, d’esp´ erance µ et de matrice de covariance Σ. On suppose que Σ est inversible. Alors

D

²

= (X − µ)

^t

Σ

⁻¹

(X − µ) suit une loi du χ

²

(d).

Lemme V.4 Soit X

_n

une suite de vecteurs al´ eatoires de R

^d

telle que X

_n

−→

^L

X et

A une matrice d × k. Alors la suite de vecteurs al´ eatoires de R

^k

AX

n

converge en

loi vers AX.

(21)

Les tests du score sont bas´ es sur la r´ egion de rejet : ξ

_n^S

> χ

²_1−α

(k) avec ξ

_n^S

= 1

n DL

_n

(b θ

_0,n

)

^t

I(b θ

_0,n

)

⁻¹

DL

_n

(b θ

_0,n

), o` u DL

n

est le gradient de la vraisemblance et θ b

0,n

l’EMV de θ sur Θ

0

.

VI Tests param´ etriques classiques

Notations :

P : proportion sur un ´ echantillon al´ eatoire pour une variable de Bernouilli : X prend les valeurs 0 ou 1 avec probabilit´ e 1 − π et π,

P =

^X¹^+···+X_n ⁿ

.

X : moyenne sur un ´ echantillon al´ eatoire de taille d’esp´ erance µ.

S

²

est la variance estim´ ee d´ efinie par : S

²

= 1

n − 1

n

X

i=1

(X

_i

− X)

²

. Lorsque IE(X) = µ est connue, on utilise aussi :

D

²

= 1 n

n

X

i=1

(X

_i

− µ)

²

.