Sur les intervalles de confiance bilatéraux en modèle exponentiel discret

(1)

HAL Id: hal-00803849

https://hal.archives-ouvertes.fr/hal-00803849

Preprint submitted on 23 Mar 2013

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Sur les intervalles de confiance bilatéraux en modèle exponentiel discret

Francis Maisonneuve

To cite this version:

Francis Maisonneuve. Sur les intervalles de confiance bilatéraux en modèle exponentiel discret. 2013.

�hal-00803849�

(2)

Sur les intervalles de confiance bilat´eraux en mod`ele exponentiel discret

Francis Maisonneuve

MINES ParisTech

R´ esum´ e

La construction d’intervalles de confiance pour le param` etre d’un mod` ele exponentiel pose un probl` eme structurel dans le cas discret. On cherche dans cette ´ etude ` a r´ eduire autant qu’il est possible les intervalles fournis par la proc´ edure standard, tout en conservant une propri´ et´ e naturelle d’emboˆıtement d´ egag´ ee par H. Blaker. On obtient par une d´ emarche fort diff´ erente des r´ esultats voisins des siens.

Abstract

About Bilateral Confidence Intervals for Discrete Exponential Families

The definition of confidence intervals for the parameter of an exponential family raises a structural problem in the discrete case. The aim of this study is to reduce as much as possible intervals provided by the standard procedure, while preserving a natural nesting condition outlined by H. Blaker. We obtain, by a quite different approach, results similar to his own.

1. Introduction

L’estimation par intervalles de confiance bilat´ eraux du param` etre r´ eel d’un mod` ele est un probl` eme classique, qui n’a pas dans le cas discret de solution parfaite dans le cadre de la statistique fr´ equentiste. Le cas binomial en particulier a donn´ e lieu ` a de nombreuses propositions de m´ ethodes et variantes : formules asymptotiques (Wald et Wilson avec ou sans correction de continuit´ e), m´ ethodes ` a couverture exacte (Clopper-Pearson [3]) ou en moyenne (Agresti et Coull [1]), proc´ edures bay´ esiennes (Jeffreys), intervalles randomis´ es (Stevens [7]) ou flous (Geyer and Meeden [5]). . .

Plutˆ ot que la d´ emarche habituelle par inversion d’un test bilat´ eral ´ equilibr´ e bien choisi, nous par- tons d’une fonction pivotale d´ efinie sur mesure, qui nous permet en section 2 de retrouver plusieurs des m´ ethodes classiques et de proposer une m´ ethode de r´ eduction des intervalles de confiance standards en conservant la couverture exacte. Le cas binomial illustre en section 3 les r´ esultats obtenus.

Soit T = τ(X 1 , . . . , X n ) la statistique canonique d’un mod` ele exponentiel relatif ` a une variable r´ eelle

discr` ete X , de param` etre θ ∈ Θ intervalle ouvert. Le mod` ele image par T est aussi exponentiel, de mesure

(3)

dominante discr` ete µ port´ ee par ∆ ^d´ = ^ef

t ∈ R : µ({t}) > 0 . On sait que, quitte ` a remplacer T par −T , le rapport f _θ ^T

2

/f _θ ^T

1

des densit´ es de T par rapport ` a µ est pour tout θ ₁ < θ ₂ une fonction croissante de t ; et que, ` a t ∈ R fix´ e, f _t ^T (θ) ^d´ = ^ef f _θ ^T (t) = e ⁿ ^[α(θ) ^t+β(θ)] est une fonction de θ strictement monotone ou unimodale sur Θ, du fait que son logarithme est strictement concave en param´ etrisation canonique.

Notons pour tout θ ∈ Θ, F _θ ^g (t) ^d´ = ^ef P _θ (T ≥ t) et F _θ ^d (t) ^d´ = ^ef P _θ (T > t) (F _θ ^g ≥ F _θ ^d ),

les versions continues ` a gauche et ` a droite de la fonction de r´ epartition compl´ ementaire de T , qui diff` erent en tout t ∈ ∆ de la quantit´ e P θ (T = t) = f _θ ^T (t) µ({t}) > 0. Comme µ est discr` ete, les variables compos´ ees F _θ ^d (T ) et F _θ ^g (T ) ne sont plus que des approximations (non diffuses) d’une variable uniforme sur ]0, 1[ , qui de plus d´ ependent de θ. On obtient une vraie fonction pivotale par m´ elange al´ eatoire :

Proposition 1.1 Soit T une variable r´ eelle de fonctions de r´ epartition compl´ ementaires continue ` a droite F ^d et ` a gauche F ^g ≥ F ^d ; et soit U une variable uniforme sur ]0, 1[ ind´ ependante de T .

La variable compos´ ee ψ(T, U) ^d´ = (1 ^ef − U ) F ^d (T ) + U F ^g (T ) v´ erifie ψ(T, U) ≡

^L

U . Preuve Il suffit de montrer que P ψ(T, U ) < y

= y en tout point y ∈ ]0, 1[. On suppose d’abord que y = F ^d (t) pour un t ∈ R, et on pose ¯ t = sup{s ≥ t : F ^d (s) = F ^d (t)}. On a {ψ(T, U ) < F ^d (t)} = {T > ¯ t } si F ^d (t) = F ^d (¯ t ) (c’est le cas si ¯ t = t ou si pas de saut en ¯ t > t), et {ψ(T, U) < F ^d (t)} = {T ≥ ¯ t } si F ^d (t) = F ^g (¯ t ) > F ^d (¯ t ), car U < 1 ; d’o` u le r´ esultat. On suppose ensuite que y = F ^d (t)+u F ^g (t)−F ^d (t) pour un t ∈ R et un u ∈ ]0, 1] ; on a {ψ(T, U) < y} = {T > t} ] {T = t} ∩ {U < u}

, de sorte que P ψ(T, U) < y

= F ^d (t) + u F ^g (t) − F ^d (t)

= y ; d’o` u ` a nouveau le r´ esultat. 2 Ainsi l’application ψ θ (t, u) ^d´ = (1 ^ef − u) F _θ ^d (t) + u F _θ ^g (t) = F _θ ^d (t) + u P θ (T = t)

v´ erifie ψ θ (T, U) ≡

^L

U d’apr` es la proposition : ψ est donc une fonction pivotale intrins` eque au mod` ele exponentiel, mais qui d´ epend d’une variable suppl´ ementaire u ∈ [0, 1]. On sait qu’` a t fix´ e, les applications F _t ^d et F _t ^g sont continues et croissantes (au sens large) sur Θ (croissance stochastique). Soit I le plus petit intervalle ouvert de R dont l’adh´ erence contient ∆ ; comme f _θ ^T > 0 partout, on a I = {0 < F _θ ^d ≤ F _θ ^g < 1}

pour tout θ ∈ Θ, et on peut pr´ eciser que F _t ^d et F _t ^g sont strictement croissantes pour tout t ∈ I : en effet la croissance de F _t ^d et F _t ^g s’´ etablit classiquement en montrant que pour tous θ ₁ < θ ₂ dans Θ, on a (F d´ esignant ici F ^g ou F ^d )

∀t ∈ R,







F _θ

₂

(t) ≥ λ _t F _θ

₁

(t)

1 − F _θ

₂

(t) ≤ λ _t 1 − F _θ

₁

(t) o` u λ t = f _θ ^T

2

(t) f _θ ^T

1

(t) ,

du fait de la croissance de l’application s ∈ R 7→ λ s ; de sorte que F θ

₂

(t) ≥ F θ

₁

(t), d’apr` es la premi` ere in´ egalit´ e si λ t ≥ 1 et d’apr` es la seconde in´ egalit´ e si λ t < 1. Supposons par l’absurde l’existence d’un t ∈ I tel que F t est constante sur un intervalle non trivial de Θ ; pour tous θ 1 < θ 2 dans cet intervalle, l’´ egalit´ e F θ

₁

(t) = F θ

₂

(t) impliquerait dans les in´ egalit´ es ci-dessus λ t = 1 et donc f _θ ^T

1

(t) = f _θ ^T

2

(t), puisque t ∈ I exclut qu’on ait F θ

₁

(t) = F θ

₂

(t) ∈ {0, 1}. La fonction f _t ^T serait donc aussi constante sur l’intervalle en question, contradiction car f _t ^T est strictement monotone ou unimodale sur Θ. En cons´ equence l’application ψ _(t,u) : θ ∈ Θ 7−→ ψ _θ (t, u) est aussi continue et croissante sur Θ pour tout (t, u) ∈ R × [0, 1] fix´ e, avec croissance stricte pour t ∈ I.

L’intervalle I n’est pas porteur de µ d` es que ∆ a un minimum t _min ou un maximum t _max . Dans le premier cas, on a F _t ^g

min

(θ) = 1 pour tout θ ∈ Θ. Comme 1 = F _t ^g

min

= F _t ^d

min

+ µ({t _min }) f _t ^T

min

avec F _t ^d

min

croissante, f _t ^T

min

est par ´ elimination strictement d´ ecroissante, et donc F _t ^d

min

ainsi que ψ _(t

_min

_,u) pour tout u ∈ [0, 1[

sont strictement croissantes sur Θ. De mani` ere analogue dans le second cas, F _t ^g

_max

= 0 + µ({t max }) f _t ^T

max

, donc f _t ^T

_max

, F _t ^g

_max

ainsi que ψ _(t

_max

_,u) pour tout u ∈ ]0, 1] sont strictement croissantes sur Θ.

On fait les hypoth` eses compl´ ementaires (couramment v´ erifi´ ees) d’´ etalement de F ^g et F ^d , qui permettent d’´ eviter tout paradoxe apparent dans l’usage de la fonction pivotale ψ

2

(4)

∀t ∈ I,







inf F _t ^g (Θ) = 0 sup F _t ^d (Θ) = 1

, si ∃t min ,







inf F _t ^d

_min

(Θ) = 0 sup F _t ^d

_min

(Θ) = 1

et si ∃t max ,







inf F _t ^g

_max

(Θ) = 0 sup F _t ^g

_max

(Θ) = 1

;

de sorte que ∀(t, u) ∈ I × [0, 1], ψ _(t,u) (Θ) = ]0, 1[ . Comme ∀t ∈ ∆, µ({t}) f _t ^T = F _t ^g − F _t ^d , on en d´ eduit

∀t ∈ I ∩∆, lim g f _t ^T = lim d f _t ^T = 0 (limites en les extr´ emit´ es gauche et droite de Θ) et f _t ^T est unimodale. Si

∆ a un minimum t min , on conclut lim d f _t ^T

_min

= 0 ; et si ∆ a un maximum t max , on conclut lim g f _t ^T

_max

= 0.

2. Divers intervalles de confiance li´ es ` a la fonction pivotale

Fixons un niveau de confiance γ ∈ ]0, 1[ et consid´ erons l’intervalle associ´ e B = 1−γ 2 , ^1+γ ₂

` a risque

´

equilibr´ e

. Comme ∀(t, u) ∈ ∆× ]0, 1[ , ψ _(t,u) est continue et strictement croisssante, {ψ (t,u) ∈ B} est un intervalle ouvert

θ ¹ _(t,u) , θ _(t,u) ²

, ´ eventuellement vide si t = t min ou t = t max , avec θ ¹ _(t,u) et θ _(t,u) ² caract´ eris´ es par : ∀t ∈ I ∩ ∆ , ψ (t,u) θ ¹ _(t,u)

= 1 − γ

2 et ψ (t,u) θ ² _(t,u)

= 1 + γ 2 ; mˆ eme chose si possible pour t min et t max , sinon θ _(t ¹

min

,u) = inf Θ ≤ θ ² _(t

min

,u) et θ _(t ¹

max

,u) ≤ sup Θ = θ ² _(t

max

,u) . Comme ∀θ ∈ Θ, U ≡

^L

ψ θ (T, U) = ψ _{(T ,U)} (θ) et {ψ _{(T ,U)} (θ) ∈ B} =

θ ¹ _{(T ,U)} , θ _{(T ,U)} ²

3 θ , on a

∀θ ∈ Θ, γ = P _θ

θ ¹ _{(T ,U)} , θ _{(T ,U)} ² 3 θ

= Z

R×

]0,1[

1 _]θ

1

(t,u)

, θ

²_(t,u)

[ (θ) f _θ ^T (t) dµ(t) du ; soit γ = X

t∈∆

P _θ (T = t) Θ e ^γ _t (θ) o` u Θ e ^γ _t (θ) ^d´ = ^ef Z 1

0 1 _]θ

1

(t,u)

, θ

²_(t,u)

[ (θ) du .

Pour tous t ∈ ∆, l’application Θ e ^γ _t , ` a valeurs dans [0, 1], est ainsi un intervalle flou de support et noyau

Θ e ^γ _t > 0 = [

0<u<1

θ _(t,u) ¹ , θ ² _(t,u)

= θ ˆ ¹ _t , θ ˆ ² _t et

Θ e ^γ _t = 1 = \

0<u<1

θ _(t,u) ¹ , θ ² _(t,u)

= θ ˇ ¹ _t , θ ˇ _t ² pour ˆ θ ¹ _t ^d´ = lim ^ef

u→1 θ ¹ _(t,u) , ˆ θ _t ² ^d´ = lim ^ef

u→0 θ ² _(t,u) , ˇ θ ¹ _t ^d´ = lim ^ef

u→0 θ _(t,u) ¹ et ˇ θ ² _t ^d´ = lim ^ef

u→1 θ ² _(t,u) (avec θ ˇ ¹ _t , θ ˇ ² _t

= ∅ si ˇ θ ¹ _t > θ ˇ ² _t ) ; en effet la croissance (stricte) de la fonction affine u 7→ ψ _θ (t, u) pour (t, θ) ∈ ∆×Θ entraine la d´ ecroissance de u 7→ θ _(t,u) ¹ et u 7→ θ _(t,u) ² (stricte pour t ∈ I ∩ ∆).

En cons´ equence ∀t ∈ ∆ les deux valeurs ˆ θ _t ¹ < θ ˆ _t ² , sont caract´ eris´ es par pour t 6= t min , F _t ^g (ˆ θ _t ¹ ) = 1 − γ

2 et ˆ θ ¹ _t

_min

= inf Θ ; pour t 6= t max , F _t ^d (ˆ θ ² _t ) = 1 + γ

2 et ˆ θ ² _t

_max

= sup Θ ; et les deux valeurs ˇ θ ¹ _t et ˇ θ _t ² , telles que ˇ θ _t ¹ , θ ˇ _t ² ∈ θ ˆ ¹ _t , θ ˆ ² _t

pour t ∈ I ∩ ∆, sont caract´ eris´ ees par pour t 6= t max , F _t ^d (ˇ θ ¹ _t ) = 1 − γ

2 et ˇ θ ¹ _t

_max

= sup Θ ; pour t 6= t min , F _t ^g (ˇ θ ² _t ) = 1 + γ

2 et ˇ θ ² _t

_min

= inf Θ . La d´ ecroissance stricte en t et la croissance en θ des applications F ^g et F ^d sur ∆ × Θ assurent que les 4 applications t 7→ θ ˆ ¹ _t , t 7→ θ ˆ _t ² , t 7→ θ ˇ ¹ _t et t 7→ θ ˇ ² _t sont strictement croissantes sur ∆. On note que l’application F _t ^d +F _t ^g ´ etant pour tout t ∈ I ∩ ∆ continue , strictement croissante sur Θ et d’image ]0, 2[ , il existe une unique valeur θ ^med _t de θ, l’estimation T -m´ ediane ponctuelle de θ sachant t ∈ I ∩ ∆, telle que

F _t ^d + F _t ^g

(θ ^med _t ) = 1 ⇐⇒ P _θ

med

t

(T < t) = P _θ

med

t

(T > t).

On v´ erifie ais´ ement que ∀γ ∈ ]0, 1[ , on a θ ^med _t ∈

min(ˇ θ ¹ _t , θ ˇ ² _t ) , max(ˇ θ ¹ _t , θ ˇ ² _t )

⊂ θ ˆ ¹ _t , θ ˆ ² _t ,

avec

Θ e ^γ _t = 1 = θ ˇ ¹ _t , θ ˇ ² _t

6= ∅ ⇐⇒ θ ˇ ¹ _t ≤ θ ^med _t ≤ θ ˇ ² _t ⇐⇒ γ ≥ P _θ

med

t

(T = t).

En fait on veut disposer de vrais intervalles pour l’estimation de θ sachant t. Une premi` ere solution serait de se r´ ef´ erer directement ` a l’intervalle al´ eatoire de confiance randomis´ e

θ _{(T ,U)} ¹ , θ ² _{(T ,U)}

, de niveau pr´ ecis γ, pour retenir l’intervalle

θ ¹ _(t,u) , θ ² _(t,u)

. Mais il parait inacceptable que pour une mˆ eme r´ ealisation

t ∈ ∆ de T , l’intervalle de confiance de θ puisse varier au gr´ e d’une valeur al´ eatoire u ind´ ependante du

(5)

mod` ele ´ etudi´ e et qui ne porte en cons´ equence aucune information le concernant ! On cherche ` a d´ efinir de vrais intervalles de confiance d´ eterministes. Une seconde solution plus int´ eressante est de remarquer que

∀(t, u) ∈ ∆× ]0, 1[ , θ ˆ _t ¹ , θ ˆ ² _t

⊇

θ ¹ _(t,u) , θ ² _(t,u) = ⇒ θ ˆ ¹ _T , θ ˆ _T ²

⊇

θ _{(T ,U)} ¹ , θ ² _{(T ,U)} . On a donc ∀θ ∈ Θ, P θ θ ˆ ¹ _T , θ ˆ _T ²

3 θ

≥ γ, ce qui exprime qu’on peut attribuer ` a l’intervalle al´ eatoire Θ b ^γ _T ^d´ = ^ef θ ˆ ¹ _T , θ ˆ ² _T

un niveau de confiance au moins ´ egal ` a γ. On retrouve ici la m´ ethode standard de couverture exacte, qui a l’inconv´ enient d’ˆ etre conservatrice car les intervalles Θ b ^γ _t associ´ es sont surdimensionn´ es.

On va s’employer dans la suite ` a les r´ eduire de mani` ere fine sous la contrainte de couverture exacte. Pour cela on se r´ ef` ere ` a la formule de calcul

∀θ ∈ Θ , P θ θ ˆ _T ¹ , θ ˆ ² _T 3 θ

= X

t∈∆ : ˆ θ

_t¹

<θ< θ ˆ

²_t

P θ (T = t), (1)

et on cherche ` a d´ efinir au mieux θ ¹ _t < θ ² _t dans θ ˆ ¹ _t , θ ˆ ² _t

pour tout t ∈ ∆, v´ erifiant encore P θ

θ ¹ _T , θ ² _T 3 θ

= X

t∈∆ : θ

¹_t

<θ<θ

_t²

P θ (T = t) ≥ γ

pour presque tout θ ∈ Θ (au sens de sauf pour un nombre au plus d´ enombrable de θ) : on dira alors que l’intervalle al´ eatoire Θ ^γ _T ^d´ = ^ef

θ ¹ _T , θ ² _T

est ` a couverture presque exacte.

On suppose dor´ enavant que ∆ est fini ou localement fini, de sorte que chaque t ∈ ∆ a un pr´ ed´ ecesseur not´ e t

₋

(si t 6= t min ) et un successeur not´ e t + (si t 6= t max ). Comme {T ≥ t} = {T > t

₋

} et {T ≥ t + } = {T > t}, on a F _t ^d

₋

θ ˆ ² _t

₋

= 1 + γ

2 = F _t ^g θ ˇ _t ²

= F _t ^d

₋

θ ˇ ² _t

et F _t ^g

₊

θ ˆ ¹ _t

₊

= 1 − γ

2 = F _t ^d θ ˇ _t ¹

= F _t ^g

₊

θ ˇ ¹ _t

; de sorte que ˆ θ ² _t

₋

= ˇ θ ² _t (si t 6= t min ) et ˆ θ ¹ _t

₊

= ˇ θ _t ¹ (si t 6= t max ). La formule ´ el´ ementaire (1) se pr´ ecise alors en

∀θ ∈ Θ , γ ≤ P _θ θ ˆ _T ¹ , θ ˆ ² _T 3 θ

= X

t∈∆ : t

⁰≤t≤t⁰⁰

P _θ (T = t) = F _t ^g

0

(θ) − F _t ^d

00

(θ) o` u







θ ˇ _t ²

0

≤ θ < θ ˆ ² _t

0

θ ˆ _t ¹

00

< θ ≤ θ ˇ ¹ _t

00

, (2)

ces derni` eres in´ egalit´ es caract´ erisant t

⁰

< t

⁰⁰

dans ∆. On d´ emontre : Th´ eor` eme 2.1 Soient t

⁰

< t

⁰⁰

dans ∆ ; l’´ equation sur Θ F _t ^g

00

+ F _t ^d

0

(θ) = 1 a une unique solution θ _t ^t

⁰00

, et on a θ ˆ _t ¹

00

< θ ˆ ² _t

0

(avec θ _t ^t

⁰00

∈ θ ˆ _t ¹

00

, θ ˆ ² _t

0

) si et seulement si γ > b γ ^t _t

00⁰

d´ ef

= (F _t ^d

0

− F _t ^g

00

) θ ^t _t

00⁰

, o` u b γ ^t _t

00⁰

∈ [0, 1[ . Pour tous γ ∈ ]0, 1[ et t

⁰⁰

∈ ∆, soit t

⁰

< t

⁰⁰

l’unique ´ el´ ement de ∆ tel que θ ˇ ² _t

0

≤ θ ˆ _t ¹

00

< θ ˆ ² _t

0

. On pose :

θ ¹ _t

00

= la plus grande valeur de θ ∈ θ ˆ _t ¹

00

, min θ _t ^t

⁰00

, θ ˇ ¹ _t

00

telle que (F _t ^g

0

− F _t ^g

00

)(θ) ≥ γ sur θ ˆ _t ¹

00

, θ . Pour tous γ ∈ ]0, 1[ et t

⁰

∈ ∆, soit t

⁰⁰

> t

⁰

l’unique ´ el´ ement de ∆ tel que θ ˆ ¹ _t

00

< θ ˆ ² _t

0

≤ θ ˇ _t ¹

00

. On pose :

θ ² _t

0

= la plus petite valeur de θ ∈

max θ ^t _t

00⁰

, θ ˇ ² _t

0

, θ ˆ ² _t

0

telle que (F _t ^d

0

− F _t ^d

00

)(θ) ≥ γ sur θ, θ ˆ ² _t

0

. Alors Θ ^γ _T =

θ _T ¹ , θ _T ²

est ` a couverture presque exacte. De plus ∀t ∈ ∆, l’application γ ∈ ]0, 1[ 7→ Θ ^γ _t est croissante (propri´ et´ e naturelle d’ emboˆıtement des intervalles) et on a

Θ e ^γ _t = 1 ⊆ Θ ^γ _t ⊆ Θ b ^γ _t =

Θ e ^γ _t > 0 . Preuve La fonction F _t ^g

00

+F _t ^d

0

est continue et strictement croissante sur Θ, d’image ]0, 2[ ; d’o` u l’existence et l’unicit´ e de θ ^t _t

⁰00

. On a t

⁰⁰

≥ t

⁰

₊ , donc F _t ^g

00

≤ F _t ^g

0

+

= F _t ^d

0

et b γ _t ^t

00⁰

∈ [0, 1[ . Et comme F _t ^g

00

θ _t ^t

⁰00

= ¹⁻ b ^γ

t0 t00

2 et F _t ^d

0

θ ^t _t

00⁰

= ¹⁺ b ^γ

t0 t00

2 , on a l’´ equivalence avanc´ ee, par d´ efinition de ˆ θ ¹ _t

00

, ˆ θ _t ²

0

et croissance stricte de F _t ^g

00

et F _t ^d

0

. 1) Consid´ erons d’abord tous les couples (t

⁰

, t

⁰⁰

) ∈ ∆ ² tels que t

⁰

< t

⁰⁰

et ˇ θ _t ²

0

≤ θ ˆ ¹ _t

00

< θ ˆ ² _t

0

≤ θ ˇ _t ¹

00

(figure 1).

On a (formule (2)) ∀θ ∈ θ ˆ ¹ _t

00

, θ ˆ ² _t

0

, F _t ^g

0

(θ) − F _t ^d

00

(θ) = P θ θ ˆ ¹ _T , θ ˆ ² _T 3 θ

≥ γ. Remplacer ˆ θ ¹ _t

00

et θ ˆ ² _t

0

par θ _t ¹

00

et θ ² _t

0

permet de r´ eduire

au mieux

(cf. la remarque 1 ci-dessous) les intervalles de confiance de θ sous la contrainte de couverture exacte (sauf en θ _t ^t

⁰00

si θ _t ¹

00

= θ ² _t

0

= θ _t ^t

⁰00

) ; en effet les niveaux de confiance des θ affect´ es sont :

4

(6)

(t ⁰⁰ ) (t ⁰⁰ ₊ ) Θ (t ⁰ )

Θ (t ⁰ ₋ )

θ ˆ ^t _t

00⁰

[ θ ˆ ² _t

0

[ θ ² _t

0

] θ ˆ _t ¹

00

] θ ¹ _t

00

] θ ˇ ¹ _t

00

ˇ [ θ ² _t

0

Figure 1. Cas de chevauchement minimal des intervalles b ^Θ

γ t⁰

et b ^Θ

γ t⁰⁰



 

 

 

 

pour θ ∈ θ ˆ ¹ _t

00

, θ _t ¹

00

, θ 6= θ ^t _t

00⁰

, X

t∈∆, t

⁰≤t<t⁰⁰

P θ (T = t) = F _t ^g

0

(θ) − F _t ^g

00

(θ) ≥ γ pour θ ∈

θ ² _t

0

, θ ˆ ² _t

0

, θ 6= θ ^t _t

⁰00

, X

t∈∆, t

⁰

<t≤t

⁰⁰

P _θ (T = t) = F _t ^d

0

(θ) − F _t ^d

00

(θ) ≥ γ .

De plus vu leurs d´ efinitions θ _t ¹

00

croˆıt et θ ² _t

0

d´ ecroˆıt quand γ d´ ecroˆıt, jusqu’` a atteindre la valeur commune θ _t ^t

⁰00

` a partir d’un certain γ _t ^t

⁰00

et rester stables jusqu’` a la valeur b γ _t ^t

00⁰

≤ γ _t ^t

⁰00

o` u ils sont rejoints par ˆ θ ¹ _t

00

et ˆ θ ² _t

0

.

2) Consid´ erons ensuite les t

⁰⁰

∈ ∆ \ {t max } pour lesquels il existe t

⁰

< t

⁰⁰

(t

⁰

unique dans ∆) tel que θ ˇ _t ²

0

≤ θ ˆ ¹ _t

00

< θ ˇ _t ¹

00

= ˆ θ ¹ _t

00

+

< θ ˆ ² _t

0

; pour eux θ _t ²

0

∈ θ ˆ _t ¹

00

+

, θ ˆ ² _t

0

a ´ et´ e d´ efini ` a l’´ etape 1. A t

⁰

fix´ e les θ ¹ _t

00

∈ θ ˆ ¹ _t

00

, θ ˆ ¹ _t

00 +

respectent entre eux les mˆ emes in´ egalit´ es que les ˆ θ _t ¹

00

, en ´ etant tous inf´ erieurs au θ _t ¹

00

0

relatif au t

⁰⁰

₀ du couple (t

⁰

, t

⁰⁰

₀ ) d´ etermin´ e

`

a l’´ etape 1, qui succ` ede aux t

⁰⁰

consid´ er´ es ici ; et la d´ efinition des θ ¹ _t

00

assure qu’ils croissent quand γ d´ ecroˆıt. On a des r´ esultats analogues pour les t

⁰

∈ ∆ \ {t min } pour lesquels il existe t

⁰⁰

> t

⁰

(t

⁰⁰

unique dans ∆) tel que ˆ θ _t ¹

00

< θ ˆ ² _t

0

−

= ˇ θ ² _t

0

< θ ˆ ² _t

0

≤ θ ˇ ¹ _t

00

, en changeant le signe des in´ egalit´ es. Et les mˆ emes consid´ erations qu’` a l’´ etape 1 sur les niveaux de confiance des θ affect´ es permettent de conclure que Θ ^γ _T ^d´ = ^ef

θ _T ¹ , θ _T ²

est bien ` a couverture presque exacte. 2

Remarque 1 La condition θ ¹ _t

00

(≤ θ ^t _t

00⁰

) ≤ θ ² _t

0

qui assure le maintien local des chevauchements entre intervalles ` a l’´ etape 1 ci-dessus est indispensable, car sinon on aurait :

– soit θ _t ²

0

, θ ¹ _t

00

⊆ θ ˆ ¹ _t

00

, θ ˆ _t ²

0

, et le niveau de confiance des θ ∈ θ ² _t

0

, θ ¹ _t

00

serait X

t∈∆ , t

⁰

<t<t

⁰⁰

P _θ (T = t) = F _t ^d

0

(θ) − F _t ^g

00

(θ) < F _t ^d

0

θ ˆ _t ²

0

− F _t ^g

00

θ ˆ ¹ _t

00

= 1 + γ

2 − 1 − γ 2 = γ.

– soit θ ¹ _t

00

> θ ˆ _t ²

0

et le niveau de confiance des θ ∈ θ ˆ ² _t

0

, θ ¹ _t

00

voisins de θ ˆ ² _t

0

serait X

t∈∆, t

⁰

<t<t

⁰⁰

P θ (T = t) = F _t ^d

0

(θ) − F _t ^g

00

(θ) ≈ F _t ^d

0

θ ˆ ² _t

0

− F _t ^g

00

θ ˆ _t ²

0

< F _t ^d

0

θ ˆ _t ²

0

− F _t ^g

00

θ ˆ ¹ _t

00

= γ par continuit´ e de F _t ^d

0

et F _t ^g

00

et croissance stricte de F _t ^g

00

.

– soit θ ² _t

0

< θ ˆ _t ¹

00

et mˆ eme conclusion pour le niveau de confiance des θ ∈ θ ² _t

0

, θ ˆ ¹ _t

00

voisins de θ ˆ _t ¹

00

. Remarque 2 On a θ ¹ _t

00

> θ ˆ _t ¹

00

d` es que θ ˇ ² _t

0

< θ ˆ ¹ _t

00

: en effet cette in´ egalit´ e assure

F _t ^g

0

θ ˆ _t ¹

00

− F _t ^g

00

θ ˆ ¹ _t

00

> F _t ^g

0

θ ˇ _t ²

0

− F _t ^g

00

θ ˆ ¹ _t

00

= 1 + γ

2 − 1 − γ

2 = γ si t

⁰

6= t _min , et F _tmin ^g θ ˆ ¹ _t

00

− F _t ^g

00

θ ˆ ¹ _t

00

= 1 − 1 − γ

2 > γ ; on a donc aussi F _t ^g

0

− F _t ^g

00

> γ au voisinage (droit) de θ ˆ ¹ _t

00

par continuit´ e de F _t ^g

0

− F _t ^g

00

. De mˆ eme, on a θ ² _t

0

< θ ˆ _t ²

0

d` es que θ ˇ ¹ _t

00

> θ ˆ _t ²

0

.

Remarque 3 Dans le cas sp´ ecial o` u t

⁰

₊ = t

⁰⁰₋

^d´ = ^ef t, on a θ _t ^t

⁰00

= θ ^med _t puisqu’alors F _t ^g

00

+ F _t ^d

0

= F _t ^d + F _t ^g .

(7)

Remarque 4 Contrairement au cas des mod` eles de loi µ diffuse, faire tendre γ > 0 vers 0 ne conduit pas ` a des estimations ponctuelles de θ : en effet par principe (presque) aucune valeur possible de θ n’est exclue des estimations par intervalles, autrement dit la r´ eunion de ceux-ci co¨ıncide toujours (presque) avec Θ.

Simplement les intervalles θ ˆ _t ¹ , θ ˆ _t ²

, t ∈ ∆ tendent ` a ˆ etre 2 ` a 2 disjoints et contigus car ∀t ∈ ∆, t 6= t _max , F _t ^d θ ˆ ² _t

= 1 + γ

2 ≈ 1 − γ

2 = F _t ^d θ ˇ ¹ _t

= ⇒ θ ˆ _t ² ≈ θ ˇ _t ¹ = ˆ θ _t ¹

₊

≈ θ ˆ _t ^t

₊

. Pour γ = 0, les intervalles contigus Θ b ^γ _t ^d´ = ^ef θ ˆ ¹ _t , θ ˆ _t ²

, qui pour t ∈ I ∩ ∆ sont les

θ _t ^t

⁻

, θ _t ^t

₊

et contiennent les estimations T -m´ edianes ponctuelles θ _t ^med , apparaissent comme les estimations T-m´ edianes par intervalles de θ sachant t. Les Θ ^γ _t =

θ _t ¹ , θ ² _t

co¨ıncident avec eux d` es que γ ≤ γ 0 d´ ef

= min

t∈∆\{t

max}

γ ^t _t

₊

: la valeur γ ₀ est le (faible) niveau de confiance qu’on peut accorder ` a ce mode m´ edian d’estimation du param` etre.

3. Exemple du mod` ele exponentiel des lois binomiales On a ici ∆ =

0, _n ¹ , _n ² , . . . , 1 , µ uniforme de masse n+1 sur ∆, Θ = ]0, 1[ et f _θ ^T (t) = θ ^{n t} (1−θ) ⁿ ^(1−t) : la loi de n T =

n

X

i=1

X i est binomiale. De plus F _t ^d et F _t ^g v´ erifient les hypoth` eses compl´ ementaires d’´ etalement.

En effet :

– ∀t ∈ I = ]0, 1[ , inf F _t ^g (Θ) = 0 et sup F _t ^d (Θ) = 1 car θ 7→ F _t ^g (θ)

θ et θ 7→ 1 − F _t ^d (θ)

1 − θ sont des polynˆ omes ; – F ₀ ^d (θ) = 1 − (1 − θ) ⁿ , donc inf F ₀ ^d (Θ) = 0 et sup F ₀ ^d (Θ) = 1 ;

– F ₁ ^g (θ) = θ ⁿ , donc inf F ₁ ^g (Θ) = 0 et sup F ₁ ^g (Θ) = 1.

On peut illustrer la d´ emarche en examinant les demi-graphes gauches des applications ε et ˆ ε (figure 2) avec ε(θ) = P θ

θ ¹ _T , θ ² _T 3 θ

=

n

X

j=0

n j

θ ^j (1 − θ) ^n−j 1 _Θ

^γ

j n

(θ) et de mˆ eme ˆ ε(θ) = P θ

θ ˆ _T ¹ , θ ˆ _T ² 3 θ

.

0.0 0.1 0.2 0.3 0.4 0.5

0.96 0.97 0.98 0.99 1.00

(a) γ = 0.95, n = 100

0.0 0.1 0.2 0.3 0.4 0.5

0.96 0.97 0.98 0.99 1.00

(b) γ = 0.95, n = 25

0.0 0.1 0.2 0.3 0.4 0.5

0.85 0.90 0.95 1.00

(c) γ = 0.8, n = 5

0.0 0.1 0.2 0.3 0.4 0.5

0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

(d) valeur limite γ

₀

≈ 0.3, n = 5

Figure 2. Demi-graphes gauches de ε (m´ ethode propos´ ee ici) et de ε ˆ (m´ ethode standard de Clopper-Pearson)

6

(8)

4. Conclusion

En quˆ ete d’une nouvelle proc´ edure d’estimation exacte par intervalles de confiance bilat´ eraux dans le cas discret selon une d´ emarche originale, nous sommes retomb´ es — en la pr´ ecisant l´ eg` erement — sur la proposition de H. Blaker. Sur le plan pratique, cette proc´ edure implique des calculs num´ eriques limit´ es pour la d´ etermination d’un intervalle d’int´ erˆ et ; elle peut donc ˆ etre mise en œuvre aussi bien pour de tr` es petits et pour de grands ´ echantillons, quel que soit le niveau de confiance souhait´ e. L’emploi de m´ ethodes approch´ ees, fond´ ees sur le th´ eor` eme central limite, devrait donc ˆ etre cantonn´ e aux ´ echantillons de tailles vraiment consid´ erables.

R´ ef´ erences

[1] A. Agresti, B. A. Coull, Approximate is better than ”exact” for interval estimation of binomial proportions, Amer.

Statist. 52 (1998) 119-126.

[2] H. Blaker, Confidence curves and improved exact confidence intervals for discrete distributions, Canad. J. Statist. 28 (2000) 783-798.

[3] C. J. Clopper, E. S. Pearson, The use of confidence or fiducial limits illustrated in the case of the binomial, Biometrika 26 (1934) 404-413.

[4] G. Casella, Refining binomial confidence intervals, Canad. J. Statist. 14 (1986) 113-129.

[5] C. J. Geyer, G. D. Meeden, Fuzzy and randomized confidence intervals and P-values, Statistical Science 20 (4) (2005) 358-366.

[6] T. E. Sterne, Some remarks on confidence or fiducial limits, Biometrika 41 (1954) 275-278.

[7] W. L. Stevens, Fiducial limits of the parameter of a discontinuous distribution, Biometrika 37 (1950) 117–129.

Sur les intervalles de confiance bilatéraux en modèle exponentiel discret

HAL Id: hal-00803849

https://hal.archives-ouvertes.fr/hal-00803849

Preprint submitted on 23 Mar 2013

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.