HAL Id: inria-00386587
https://hal.inria.fr/inria-00386587
Submitted on 22 May 2009
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires
Estimation par plug-in du taux d’entropie d’un processus markovien de sauts à espace d’état fini
Philippe Regnault
To cite this version:
Philippe Regnault. Estimation par plug-in du taux d’entropie d’un processus markovien de sauts à espace d’état fini. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France.
�inria-00386587�
proessus markovien de sauts à espae d'état ni
PhilippeRegnault
LaboratoiredeMathématiquesNiolasOresme,UniversitédeCaenBP5186,
14032 CAENedex
Résumé
L'entropie d'une loi à valeurs dans un ensemble ni est largement utilisée dans
toutes lesappliations impliquant desvariablesaléatoires. L'équivalentnaturel pour
unproessusaléatoireestsontauxd'entropie,s'exprimantommeunefontiondela
probabilité invarianteetdugénérateurpourunproessusmarkoviendesautshomo-
gène,ergodique,àespaed'étatni.
Ononstruitunestimateurparplug-indeetauxd'entropiedansleasdel'obser-
vationd'unetrajetoireduproesssussurunelonguepériodedetemps.Ondémontre
queetestimateuradebonnespropriétésasymptotiques,ilestonvergentetasymp-
totiquementnormal;savarianeasymptotiqueestexpliitedanslaplupartdesas.
Leas des proessusàdeuxétats,partiulièrementliéàl'étudededuréesdevie
oudelaabilitéd'unsystème,faitl'objetd'uneétudenumériquedétaillée.
Abstrat
Theentropyofadistributionwithnitesupportiswidelyusedinall appliations
involvingrandomvariables.Anaturalequivalentfor randomproessesistheentropy
rate. For ergodi pure-jump nite state Markov proesses, this rate is an expliit
funtionoftheasymptotidistributionandtheinnitesimalgenerator.
Weestimatetheentropyratebyplug-infromtheobservationofonelongtrajetory
oftheproess.Thisestimatorisproventobestronglyonsistentandasymptotially
normalwithexpliitvarianeinmostoftheases.
Theaseoftwo-stateMarkovproessess,widelyusedinreliabilityorsurvivaldata
analysisisdetailledandillustrated.
Mots-lés:Statistiquemathématique,statistiquedesproessus,proessusmar-
koviensdesauts,ergodiité,tauxd'entropie,estimationparamétrique.
1 Introdution
L'entropied'uneloi
P
surunensembleniE
,H (P) = − X
x∈E
P (x) log P (x)
,aétéintroduiteparShannon[7℄en 1948dansleadrede l'étudedesodesde
ompression :ilamontré quesi
(X
n)
n∈N est unehaînedeMarkovergodiqueàespaed'étatni,lequotient
1
n
H (P
(X1,...,Xn))
admetune limiteH(X )
lorquen
tend vers l'inni,appeléetaux d'entropie de lahaîne, représentant letaux deompressionoptimaldeodesdeompression.outilsstatistiqueomplèteaétédéveloppéeetappliquéedansungrandnombre
dedomaines(voir[3℄).
Lanotiondetauxd'entropieintroduiteparShannons'adapteauxproessus
markoviensdesauts ergodiquesàespaed'étatniommesuit.
Soit
X = (X
t)
t∈R+ un proessus markovien de sauts ergodique à valeursdansunensembleni
E
.OnnoteX
(T)larestritiondeX
àl'intervalle[0, T ]
.Dénition:
L'entropie partielle de
X
estH
T(X ) = Z
f
X(T)log f
X(T)dm
oùf
X(T) est lavraisemblanede
P
X(T) parrapportàune mesuredominantem
.Le taux d'entropie
H(X)
deX
est lalimite de T1H
T(X )
lorsqueT
tend versl'inni.
0.0 0.2 0.4 0.6 0.8 1.0
12345
Fig.1Unetrajetoired'unproessusdemarkovàinqétats
Une mesuredominante
m
deP
X(T) aété onstruite parAlbert dans [1℄ etrepriseparBadDumitresudans[4℄.Lavraisemblaneassoiéeyestexpliitée,
permettant d'établir une formule expliite du taux d'entropie d'un proessus
de Markov ergodique, fontion de son générateur
A = (a
i,j)
(i,j)∈E2 et de saprobabilitéinvariante
π
,soitH(X ) = − X
i∈E
π(i) X
j∈E,j6=i
a
i,jlog a
i,j+ X
i∈E
π(i) X
j∈E,j6=i
a
i,j.
(1)2 Estimation du taux d'entropie
L'estimationdutauxd'entropied'unehaînedeMarkovaété abordéepar
G. Ciuperaet V. Girardin dans [2℄puis parV. Girardinet A. Sesboüé dans
[5℄.Lesauteursyproposentunestimateurparplug-indutauxd'entropie,basé
surl'estimationdelamatriedetransitiondelahaîneetdesaloistationnaire.
Onadapteiiettedémarheauasd'unproessusàtempsontinu.
Laprobabilité invariante
π
d'un proessus de Markovergodique est ara-tériséeparl'égalité
π.A = 0
.Laprobabilitéinvarianteestdonunefontiondu générateur.A. Albertaétablidans[1℄ uneformuleexpliite,préisémentπ(i) = a
(i,i)P
k∈E
a
(k,k),où
a
(i,i) estle(i, i)
-ièmeofateurdeA
.Ce résultat, joint au théorème de Bad Dumitresu, implique que le taux
d'entropieest unefontiondugénérateur,
H(X ) = h(A)
.Ononstruitalorsunestimateurparpluginde
H(X )
,H b
T= h( A b
T)
,où
A b
T estunestimateurdugénérateur.A.Albert([1℄)aonstruitunestimateur
A b
T parmaximumdevraisemblane dugénérateurd'unproessusergodique.Expliitement,A b
T(i, j) =
n
T(i, j)
r
T(i)
sii 6 = j
etr
T(i) 6 = 0, 0
sii 6 = j
etr
T(i) = 0,
− X
j6=i
A b
T(i, j)
sii = j.
où
n
T(i, j)
estlenombredetransitionsdel'étati
àl'étatj
etr
T(i)
estletempsde séjour en
i
durant l'intervalle de temps[0, T ]
. Cet estimateur possède debonnespropriétésasymptotiques:
A b
T onvergepresquesûrementversA
,
√ T
A b
T− A
L→ N (0, Σ
2A)
oùΣ
2A estune matriediagonaledontleso-eientsdiagonauxsont
a
i,jρ/a
i,i,oùρ
estleproduitdesvaleurspropresnonnullesde
A
.3 Propriétés asymptotiques de l'estimateur
L'estimateur
H b
T= h( A b
T)
héritealorsdespropriétésdeA b
T.Théorème :Aveslesnotationsdonnéesplushaut,
1.
H b
T est fortementonsistant,soitH b
Tp.s.
→ H(X)
,2. si ladérivée
D
h(A)
deh
enA
est non nulle,H b
T est asymptotiquement normalet devarianeasymptotiqueexpliite, soit√ T
H b
T− H(X)
L→ N (0, Σ
2H)
oùΣ
2H= X
(i,j)∈E2,i6=j
a
i,ja
(i,i)ρ ∂h
∂a
i,j(A)
2,
3. Si
D
h(A) = 0
,alors2T
H b
T− H(X)
L−→ X
(i,j)∈E,i6=j
λ
i,jχ
2(1)
,ave
λ
i,j= a
i,jρ/a
(i,i).1. Puisque
A b
T onvergepresquesûrementversA
etqueh
estontinue,H b
T= h( A b
T)
onvergepresquesûrementversh(A) = H(X )
.2.,3. Pourlesditributionsasymptotiques,onproposeladémonstrationduas
partiulierd'unproessusàdeuxétatsdanslasetionsuivante.Leleteur
pourrasereporterà[6℄pourunedémonstrationdansleasgénéral.
Dans le as où
D
h(A)
ne s'annule pas, la variane asymptotique est une fontionexpliitedugénérateurA
,soitΣ
2H= s(A)
.Sonestimateurparplug-inΣ d
2H T= s( A b
T)
estfortementonsistant,d'oùlerésultatsuivant.Corollaire:Si
D
h(A) 6 = 0
alors√
T ( H b
T− H(X))/d Σ
H T−→ N
L(0, 1)
.4 Cas d'un proessus à deux états
Dansle as partiulierd'un proessus àdeux états, onpeutpréiser leré-
sultat duthéorèmepréédentommesuit.
Théorème :
1. Si legénérateur n'estpas uniforme,alors
√ T ( H b
T− H(X )) → N (0, Σ
2H)
quand
T
tendversl'inni,où
Σ
2H= a
1,2a
2,1(a
1,2+ a
2,1)
3( − a
1,2− a
2,1log(a
1,2a
2,1) + a
2,1)
2+( − a
2,1+ a
1,2− a
1,2log(a
1,2a
2,1)
2)
.
2. Si le générateur est uniforme, alors
2T (H(X ) − H b
T) → χ
2(2)
quandT
tendversl'inni.
Démonstration:
1. Ladérivéede
h
enA
estnullesietseulementsilegénérateurestuniforme(
a
1,2= a
2,1= 1
).Eneet,laformule(1)devient,pourn = 2
,H(X ) = a
1,2a
2,1a
1,2+ a
2,1(2 − log(a
1,2a
2,1))
où
A =
− a
1,2a
1,2a
2,1− a
2,1et
a
1,2, a
2,1> 0
don
∂h
∂a
1,2(a
1,2, a
2,1) = − a
1,2a
2,1+ a
22,1− a
22,1log a
1,2a
2,1(a
1,2+ a
2,1)
2,
∂h
∂a
2,1(a
1,2, a
2,1) = − a
1,2a
2,1+ a
21,2− a
21,2log a
1,2a
2,1(a
1,2+ a
2,1)
2.
Lesystèmed'équations
− a
1,2a
2,1+ a
22,1− a
22,1log a
1,2a
2,1= 0
− a
1,2a
2,1+ a
21,2− a
21,2log a
1,2a
2,1= 0
admetpouruniquesolution
(a
1,2, a
2,1) = (1, 1)
.2. Si
A
n'est pas uniforme, le résultat est une onséquenede la méthodedelta.
3. Si
A
est uniforme,undéveloppementdeTaylordeh
àl'ordre2
donneH b
T− H(X ) = −
14A b
T(1, 2) − a
1,2 2+
A b
T(2, 1) − a
2,1 2+ o
k A b
T− A k
2,
ladérivéeroiséeétantnullepourlegénérateuruniforme.
Or
√ T
AbT(1,2)−a1,2
ΣA(1,2)
,
AbTΣ(2,1)−a2,1A(2,1)
L−→ N (0, Id)
,donT
A b
T(1, 2) − a
1,2 2Σ
2A(1, 2) +
A b
T(2, 1) − a
2,1 2Σ
2A(2, 1)
−→
Lχ
2(2).
Lerésultatendéouleimmédiatementpuisque
Σ
2A(1, 2) = Σ
2A(2, 1) = 2
.Les gures
2
et3
illustrent respetivement la onvergene pontuelle de l'estimateurH b
T dans le as d'un générateur non uniforme et dans le as dugénérateur uniforme. L'estimateuraété alulé àpartirde lasimulation d'un
proessus de Markovpour unintervallede temps
[0, 5000]
.Dans lesdeux as,la onvergene est très rapide, d'autant plus que le générateur est prohe du
générateuruniforme(laonvergeneyétantplusrapidepuisqueladérivéeyest
nulle).
0 100 200 300 400 500
0.00.10.20.30.40.5
Index
cvh
Fig. 2 Convergene de
H b
T pour(a
1,2, a
2,1) = (2, 3)
0 100 200 300 400 500
0.920.940.960.981.00
Index
cvh
Fig. 3 Convergene de
H b
T pour(a
1,2, a
2,1) = (1, 1)
Lesgures
4
et5
illustrentrespetivementlaonvergenedelafontionde répartitionempiriquede√ T ( H b
T− H (X))/Σ
H verselled'uneloinormalepourleasd'unproessusdegénérateurnonuniformeetlaonvergenedelafontion
de répartitionempirique de
2T ( H b
T− H(X ))
verselle d'uneloiduχ
2 àdeuxdegrésdelibertépourunproessusdegénérateuruniforme.Danslesdeuxas,
lesfontionsde répartitionempiriques ontété obtenuesaprès lasimulationde
200
trajetoiressurlesintervalles detemps[0, 1000]
,[0, 2000]
et[0, 3000]
.−4 −2 0 2 4
0.00.20.40.60.81.0
T=1000
x
function(x) pnorm(x) (x)
−4 −2 0 2 4
0.00.20.40.60.81.0
T=2000
x
function(x) pnorm(x) (x)
−4 −2 0 2 4
0.00.20.40.60.81.0
T=3000
x
function(x) pnorm(x) (x)
Fig. 4 Convergene de la fontion de répartition empirique de
√ T ( H b
T− H (X))/Σ
H verselledelaloinormaleentréeréduitepour(a
1,2, a
2,1) = (2, 3)
0 1 2 3 4
0.00.20.40.60.8
T=1000
x
function(x) pchisq(x, 2) (x)
0 1 2 3 4
0.00.20.40.60.8
T=2000
x
function(x) pchisq(x, 2) (x)
0 1 2 3 4
0.00.20.40.60.8
T=3000
x
function(x) pchisq(x, 2) (x)
Fig.5Convergenedelafontionderépartitionempiriquede
2T ( H b
T− H (X))
verselledelaloidu
χ
2(2)
pour(a
1,2, a
2,1) = (1, 1)
Référenes
[1℄ A.Albert.EstimatingTheInnitesimalGeneratorofaContiniousTime,
Finite State Markov Proess. Annals of mathematial statistis, Vol. 33,
p.727-753.1962.
[2℄ G.CiuperaandV.Girardin.EstimationoftheEntropyRateofaCoun-
tableMarkovChain.Communiations inStatistis -TheoryandMethods,
Vol.36,p.1-15.2007.
[3℄ T.M.CoverandJ.A.Thomas.ElementsofInformationTheory.Edition
Wiley.1991.
[4℄ M. Bad Dumitresu. Some Informational Properties of Markov Pure-
Jump Proesses. Casopis Pro Pestovani Matematiky Vol. 4, p. 429-434.
1986.
[5℄ V.GirardinandA.Sesboüé.ComparativeConstrutionofPlug-inEsti-
matorsoftheEntropyRateofTwo-stateMarkovChains.Aparaîtredans
Methodology andComputingin Applied Probability.2009.
[6℄ P. Regnault. Etude et estimation dutaux d'entropie d'un proessus de
Markov.Mémoirede nde master.UniversitéParis-Sud.2008.
[7℄ C.E.Shannon.AMathematialTheoryofCommuniation.TheBellSys-
temTehnial Journal Vol.27,p. 379-423,623-656.1948.