Soit (Xn)n∈N une chaîne de Markov à valeurs dans E

(1)

MICHEL BONNEFONT

Master MIMSE Bordeaux

Dans tout ce chapitre, (X_n)n∈N sera une chaîne de Markov homogène de para- mètres (µ, P).

1. Définitions et premières propriétés

Notation-Définition 1.1. Soit (X_n)n∈N une chaîne de Markov à valeurs dans E.

Soit i∈E, on note

N_i =N_i(X) = card{n ≥0, X_n =i}

le nombre de passages de la chaîne en i. On définit les instants successifs de passage en ipar

τ_i =τ_i¹ =τ_i¹(X) = inf{p >0, X_p =i}

et pour n ≥2, si τ_iⁿ⁻¹ <+∞,

τ_iⁿ =τ_iⁿ(X) = inf{p > τ_iⁿ⁻¹, X_p =i}.

De plus on note, avec τ_i⁰ = 0,

∀n ≥1, S_iⁿ =

(τ_iⁿ−τ_iⁿ⁻¹ si τ_iⁿ⁻¹ <∞, 0 sinon.

Enfin, on note Ei l’espérance sous Pi.

Remarque 1.2. Les τ_iⁿ, i∈E, n≥1, sont des temps d’arrêt par rapport àFn. Définition 1.3. Un point i de E est dit récurrent pour la chaîne de Markov (X_n)n∈N si Pi(N_i =∞) = 1. Il est dittransient si Pi(N_i =∞) = 0.

Lemme 1.4. Pour r ≥ 1, S_i^r est indépendant de la tribu F_τ^r−1

i ( tribu des événe- ments antérieurs au temps d’arrêt τ_i^r−1) et conditionnellement à τ_i^r−1 <∞, S_i^r

P(S_i^r =n|τ_i^r−1 <∞) = Pⁱ(τ_i =n).

Démonstration. Appliquons la propriété de Markov forte au temps d’arrêtτ =τ_i^r−1. Sous τ < ∞ on a automatiquement X_τ = i. Donc conditionnellement à τ < ∞, (X_τ+n)_n∈_N est une chaîne de Markov de paramètre (δ_i, P) et est indépendante de X₀, . . . , X_τ. De plus,

S_i^r= inf{n ≥1, Xτ+n=i},

donc S_i^r est le temps de premier passage de(X_τ+n)_n∈_N en i.

1

(2)

Lemme 1.5. Soit f_i =Pi(τ_i <∞) la probabilité de retour en i. Alors

∀r∈N,Pi(N_i > r) =f_i^r.

De plus, sif_i = 1, on aPi(N_i = +∞) = 1.Et sif_i <1, sous Pi, la variable aléatoire N_i est une loi géométrique de paramètre 1−f_i.

Démonstration. Observons tout d’abord que si X₀ = i alors N_i > r ⇐⇒ τ_i^r < ∞.

Montrons le lemme par récurrence surr.

— Soit r= 1. Partant dei, le nombre N_i de fois où on visite l’état i au cours de la trajectoire est superieur ou égal à 2 si et seulement si le tempsτ_i de premier retour en i est fini. D’où :

Pi(N_i >1) =Pi(τ_i <∞) = f_i.

— Supposons le résultat vérifié pourr ≥1. Comme précedemment, le nombreN_i de fois où on visite l’état i est superieur ou égal à r+2 si et seulement si le tempsτ_i^r+1 de r+1 ème retour en i est fini. On en déduit :

Pi(N_i > r+ 1) =Pi(τ_i^r+1 <∞),

=Pⁱ(τ_i^r <∞, S_i^r+1 <∞),

=Pⁱ(S^r+1 <∞|τ_i^r <∞)Pⁱ(τ_i^r <∞),

=f_if_i^r d’après le lemme précédent,

=f_i^r+1.

On a donc le résultat souhaité pour toutr. Maintenant sif_i :=Pi(τ_i <∞) = 1alors Pi(N_i =∞) = lim

r→∞Pi(N_i > r) = 1. Et si f_i <1, alors pour r≥1 Pi(N_i =r) = Pi(N_i > r−1)−Pi(N_i > r) = f_i^r−1(1−f_i).

Le théorème suivant fournit un premier critère de récurrence et transience plus maniable que la définition de la récurrence et de la transience.

Théorème 1.6.

(1) L’état i est récurrent si seulement si Pi(τ_i <∞) = 1.

(2) L’état i est transient si et seulement si Pⁱ(τi <∞)<1.

En particulier tout état est récurrent ou transient.

Démonstration. Il suffit de montrer que si Pi(τ_i <∞) = 1 alors i est récurrent et siPi(τ_i <∞)<1 alors iest transient.

— SupposonsPi(τ_i <∞) = 1alors Pi(N_i =∞) = lim

r→∞Pi(N_i > r) = 1 donc i est récurrent.

— SupposonsPⁱ(τ_i <∞)<1alors Pⁱ(N_i =∞) = lim

r→∞Pⁱ(N_i > r) = 0 donc i est transient.

On déduit maintenant un deuxième critère de récurrence et de transience.

(3)

Théorème 1.7.

(1) L’état i est récurrent si seulement si P∞

n=0P_iiⁿ = +∞.

(2) L’état i est transient si et seulement si P∞

n=0P_iiⁿ <+∞.

Ce théorème se démontre à partir des deux lemmes suivants : Lemme 1.8. On a Eⁱ(Ni) =P∞

n=0P_iiⁿ. Démonstration.

Ei(N_i) = Ei

∞

X

n=0

1{Xn=i}

!

=

∞

X

n=0

Ei 1{Xn=i}

par Fubini-Tonelli,

=

∞

X

n=0

Pi(X_n =i) =

∞

X

n=0

P_iiⁿ.

Lemme 1.9. Si X est une variable aléatoire à valeurs dans N alors

E[X] =X

r≥0

P(X > r).

En particulier si f_i :=Pⁱ(τ_i <+∞)<1,

Ei(N_i) = 1 1−fi

<∞.

Démonstration. Par Fubini-Tonelli E(X) =X

k≥1

kP(X =k) = X

k≥1 k−1

X

l=0

P(X =k)

=X

l≥0

X

k≥l+1

P(X =k) = X

l≥0

P(X ≥l+ 1).

Par conséquent, si f_i :=Pi(τ_i <+∞)<1, Eⁱ(N_i) =

∞

X

r=0

Pⁱ(N_i > r) =

∞

X

r=0

f_i^r = 1

1−f_i <∞.

Démonstration du théorème . D’après ce qui précède, il nous suffit de montrer que siPⁱ(τi <∞) = 1 alorsP∞

n=0P_iiⁿ= +∞et siPⁱ(τi <∞)<1alorsP∞

n=0P_iiⁿ<+∞.

— SupposonsPⁱ(τi <∞) = 1alorsPⁱ(Ni =∞) = 1etP

n≥0P_i,iⁿ =Eⁱ[Ni] = +∞.

— Supposons Pi(τ_i <∞)<1 alors P

n≥0P_i,iⁿ =Ei[N_i] = _1−f¹

i <∞.

Corollaire 1.10. Soit i un point de E. Alors

Pi(N_i =∞) = 1⇐⇒Pi(N_i =∞)>0, Pi(N_i =∞)<1⇐⇒Pi(N_i =∞) = 0.

(4)

2. Structure de classe

Théorème 2.1. La récurrence et la transience sont des propriétés de classe.

Démonstration. Soient i, j tels que i ←→ j. Il existe n, m ≥ 0 vérifiant P_ijⁿ > 0 et P_ji^m>0 , et pour toutr ≥0on a P_ii^n+r+m ≥P_ijⁿP_jj^rP_ji^m d’où

∞

X

r=0

P_jj^r ≤ 1 P_ijⁿP_ji^m

∞

X

r=0

P_ii^n+r+m. Supposons maintenant que iest transient alors

∞

X

r=0

∞

X

r=0

P_ii^n+r+m <+∞

et doncj est transient.

Supposons maintenant que j est récurrent alors +∞=

∞

X

r=0

∞

X

r=0

P_ii^n+r+m

et donci est récurrent.

Remarque 2.2. On peut donc parler de classe récurrente ou transiente. De plus, une chaîne de Markov est dite récurrente (respectivement transiente) si tous ses états sont récurrents (respectivement transients).

Théorème 2.3. Toute classe récurrente est fermée.

Ou de manière équivalente : toute classe qui n’est pas fermée est transiente.

Démonstration. SoitC une classe qui n’est pas fermée. Il existei∈ C,j /∈ C etm ≥1 tels quePi(X_m =j)>0. De plus, puisquej ne conduit pas ài,Pi(X_m =j, X_m+l = i) = 0 pour tout l ≥ 0. Donc Pⁱ({Xm = j}) = Pⁱ({Xm =j} ∩ {Ni <∞}). Ceci implique que

Pⁱ(Ni <∞)≥Pⁱ({Xm =j} ∩ {Ni <∞}) = Pⁱ({Xm =j})>0.

Donci est transient et donc C est transiente.

Théorème 2.4. Toute classe fermée et finie est récurrente.

Démonstration. Soit C une classe fermée et finie, supposons que X₀ ∈ C. C étant fermée et finie, pour chaque réalisation de la chaîne de Markov, il existe un état qui est visité une infinité de fois.

On en déduit que Pµ0(S

j∈E{N_j =∞}) = 1. C étant finie, il existe donc un état i tel que P^µ0(N_i =∞) >0. Montrons que i est récurrent, il nous suffit de montrer quePi(N_i =∞)>0.

PosonsT_i = inf{n ∈N, X_n =i}, on va montrer :

0<Pµ0(N_i =∞) = Pµ0(T_i <∞)Pi(N_i =∞).

(5)

En effet, T_i est un temps d’arrêt et on a

Pµ0(N_i =∞) = Pµ0({T_i <∞} ∩ {X_T_i_+n=ipour une infinité de n}),

=Pµ0(X_T_i_+n=i pour une infinité den|T_i <∞)Pµ0(T_i <∞)

=Pⁱ(X_n =i pour une infinité de n)P^µ0(T_i <∞) par la propriété de Markov forte qui nous dit que, conditionnellement à{T_i <∞}, (X_T_i_+n)n∈N est une chaîne de Markov de paramètres (δ_i, P),

=Pµ0(T_i <∞)Pi(N_i =∞).

Donc on obtient que Pⁱ(N_i =∞)>0, donci est récurrent et C l’est aussi.

Corollaire 2.5. Toute chaîne de Markov homogène sur un espace d’états fini admet (au moins) une classe récurrente.

Définition 2.6. Un point i de E est dit récurrent positif pour la chaîne de Markov (X_n)n∈N si Ei(τ_i) < ∞. Un point récurrent de E qui n’est pas récurrent positif est dit récurrent nul.

Théorème 2.7. La récurrence positive et la récurrence nulle sont des propriétés de classe.

Démonstration. Résultat admis.

Proposition 2.8. Si E est fini, tous les états récurrents sont récurrents positifs

Démonstration. Résultat admis.