Université Paris-Dauphine Master 1, Mathématiques et applications
Contrôle des chaînes de Markov Année : 2019-2020
Partiel - 30 octobre 2019 durée : 2 heures
Les documents, téléphones et ordinateurs portables sont interdits.
Dans toute la feuille(Ω,F,P) désigne un espace probabilisé.
Exercice 1. [Cours - projection orthogonale]
SoitX une variable aléatoire dansL2(F). SoitGune sous-tribu deF, etY ∈L2(G)une variable aléatoire qui satisfait
E[(X−Y)2] = inf
Z∈L2(G)E[(X−Z)2].
Montrer qu’alors, pour tout Z∈L2(G),E[(X−Y)Z] = 0.
Exercice 2. Soit(Xk)k≥1 une suite de variables aléatoires i.i.d. telles que, pour tout k≥1, P(Xk=−1) =P(Xk= 1) = 1
2. On pose S0 = 0, et pour tout n ≥ 1, Sn = Pn
k=1Xk. On considère la filtration (Fn)n≥0, où F0={∅,Ω} et, pour toutn≥1,Fn=σ(X1, . . . , Xn).
Soit a ∈N∗, et λ∈ R+ tel que 0 < λ < 2aπ. On définit Ta comme étant le temps de sortie de [−a, a], c’est-à-dire
Ta= inf{n≥0 : |Sn|=a}, avec la convention queTa=∞ si l’ensemble est vide.
1. Montrer queTa est un temps d’arrêt pour la filtration(Fn)n≥0. 2. Pour tout n≥0, on définit la variable aléatoire
Mn= (cosλ)−ncos(λSn).
Montrer que(Mn)n≥0 est une martingale pour la filtration(Fn)n≥0. 3. Montrer que, pour tout n≥0,
(cosλ)−n∧Tacos(λa)≤Mn∧Ta. En déduire que cos(λa)E
(cosλ)−n∧Ta
≤1.
4. En déduire que E
(cosλ)−Ta
≤(cos(λa))−1, puis que Ta est fini p.s.
Solution de l’exercice 2.
1. Remarquons que pour tout n≥0,Sn est Fn-mesurable. On a de plus {Ta=n}={|S0|< a, . . . ,|Sn−1|< a,|Sn|=a}, qui est bien dansFn, donc Ta est un temps d’arrêt.
2. Pour tout n≥0,
◦Mn est σ(Sn)-mesurable doncFn-mesurable.
◦ Comme0< λ < 2aπ eta∈N∗,λ∈(0,π2), donccos(λ)>0. Ainsi,|Mn| ≤cos(λ)−n est dansL1.
◦Calculons,
E[Mn+1|Fn] =E[(cosλ)−(n+1)cos(λSn+1)|Fn]
= (cosλ)−(n+1)E[cos(λ(Sn+Xn+1))|Fn]
= (cosλ)−(n+1)X
y∈Z
E[cos(λ(y+Xn+1))]I{Sn=y}, (Xn+1 ind. deFn,Sn estFn-mes.)
= (cosλ)−(n+1)X
y∈Z
1
2(cos(λ(y+ 1)) + cos(λ(y−1)))I{Sn=y}
= (cosλ)−(n+1)X
y∈Z
cos(λy) cos(λ)I{Sn=y}, id. cos(a+b) + cos(a−b) = 2 cosacosb
= cos(λ)−ncos(λSn) =Mn.
Ainsi, nous avons établi que(Mn)n≥0 est une martingale.
3. On a Mn∧Ta = (cosλ)−n∧Tacos(λSn∧Ta). La fonction cosétant paire, on a cos(λSn∧Ta) = cos(λ|Sn∧Ta|).
De plus, commeλ >0, on a p.s.
0≤λ|Sn∧Ta|=λ(|STa|I{Ta≤n}+|Sn|I{Ta≥n})
≤λa, par définition deTa, et car|Sn| ≤asi Ta> n
< π
2, par définition deλet cara∈N∗. La fonctioncos étant décroissante sur(0,π2), on déduit que
cos(λ|Sn∧Ta|)≥cos(λa), et par suite que, Mn∧Ta ≥(cosλ)−n∧Tacos(λa).
En prenant l’espérance, et en utilisant le théorème d’arrêt qui nous dit que (Mn∧Ta)n≥0
est une martingale, on déduit que
cos(λa)E[(cosλ)−n∧Ta]≤E[Mn∧Ta] =E[M0∧Ta] =E[M0] = 1, qui est équivalent à l’identité demandée.
4. On alimn→∞n∧Ta=Tap.s., donc d’après le lemme de Fatou et la question précédente (en utilisant quecos(λa)>0),
E[(cosλ)−Ta]≤lim inf
n→∞ E[(cosλ)−n∧Ta]≤(cos(λa))−1.
Ainsi,E[(cosλ)−Ta]<∞p.s. Ainsi0≤(cosλ)−Ta <∞p.s. et par suite−Talog(cos(λ))<
∞ p.s. Commecos(λ)∈(0,1)on en déduite que Ta<∞p.s.
Exercice 3. [Variations autour du problème de Cayley-Moser]
Chaque minute, une machine tire au hasard un nombre réel positif. On note Xn le réel obtenu à la minute n et on suppose que les (Xn)n≥1 sont des variables aléatoires indépendantes mais pas forcément identiquement distribuées, positives et d’espérance finie. Vous pouvez observer la machine pendantN minutes. Chaque minute, vous avez le choix entre dire “stop” ou “je continue”, mais vous ne pouvez dire “stop” qu’une seule fois. Si vous décidez de vous arrêter à la minuten, on vous remet (en euros) la somme Xn et le processus s’arrête là. Sinon le processus continue jusqu’à ce vous disiez “stop”. L’horizon est fini : si vous ne vous êtes pas arrêtés strictement avant la minute N, vous devez dire “stop” à la minuteN. L’objectif est de trouver une stratégie optimale maximisant la somme reçue.
1. Rappeler la définition de la fonction valeur (Zn)1≤n≤N, solution de ce problème d’arrêt optimal et montrer que, pour tout1≤n≤N,Znest σ(Xn)- mesurable.
2. Pour tout 1≤n≤N, on poseVn:=E[Zn]. Montrer que,
∀1≤n≤N −1, Vn=ϕn(Vn+1), où, pour tout x∈R,ϕn(x) =E[max(Xn, x)].
3. Donner la définition du cours de T?, le plus petit temps d’arrêt optimal borné parN. 4. Montrer que(Zn∧T∗)1≤n≤N est une martingale.
5. Montrer que le temps d’arrêt optimal T? peut se réécrire de la manière suivante : T? =
(inf{1≤k≤N −1 :Xk ≥Vk+1} si non vide
N sinon.
6. Application 1. On suppose que, pour tout 1 ≤ n ≤ N, Xn suit une loi uniforme sur l’intervalle[0, N + 1−n].
(a) Trouver la relation de récurrence rétrograde pour les (Vn)1≤n≤N.
(b) Application numérique. Expliciter dans le cas où N = 4. Conclure sur la stratégie à adopter et donner le gain moyen optimal.
7. Application 2. On suppose que les (Xn)n≥1 sont identiquement distribuées, de loi ex- ponentielle de paramètre 1.
(a) Trouver la relation de récurrence rétrograde pour les (Vn)1≤n≤N.
(b) Le but de cette question est de montrer queV1−log(N)N−→→∞0. Pour tout1≤n≤N, posonsUn=VN−n+1; il est alors équivalent de montrer que
UN −log(N)N−→→∞0.
i. Montrer queU1 = 1 et que, pour tout2≤n≤N, Un=Un−1+e−Un−1.
ii. Pour tout 1 ≤ n ≤ N, posons Bn = eUn −(n+ 1). Montrer que, pour tout 2≤n≤N,
Bn−Bn−1= (n+Bn−1)
exp 1 n+Bn−1
−1
−1.
iii. Montrer que, pour tout 1≤n≤N,Bn≥0; en déduire queUn≥log(n+ 1).
iv. Montrer queBN ≤log(N) +c, pour une constantec, lorsqueN est suffisamment grand.
v. Conclure.
Solution de l’exercice 3.
1. On considère la filtration canonique (Fn)n≥1 = (σ(X1, . . . , Xn))n≥1. Pour tout n ≥ 1, le processus de gain est Yn = Xn où les (Xn)n≥0 sont indépendantes et intégrables.
On est donc dans le cadre Markovien. Ainsi d’après le cours, la fonction valeur Zn est σ(Xn)-mesurable. On demande cependant de le redémontrer.
Par définition,
◦ ZN =XN,
◦ ∀1≤n≤N,Zn= max(Xn,E[Zn+1|Fn]).
Par récurrence rétrograde, ZN = XN est σ(XN)-mesurable. Soit 1 ≤ n+ 1 ≤ N et supposons que Zn+1 estσ(Xn+1)-mesurable. Alors,
E[Zn+1|Fn] =E[Zn+1].
En effet, les v.a. (Xn)n≥1 étant indépendantes, on a que Zn+1 est indépendante deFn. Ainsi au rang n,
Zn= max(Xn,E[Zn+1|Fn]) = max(Xn,E[Zn+1]) estσ(Xn)-mesurable.
2. D’après la question précédente, pour tout1≤n≤N −1,
Zn= max(Xn,E[Zn+1]) = max(Xn, Vn+1).
En prenant l’espérance des deux côtés, on déduit que :
Vn=E[Zn] =E[max(Xn, Vn+1)] =ϕn(Vn+1).
3. D’après le cours, T?=
(inf{1≤k≤N−1 : Xk ≥E[Zk+1|Fk]} si non vide
N sinon .
4. Voir cours.
5. On utilise la question 3. et le fait que,Yk=Xk,E[Zk+1|Fk] =E[Zk+1] =Vk+1. 6. Application 1.
(a) On a XN ∼U([0,1]), donc
VN =E[XN] = 1 2,
Pour tout 1≤n≤N, posonsM =N + 1−n, et pour tout x∈[0, M], calculons, ϕn(v) =E[max(Xn, v)] = 1
M Z v
0
vdx+ Z M
v
xdx
= v2+M2
2M = v2+ (N + 1−n)2 2(N + 1−n) .
D’après la question 2., pour tout 1≤n≤N−1,
Vn=ϕn(Vn+1) = Vn+12 + (N+ 1−n)2 2(N + 1−n) . (b) Cas N = 4.
n= 4, V4 = 1 2 n= 3, N + 1−n= 2, V3 =
1 22 + 22
2·2 = 17
16 '1.06 n= 2, N + 1−n= 3, V2 =
172 162 + 32
2·3 = 2593
1536 '1.69 n= 1, N + 1−n= 4, V1 =
25362 15362 + 42
2·4 '2.36
Stratégie : choisir le premier objet si X1 ≥ 1.69 sinon on continue, on choisit le deuxième objet si X2 ≥1.06 sinon on continue, on choisit le troisième objet si X3 ≥ 0.5, sinon on choisit le quatrième objet.
Le gain moyen optimal est V1 = 2.36.
7. Application 2.
(a) On a XN ∼E([0,1]), donc
VN =E[XN] = 1, Calculons, pour tout v >0,
ϕ(v) =E[max(X1, v)] = Z v
0
ve−xdx+ Z ∞
v
xe−xdx
=v(1−e−v) +ve−v+e−v
=v+e−v.
D’après la question 2., pour tout 1≤n≤N−1,
Vn=ϕn(Vn+1) =ϕ(Vn+1) =Vn+1+e−Vn+1. (b) i. On aU1=VN = 1 d’après le point (a). Pour tout2≤n≤N,
Un=VN−n+1=VN−n+2+e−VN−n+2, d’après (a)
=VN−(n−1)+1+e−VN−(n−1)+1
=Un−1+e−Un−1, par définition deUn−1.
ii. Notons que d’après la question i., on aeUn =eUn−1exp(e−Un−1). D’après la défi- nition de Bn, on a eUn = n+ 1 +Bn. Remplaçant ceci dans la première identité on obtient,
n+1+Bn= (n+Bn−1) exp 1 n+Bn−1
⇒ Bn= (n+Bn−1) exp 1 n+Bn−1
−n−1.
ConsidéronsBn−Bn−1 en remplaçantBn par l’identité ci-dessus : Bn−Bn−1 = (n+Bn−1) exp 1
n+Bn−1
−Bn−1−n−1
= (n+Bn−1)
exp 1
n+Bn−1
−1
−1, qui est l’identité recherchée.
iii. En utilisant le développement en série entière de l’exponentielle, on obtient, (n+Bn−1)
exp
1 n+Bn−1
−1
−1 = 1
2!(n+Bn−1) + 1
3!(n+Bn−1)2 +. . . De plus,B1 =eU1 −2 =e1−2>0. Donc de l’identité ci-dessus et de la question ii. on déduit par récurrence que(Bn) est croissante comme fonction de net donc positive.
De la définition deBn, on a
Un= log(Bn+ (n+ 1))≤log(n+ 1),
où dans la deuxième inégalité on a utilisé le fait que log est croissante et que Bn≥0.
iv. De la question précédente, on déduit que Bn−Bn−1 ≤ 1
2!n+ 1
3!n2 +· · · ≤ 1 n pournassez grand. Ainsi, pour N suffisamment grand,
BN =
N
X
n=2
(Bn−Bn−1) +B1 ≤C+ log(N).
v. En utilisant les questions précédentes, on a
0≤UN −log(N+ 1) = log(BN + (N + 1))−log(N+ 1),d’après iii. et déf. BN
= log BN
N+ 1+ 1 ,
et le membre de droite tend vers 0 car, pourN assez grand, 0 ≤ NB+1N ≤ logN+1N +
C
N+1 →0.
Ainsi, par encadrement, on déduit que limN→∞UN −log(N + 1) = 0. Comme log(N)∞∼log(N+ 1), on a le résulat voulu.
Ceci signifie que dans ce modèle, quand le nombre d’objets est grand, le gain moyen optimal est de l’ordre delog(N).