Estimateur crible de l’opérateur d’un processus ARB(1) Sieve estimator of the operator in ARB(1) process

(1)

Statistique/Probabilités

Estimateur crible de l’opérateur d’un processus ARB(1) Sieve estimator of the operator in ARB(1) process

Fatiha Rachedi, Tahar Mourid

Université Abou Bekr Belkaid, Département de mathématiques, Faculté des sciences, Tlemcen 1300, Algérie Reçu le 1^ermars 2002 ; accepteé après révision le 23 janvier 2003

Présenté par Paul Deheuvels

Résumé

Nous considérons l’estimation par la méthode des « cribles » de Grenander de l’opérateur d’un processus autorégressif d’ordre un à valeurs dans un espace de Banach séparable. Nous montrons la convergence presque sûre de l’estimateur dans le cas où l’opérateur est strictement 2-intégral, 2-sommable et puis 2-nucléaire pour les normes adéquates. Pour citer cet article : F. Rachedi, T. Mourid, C. R. Acad. Sci. Paris, Ser. I 336 (2003).

Abstract

We consider the sieve estimator of the operator of a Banach autoregressive process. We show the almost sure convergence when the operator is 2-summing, strictly 2-integral, afterwards 2-nuclear for the adequate norms. To cite this article: F. Rachedi, T. Mourid, C. R. Acad. Sci. Paris, Ser. I 336 (2003).

Abridged English version

Let(B,B, )be a separable Banach space equipped with itsσ-algebra. We consider a sequence(εn, n∈Z) of i.i.d. random variables, defined on a probability space(Ω,A, P ) and with values in B, of zero mean and 0< σ²=Eεn²<+∞(aB-strong white noise). Letρ be an operator of L(B) the space of bounded linear operators fromB toB,such that∃j0∈N^∗for whichρ^j⁰_L<1.A random process(Xn, n∈Z)defined on the probability space(Ω,A, P )is said an autoregressive process of order one with values inB(ARB(1)), if it satisfies the following relation:

X_n=ρX_n₋₁+ε_n, n∈Z. (1)

The process(X_n, n∈Z)is strictly stationary ([3], p. 148). The problem in this Note is the estimation of the parameterρby the method of sieves define by Grenander [7] following the ideas of Hwang et Geman [6] for the case of observations i.i.d. and adapting them to the setting of dependent observations verifying (1).

Adresse e-mail : [email protected] (T. Mourid).

doi:10.1016/S1631-073X(03)00061-X

(2)

We denote byΘthe space of the parameters equipped with a metricd. The sieve for the spaceΘis a sequence {Θm}mofΘ such thatΘmis compact,Θm⊂Θm+1,and

mΘmis dense inΘ.We denote byPρ the stationary law induced on(B,B)byX₀and byP₀the law ofε₀. We suppose thatPρ is absolutely continuous with respect toP₀.In ([4], Proposition 4) in the gaussian case and under some conditions,Pρ andP₀are equivalent. We denote byρ0the true value of parameter. Now we introduce the following definitions and notations:

(a) forρ∈Θm, Bm(ρ, ε):= {θ∈Θm|d(ρ, θ ) < ε};

(b) the density of the transition probability of process (X_n)_n verifying (1), with respect to P₀ is noted by g(x, y, ρ)=(P_ρ(dx/X₀=y))/(P₀(dx))wherex, y∈Bandρ∈Θ;

(c) the conditional entropyH (ρ, θ ):=E_ρlng(X, y, θ )=

ln(g(x, y, θ ))g(x, y, ρ)dP₀(x);

(d) for a real-valued functiongwe setg(A):=sup_y_∈_Ag(y);

(e) L_n(x₁, . . . , x_n;ρ)denote the conditional likelihood function. The set of points ofΘ_mwhereL_n(x₁, . . . , x_n; ·) attains his maximum is denoted by:

M_mⁿ = {ρ∈Θ_m|L_n(ω;ρ)=L_n(ω;Θ_m):=sup_θ_∈_Θ

mL_n(ω;θ )}. SimilarlyA_m= {ρ∈Θ_m|H (ρ₀, ρ)=H (ρ₀, Θ_m):=sup_θ_∈_Θ

mH (ρ₀, θ )}.

LetΘbe the space of 2-summing operators and the metricπ₂deduced from the norm of 2-summing operators.

For this study we follow [6]. Especially we have:

Theorem. If the sieve {Θ_m} is chosen such that (1) for all m and all ρ ∈Θ_m, there exist ε >0 such that E_ρ₀ln(g(X, y, B_m(ρ, ε))) <∞.(2) A_m −→

m→+∞ρ₀then sup_ρ_∈_Mn

mπ₂(ρ, ρ₀) −→

m,n→+∞0 a.s.

1. Introduction

Soit(B,B, )un espace de Banach séparable muni de sa tribu Borélienne(ε_n, n∈Z)un bruit blanc fort à valeurs dans B etρ un opérateur linéaire et borné de B dansB (ρ∈L(B) tel que ∃j₀∈N^∗: ρ^j⁰_L<1.

(X_n, n∈Z)est un processus autorégressif d’ordre un dansB(ARB(1)), associé àρet(ε_n)si :

Xn=ρXn−1+εn, n∈Z. (2)

(Xn, n∈Z)est strictement stationnaire ([3], p. 148). Dans cette Note on considére l’estimation deρpar la méthode des « cribles » de Grenander [7] en suivant Hwang et Geman [6] avec adaptation aux observations vérifiant (2). Le casBun espace de Hilbert etρde Hilbert Schmidt a été résolue par les « moindres-carrées » [3]. L’estimation par le maximum de vraisemblance en dimension infinie est traitée par [7] par la méthode des « cribles ». Dans [2] le cas oùB est un espace de Hilbert a été traité. Nous traitons le casρ 2-sommable, ensuite strictement 2-intégral et 2-nucléaire. Nous obtenons la convergence p.s. de l’estimateur crible (cas général) et avec exemples de cas de processus de Wiener. La géométrie de l’espace de Banach est cruciale.

2. Définitions et notations

SoitΘl’espace des paramètres muni d’une métriqued. Un « crible » est une suite de sous ensembles{Θ_m}mde Θtelle queΘ_mcompact,Θ_m⊂Θ_m₊₁,et

mΘ_mest dense dansΘ.SoitP_ρ la loi deX_netP₀deε₀. Supposons queP_ρ est absolument continu par rapport à P₀ ([4], Proposition 4). Le modèle (2) est identifiable (P_ρ =P_θ si ρ=θ). Soitρ₀la vraie valeur. Introduisons les définitions suivantes :

(a) Pourρ∈Θ_m, B_m(ρ, ε):= {θ∈Θ_m|d(ρ, θ ) < ε}.

(b) La densité de la probabilité de transition du processus (X_n)_n vérifiant (2), par rapport à P₀ est notée g(x, y, ρ)=(Pρ(dx/X0=y))/(P0(dx))oùx, y∈B etρ∈Θ.

(c) L’entropie conditionnelleH (ρ, θ ):=Eρlng(X, Y, θ )=

ln(g(x, Y, θ ))g(x, Y, ρ)dP0(x).

(3)

(d) Pour une fonction à valeurs réellesgnous posonsg(A):=sup_y_∈_Ag(y).

(e) Ln(x₁, . . . , xn;ρ)est la fonction de vraisemblance conditionnelle. L’ensemble des points deΘmoùLn(x₁, . . . , xn; ·)atteint son maximum est noté :M_mⁿ = {ρ∈Θm|Ln(ω;ρ)=Ln(ω;Θm):=sup_θ_∈_Θ

mLn(ω;θ )}. De mêmeAm= {ρ∈Θm|H (ρ₀, ρ)=H (ρ₀, Θm):=sup_θ_∈_Θ_mH (ρ₀, θ )}.

3. L’opérateurρest 2-sommable

ρest 2-sommable si∃C0| ∀x₁, . . . , x_n∈B: _n

i=1ρ(x_i)²1/2

C·sup_x∗1

_n

i=1|(x^∗, x_i)|²1/2

([5], p. 31). La plus petite valeur deC est notéeπ₂(ρ). Cet ensemble de Banach est notéΠ₂(B)etπ₂est sa norme : ρ_Lπ₂(ρ)([5], p. 38). SiBest un Hilbert,Π₂(B)est l’espace des opérateurs de Hilbert–Schmidt ([5], p. 84).

SoitΘ=Π₂(B). Nous avons le résultat suivant.

Théorème 1. Si le « crible »,{Θ_m}est choisi tel que (1)pour tout met toutρ∈Θ_m, il existe ε >0 tel que E_ρ₀ln(g(X, y, B_m(ρ, ε))) <∞;(2) A_m −→

m→+∞ρ₀alors sup_ρ_∈_Mn

mπ₂(ρ, ρ₀) −→

m,n→+∞0 p.s.

Remarque. La condition (1) est une condition de finitude de moment. Comme dans [6] on peut avoir une condition suffisante pour la condition (2). En effet la condition H (ρ0, ρm)→H (ρ0, ρ0) implique en général ρm→ρ0. Par suite si de plus le crible{Θm}est choisi tel que ∃ρm∈Θm etH (ρ0, ρm)→H (ρ0, ρ0)on aura sup_ρ_∈_Mn

mπ2(ρ, ρ0) −→

m,n→+∞0.

Pour l’ordre de croissance demdu cribleΘ_mnous introduisons les conditions :

C₁: Si(ρ_m)est une suite telle que∀n, ρ_m∈Θ_metH (ρ₀, ρ_m)→H (ρ₀, ρ₀)alorsρ_m→ρ₀. C₂: Il existe une suite (ρ_m∈Θ_m)telle queH (ρ₀, ρ_m)→H (ρ₀, ρ₀).

Pourδ >0 et nsoitDm= {ρ∈Θm|H (ρ0, ρ)H (ρ0, ρm)−δ}oùρm est dans C2. Soitl sous ensembles Γ1, . . . , Γl deΘmet

ϕm:=sup

k

tinf0Eρ₀exp

tln

g(x, y, Γ_k) g(x, y, ρ_m) .

Théorème 2. Soit{Θm}un crible vérifiant la condition C1. Si pour toutδ >0,on peut trouver Γ₁^m, . . . , Γ_l^m

m

dans Θm, n=1,2, . . . , tels que : (i) Dm ⊆_l_m

k=1Γ_k^m; (ii) _+∞

n=1lmn(ϕmn)ⁿ <+∞, mn −→

n→+∞+∞ alors sup_ρ_∈_Mn

mnπ₂(ρ, ρ₀) −→

n→+∞0 p.s.

4. L’opérateurρest strictement 2-intégral

Soient(xk)k une base dansB et(y_k^∗)k la suite des fonctionnelles de coéfficients associée à cette base. Si(y_k^∗)k

forme une base dansB^∗,(xk)kest dite base de shrinking. SiBest tel queB^∗admet une base(y_k^∗)k,alorsBadmet une base de shrinking ([9], p. 10). On note(·,·)le crochet de dualité entreB etB^∗. Le couple(y^∗_k, xk)k est dit système biorthogonal si(y_k^∗, xj)=δkj, il forme une base de Markushevich dansBsi l’espace engendré par(xk)k, noté[xk]k,est dense dansB et[y_k^∗]k est faiblement dense dansB^∗. En outre tout espace de Banach séparableB admet une base de Markushevich [10].

(4)

On noteJ2(B)l’ensemble des opérateurs strictement 2-intégraux deBdansB, on associe la norme 2-intégrale, notée · 2([5], p. 97), on a ρ_Lρ2. ρest 2-sommable tel queπ₂(ρ)= ρ2([5], p. 99). Soit(Γ,F, ν)un espace mesurable. Toute fonctionφ∈L²(ν)induit un opérateurMφdeL^∞(ν)dansL²(ν)défini par :f →φf, etMφ_LφL₂(ν). On noteM2(L^∞(ν), L²(ν))l’ensemble des opérateurs de multiplication deL^∞(ν)dans L²(ν)et·,·le produit scalaire dansL²(ν).D’aprés ([5], p. 111 )ρest strictement 2-intégral si et seulement s’il existe un espace mesurable(Γ,F, ν), deux opérateurs linéaires bornésaetbdeL²(ν)dansBet deBdansL^∞(ν) respectivement, etM_φ∈M2(L^∞(ν), L²(ν))(ouφ∈L²(ν)) tel que le diagramme suivant commute :

B −→^ρ B

b↓ ↑a

L^∞(ν) −→^M^φ L²(ν)

(3)

L’étude de la fonction de vraissemblance pour des v.a. vérifiant (2) est assez compliquée dans le cas d’un opérateur quelconque. Ceci nous amène à considérer une représentation « spectrale » deρassociée à une base biorthogonale.

Soit(ek)_k_∈Nune base orthonormale dansL²(ν).La suite(ae_k)_k_∈Nforme une base dans Im(ρ)et siaest injective c’est une base de Schauder. Pour obtenir une décomposition deρnous introduisons l’hypothèse suivante : H : La suite(ae_k)k∈N est une base de shrinking. Notons(f^∗

k)k∈N la suite des fonctionnelles de coefficients associée à (ae_k)_k_∈N, λ_k=1/f^∗

k²etu^∗

k=f^∗

k/f^∗

k, ∀k∈N.Nous avons les lemmes suivants : Lemme 1. Sous l’hypothèse H, les(u^∗

k)_k_∈Nsont des vecteurs propres normés deaa^∗deB^∗associés aux valeurs propres(λ_k)_k_∈N.

Lemme 2. Sous l’hypothèse H,ρs’écrit : ρ(·)=

k∈N

α_k

e_k, e_kb(·)

ae_k, (4)

oùα_k= e_k, φ, ∀k∈N,etφ∈L²(ν)est associée àρpar le diagramme (3).

Si a et b sont connus l’estimation de ρ revient à l’estimation de φ dans L²(ν).Comme φ=

k∈Nαkek

l’estimation deφ passe par l’estimation de ces coéfficients(αk)k.Le fait de considérer quea etbsont connus, n’est pas trés restrictif. Voici un exemple :

Exemple. SoientB=C([0,1])l’espace des fonctions continues sur[0,1]etM2(B)l’ensemble des opérateurs de multiplication de B dans B. Toute fonction φ ∈C([0,1]) induit un opérateur de multiplication M_φ ∈ M2(C([0,1]))d’image dansL²([0,1])([5], p. 40). Soitρ∈M2(C([0,1])) défini parφ∈C([0,1])(ρintervient dans la représentation de certains processus autorégressif à temps continu (voir par exemple [3], p. 150)). Soitµ une mesure de probabilité sur[0,1]de densité dµ(t)/dt =(φ/φ)² ([5], p. 108), on obtient la décomposition de ρ =ci₂d où dest l’injection de C([0,1]) dans L^∞(µ), i₂ l’identité formelle de L^∞(µ) dans L²(µ) et c l’application deL²(µ)→L²([0,1]):f→φf. Doncρest strictement 2-intégral ([5], p. 97) etρ2= φL²([0,1]). Dans le diagramme (3)aest l’identité dansL²([0,1])etbest l’injection deC([0,1])dansL^∞([0,1]).

Supposons que le processus(Xn)n vérifiant (2) est gaussien et Pρ est absolument continue par rapport àP0

(cf. Paragraphe 2). Donc∀k∈Nles v.a. réelles(f_k^∗, εn)nsont gaussiennes indépendantes et de même varianceσ_k². SoitΘ=L²(ν). Nous considérons le cribleΘ_m^∗= {φ∈L²(ν)|φ=_m

k=0α_ke_k, _m

k=0k²|α_k|²m}. Proposition 1. L’estimateur crible deφ est la fonction φˆ_m=_m

k=0αˆ_ke_k où αˆ_k = nⁿⁱ⁼¹^e^k^,e^k^bxⁱ⁻¹^(f^k^∗^,xⁱ⁾ i=1e_k,e_kbx_i₋₁²+2nλk, k= 0, . . . , m, et tel queλvérifie_m

k=0k²ⁿ_i₌₁e_k,e_kbx_i₋₁(f_k^∗,x_i) n

i=1ek,ekbxi−1²+2nλk

2

=m.

(5)

Le Théorème 2 donne la convergence p.s. deφˆm,et l’ordre de la dimensionm.

Théorème 3. Simn=O(n^1/3⁻^δ)pourδ >0, alors ˆφm_n−φ0L²(ν)−→

n→∞0 p.s.

Remarque. L’ ordre demest polynomial alors que dans [3] est logarithmiquem_n=o(logn).

4.1. ρest 2-nucléaire

Nous traitons l’estimation deρdu diagramme (3) dans le cas oùaetbont une forme particulière (Lemme 3).

ρ admet alors une décomposition « spectrale » (Lemme 4). Avec les mêmes notations du Paragraphe 4 et le diagramme (3) on prendνune mesure de dénombrement surN.ρest dit alors 2-nucléaire etMφest un opérateur diagonal notéDα où α=(αn)n∈8². On note D(8^∞, 8²)l’ensemble des opérateurs diagonaux de8^∞dans8². N2(B)est l’espace de Banach des opérateurs 2-nucléaires muni deη₂(·):η₂(ρ)=infb,a,D_α(b_La_LDα_L).

D’autre part, d’après ([5], Proposition 5.23) il existe(h^∗_k)_k_∈N, (vk)_k_∈N deux suites normées dans la boule unité deB^∗ etB respectivement, etβ=(β_k)_k_∈N∈8², tel queρ s’ecritρ=

k∈Nβ_k(h^∗_k,·) v_k. Soit(e_k)_k_∈N la base canonique de8². Le lemme suivant donne une représentation deaetb.

Lemme 3. aest défini par :(ξ_k)_k→

k∈Nξ_k v_k, etbpar : x∈B→((h^∗_k, x))_k. Ainsi nous obtenons la décomposition suivante deρ:

Lemme 4. Sous Hρs’écrit :ρ=

k∈Nαk(h^∗_k,·)aek.

Remarque 1. Si(f_k^∗)k=(h^∗_k)k alors les(aek)k sont des vecteurs propres deρassociés aux valeurs propres(αk)k. SoitΘ=8². Nous considérons le cribleΘ_m^∗∗= {α∈8²|α=_m

k=0α_ke_k, _m

k=0k²|α_k|²m}. Proposition 2. L’estimateur crible deαest la fonctionαˆ=_m

k=0αˆ_ke_koùαˆ_k=nⁿⁱ⁼¹^(h^∗^k^,xⁱ⁻¹^)(f^k^∗^,xⁱ⁾

i=1(h^∗_k,x_i−1)²+2nλk, k=0, . . . , m, et tel queλvérifie_m

k=0k²ⁿ_i=1(h^∗_k,xi−1)(f_k^∗,xi) n

i=1(h^∗_k,x_i₋₁)²+2nλk

2

=m.

La convergence deαˆ s’établie de la même façon queφˆdu Théorème 3.

Remarque. Soitρ∈D(8^∞, 8^∞)défini parα=(α_k)_k_∈N∈8², alors ρ est 2-nucléaire d’image dans 8²tel que ρ2= α₈².a de (3) est l’injection de8² dans8^∞etbest l’identité dans8^∞. L’estimation deρrevient alors à l’estimation deα.

SoitP_X₀ etP_ε₀les lois gaussiennes deX₀etε₀, C_X₀ etC_ε₀ les opérateurs de covariance respectivement,HX0

etHε0 les espaces à noyau autoreproduisant associés à P_X₀ etP_ε₀ et supposonsP_X₀ ∼P_ε₀ (cf. Paragraphe 2).

D’aprés [8]∃j_X₀,j_ε₀ continues et compactes deHX0 et deHε0 respectivement dansBtels queC_X₀=j_X₀ j_X^∗

0 et C_ε₀=j_ε₀ j_ε^∗

0. De plus on a : P_X₀∼P_ε₀ ⇐⇒





∃T :Hε0→HX0 un isomorphisme linéaire tels que : (i)j_X^∗

0=Tj_ε^∗

0, (ii)S=T^∗T −Id_H_ε

0 est un opérateur de Hilbert–Schmidt deL(Hε₀).

(6)

Soit(λk, wk)_k_∈Nles éléments propres deS, ∃!w^∗_ktel quej_ε^∗

0w^∗_k=wk,∀k∈N.(wk)_k_∈Nest une base orthonormale deHε₀.

Lemme 5. ρs’écrit :ρ=

k∈Nαk(w_k^∗,·) jε₀wkoùαkαk/(1−αkαk)=λk,∀k∈N.

Lemme 6. SiCε₀ est injective alors(w^∗_k, jε₀wk)k∈Nest une base de Markushevich et(jε₀wk)k∈Nest une base de shrinking.

Exemple. Nous traitons l’estimation deρdu Lemme 5 dans le cas oùε₀est le processus de Wiener en s’inspirant de [1] (p. 81). SoientB=C([0,1])muni de la topologie de la convergence uniforme etP₀la mesure de Wiener de fonction de covarianceγ (s, t)=min(s, t). Dans ce cas nous avons (cf. [1], p. 81) : B^∗([0,1])est identifié àM([0,1])l’espace des mesures régulières de Borel sur B_[0,1], j_ε^∗

0(µ)(s)=C_ε₀(µ)(s)=₁

0min(t, s)µ(dt)= s

0µ([t,1])dt, µ∈M([0,1]), s∈ [0,1], ∀t ∈ [0,1], w0(t)=t et wk(t)= ^√_kπ²sinkπ t, k=0, w^∗₀ =δ1 la mesure de Dirac en 1 et w_k^∗(dt)=(−1)^k√

2δ1(dt)+√

2kπsinkπ t (dt), k1. L’estimateur crible de ρ est ˆ

ρ_m(f )(s)=_m

k=0αˆ_kw^∗_k,·w_koùαˆ₀=nⁿⁱ⁼¹^xⁱ⁻¹⁽¹⁾^·^xⁱ⁽¹⁾ i=1x_i²₋₁(1)+2nλ_nk, ˆ

α_k= _n

i=1((−1)^kxi−1(1)+kπ1

0xi−1(t)sinkπ tdt)((−1)^kxi(1)+kπ1

0xi(t)sinkπ tdt) _n

i=1((−1)^kx_i₋₁(1)+kπ₁

0x_i₋₁(t)sinkπ tdt)²+2nλ_nk

, k=1, . . . , m, ou encore :

ˆ

ρm(f )(s) = 1

0

ˆ

α0·I_[0,1](s)· +2 m k=1

ˆ αk

(−1)^k kπ sinkπ s

·f (t)·δ1(dt)

+ 1 0

2f (t) _m

k=1

ˆ

αk sinkπ s·sinkπ tdt

dt.

En posantK₁(s, t)=α₀·I_[_0,1_](s)· +2

k1α_k⁽⁻_kπ¹⁾^ksinkπ s, K₂(s, t)=2

k1α_k sinkπ s·sinkπ t, et K= K1+K2,ρest à noyauKpar rapport à la mesure(δ1+I_[0,1])ηoùηest la mesure de Lebesgue.

Références

[1] A. Antoniadis, J.H. Beder, Joint estimation of the mean and the covariance of a Banach valued gaussien vector, Statistics 20 (1) (1989) 77–93.

[2] N. Bensmain, T. Mourid, Estimateur sieve de l’opérateur d’un processus ARH(1), C. R. Acad. Sci. Paris, Sér. I 332 (2001) 368–372.

[3] D. Bosq, Linear Processes in Function Spaces: Theory and Applications, Springer, 2000.

[4] D. Bosq, T. Mourid, On the equivalence of the measures induced by Banach valued Gaussian autoregressive processes, Stochastic Anal.

Appl. 17 (2) (1999) 137–144.

[5] J. Diestel, H. Jarchow, A. Tonge, Absolutely Summing Operators, Cambridge University Press, Cambridge, 1995.

[6] S. Geman, C.R. Hwang, Nonparametric maximum likelihood estimation by the method of sieves, Ann. Statist. 10 (1982) 401–414.

[7] U. Grenander, Abstract Inference, Wiley, New York, 1981.

[8] H.H. Kuo, Gaussian Measures in Banach Spaces, in: Lecture Notes in Math., Vol. 436, Springer-Verlag, New York, 1975.

[9] J. Lindenstrauss, L. Tzafiri, Classical Banach Spaces I: Sequences Spaces, in: Ser. Modern Surveys in Math., Springer-Verlag, 1977.

[10] A. Pelczynski, All separable Banach spaces admit for everyε >0 fondamental and total biorthogonal sequences bounded by(1+ε), Studia Math. 55 (1976) 295–304.