• Aucun résultat trouvé

ESTIMATION NON-PARAM´ETRIQUE DE LA FONCTION DE HASARD AVEC VARIABLE EXPLICATIVE FONCTIONNELLE: CAS DES DONN´EES SPATIALES

N/A
N/A
Protected

Academic year: 2022

Partager "ESTIMATION NON-PARAM´ETRIQUE DE LA FONCTION DE HASARD AVEC VARIABLE EXPLICATIVE FONCTIONNELLE: CAS DES DONN´EES SPATIALES"

Copied!
18
0
0

Texte intégral

(1)

DE LA FONCTION DE HASARD AVEC VARIABLE EXPLICATIVE FONCTIONNELLE:

CAS DES DONN´ EES SPATIALES

ALI LAKSACI et BOUBAKEUR MECHAB

In this paper, we study a kernel estimator of the conditional hazard function when the covariates take values in some abstract function space. The almost completely convergence (with rate) of this estimate is obtained when the sample considered is collected in spatial order with mixing structure. These results are extensions to spatial dependent data of the results given by Ferratyet al. (Rev. Roumaine Math. Pures Appl. 53(2008), 1–18).

AMS 2010 Subject Classification: 62G05, 62G20, 62N02.

Key words: donn´ees spatiales, champ al´eatoire fonctionnel, estimation non-para- etrique, fonction de hasard conditionnelle, probabilit´es de petites boules.

1. INTRODUCTION

Les probl`emes statistiques li´es `a la mod´elisation et `a l’´etude de donn´ees spatiales connaissent ces derniers temps un grand int´erˆet en statistique. L’im- portance de ce th`eme de recherche est motiv´ee par la croissance du nombre de probl`emes concrets pour lesquels les donn´ees sont r´ecolt´ees dans un ordre spatial. De tels probl`emes se rencontrent dans de nombreux domaines tels l’´epid´emiologie, l’´econom´etrie, les sciences de l’environnement et de la terre, l’agronomie, l’imagerie, . . . . En statistique non param´etrique la mod´elisation des donn´ees spatiales est relativement r´ecente par rapport au cas param´etrique.

En effet, les premiers r´esultats ont ´et´e obtenus par Tran [21], tandis que les r´ef´erences les plus r´ecentes incluent celles de Dabo-Niang et Yao [6], Carbonet al. [4] et Li et Tran [17]. L’objectif de ce travail est d’´etudier l’estimation non param´etrique de la fonction de hasard conditionnelle lorsque les observations sont `a la fois spatialement d´ependantes et la coraviable est dans un espace semi-m´etrique de dimension ´eventuellement infinie.

L’estimation de la fonction de hasard joue un rˆole tr`es important en statistique. En effet, elle est utilis´ee dans l’analyse de risque ou pour l’´etude

REV. ROUMAINE MATH. PURES APPL.,55(2010),1, 35–51

(2)

des ph´enom`enes de survie dans de nombreux domaines tels (m´edecine, g´eophy- sique, fiabilit´e,. . .). La litt´erature sur l’estimation de la fonction de hasard est tr`es abondante, lorsque les observations sont vectorielles. Citons, par exemple, Watson et Leadbetter [22], Roussas [20], Lecoutre et Ould-Said [15], Est`evez et al. [7] et Quintela-del-Rio [13] pour des r´ef´erences r´ecentes. Dans tous ces travaux les auteurs consid`erent des observations ind´ependantes ou des donn´ees d´ependantes issues de s´eries temporelles. Dans le cas spatial, la litt´erature est tr`es restreinte, il n’y a qu’un seul travail de Li et Tran [16]. Ces derniers ont obtenu, dans un contexte spatial, la normalit´e asymptotique d’un estimateur

`

a noyau de la fonction de hasard. Les premiers r´esultats sur l’estimation non param´etrique de ce mod`ele, en statistique fonctionnelle, ont ´et´e obtenus par Ferraty et al. [9]. Ils ont ´etudi´e la convergence presque compl`ete d’un es- timateur `a noyau pour la fonction de hasard d’une variable al´eatoire r´eelle conditionn´ee par une variable explicative fonctionnelle. La normalit´e asymp- totique de ce dernier estimateur a ´et´e obtenue, dans le cas α-m´elangeant, par Quintela-del-Rio [14]. Nous renvoyons `a Ferratyet al. [10] pour la conver- gence presque compl`ete uniforme sur la composante fonctionnelle de ce mod`ele non param´etrique.

L’apport principal de ce travail est la g´en´eralisation des r´esultats de Ferraty et al. [9] au cas des observations spatialement d´ependantes. Sous des conditions de m´elange assez g´en´erales, on ´etablit la convergence presque compl`ete (avec vitesse) d’un estimateur `a noyau pour la fonction de hasard d’une variable al´eatoire r´eelle conditionn´ee par une variable explicative fonc- tionnelle. Notons que, comme toutes les propri´et´es asymptotiques en statis- tique non param´etrique fonctionnelle, notre r´esultat est li´e au ph´enom`ene de concentration de la mesure de probabilit´e de la variable explicative et `a la r´egularit´e de l’espace fonctionnel du mod`ele. Mentionnons ´egalement qu’en statistique spatiale, on distingue deux types d’asymptotiques (voir Cressie [5]).

L’asymptotique extensive et l’asymptotique intensive. La premi`ere traite le cas o`u la taille des observations croˆıt avec celle du domaine d’observation.

En pratique, cette asymptotique est utilis´ee lorsque les observations sont collect´ees par des stations de mesure s´epar´ees. On trouvera des exemples de donn´ees fonctionnelles, adapt´ees `a cet asymptotique, en ´economie (les courbes de consommation d’un produit quelconque dans diff´erentes villes), en- vironnement (les courbes de concentration d’un gaz polluant dans diff´erentes r´egions) ou en agronomie (les courbes de pluviom´etrie dans diff´erentes lo- calit´es). L’asymptotique intensive examine la situation d’observations qui se densifient dans un domaine born´e fix´e. Cela est le cas, par exemple, en prospection mini`ere ou en analyse radiographique.

Nous pr´esentons l’estimateur de notre mod`ele spatial dans le Paragra- phe 2. Dans le Paragraphe 3 nous donnons les hypoth`eses, puis nous ´etudions

(3)

la convergence presque compl`ete de cet estimateur. Comme application, nous traitons, dans le Paragraphe 4, l’estimation de risque maximum condition- nellement `a une variable explicative fonctionnelle.

2. LE MOD `ELE ET SON ESTIMATEUR

SoitN un entier naturel dans N. On consid`ere le champ al´eatoire Zi= (Xi, Yi),i∈NN `a valeurs dansF ×R, o`u (F, d) est un espace semi-m´etrique de dimension ´eventuellement infinie. Dans ce contexte, (Xi)i∈NN peut ˆetre une variable al´eatoire fonctionnelle. Notons que, depuis une bonne dizaine d’ann´ees, la communaut´e statistique s’est pr´eoccup´ee du d´eveloppement de mod`eles et m´ethodes adapt´es `a ce contexte de donn´ees fonctionnelles. Alors que les premi`eres ´etudes dans cette direction se sont essentiellement con- centr´ees sur des mod`eles lin´eaires (voir Bosq [2], Ramsay et Silverman [19]), les d´eveloppements r´ecents (voir Ferraty et Vieu [11]) font ´etat de mod`eles non-param´etriques adapt´es `a ce type de donn´ees.

Par la suite, on fixe un point x dans F (respectivement, un compact S ∈ R), on suppose que les observations spatiales (Xi, Yi)i∈NN ont la mˆeme distribution queZ := (X, Y) et que la version r´eguli`ere de la probabilit´e condi- tionnelle de Y sachantX=x existe et admet une densit´e born´ee par rapport

`

a la mesure de Lebesgue sur R, not´ee fx. Le param`etre fonctionnel ´etudi´e dans cet article, not´e hx, est d´efini, pour touty∈Rtel queFx(y)<1, par

hx(y) = fx(y) 1−Fx(y),

o`uFx est la fonction de r´epartition conditionnelle de Y sachantX=x.

Par ailleurs, nous supposons que le champ al´eatoire fonctionnel est ob- serv´e sur l’ensemble In=

i= (i1, . . . , iN) ∈NN, 1≤ik ≤nk, k = 1, . . . , N , n= (n1, . . . , nN)∈NN et on estime la fonction de r´epartition conditionnelle par

Fbx(y) = P

i∈InK(h−1K d(x, Xi))H(h−1H (y−Yi)) P

i∈InK(h−1K d(x, Xi)) ∀y∈R,

o`u K est un noyau,H une fonction de r´epartition ethK =hK,n (respective- ment, hH =hH,n) une suite de nombres r´eels positifs.

De Fbx, on d´eduit un estimateur de la densit´e conditionnelle, not´e fbx, d´efini par

fbx(y) = h−1H P

i∈InK(h−1Kd(x, Xi))H0(h−1H (y−Yi)) P

i∈InK(h−1K d(x, Xi)) ∀y∈R,

o`u H0 est la d´eriv´ee de H. Notons que, si N = 1, on obtient les mˆemes estimateurs de Ferratyet al. [8]. L’estimateur naturel de la fonction de hasard

(4)

conditionnelle, not´e bhx, est

bhx(y) = fbx(y)

1−Fbx(y) ∀y∈R.

Le but de ce travail est d’´etudier la convergence presque compl`ete de l’estimateurbhx vershx, lorsque le champ al´eatoire fonctionnel (Zi)i∈NN v´erifie la condition de m´elange suivante.









Il existe une fonctionϕ(t)↓0 quand t→ ∞, telle que

∀E, E0 sous ensemble de NN de cardinal fini α(B(E),B(E0)) = sup

B∈B(E), C∈B(E0)

|P(B∩C)−P(B)P(C)| ≤

≤ψ(Card (E),Card(E0))ϕ(dist (E, E0)),

o`u B(E) (resp. B(E0)) la tribu bor´elienne engendr´ee par (Zi, i∈E) resp.

(Zi, i ∈ E0)

, Card(E) resp. Card(E0)

est le cardinal de E resp. E0 , dist(E, E0) d´esigne la distance euclidien entre E et E0 et ψ une fonction sym´etrique :N2 →R+, d´ecroissante par rapport aux deux variables s´epar´ement et satisfait l’une des conditions suivantes

(1) ψ(n, m)≤Cmin (n, m), n, m∈N ou

(2) ψ(n, m)≤C(n+m+ 1)βe, n, m∈N pour certains βe≥1 et C >0.

Notons que ces conditions ont ´et´e utilis´ees par Tran [21] et elle sont v´erifi´ees par de nombreux mod`eles spatiaux (voir Guyon [12]).

3. PROPRI ´ET ´ES ASYMPTOTIQUES

Dans la suite, nous noterons par C et/ou C0 des constantes strictement positives quelconques et nous supposons que: ∀y ∈ S,Fx(y)<1. Rappelons que dans ce contexte spatial, n → ∞ signifie que min{nk} → ∞ et que pour chaque 1≤j, k≤N on a|nnj

k|< C <∞. Introduisons les hypoth`eses suivantes (H1)P(X∈B(x, r)) =φx(r)>0 o`uB(x, r) est la boule ferm´ee, centr´ee en x et de rayonr.

(H2) La fonctionϕ v´erifie

P

i=1

iδϕ(i)<∞,δ >5N. (H3) 0 < sup

i6=j P[(Xi, Xj)∈B(x, h)×B(x, h)] ≤ C(φx(h))(a+1)/a, avec 1< a < δN−1.

(5)

(H4) Il existe un voisinage de x, not´e Nx, tel que: ∀(x1, x2) ∈ Nx2,

∀(y1, y2)∈ S2

|Fx1(y1)−Fx2(y2)| ≤C db1(x1, x2) +|y1−y2|b2

, b1>0, b2>0

|fx1(y1)−fx2(y2)| ≤C db3(x1, x2) +|y1−y2|b4

, b3 >0, b4 >0.

(H5) K est de support [0,1], v´erifie C1I[0,1](·) ≤ K(·) ≤ C01I[0,1](·), o`u 1I[0,1] est la fonction indicatrice de [0,1].

(H6)H est une fonction de classeC2 et `a support compact.

(H7) Il existe 0< α <(δ−5N)/3N etη0 >0, tels que:

n→∞lim nbαhH =∞ et Cnb(5+3α)N−δδ 0 ≤hHφx(h), o`unb=n1. . . nN.

Nos hypoth`eses sont relativement standard, puisque les conditions (H1), (H3)–(H7) sont tr`es similaires `a celles utilis´ees par Ferraty et al. [9], tandis que l’hypoth`ese (H2) est la mˆeme que dans Tran [21].

Th´eor`eme 1. Sous les hypoth`eses (1), (2) et(H1)–(H7), on a, sup

y∈S

|bhx(y)−hx(y)|=O

hbK1 +hbH2

+O

lognb nbhHφx(hK)

1

2

!

, p.co.

Il est int´eressant de noter que si N = 1 on obtient la mˆeme vitesse de convergence de Ferraty et al. [9].

D´emonstration. On consid`ere la d´ecomposition bhx(y)−hx(y) = 1

1−Fbx(y) h

fbx(y)−fx(y) i

+ hx(y) 1−Fbx(y)

h

Fbx(y)−Fx(y) i

.

La d´emonstration du Th´eor`eme 1 repose sur les r´esultats suivants sup

y∈S

|Fbx(y)−Fx(y)|=O

hbK1 +hbH2

+O

logbn nbφx(hK)

12!

p.co.

sup

y∈S

|fbx(y)−fx(y)|=O

hbK1+hbH2 +O

logbn bnhHφx(hK)

12!

p.co.

∃η >0 tel que X

n∈NN

P

y∈Sinf|1−Fbx(y)|< η

<∞,

(6)

dont les d´emonstrations sont bas´ees, respectivement, sur les d´ecompositions Fbx(y)−Fx(y) = 1

FbDx n

FbNx(y)−EFbNx(y)

Fx(y)−EFbNx(y) o

+ +Fx(y)

FbDx

EFbDx−FbDx

et

fbx(y)−fx(y) = 1 FbDx

n

fbNx(y)−EfbNx(y)

fx(y)−EfbNx(y)o + +fx(y)

FbDx

EFbDx −FbDx o`u

FbDx = 1 nbE

K(h−1K d(x, X1)) X

i∈In

K(h−1K d(x, Xi)),

FbNx(y) = 1 nbE

K(h−1K d(x, X1)) X

i∈In

K(h−1K d(x, Xi))H(h−1H (y−Yi), et

fbNx(y) = 1 nhb HE

K(h−1K d(x, X1)) X

i∈In

K(h−1K d(x, Xi))H0(h−1H (y−Yi), o`u1 est l’indice spatial des composantes fix´ees `a 1.

Finalement, le Th´eor`eme 1 est une cons´equence des r´esultats suivants.

Lemme 2. Sous les hypoth`eses (1), (2), (H1)–(H3), (H5) et(H7), on a, FbDx −EFbDx =O

lognb nbφ(hK)

12!

, p.co.

Corollaire 3. Sous les hypoth`eses du Lemme2, on a, X

n∈NN

P

FbDx <1/2

<∞.

Lemme 4. Sous les hypoth`eses (H1) et (H4)–(H7), on a, sup

y∈S

Fx(y)−EFbNx(y) =O

hbK1+hbH2

.

Lemme 5. Sous les conditions du Th´eor`eme 1, on a, sup

y∈S

FbNx(y)−EFbNx(y) =O

lognb nbφ(hK)

12!

, p.co.

(7)

Lemme 6. Sous les hypoth`eses (H1) et (H4)–(H7), on a, sup

y∈S

fx(y)−EfbNx(y) =O

hbK3+hbH4

.

Lemme 7. Sous les conditions du Th´eor`eme 1, on a, sup

y∈S

fbNx(y)−EfbNx(y) =O

lognb bnhHφx(hK)

12!

, p.co.

Lemme 8. Sous les conditions du Th´eor`eme 1, on a,

∃η >0 tel que X

n∈NN

P

y∈Sinf|1−Fbx(y)|< η

<∞.

4. APPLICATION: ESTIMATION DU POINT `A HAUT RISQUE Dans cette section, on se propose d’estimer le point `a haut risque dans S, not´e θ(x), d´efini par

(3) hx(θ(x)) = max

y∈S hx(y).

Ce mod`ele a un grand int´erˆet en statistique, notamment dans l’analyse de risque sismique (voir Quintela-del-Rio [13]). Dans notre contexte fonctionnel, on suppose qu’il existe un point uniqueθ(x) dansS v´erifiant (3). L’estimateur naturel de θ(x) , not´e θ(x), est tel queb

(4) bhx(bθ(x)) = max

y∈S bhx(y).

En g´en´eral, cet estimateur n’est pas unique. Ainsi, dans toute la suite de cet article bθ(x) d´esignera toute variable al´eatoire v´erifiant (4).

Afin d’´etudier la convergence presque compl`ete de l’estimateur θ(x), onb garde les hypoth`eses de la section pr´ec´edente et on suppose que la fonctionhx est de classeC2 par rapport `ay et telle que

(5) hx0(θ(x)) = 0 et hx00(θ(x))>0.

Finalement, le th´eor`eme pr´ec´edent nous permet de conclure le corollaire suivant:

Corollaire 9. Sous les conditions (1), (2), (H1)–(H7) et (5), on a, θ(x)b −θ(x) =O

hbK1/2+hbH2/2 +O

lognb nbhHφx(hK)

14!

, p.co.

(8)

5. APPENDICE

Dans les preuves suivantes nous noterons pour touti∈In

Ki(x) =K(h−1K d(x, Xi)), Hi(y) =H(h−1H (y−Yi)) et

Hi0(y) =H0(h−1H (y−Yi)).

D´emonstration du Lemme 2. La d´emonstration est bas´ee sur des id´ees similaires `a celles utilis´ees par Carbon et al. [3]. En effet, on a

FbDx(x)−E[FbDx(x)] = 1 nEb [K1(x)]

X

i∈In

i(x)

o`u ∆i(x)Ki(x)−E[Ki(x)]. On consid`ere la d´ecomposition spatiale de Tran [21]

sur les variables ∆i(x), d´efinie, pour un entier pn fix´e, de la mani`ere suivante U(1,n, x,j) =

2jkpn+pn

X

ik=2jkpn+1 k=1,...,N

i(x),

U(2,n, x,j) =

2jkpn+pn

X

ik=2jkpn+1 k=1,...,N−1

2(jN+1)pn

X

iN=2jNpn+pn+1

i(x),

U(3,n, x,j) =

2jkpn+pn

X

ik=2jkpn+1 k=1,...,N−2

2(jN−1+1)pn

X

iN−1=2jN−1pn+pn+1

2jNpn+pn

X

iN=2jNpn+1

i(x),

U(4,n, x,j) =

2jkpn

X

ik=2jkpn+1 k=1,...,N−2

2(jN−1+1)pn

X

iN−1=2jN−1pn+pn+1

2(jN+1)pn

X

iN=2jNpn+pn+1

i(x),

et ainsi de suite. Les deux derniers termes sont U(2N−1,n, x,j) =

2(jk+1)pn

X

ik=2jkpn+pn+1 k=1,...,N−1

2jNpn+pn

X

iN=2jNpn+1

i(x),

U(2N,n, x,j) =

2(jk+1)pn

X

ik=2jkpn+pn+1 k=1,...,N

i(x).

(9)

Pour ri = 2−1nip−1n , i = 1, . . . , N et J = {0, . . . , r1 − 1} × . . .× {0, . . . , rN−1}, on pose

T(n, x, i) =X

j∈J

U(i,n, x,j).

Sans perte de g´en´eralit´e, on peut ´ecrire (6) |FbDx(x)−E[FbDx(x)]|= 1

bnE[K1(x)]

2N

X

i=1

T(n, x, i),

parce que mˆeme si ni n’est pas exactement ´egal `a 2ripn, on regroupe les variables restantes dans un bloc T(n, x,2N + 1) (ceci ne changera pas la d´emonstration voir Biau et Cadre [1]).

Maintenant, en vertu de la derni`ere ´equation (6), pour chaqueη >0 on a P

|FbDx(x)−E[FbDx(x)]| ≥η

≤2N max

i=1,...P(T(n, x, i)≥ηbnE[K1(x)]). Ainsi, il suffit de calculer

P(T(n, x, i)≥ηbnE[K1(x)]) pour chaquei= 1, . . . ,2N.

On traite seulement le casi= 1. Pour cela, on re-num´erote les variables (U(1,n, x,j);j∈ J) et on applique le Lemme 4.5 de Carbon et al. [3] sur les variables re-num´erot´ees. Les variables avec la nouvelle num´erotation seront not´ees Z1, . . . , ZM o`u M =QN

k=1rk = 2−Nnpb −Nn ≤npb −Nn . Remarquons que, pour chaque Zj il existe un certain jdansJ tel que

Zj = X

i∈I(1,n,x,j)

i(x)

o`uI(1,n, x,j) ={i: 2jkpn+ 1≤ik≤2jkpn+pn;k= 1, . . . , N}.La distance s´eparant ces ensembles est sup´erieure `a pNn et chaque ensemble contient pNn

´

el´ements.

Le Lemme 4.5 de Carbon et al. [3] nous permet d’approximerZ1,Z2,. . ., ZM par des variables al´eatoires ind´ependantes Z1, . . . , ZM de mˆeme loi que Zj=1,...,M et telle que

M

X

j=1

E|Zj−Zj| ≤2CM pNnψ(M −1)pNn, pNn ϕ(pn).

Alors, d’apr`es les in´egalit´es de Bernstein et de Markov, on a P(T(n, x, i)≥ηnEb [K1(x)])≤B1+B2,

(10)

o`u

B1 =P

M

X

j=1

Zj

≥ M ηnbE[K1(x)]

2M

≤

≤2 exp

− (ηbnE[K1(x)])2

MVar [Z1] +CpNnηnbE[K1(x)]

,

B2 =P

M

X

j=1

|Zj−Zj| ≥ ηnEb [K1(x)]

2

≤ C ηnbE[K1(x)]

M

X

j=1

E|Zj−Zj| ≤

≤CM pNn(ηnbE[K1(x)])−1ψ((M−1)pNn, pNn)ϕ(pn).

Commenb= 2NM pNn et ψ((M−1)pNn, pNn)≤pNn alors pour η=η0

q logbn nbφx(hK)

B2≤bnpNn (logn)b −1/2(nφb x(hK))−1/2ϕ(pn).

On prend pnC

b x(hK) logbn

1/2N

, alors

(7) B2 ≤(logn)b −1bnϕ(pn).

D’apr`es (H7), on montre que P

n∈In

nbϕ(pn)<∞.

On va traiter, maintenant, B1. Pour cela, il suffit d’´evaluer Var [Z1].

En effet,

Var [Z1] = Var

"

X

i∈I(1,n,x,1)

i(x)

#

= X

i,j∈I(1,n,x,1)

|Cov(∆i(x),∆j(x))|. Posons Qn = P

i∈I(1,n,x,1)

Var [∆i(x)] et Rn = P

i6=j∈I(1,n,x,1)

|Cov(∆i(x),∆j(x))|.

En vertu de (H1), on a Var[∆i(x)] ≤ C(φx(hK) + (φx(hK))2), donc Qn = O pNnφx(hK)

.En ce qui concerneRn, on utilise les techniques de Masry [18]

et on consid`ere les ensembles

S1 ={i,j∈I(1,n, x,1) : 0<ki−jk ≤cn}, S2 ={i,j∈I(1,n, x,1) :ki−jk> cn}, o`ucn est une suite r´eelle tendant vers +∞. Ainsi,

Rn = X

(i,j)∈S1

|Cov (∆i(x),∆j(x))|+ X

(i,j)∈S2

|Cov (∆i(x),∆j(x))|=R1n+R2n.

(11)

D’ une part, on a R1n= X

(i,j)∈S1

|E[Ki(x)Kj(x)]−E[Ki(x)]E[Kj(x)]| ≤

≤CpNncNnφx(hK)

x(hK))1/ax(hK)

≤CpNncNnφx(hK)(a+1)/a. D’autre part, on a R2n = P

(i,j)∈S2

|Cov (∆i(x),∆j(x))|. Comme le noyauK est born´e, du Lemme 2.1(ii) de Tran [21] on obtient

|Cov (∆i(x),∆j(x))| ≤Cϕ(ki−jk). Ainsi

R2n≤C X

(i,j)∈S2

ϕ(ki−jk)≤CpNn X

i:kik≥cn

ϕ(kik)≤CpNnc−N an X

i:kik≥cn

kikN aϕ(kik). On prend cn = (φx(hK))−1/N a, alors

R2n ≤CpNnc−N an X

i:kik≥cn

kikN aϕ(kik)≤CpNnφx(hK) X

i:kik≥cn

kikN aϕ(kik). D’apr`es (H2) on peut ´ecrire R2n ≤CpNnφx(hK).De plus, avec ce choix de cn on a

R1n≤CpNnφx(hK).

D’o`u

Var [Z1] =O pNnφx(hK) .

En utilisant ce dernier r´esultat, avec les d´efinitions de pn,M et η, on montre B1≤exp (−Cη0logn)b .

Par cons´equent, un choix appropri´e de η0 permet de d´eduire le r´esultat du

Lemme.

D´emonstration du Corollaire 3. On a,E

FbDx(x)

= 1, donc P

bFDx(x)

≤1/2

≤P

bFDx(x)−E

FbDx(x)

>1/2 et Corollaire 3 devient est une cons´equence du Lemme 2.

D´emonstration du Lemme 4. Du fait que les variables al´eatoires sont identiquement distribu´ees, on a

∀y ∈ S, Fx(y)−EFbNx(y) =E

K1(x)1IB(x,hK)(X) [E[H1(y)/X]−Fx(y)]

. En int´egrant par parties, on montre que

E(H1(y)/X) = Z

R

H(h−1H (y−z))fX(z)dz=h−1H Z

R

H0(h−1H (y−z))FX(z)dz.

(12)

En consid´erant le changement de variable usuel t= y−zh

H on obtient E(H1(y)/X) =

Z

R

H0(y)FX(y−hHt)dt, donc

|E(H1(y)/X)−Fx(y)| ≤ Z

R

H0(y)|FX(y−hHt)−Fx(y)|dt.

Sous (H4), on a

∀y∈ S, 1IB(x,hK)(X)|E(H1(y)/X)−Fx(y)| ≤ Z

R

H0(y) hbK1+|t|b2hbH2 dt.

Comme H0 est une densit´e de probabilit´e, alors, l’hypoth`ese (H6) ach`eve la d´emonstration du Lemme 4.

D´emonstration du Lemme 5. On consid`ere le recouvrement S ⊂

zn

[

k=1

(tj−ln, tj +ln)

avec ln =nb−α−12 etzn ≤nbα+12. En posant,j(y) = arg minj∈{1,2,...,zn}|y−tj|, on obtient la d´ecomposition

FbNx(y)−EFbNx(y) ≤

FbNx(y)−FbNx(tj(y))

| {z }

T1

+

FbNx(tj(y))−EFbNx(tj(y))

| {z }

T2

+

EFbNx(tj(y))−EFbNx(y)

| {z }

T3

.

•En ce qui concerne (T1) et (T3) on utilise le fait queH0 est born´ee pour d´emonter

FbNx(y)−FbNx(tj(y))

≤ 1 nbE[K1(x)]

X

i∈In

Ki(x)

Hi(y)−Hi(tj(y)) ≤

≤C 1 nbE[K1(x)]

X

i∈In

Ki(x)

Hi(y)−Hi(tj(y))

≤C ln

hHFbDx.

De la d´efinition de ln et sous l’hypoth`ese (H7), on a hln

H = o

q logbn bnφ(hK)

. Ainsi, la convergence presque compl`ete de FbDx, nous permet d’´ecrire

(8)

FbNx(y)−FbNx(tj(y)) =o

s lognb nbφ(hK)

!

, p.co.

(13)

et (9)

EFbNx(tj(y))−EFbNx(y) =o

s logbn nbφ(hK)

! .

•Pour (T3), ∀η >0, on a P sup

y∈S

FbNx(tj(y))−EFbNx(tj(y)) > η

s lognb nbφ(hK)

!

=

=P max

j∈{1,2,...,zn}

FbNxk(tj)−EFbNxk(tj) > η

s lognb nbφ(hK)

!

≤zn max

j∈{1,2,...,zn}P

FbNxk(tj)−EFbNxk(tj) > η

s lognb nbφ(hK)

! .

Posons

0i=Ki(x)Hi(tj)−E[Ki(x)Hi(tj)]. Il est clair que





|∆0i| ≤C|∆i(x)|,

Var [∆0i]≤CVar [∆i(x)] et

Cov(∆0i,∆0j)≤CCov(∆i(x),∆j(x)) ∀i6=j.

En utilisant les mˆemes arguments que dans le Lemme 2, on montre P max

z∈Gn

FbNx(z)−E

FbNx(z) > η0

s

lognb nbφx(hK)

!

≤zn(B1+B2). La d´efinition dezn, l’´equation (7) et l’hypoth`ese (H7) nous permettent d’´ecrire

X

n∈In

bnα+12B2<∞.

Tandis qu’un choix convenable de η0 donne X

n∈In

bnα+12B1<∞.

Finalement, le Lemme 5 est une cons´equence de ces deux derniers r´esultats combin´es avec les ´equations (8) et (9).

D´emonstration du Lemme 6. En utilisant la stationnarit´e des observa- tions, le conditionnement par la variable explicative et le changement de varia- ble usuel t= y−zh

H , on obtient h−1H E H10(y)/X

=h−1H Z

R

H0(y)fX(y−hHt)dt,

(14)

et on en d´eduit

|h−1H E(H10(y)/X)−fx(y)| ≤ Z

R

H0(y)|fX(y−hHt)−fx(y)|dt.

Sous la deuxi`eme partie de (H4)

∀y ∈ S, 1IB(x,hK)(X)|h−1H E(H10(y)/X)−fx(y)| ≤ Z

R

H0(y)(hbK3 +|t|b4hbH2)dt.

L’hypoth`ese (H6) ach`eve la d´emonstration du Lemme 6.

D´emonstration du Lemme 7. La d´emonstration est tr`es similaire `a celle du Lemme 5. En effet, on consid`ere le recouvrementS ⊂Szn

k=1(tj−ln, tj+ln) avecln=bn32α−12 etzn ≤nb32α+12. En posantj(y) = arg minj∈{1,2,...,zn}|y−tj|, on obtient la d´ecomposition

fbNx(y)−EfbNx(y) ≤

fbNx(y)−fbNx(tj(y))

| {z }

S1

+

fbNx(tj(y))−EfbNx(tj(y))

| {z }

S2

+

EfbNx(tj(y))−EfbNx(y)

| {z }

S3

.

• Etude de´ S1 etS3. De mˆeme que pour T1 et T3 dans le Lemme 5, on utilise le fait queH est une fonction de classeC2 et `a support compact. On a

fbNx(y)−fbNx(tj(y))

≤ h−1H nbE[K1(x)]

X

i∈In

Ki(x)

Hi0(y)−Hi0(tj(y)) ≤

≤C h−1H bnE[K1(x)]

X

i∈In

Ki(x)

Hi0(y)−Hi0(tj(y))

≤C ln h2HFbDx.

La d´efinition delnet l’hypoth`ese (H7) nous permet d’´ecrirehln2 H

oq

logbn nbhHφ(hK)

. La convergence presque compl`ete deFbDx implique

fbNx(y)−fbNx(tj(y)) =o

s

logbn bnhHφ(hK)

!

, p.co.

(10)

EfbNx(tj(y))−EfbNx(y) =o

s lognb nbhHφ(hK)

! . (11)

(15)

•En ce qui concerne (S2), on suit les mˆemes ´etapes de T3;∀η >0, on a P sup

y∈S

fbNx(tj(y))−EfbNx(tj(y)) > η

s

lognb bnhHφ(hK)

!

=

=P max

j∈{1,2,...,zn}

fbNxk(tj)−EfbNxk(tj) > η

s

lognb nbhHφ(hK)

!

≤zn max

j∈{1,2,...,zn}P

fbNxk(tj)−EfbNxk(tj) > η

s

lognb bnhHφ(hK)

! .

Posons

00i =Ki(x)Hi0(tj)−E

Ki(x)Hi0(tj) . Alors

|∆00i| ≤C|∆i(x)|,

Var [∆00i] =O(hHφ(hK)) et E

Hi0Hj0|(Xi, Xj)

=O(h2H) ∀i6=j.

En utilisant les mˆemes ´etapes du Lemme 2, avec une l´eg`ere modification dans le choix de cn, on montre que

Cov(∆0i,∆0j) =O(hHφ(hK)) ∀i6=j.

Ainsi,

P max

z∈Gn

fbNx(z)−E

fbNx(z) > η0

s

lognb nbhHφx(hK)

!

≤zn B10 +B20 o`uB01≤exp (−C(η0) logbn) et

B20 ≤npb Nn (logbn)−1/2(nhb Hφx(hK))−1/2ϕ(pn).

Prenons pnC

bnhHφx(hK) logbn

1/2N

, la d´efinition de zn sous l’hypoth`ese (H7), un choix convenable de η0 nous permettent d’´ecrire

X

n∈In

nb32α+12(B20 +B10)<∞.

Par cons´equent, le Lemme 7 est une cons´equence de ce dernier r´esultat combin´e avec les ´equations (10) et (11).

Preuve du Lemme8. Il suffit de remarquer que

y∈Sinf |1−Fbx(y)| ≤ 1−sup

y∈S

Fx(y)

/2⇒sup

y∈S

|Fbx(y)−Fx(y)| ≥ 1−sup

y∈S

Fx(y)

/2.

(16)

En termes de probabilit´e, on obtient P

y∈Sinf |1−Fbx(y)|<

1−sup

y∈S

Fx(y) /2

≤P

sup

y∈S

|Fbx(y)−Fx(y)| ≥

1−sup

y∈S

Fx(y)

/2

<∞.

Il suffit, donc, de prendre η=

1−sup

y∈S

Fx(y)

/2 et appliquer les r´esultats des Lemmes 2–5 pour achever la d´emonstration du Lemme 8.

D´emonstration du Corollaire 9. Sous l’hypoth`ese (5), le d´eveloppement de Taylor de la fonction hx au voisinage deθ(x), en particulier pour le point θ(x), estb

hx(θ(x)) =b hx(θ(x)) + (θ(x)b −θ(x))2hx00) j! ,

o`u θ est entre θ(x) etb θ(x), il est donc n´ecessairement dans le compact S.

Ainsi

|bθ(x)−θ(x)|2≤ 2!

miny∈Shx00(y)|hx(θ(x))b −hx(θ(x))|

et `a l’aide d’arguments analytiques on montre que

|hx(θ(x))b −hx(θ(x))| ≤2 sup

y∈S

|bhx(y)−hx(y)|.

D’o`u

|bθ(x)−θ(x)|2≤ C

miny∈Shx00(y) sup

y∈S

|bhx(y)−hx(y)|.

En utilisant le r´esultat du Th´eor`eme 1, on montre que

|bθ(x)−θ(x)|2=O

hbK1+hbH2 +O

lognb nbhHφx(hK)

12!

.

Remerciements. Le rapporteur anonyme est vivement remerci´e pour ses commen- taires pertinents.

REFERENCES

[1] G. Biau and B. Cadre,Nonparametric spatial prediction. Stat. Inference Stoch. Process 7(2004), 327–349.

[2] D. Bosq,Linear Processes in Function Spaces: Theory and Applications.Lecture Notes in Statistics149, Springer, 2000.

(17)

[3] M. Carbon, L.T. Tran and B. Wu,Kernel density estimation for random fields. Statist.

Probab. Lett.36(1997), 115–125.

[4] M. Carbon, C. Francq and L.T. Tran, Kernel regression estimation for random fields.

J. Statist. Plann. Inference137(2007), 778–798.

[5] N.A. Cressie,Statistics for Spatial Data. Wiley, New York, 1991.

[6] S. Dabo-Niang and A.F. Yao, Kernel regression estimation for continuous spatial pro- cesses.Math. Methods Statist16 (2007), 298–317.

[7] G. Est´evez-P´erez, A. Quintela-del-Ro and Ph. Vieu, Convergence rate for cross- validatory bandwidth in kernel hazard estimation from dependent samples. J. Statist.

Plann. Inference104(2002), 1–30.

[8] F. Ferraty, A. Laksaci and Ph. Vieu,Estimating some characteristics of the conditional distribution in nonparametric functional models.Stat. Inference Stoch. Process9(2006), 47–76.

[9] F. Ferraty, A. Rabhi and Ph. Vieu, Estimation non-param´etrique de la fonction de hasard avec variable explicative fonctionnelle. Rev. Roumaine Math. Pures Appl.53 (2008), 1–18.

[10] F. Ferraty, A. Tadj, A. Laksaci and Ph. Vieu,Rate of uniform consistency for nonpara- metric estimates with functional variables.J. Statist. Plann. Inference. (accept´e) [11] F. Ferraty and Ph. Vieu, Nonparametric Functional Data Analysis. Springer Series in

Statistics. Springer, New York, 2006.

[12] X, Guyon, Estimation d’un champ par pseudo-vraisemblance conditionnelle: Etude asymptotique et application au cas Markovien. Proceedings of the Sixth Franco-Belgian Meeting of Statisticians, 1987.

[13] A. Quintela-del-Ro, Nonparametric estimation of the maximum hazard under depen- dence conditions.Statist. Probab. Lett.76(2006), 1117–1124.

[14] A. Quintela-del-Ro, Hazard function given a functional variable: Non-parametric esti- mation under strong mixing conditions.J. Nonparametr. Stat.20(2008), 413–430.

[15] J.P. Lecoutre and E. Ould-Said, Estimation de la densit´e et de la fonction de hasard conditionnelle pour un processus fortement m´elangeant avec censure.C.R. Math. Acad.

Sci. Paris314(1992), 295–300.

[16] J. Li and L.T. Tran,Hazard rate estimation on random fields.J. Multivariate Anal.98 (2007), 1337–1355.

[17] J.Li and L.T. Tran, Nonparametric estimation of conditional expectation. J. Statist.

Plann. Inference139(2009), 164–175.

[18] E. Masry,Recursive probability density estimation for weakly dependent stationary pro- cesses. IEEE Trans. Inform. Theory32(1986), 254–267.

[19] J.O. Ramsay and B.W. Silverman,Applied Functional Data Analysis; Methods and Case Studies.Springer-Verlag, New York, 2002.

[20] G. Roussas, Hazard rate estimation under dependence conditions. J. Statist. Plann.

Inference22(1989), 81–93.

[21] L.T. Tran,Kernel density estimation on random fields.J. Multivariate Anal. 34(1990), 37–53.

[22] G.S. Watson and M.R. Leadbetter,Hazard analysis.Sankhyia26(1964), 101–116.

Received 29 March 2009 Universit´e Djilali Liabes Laboratoire de Math´ematiques BP 89, Sidi Bel Abbes, 22000, Alg´erie

[email protected]

(18)

Références

Documents relatifs

Continuité et opérations Continuité et composition Prolongement par continuité Fonctions croissantes Continuité sur un intervalle. Continuité sur un intervalle fermé et

(1996) dans le cadre des données complètes, lorsque la fonction de survie est estimée à l’aide d’un noyau.. Le but de cet article est d’étendre cette dernière

(iv) Quelle est la probabilit´e qu’`a la ki`eme fl´echette, il atteigne la mouche pour la ni`eme fois?. (v) Quelle est la probabilit´e qu’il atteigne pour la premi`ere fois la

Dans ce programme la variable M désigne le nombre de boules contenues dans l’urne (qui diminue qu fil de l’expérience...) donc à chaque tirage la propbabilité de tirer la boule

Les probl´ ematiques li´ ees ` a l’analyse de donn´ ees g´ eom´ etriques sont en plein d´ eveloppement, aussi bien pour des applications en petite dimension (maillages ou nuages

De tels mod` eles ` a censure ont ´ et´ e abondamment ´ etudi´ es dans la litt´ erature pour des variables al´ eatoires r´ eelles ou multi-dimensionnelles, et dans des

Il n’est pas n´ ecessaire de relancer tous les calculs d’estimation des param` etres du mod` ele ` a chaque fois que la base de donn´ ees est compl´ et´ ee par de

En étendant ces résultats, on peut faire la caractérisation fonctionnelle des fonctions rationnelles d'une ou plusieurs variables réelles ou complexes.. On va présenter les