• Aucun résultat trouvé

2. Statistique 59

2.1.1. Estimateurs de la densité

On commence par l’étude de ce chapitre par l’estimation de la densité. Pour cela considérons X = (Xn)n∈N une suite stationnaire de vecteurs aléatoires à valeurs réelles. Supposons que leur loi (commune) est absolument continue par rapport à la mesure de Lebesgue et notons f une densité commune de toutes ces variables.

Cas i.i.d.

Nous énonçons le résultat historique donnant la normalité asymptotique des estimateurs de la densité dans le cas i.i.d. Ce résultat est fondamental puisqu’il fut le premier résultat de normalité asymptotique pour des estimateurs à noyau et les conditions minimales de fenêtre y furent introduites. Dans ce qui suit, on considérera que la suite X est une suite de variables aléatoires indépendantes et identiquement distribuées.

Estimateur de Parzen-Rosenblatt L’estimateur à noyau de la densité de Parzen-Rosenblatt dans le cas non récursif fut introduit par Emanuel Parzen [Par62] en 1962 et Murray Rosenblatt [Ros56b] en 1956. Il est donné en tout point x ∈ R et pour tout n ∈ N par

fnP R(x) = 1 nbn n X i=1 K x − Xi bn  , (2.1)

où (bn)n∈N est une suite décroissante de réels strictement positifs et K est un noyau. Remarque. Les bn, n ∈ N sont appelés paramètres de fenêtre.

Dans de nombreux articles, les résultats de normalité asymptotique sont étudiés dans le cas multi-varié. Cependant, par souci d’uniformisation, nous n’énoncerons les théorèmes que dans le cas uni-varié.

Deux ensembles de conditions très classiques en estimation par noyau (qui furent introduites par Emanuel Parzen [Par62]) sont les suivants.

60 2.1. Estimateurs non-récursifs à noyau

Conditions (K). Le noyau K satisfait les hypothèses suivantes. (K1) K est pair.

(K2) K est borné.

(K3) kyk |K(y)| tend vers 0 lorsque kyk tend vers +∞.

Conditions (M). La suite (bf n)n∈N satisfait les hypothèses suivantes. (M1) bf n−−−−−−→

n→+∞ 0. (M2) nbf n−−−−−−→

n→+∞ +∞.

Emanuel Parzen [Par62] établit dans son article de 1962, le théorème central limite suivant. Théorème 2.1.1 (Parzen, 1962). Supposons que K satisfasse les conditions (K) et que (bn)n∈N

satisfasse les conditions (M), alors on a la convergence en loi suivante :f p

nbn



fnP R(x) − EhfnP R(x)i−−−−−−→

n→+∞ N (0, σ2), pour tout x ∈ R avec σ2= f (x)R

RK(x)2dx.

La preuve de ce résultat repose sur l’utilisation du théorème 1A dans [Par62] dont nous ferons usage dans les chapitres 5et6 et que nous donnons ci-après.

Théorème 2.1.2 (Théorème 1A, [Par62]). Si une fonction M : R → R intégrable satisfait aux conditions (K2) et (K3) et si g : R → R est intégrable, alors pour toute suite (hn)n∈N de réels positifs qui converge vers 0 et pour tout x ∈ R tel que g soit continue en x, on a

h−1n Z R M  y hn  g(x − y)dy −−−−−−→ n→+∞ g(x) Z R M (y)dy. Remarque. Dans le théorème précédent M n’est pas forcément un noyau.

Afin d’établir des intervalles de confiance, il est plus commode de déterminer la convergence en loi de la suite 

nbn



fnP R− f (x)

n∈N vers une loi normale centrée réduite. Dans le cadre énoncé précédemment, si on suppose de plus que nb3n→ 0 lorsque n → +∞, alors on obtient ce nouveau théorème central limite. Dans la suite, nous essayerons, dès que possible, de donner la normalité asymptotique sous cette forme.

Dans la littérature, les conditions (M) sont appelées conditions minimales sur le paramètref

de fenêtre. Cas dépendant

Désormais, il serait intéressant d’imposer des conditions de dépendance sur les données. D’une part, cela nous permettrait d’étendre les résultats précédents à des données qui ne sont pas indé-pendantes ce qui est souvent le cas lorsque l’on souhaite utiliser ces estimateurs sur des données réelles. De plus, les données spatiales n’ont de réel intérêt que s’il y a une condition de dépen-dance, en effet lorsque l’on traite des données spatiales et i.i.d. on peut simplement se ramener au cas séquentiel en listant les observations les unes après les autres, au travers de n’importe quelle bijection de Zd dans N, ce qui rendrait la structure de grille inutile. Remarquons que la méthode qui consiste à lister les données au travers d’une bijection nous sera utile dans le cas dépendant ; mais dans ce cas, il faudra choisir attentivement la bijection en tenant compte de la

condition de dépendance.

Une multitude de conditions de dépendance sont envisageables mais nous ne nous intéresserons, ici, qu’à deux en particulier : le mélange fort au sens de Rosenblatt [Ros56a] et la dépendance faible au sens de Wu [Wu05] que nous avons déjà présentés dans les sections précédentes.

Pour pouvoir étudier ces estimateurs dans le cas des données spatiales, il faut généraliser la définition 2.1 à ce cas. En considérant des régions non-vides Λn, n ∈ N de la grille Zd et un champ stationnaire (Xi)i∈Zd de vecteurs aléatoires à valeurs dans RN dont la loi commune est absolument continue par rapport à la mesure de Lebesgue sur R et admet une fonction inconnue f pour densité par rapport à cette dernière, l’estimateur de Parzen-Rosenblatt pour des données spatiales est donné pour tout n ∈ N et en tout point x ∈ R par

fnP R(x) = 1n|bN n n X i∈Λn K x − Xi bn  , (2.2)

où (bn)n∈N est toujours une suite décroissante de réels strictement positifs et (Λn)n∈N est une suite de régions de Zdtelles que |Λn| → +∞ lorsque n → +∞.

Dans ce qui précède nous avons introduit les conditions minimales sur le paramètre de fenêtre comme l’avait fait Emanuel Parzen dans [Par62], notons que puisque nous nous intéressons au cas multi-varié (N > 1), il est nécessaire d’adapter ces conditions. Ainsi nous considérons l’extension des conditions (M) suivante.f

Conditions (M). La suite (bn)n∈N satisfait les hypothèses suivantes. (M1) bn−−−−−−→

n→+∞ 0. (M2) nbNn −−−−−−→

n→+∞ +∞.

Évidemment les premiers théorèmes limite pour ces estimateurs ont été obtenus dans le cas uni-dimensionnel (i.e. d = 1) et dans ce cas Λn=J1, nK. Jusqu’à mention du contraire, d = 1. Mélange fort Dans toute cette section, on suppose que les conditions (K) et (M) sont satis-faites. On suppose de plus que le noyau K satisfait la propriété ci-dessous.

Z

R

u2|K(u)|du < +∞. (2.3)

Premièrement, nous nous intéressons au cas du mélange fort. Un des premiers résultats dans cette direction est celui de Denis Bosq [Bos98] (Théorème 2.3) dans lequel l’auteur suppose que les conditions suivantes1 sont satisfaites.

sup s<t kfs,t− f ⊗ f k< +∞, (2.4) sup t1<t2<t3<t4 kft1,t2,t3,t4k< +∞, (2.5) où ft1,t2 est une densité du vecteur aléatoire (Xt1, Xt2) et ft1,t2,t3,t4 est une densité du vecteur aléatoire (Xt1, Xt2, Xt3, Xt4), ti ∈ R, i ∈ {1, 2, 3, 4} dont on suppose que la loi est absolument

62 2.1. Estimateurs non-récursifs à noyau

continue par rapport à la mesure de Lebesgue sur R4. Et en supposant que f est suffisamment régulière et que le paramètre de fenêtre satisfait à l’égalité

bn= c

ln ln nnN +41

pour un certain c > 0 et que les coefficients de mélange satisfont à α∞,∞(k) = O(k−β) où β > 2, Denis Bosq obtient le résultat de normalité asymptotique suivant : pour tout x ∈ R tel que f (x) > 0 q nbN n  fnP R(x) − f (x)−−−−−−→ n→+∞ N (0, σ2(x)) où σ2(x) = f (x)R

RK2(u)du. Denis Bosq démontre ce théorème en utilisant la méthode de Bernstein et, afin de montrer la normalité asymptotique des grands blocs, il approxime ces derniers par un tableau triangulaire (Wn,kn) n>1

16kn6n

de variables i.d.d. (ligne à ligne) satisfaisant à la condition de Lyapounov : 1 σ3 n kn X i=1 E h |Wn,i|3i−−−−−−→ n→+∞ 0 pour σn2 = nV[Wn,1].

En 1999, Denis Bosq, Florence Merlevède et Magda Peligrad [BMP99], obtiennent dans le cas uni-varié (N = 1) un théorème limite dont le domaine d’applications est plus vaste. En effet les auteurs se débarrassent de l’ hypothèse (2.5) et déduisent des deux hypothèses suivantes

X

k>1

kα∞,∞(k) < +∞ (2.6)

et

bnQ n1/3ln n et bn= o(n−1/5) (2.7) un théorème central limite pour l’estimateur fnP R sous des hypothèses de régularité de la densité inconnue f ainsi que du noyau K.

Dans le cas spatial (d> 2) et uni-varié (N = 1), Mohamed El Machkouri [EM11] a établi le résultat ci-dessous de normalité asymptotique pour l’estimateur défini par (2.2).

Théorème 2.1.3 (El Machkouri, 2011). Supposons que Λn =J1, nKd pour tout n ∈ N et que les conditions suivantes soient satisfaites :

1. la loi commune des Xi, i ∈ Zd est absolument continue par rapport à la mesure de Le-besgue et on note par f une densité de probabilité de cette loi que l’on suppose continue et strictement positive ;

2. pour tout i ∈ Zd\ {0}, la loi du couple (X0, Xi) est absolument continue par rapport à la mesure de Lebesgue sur R2 et on note par f0,i une densité de probabilité de cette loi de probabilité ;

3. K est à support compact et de carré intégrable ; 4. bn→ 0, ndbn→ +∞ et ndb3n→ 0 lorsque n → +∞. 5. P+∞

Pour tout x ∈ R, q ndbnfnP R(x) − f (x)−−−−−−→L n→+∞ N (0, σ2), où σ2 = f (x)R RK2(u)du.

L’auteur obtient ce résultat au moyen de la méthode de Lindeberg. Dans la preuve, il développe aussi de nombreuses astuces de calcul qui nous seront utiles pour les preuves des chapitres5 et 6.

Dépendance physique au sens de Wu Ce mode de dépendance ayant été introduit en 2005 par Wei Biao Wu [Wu05], il n’existe que peu de résultats pour les estimateurs de Parzen-Rosenblatt dont les données forment une suite ou un champ p-stable. Nous rappelons que Mohamed El Machkouri [EM14] a obtenu, en appliquant la méthode de Lindeberg, le résultat majeur suivant traitant des champs 2-stables uni-variés (N = 1).

Théorème 2.1.4 (El Machkouri, 2014). Sous les conditions suivantes :

1. la loi commune des Xi, i ∈ Zdest absolument continue par rapport à la mesure de Lebesgue et on note par f une densité de probabilité de cette loi. On suppose que f est strictement positive, continue et bornée ;

2. pour tout i ∈ Zd\ {0}, la loi du couple (X0, Xi) est absolument continue par rapport à la mesure de Lebesgue sur R2 et on note par f0,i une densité de probabilité de cette loi de probabilité. De plus sup(x,y)∈R2

i∈Zd

|f0,i(x, y) − f (x)f (y)| < +∞ ; 3. K est Lipschitz, de carré intégrable, pair et vérifieR

R|uK(u)|du < +∞ ; 4. bn→ 0, |Λn|bn→ +∞ et |Λn|b3

n→ 0 as n → +∞ ; 5. P

i∈Zd|i|5d2 δi,2 < +∞. Pour tout x ∈ R, q ndbnfnP R(x) − f (x)−−−−−−→L n→+∞ N (0, σ2), où σ2(x) = f (x)R RK2(u)du.

Comme le précise l’auteur, si on ne considère que des processus linéaires à la place des champs de Bernoulli généraux, il est possible d’affaiblir l’hypothèse 5 tout en conservant le résultat au coût de la perte des conditions minimales sur le paramètre de fenêtre (voir Hallin et al. [HLT01]). Il est intéressant de remarquer que pour pouvoir traiter les champs p-stables, il est d’usage d’utiliser une approximation par des champs mn-dépendants où (mn)n est une suite d’entiers bien choisie. On contrôle ensuite cette approximation au travers d’une inégalité de moment telle que celle démontrée par Wei Biao Wu dans [Wu05] (Théorème 1). Pour obtenir cette inégalité, l’un des arguments principaux repose sur l’inégalité de Burkholder 1.4.4; par la suite l’inégalité obtenue par Wu fut améliorée dans les travaux de Wei Biao Wu, Dalibor Volný et Mohamed El Machkouri [EMVW13] où l’on commence à voir apparaître la forme actuelle de celle-ci et dans celui de Mohamed El Machkouri [EM14] dans lequel apparaît l’approximation par des champs mn-dépendants. Nous verrons dans les chapitres 5 et 6 que cette inégalité peut être étendue au cas de la régression pour les estimateurs à noyau de la régression dans le cas non-récursif dans un premier temps (Proposition5.4.5) puis, dans un second temps, aux estimateurs récursifs (Proposition 6.3.7).

64 2.1. Estimateurs non-récursifs à noyau

Documents relatifs