R EVUE DE STATISTIQUE APPLIQUÉE
V. C OUALLIER P. S ARDA
P. V IEU
Estimation non paramétrique de discontinuités d’une fonction d’intensité
Revue de statistique appliquée, tome 45, n
o3 (1997), p. 89-106
<http://www.numdam.org/item?id=RSA_1997__45_3_89_0>
© Société française de statistique, 1997, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
89
ESTIMATION NON PARAMÉTRIQUE
DE DISCONTINUITÉS
D’UNE FONCTION D’INTENSITÉ
V.
Couallier,
P.Sarda,
P. VieuLaboratoire de
Statistique
et Probabilités U.M.R. C55830Université Paul Sabatier
118, Route de Narbonne 31062 TOULOUSE Cedex Rev.
Statistique Appliquée,
1997, XLVRÉSUMÉ
Nous proposons un estimateur non
paramétrique
depoints
de discontinuité et des valeurs du saut en cespoints,
pour la fonction d’intensité d’un processusponctuel.
Nous obtenons uneexpression asymptotique
de l’erreurquadratique
de cet estimateur dans un modèle de Poisson à intensitémultiplicative,
sous deshypothèses
derégularité
de la fonction entre deuxpoints
de discontinuité. La méthode est illustrée à l’aide de données simulées. Nous proposons enfin
une méthode d’estimation de la fonction d’intensité tenant compte des discontinuités. Nous utilisons cette méthode sur un
jeu
de donnéesmétéorologiques.
Mots-clés : Estimation non
paramétrique,
processus de Poisson, intensité, estimation de discontinuités.ABSTRACT
We propose a
nonparametric
estimatorof jump points
andcorresponding
sizesof jump
values for the
intensity
of apoint
process. We obtain anasymptotic expression
for aquadratic
error of this estimator in a
multiplicative intensity
Poisson process underregularity
conditionsfor the
intensity
between twojump points.
The method is illustratedthrough
simulated data.We propose
finally
a method forestimating
theintensity
which takes intoaccount jump points.
We use this method on
meteorological
data.Keywords : Nonparametric
estimation, Poisson process, intensity, estimationof jump points.
1. Introduction
On considère N
points
sur un intervalle[0, T].
Cespoints peuvent
être des dates d’occurences de certains événementscaptés
dans letemps
comme des émissionsradioactives,
des arrivées dans une filed’attente,
ou encore des localisations d’événe- mentsponctuels.
Une manièred’appréhender
ces donnéesnumériques,
ordonnées sur[0, T],
est d’admettrequ’elles
décrivent une réalisation d’un processusponctuel
surR,
censuré àgauche
en0,
et à droite en T. Pour lacompréhension
de tels processus,on connaît
l’importance
de la fonction d’intensitéstochastique
définie dans le casgénéral
paroù
N(t, t
+8)
est le nombre depoints
tombant dans l’intervalle[t, t
+6]
etUt
estl’histoire du processus
jusqu’en
t.Afin
d’exploiter
cettedéfinition,
on faitgénéralement l’hypothèse
minimaleque le processus n’admet pas d’occurence
multiple,
cequi
s’écritNous renvoyons à Cox et Isham
(1980)
pour unedescription
des processusponctuels.
On s’intéresse à l’estimation de cette intensité et pour cela on se
place
dans lecadre de l’estimation non
paramétrique.
Eneffet,
les méthodesdéveloppées
dans cettediscipline
ontl’avantage
de ne pas supposerl’appartenance
del’objet
estimé à uneclasse de fonctions indexées par un nombre fini de
paramètres
réels. L’estimateur leplus largement
utilisé est l’estimateur à noyau introduit par Ramlau-Hansen(1983)
etDiggle (1985).
Ce dernier étudie lespropriétés asymptotiques
de cet estimateur dans le cas d’un processus de Cox.L’analyse
de l’erreurquadratique
moyenne montre que laqualité
de l’estimateurdépend
du choixcapital
duparamètre
delissage,
commec’est le cas dans les autres
problèmes
d’estimation à noyau. Il s’estdéveloppé
uneimportante bibliographie
sur la sélection de ceparamètre
dans lesproblèmes
voisinsd’estimation de densité ou de fonction de
régression (voir Marron, 1988, Vieu, 1993,
et
Broniatowski,
1993 pour des revuesbibliographiques)
etplus
récemment dans le cadrequi
nous intéresse.Ainsi,
Brooks et Marron(1991)
ont obtenu des résultatsd’ optimalité asymptotique
pour le choix de ceparamètre
et pour une mesure d’erreurquadratique,
dans un modèlepoissonien
nonhomogène
etmoyennant quelques
conditions de
régularité
de la fonction d’intensité à estimer.Dans la
pratique,
ilpeut
s’avérer que ces conditions ne soient pasremplies
danscertaines
régions
de l’intervalle. Le travailprésenté
dans cet article est motivé parl’allègement
deshypothèses
derégularité
de la fonction d’intensité cequi permet d’envisager
d’éventuelspoints
de discontinuité pour cette fonction.Le
problème
de l’estimation de discontinuités a été essentiellementenvisagé
dans le cas de la
régression.
Wu et Chu(1993a)
ontproposé
des estimateurs à noyau depoints
de discontinuités et de la valeur du saut en cespoints.
Nous nousinspirons
ici de leur travail pour estimer les discontinuités éventuelles de la fonction d’intensité.
Dans la section
2,
nousexplicitons
le cadregénéral
d’estimation nonparamétri-
que du processus d’intensité et nous
précisons
les estimateurs à noyau entrantenjeu.
Nous
présentons également
l’idéegénérale
de la méthode d’estimation d’une disconti- nuité. Dans la section3,
ensupposant
que le processussous-jacent
est un processus de Poisson nonhomogène
à intensitémultiplicative,
nous donnons une écritureasympto- tique
de l’erreurquadratique ponctuelle
de l’estimateur à noyau d’une discontinuité.Ce résultat est obtenu sous des
hypothèses
derégularité
de l’intensité entre deuxpoints
91
ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSde discontinuité. Dans la section
4,
nous mettons en oeuvre la méthodeproposée
àla section 2 à l’aide de données simulées. Nous
analysons
les résultats obtenus endiscutant en
particulier
les choix du noyau et de lalargeur
de fenêtre. Nous proposonsune méthode alternative d’estimation pour une fonction d’intensité
supposée
discon-tinue
s’appuyant
sur un estimateur à noyauadapté
à la correction des effets de bord(Diggle, 1985).
Ce
problème
de discontinuités dans la structure de processusponctuels
estmotivé par l’intérêt
pratique
que luiporte
le Centre deMétéorologie
Nationalequi
cherche à localiser des
ruptures
dans la structuremicrométrique
des nuages. Nous conclurons donc par une validationnumérique
de notre méthode sur les données fournies par cetorganisme.
2. Estimation à noyau de l’intensité
stochastique
On considère N
points Xi
sur[0, T] représentant
une réalisation d’un processus de fonction d’intensitéstochastique
À.Afin d’estimer
A,
Ramlau-Hansen(1983)
etDiggle (1985)
ontadapté
unestimateur non
paramétrique
de la densité d’une variable aléatoireréelle,
à savoir l’estimateur à noyauusuel,
enposant
avec
Kh(.) = h-1 K(.jh),
où lenoyau K
est une densité deprobabilité supposée symétrique,
et h est un réel strictementpositif appelé paramètre
delissage
oulargeur
de fenêtre.
Dans le cas d’un processus de
comptage,
sousl’hypothèse
d’une intensitémultiplicative (Aalen, 1978) qui
suppose la factorisation du processus d’intensité enun processus
prévisible
et une fonctiondéterministe,
Ramlau-Hansen(1983)
obtientla convergence uniforme et la normalité
asymptotique
d’un estimateur à noyau de cette fonction déterministe sous unehypothèse
de continuité.Dans cette classe de processus, Brooks et Marron
(1991)
s’intéressentplus
par- ticulièrement aux processus de Poisson(voir
section3).
Sousl’hypothèse
d’existence de deux dérivées deÀ,
ils obtiennentl’ optimalité asymptotique
de la fenêtre choisie par validation croiséeglobale. Moncaup et
al(1995) comparent
ce choix avec celui d’une fenêtre obtenue par validation croisée locale.Diggle (1985)
obtientl’expression
de l’erreurquadratique
moyenne définie parEQMx(h) - E[(x) - 03BB(x)]2
dans le cas d’un processus de Cox encoreappelé
processus doublement
stochastique (Cox
etIsham, 1980).
La fonction À est alors la réalisation d’un processus{039B(x), x
ERI
stationnaire etpositif.
Conditionnellement à la réalisation 03BB deA,
le processusponctuel
est un processus de Poisson de fonction d’intensité À. L’auteur étudieEQMx(h)
dans le cas d’un noyau uniforme et àpartir
de
l’expression obtenue,
propose un choix de lalargeur
de fenêtre dutype «plug-
in»
qui
consiste àprendre h
minimisant un estimateurM(h)
deEQMx(h).
Dansle même contexte,
Diggle
et Marron(1988) poursuivent
ce travail encomparant
la fenêtre«plug-in»
à celle obtenue en densité par validation croisée(Marron, 1988).
Ils établissent tout d’abord une
équivalence
entre les deuxapproches puis, lorsque
la fonction
8(lx - yI) = E(039B(x)039B(y))
se met sous la forme8(x) = 03BCc03B40(x) (03B40
fixée)
et03B40(|x|)
admet une dérivée d’ordre 4 continue en0,
ils obtiennent uneexpression asymptotique
deEQMx(h)
sous la forme d’une somme dont les deux termesprincipaux dépendent respectivement
de la variance et du carré du biais de l’estimateur.Dans l’ensemble des travaux cités
ci-dessus,
les auteurs seplacent
sous deshypothèses
derégularité.
Entre autres, dans le cadre d’un processus dePoisson,
unehypothèse
minimale de continuité de la fonction d’intensité estrequise
et conduit demanière naturelle à considérer des noyaux
symétriques,
au moins en unpoint
loin dubord de l’intervalle
(voir Diggle, 1985,
pour leproblème
des effets debord).
Pour estimer la fonction d’intensité en un
point
dediscontinuité,
il est naturel de considérer des noyauxdissymétriques.
Eneffet,
nousprivilégions
ainsi lecomptage
despoints
d’un côté ou d’un autre dupoint x
cequi
nous amène à estimer intuitivement les limites à droite et àgauche
de À en x.Cette idée nous conduit à considérer deux estimateurs à noyau
Ai et À2
définispar
et
où
K1
etK2
sont deux noyauxdissymétriques
àsupport [-1, w]
et[-w, 1] respecti-
vement, et w un réel dans
[0, 1 [.
On définitégalement
où
kw
est une constantedépendant
des noyauxK1
etK2 (voir ci-dessous).
Intuitivement,
la valeur absoluede S
estplus grande
auxpoints
de discontinuité de À alorsqu’en
unpoint
decontinuité, 1
estproche
de2.
Lapondération kw
estintroduite afin d’obtenir un estimateur du saut
asymptotiquement
non biaisé dans le cadre d’un processus de Poisson(voir
Lemme2).
Finalement,
ensupposant
que la fonction À admet unpoint
de discontinuité03B8,
un estimateur de ce
point
est fourni par93
ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSNotons
qu’un
estimateur similaire a été introduit dans le cadre de larégression
par Wu et Chu
(1993a) qui
en étudient lespropriétés asymptotiques.
3. Estimation de discontinuités de la fonction d’intensité d’un processus de Poisson
3.1. Le modèle
Explicitons
le processus d’intensitéstochastique
dans le cas d’un modèlepoissonien
nonhomogène.
Nous supposonsqu’il
existe une mesure 03BC sur R telle que- N(t)
=N(O, t)
est un processus de dénombrement à accroissementsindépen- dants ;
-
N(s, t)
suit une loi de Poissond’espérance 03BC([s, z[).
.
Si,
en outre, il existe une fonction À telleque 03BC([s, tu)
=ts 03BB(x)dx
alors onsait
(Cox
etIsham, 1980)
que cette fonction A est le processus d’intensité défini dans le casgénéral
par(1) qui
est donc dans ce cas une fonction déterministe.On cherche donc à estimer les discontinuités d’une fonction À déterministe sachant que
où P(m) désigne
la loi de Poisson deparamètre
m.Nous utilisons en outre une forme
simplifiée
du modèle à intensitémultiplicative
introduit par Aalen
(1978)
etfréquemment
utilisée pour modéliser des processus de dénombrement. Nous supposons que la fonction d’intensité s’écritoù c est une constante
positive
et a est une fonction déterministe inconnue telle queT
a = 1.D’après (5)
et(6)
c estl’espérance
du nombre d’observations N.Cette
décomposition
est évidemmentpossible
pour tout processus de Poisson.Dans les
expressions asymptotiques,
nous ferons tendre c versl’infini,
cequi
revientà
augmenter
le nombre d’observations sur l’intervalle[0, T]
sanschanger
la formegénérale
de la fonction d’intensitéAc (voir
à cesujet
la discussion dansDiggle
etMarron, 1988,
à propos de la nature desproblèmes asymptotiques
pour l’estimation d’une fonctiond’intensité).
Nous considérons pour cela une suite1 c,, + ’
de nombresréels pour
laquelle
est définie la suite de fonctions d’intensité03BBcs(x) = csa(x)
indexées par s.
L’estimateur S
est alors défini pourchaque
fonctionÀcs
àpartir
de lalargeur
de fenêtrehs .
3.2.
Développement asymptotique
de l’erreurquadratique
moyenne Nous nous intéressons à l’erreurquadratique
moyenneEQMx(h)
définie paroù 03BB(x+) et A(x-) (respectivement 03B1(x+)
et03B1(x-))
sont les limites à droite et àgauche
de la fonction À(respectivement a)
aupoint
x. Afin d’obtenir ledéveloppement asymptotique
deEQMx(h),
nous ferons leshypothèses
suivantes :H.1 - les noyaux
K1
etK2
sont des fonctions de densité deprobabilité
àsupports respectifs [-1, w]
et[-w, 1]
où w E[0, 1 [ et
vérifientH.2 - la fonction d’intensité 03BB admet un nombre fini de
points
de discontinuité et entre cespoints,
elle admet une dérivéelipschitzienne;
H.3 - les suites Cs et
hs
vérifientNous aurons
également
besoin du résultat suivant :Lemme 1 : Conditionnellement à
N,
lesXi
sont distribuées comme lesstatistiques
d’ordre de N variables aléatoires réelles
Yi, (i
=1,.., N) indépendantes
etidentique-
ment distribuées de densité a.
Pour la démonstration de ce
lemme,
nous renvoyons àKingman (1993) (p. 22).
Lemme 2 :
expression
etdéveloppement asymptotique
du biaisSous les
hypothèses H.1,
H.2 etH.3,
en notantK21
=K2 - Kl, 03B1’(x-)
eta’(x+)
les limites
respectives
àgauche
et à droite en x de a’ la dérivée de a, on a, pourx
E]O, T[
et pour s assezgrand
95
ESTIMATION NON
PARAMÉTRIQ UE
DE DISCONTINUITÉSPreuve : en utilisant la définition de
K21
on a Vx~]0, T[,
Vs > 0D’après
le lemme1,
on aEn effectuant le
changement z
=(y - x)/hs
pour x~]0, T[
et pour s àpartir
d’uncertain rang, on
obtient, puisque E(N)
= csA
partir
de cette écritureintégrale,
nous obtenons undéveloppement
asymp-totique
du biais. Leshypothèses
H.2 et H.3 nousdonnent,
pour s assezgrand,
lacontinuité de À et de sa dérivée sur les intervalles
Il =]x - hs , xi et 12 =]x, x
+hs [.
Deux
développements
deTaylor
surIl
et12
définissentel
et03BE2z
tels queOn a
donc,
en tenantcompte
de l’écriture dekw
Or,
par H.2Les
O(hs)
sont uniformes en z et enintégrant
sur z nous obtenonsLe théorème suivant nous fournit
l’expression
deEQMx(h).
Théorème : Développement asymptotique
deEQMx (h)
Sous les
hypothèses H.1,
H.2 etH.3,
nous avonsoù
et
Preuve du théorème : En
décomposant
de manière habituelle l’erreurquadratique
en deux termes de biais au carré et variance on obtient :
On note
avec
On a alors
97
ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSEn
appliquant
lechangement
de variable z =( y - x)/hs
pour x~]0, T[
etpour s assez
grand,
onobtient,
en utilisant le Lemme 1Le Lemme 2 nous donne une
expression asymptotique
deIs(x) .
En utilisant la mêmetechnique
dedéveloppement
dea (x
+h8u),
on obtientLes deux autres termes du
développement
de la variance deS(x) s’expriment
de la même
façon.
Eneffet, 1; (x)
estmajoré
par une constanteindépendante
de s etEnfin,
à l’aide del’inégalité
deCauchy
Schwartz et en utilisant(10)
et(11)
onobtient
On a donc par
(9), (10), (11)
et(12) l’expression asymptotique
de lavariance,
sachant que dans
(11), O(hs)
est unO(hs) :
qui,
combinée avecl’expression (7)
dubiais,
amène directement le résultat(8)
etachève ainsi la preuve du théorème. D
4.
Études
de simulationsPour modéliser un processus de Poisson d’intensité connue, nous avons utilisé le Lemme 1 et
généré
Npoints Yi
de densité a connue. Cette fonction est construitepar morceaux sur l’intervalle
[0, 20]
àpartir
des densités deprobabilités
de variablesaléatoires réelles
gaussiennes
et uniformes :où
-
fX désigne
la densité deprobabilité
de la variable aléatoire réelleX ;
-
N(m,03C3)
est la variable aléatoire normale de moyenne m et d’écarttype
03C3;-
U [0: ,,8]
est la loi uniforme sur l’intervalle[a, 03B2];
-
I[a,b]
est la fonction indicatrice dusegment [a, b] ;
- a,
b,
c, d sont des constantes réellespositives qui
font de a une densité deprobabilité
sur[0,20].
Les N
points
ordonnés constituent donc une réalisation d’un processuspois-
sonien d’intensité A Na et la fonction d’intensité 03BB admet trois discontinuités en x =
5, x
= 10 et x = 13. Dans cettesimulation,
N = 2425.Afin d’estimer
A,
nous avons utilisél’estimateur À
défini en(2)
sauf auxextrémités de l’intervalle où une correction des effets de bord est
appliquée.
Cetestimateur
corrigé,
introduit parDiggle (1985)
s’écritLe
problème
du choix des noyaux est de moindreimportance
parrapport
à celui du choix des fenêtres. Nous avons utilisé dans tous nos calculs des noyaux uniformes faciles à mettre en oeuvre. Nous avons donc99 ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSLes
figures
1 à 3 sont les tracés de la fonction À et del’estimateur À
pour troisvaleurs de la
largeur
de fenêtre.L’importance
du choix duparamètre
delissage,
miseen évidence dans les
expressions
d’erreursquadratiques asymptotiques
obtenues par Brooks et Marron(1991), peut
être directement observée sur cesfigures.
Des valeursde h
trop petites
fontapparaître
unsous-lissage (A oscille beaucoup trop)
caractérisantune variance
importante
del’estimateur,
tandis que des valeurs de htrop grandes gomment
les variationsbrusques
de;
il s’ensuit unsurlissage
de la courbe et c’est la contribution du biais à l’erreurquadratique qui
devienttrop importante (voir
à cesujet Moncaup et al, 1995).
Les tracésde
montrent que le choix de fenêtre mettant le mieux en évidence les discontinuités est h =0.4,
choixqui
par ailleurs sous-lisse la fonction sur les sous-intervalles de continuité.FIGURE 1
Estimateur à
noyau
pour h =0, 4
FIGURE 2
Estimateur à
noyau
pour h = 1FIGURE 3
Estimateur à
noyau A
pour h = 2Nous avons tracé la
fonction
définie en(3)
enprenant w
= 0. On obtient alors en utilisant des noyaux uniformesLes
figures
4 à 6 montrent l’estimateur S pour troislargeurs
de fenêtre. Les courbesde S
mettent bien en évidence les effets de bordexposés plus
haut et nousne pouvons
analyser
ces courbes que sur l’intervalle[0, T]
diminué d’une bande delargeur h
aux deux extrémités.FIGURE 4
pour h
=0, 4
101
ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSFIGURE 5
S pour h
= 1FIGURE 6
pour
h = 2L’importance
du choix de la fenêtre dans la localisation despoints
de dis-continuité, qui apparaît
sur cesfigures
a été mise en évidence dansl’expression asymptotique (8).
Nous remarquons toutefois que dans lapratique,
ladégradation
del’estimateur
défini en(4)
est moinsimportante
que celle observée engénéral
surl’estimation de la courbe A elle-même. Sur toutes les simulations
faites,
nous avons observé un boncomportement
de la localisation des discontinuités.Cependant,
laqualité
de l’estimation de la hauteur du saut, donnée ici par la valeur deS
auxpoints
de discontinuité
(estimés
par),
estplus
sensible au choix duparamètre
delissage.
Nous
présentons
ci-dessous une seconde méthode d’estimation des sauts en les dis- continuités estiméesqui s’appuie
sur une estimation de la fonction d’intensité en la supposant discontinue.Dans notre
exemple, pour h
=1,
les troispremiers
maximums locaux et les estimations des sautscorrespondants
donnent :En
supposant
le nombre p de discontinuités connu etaprès
estimations à l’aide deS
des pdiscontinuités,
nous pouvonsappliquer
sur lesp+1
intervalles ainsi formésune estimation de À
qui
tientcompte
des effets de bord : ainsi l’estimateur défini en(13)
est calculé surchaque
sous-intervalle. La fonction étant continue sur chacun dessous-intervalles,
nous utilisons pourchaque
estimateuri,
z =1,..., (p+1)
lalargeur
de fenêtre obtenue par validation croisée
exposée
dans Brooks et Marron(1991).
Lafigure
7 est le tracé desquatres
estimations de À sur les intervalles estimés[0, 5.09], [5.09,9.93], [9.93,13.22]
et[13.22,20].
FIGURE 7
Estimation de 03BB par intervalle de continuité
Cette méthode nous
permet
de définir un nouvel estimateur de la hauteur du saut aupoint
dediscontinuité i
estimé enposant
5.
Application
aux donnéesmétéorologiques
On
dispose
d’une sérieXi,
i =1,..., N,
N =10229,
degouttes
d’eau lelong
de la
trajectoire
d’un avionqui
traverse un nuage. Nous renvoyons àBrenguier (1993)
et
Moncaup et
al(1995)
pour unedescription
détaillée dujeu
de données.103
ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSOn suppose que ces données sont une réalisation censurée d’un processus de Poisson non
homogène
décrit dans la section 3. L’estimateur de la fonction d’intensité À est l’estimateurcorrigé (13)
avec h =1.335,
valeurqui
minimise le critère de validation croisée(Moncaup et al, 1995).
Les fortespentes
décelées en 47000 et 47015(cf. fig.8)
par cette méthoded’estimation, qualifiée
dedirecte,
laissent penser que la fonction d’intensité est discontinue.FIGURE 8
Estimation «directe» de 03BB pour h = 1.335
FIGURE
9Tracé de S
pour h
= 6Nous avons
calculé S
avec la valeur arbitraire h = 6. Sur lafigure 9,
nous voyons deuxpics
bien définis et deux autresplus
discrets. Nous avons donc faitl’hypothèse
del’existence de
quatre
discontinuités estimées par1, 2, 3
et4.
Sous cettehypothèse,
en utilisant la méthode
précédente,
nous obtenons une nouvelle estimation de À obtenue par morceaux sur lescinq
intervalles définis par lesbi, présentée
à lafigure
10. Par
comparaison
avec la méthode d’estimation directe(figure 8)
on obtient unecourbe
plus
lisse entre lespoints
de discontinuités. Cela tient essentiellement au fait que les fenêtres obtenues par validation croisée surchaque
intervalle sontplus larges
que la fenêtre
globale h
= 1.335.FIGURE 10
Estimation de 03BB par intervalle de continuité
(quatre discontinuités)
6. Conclusion
Notre étude nous a
permis
de mettre en évidence la validité de la méthode d’estimation de discontinuitésproposée
à la fois pour l’estimation des cassures elles-mêmes mais aussi pour l’améliorationapportée
à l’estimation d’une fonction d’intensitésupposée
discontinue. Le boncomportement
sur les simulations de l’estimateur d’une intensité discontinue nepeut
que renforcer la nécessitéd’apporter
des
réponses théoriques
à certainsproblèmes
non encore résolus. Enparticulier,
ilserait intéressant d’établir des résultats de convergence de nos estimateurs
(x)
etdu
type
de ceux obtenus par Wu et Chu(1993a, 1993b)
enrégression.
Le
problème
du choix duparamètre
delissage
estégalement capital,
tantpour la
première
méthode d’estimation de discontinuités(section 3)
que pour la seconde méthode d’estimation du sauts’appuyant
surl’hypothèse que À
admet p discontinuités. Nous avons utilisé un choixautomatique
deslargeurs
de fenêtresur
chaque
sous-intervallequi s’inspire
des travaux de Brooks et Marron(1991).
Cependant,
les bornes des intervalles étantaléatoires,
nous ne pouvons pas déduire directementl’optimalité asymptotique
de cesparamètres
delissage
àpartir
desrésultats de Brooks et Marron.
Pourtant,
toutporte
à croirequ’en prouvant
la105
ESTIMATION NON
PARAMÉTRIQUE
DE DISCONTINUITÉSconvergence presque sûre des
estimateurs
sousl’hypothèse
que p est bien le nombre depoints
dediscontinuités,
un résultat similaired’ optimalité asymptotique pourrait
être obtenu. Dans notre
simulation,
p est évidemment connu. Dans lesapplications,
ce nombre est en
général inconnu,
et la méthodeproposée
à la section 2 n’en fournit pas un estimateur. Il semblecependant
que le choix de la valeur de p est crucial(voir
à ce
sujet
les résultats de Wu etChu,
1993a et 1993bqui
obtiennent enrégression
des convergences différentes selon que le nombre de discontinuités est sous-évalué
ou
sur-évalué).
Enfin il serait intéressantd’élargir
notre modèle aux processus de Coxcar souvent les
applications pratiques
nécessitent un caractère aléatoire de la fonction d’intensité et le modèle de Cox à intensitémultiplicative
fournit toute la structuremathématique
désirée.Remerciements
Nous tenons à remercier Jean-Louis
Brenguier
et Anna Pawlovska du Centre National de la RechercheMétéorologique
de Toulouse. Les nombreuses discussions que nous avons eues avec eux sont une desorigines
de ce travail. Nous tenons aussi à remercier lerapporteur
dont les commentairespertinents
ontpermis
d’améliorer laprésentation
de ce travail.Bibliographie
AALEN,
O.(1978), Nonparametric
inference for afamily of counting
processes, Ann.Statis., 6,
701-726.BRENGUIER,
J.L.(1993),
Observations of cloud microstructure at the centimeterscale,
J.of Applied Meteorology , 32,
783-793.BRONIATOWSKI,
M.(1993),
Cross validation in kernelnonparametric density
estimation : a survey, Publi. de l’I.S.
U.P.,
volXXXVII, 3-4,
3-28.BROOKS,
M.M. andMARRON,
J.S.(1991), Asymptotic optimality
of the least- squares cross-validation bandwidth for kernel estimates ofintensity functions,
Stochastic Processes and their
Applications, 38, 157-165, North-Holland.
COX,
D.R. andISHAM,
V.(1980), Point processes, Chapmann
andHall,
London.DIGGLE,
P.(1985),
A Kernel Method forSmoothing
Point ProcessData, Appl.
Statist., 34,
138-147.DIGGLE,
P. andMARRON,
J.S.(1988), Equivalence
ofSmoothing
ParametersSelectors in
Density
andIntensity Estimation,
J.of
the American StatisticalAssociation, 83,
793-800.KINGMAN,
J.F.C.(1993),
PoissonProcesses,
OxfordUniversity
PressInc.,
New-York.
MARRON,
J.S.(1988),
Automaticsmoothing parameter
selection : a survey,Empi-
rical
Economics, 13,
187-208.MONCAUP, S., SARDA,
P. et VIEU P.(1995),
Une mise en oeuvre d’estimateursnon
paramétriques
sur des donnéesmétéorologiques,
Revue deStatistique Appliquée,
VolXLIII(4),
77-88.RAMLAU-HANSEN,
H.(1983), Smoothing counting
process intensitiesby
mean ofkernel
functions,
Ann.Statist., 11,
453-466.VIEU,
P.(1993),
Bandwidth selection for kernelregression :
a survey. In"Compu-
ter Intensitive Methods in Statistics". Ed. W.