R EVUE DE STATISTIQUE APPLIQUÉE
S ALIMA H ASSANI P ASCAL S ARDA P HILIPPE V IEU
Approche non paramétrique en théorie de la fiabilité : revue bibliographique
Revue de statistique appliquée, tome 34, n
o4 (1986), p. 27-41
<http://www.numdam.org/item?id=RSA_1986__34_4_27_0>
© Société française de statistique, 1986, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
27
APPROCHE NON PARAMÉTRIQUE
EN THÉORIE DE LA FIABILITÉ :
REVUE BIBLIOGRAPHIQUE
Salima
HASSANI,
Pascal SARDA,Philippe
VIEUUniversité Paul Sabatier, Toulouse
A la mémoire de Gérard COLLOMB
qui
fut à l’initiative de ce travail RÉSUMÉNous passons en revue les estimateurs non paramétriques de la fonction de hasard
proposés à ce jour. Nous donnons quelques exemples pratiques d’utilisation de ces estimateurs, puis les principaux résultats les concernant selon que le problème est à données non censurées
ou à données censurées. Dans chacun de ces deux cas nous étudions séparément les estimateurs utilisant l’échantillon ordonné des observations et ceux construits directement à partir d’esti-
mateurs de la densité. Les résultats concernent le biais, la déviation maximale et la convergence de ces estimateurs pour des observations indépendantes. Un résultat de convergence pour des observations dépendantes établi parallèlement à cette étude est donné dans la dernière partie.
ABSTRACT
We survey non-parametric estimators of the hazard function proposed at this day. We give
some practical examples of application of these estimators, then principal results for them, with uncensored data or censored data. In each case we study estimators built with a orderly sample of observations and those built from density estimators. The results are about the bias, maximum deviation and convergence of these estimators from independant observations. A result of convergence from dependant observations established parallely with this study is given in the
last part. -
Mots clés : Fonction de
hasard,
Taux dedéfaillance,
Estimationnon-paramétri-
que, Fiabilité.
1. INTRODUCTION
On s’intéresse par
exemple
à la durée de vie delampes d’éclairage.
Enprenant l’origine
destemps
au moment de la mise en service de lalampe
oncherche à évaluer la
probabilité qu’une lampe
tombe en panne entre les instantst et t + At sachant
qu’elle
fonctionne encore autemps
t(At
> 0 estpris
au sensphysique
duterme).
On note X la variable aléatoire réellepositive
« durée devie d’une
lampe
». Ondésigne
par f(resp. F)
la densité(resp.
la fonction derépartition)
de X.Pour t fixé tel que F
(t)
1 on aRevue de Statistiques Appliquées, 1986, vol XXXV, n° 4
28
et dès que la densité f est continue on a,
Pour une variable aléatoire réelle X
positive
derépartition
F et de densitéf on
appelle
fonction dehasard,
ouparfois
taux dehasard,
hasard ou bien tauxde
défaillance,
la fonction h définie parL’interprétation
que l’onpeut
en faire dans le cas d’une densité f continue(voir exemple ci-dessus)
révèlel’importance
de l’étude de la fonction de hasarddans de nombreux
problèmes pratiques,
notamment dans les études de fiabilitéou de survie.
On
appelle
fonction de hasard cumulée la fonction H définie parDans les revues de
langue anglaise
Hporte
le nom de «Log-survival
function »
puisque,
Le
problème
de l’estimation de la fonction h a donné lieu à de nombreuses études dans le cadre de lastatistique paramétrique. Cependant,
dans la
pratique,
il estparfois
difficile de trouver le modèleparamétrique
convenable. Les méthodes non
paramétriques
lèvent cette difficultépuis- qu’aucune hypothèse
restrictive n’est faite sur la loi de X. Cette loi n’est passupposée appartenir
à une classe de lois indexées par un nombre fini deparamètres réels,
mais seulement vérifier deshypothèses
trèsgénérales
derégularité.
Le cas leplus général
est celui où cette loi admet une densité nullesur R - et continue sur
R + ;
pour certains résultats nous aurons toutefois besoind’hypothèses plus
fortes. Il est à notercependant
que ces méthodesnécessitent un nombre
important
d’observations(disons
1 000 etplus).
Lesrésultats que nous exposons dans la suite trouveront des
applications
immédiates dans des domaines où ce nombre
important
de donnéesexiste,
le
plus
souvent dans le domaine médical(la
fonction de hasardcorrespond
au
risque
instantané dedécès)
ougéophysique (cf. exemple
1ci-dessous).
Leproblème
de défaillance deslogiciels
est unexemple
d’étudeoù,
au moins à cejour,
les modèlesparamétriques
serontpréférables
à cause du peud’observations
disponibles.
D’autrepart,
l’estimation nonparamétrique
de lafonction de hasard
peut permettre
de choisir un modèleparamétrique
convenable et donc de déboucher sur une étude
classique.
Nous nous proposons dans cet article de passer en revue les différents travaux effectués à ce
jour
en estimation nonparamétrique
de la fonction dehasard. Ce travail
complète
la revuebibliographique
de SINGPURWALLAet WONG
(1983a).
Nous donnons dans le
paragraphe
2quelques applications
de l’esti-mation de h selon que les données sont censurées ou non
(définitions au § 2).
Dans le
paragraphe
3 nous donnons desgénéralités
sur les noyauxpuisque
Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4
29 ceux-ci interviennent dans la
plupart
des estimateurs nonparamétriques
introduits.
Ces estimateurs sont donnés dans le
paragraphe
4(resp. 5)
ainsi que les résultats les concernant àpartir
de données non censurées(resp.
censu-rées)
etindépendantes.
Dans chacun de cesparagraphes
les estimateurs sont classés selonqu’ils
sont construits àpartir
de l’échantillon ordonné ou bien directement àpartir
d’estimateurs de f et F. Cette classification relativement arbitraire trouve sonorigine
dans l’état actuel dudéveloppement
de l’esti-mation non
paramétrique
du taux de défaillance. Nous donnons dans leparagraphe
6quelques
nouveaux résultatsqui
ont été établisparallèlement
à cette étude et
qui
concernent le cas d’observationsdépendantes.
Nousdonnons enfin dans le
paragraphe
7quelques
références sur des études par simulation.2. EXEMPLES D’UTILISATION
Nous donnons brièvement deux
exemples
d’utilisation de l’estimation de h. Nous renvoyons aux auteurs pourplus
de détails. Les estimateurs utilisés dans cesexemples
sont définis auxparagraphes
4 et 5.2.1. Problème à données non censurées
On dit que le
problème
est à données non censuréeslorsque
l’onpeut
observer toutes les variables.RICE et ROSENBLATT
(1976)
traitent unproblème
relevant de lagéophysique (secousses sismiques).
La fonction de hasard h(t) représente
lerisque
d’avoir une nouvelle secousse autemps
t, l’instant 0 étantpris
aumoment de la dernière secousse
enregistrée.
Ilsdisposent
des données des 4 764 dernières secoussesenregistrées
en Californie. Le résultat de leur étude montre que cerisque
est très élevé dans les dixpremières
minutespuis
décroîtpour se stabiliser au bout de 25 h environ.
2.2. Problème à données censurées
Dans
beaucoup
deproblèmes pratiques
on nedispose
pas de toutes les donnéesXi ,...,Xn
maisuniquement
descouples (Zi, Ji),
i = 1 ,..., n, oùet
les
Ci
étant des variables aléatoires réellespositives.
On ditqu’on
a alors unproblème
à données censurées à droite par les variablesCI Cn.
Revue de Statistiques Appliquées, 1986, vol XXXV, nc) 4
30
YANDELL
(1983)
traite des donnéesprovenant
d’uneexpérience
desurvie,
pour rechercher l’effet d’une dose de 300 rad. d’une irradiation par les rayons gamma sur 2 534 souris. Les animaux sontrépartis
en deuxgroupes, « traitement » et « contrôle ». Ils meurent naturellement ou sont
sacrifiés.
Xi
est ici la durée de vie(potentielle lorsque
l’animal estsacrifié)
et
Ci
la date àlaquelle
leième
animal est sacrifié s’il est encore en vie. Les données sont constituées par le moment(c’est-à-dire
Z; - min(Xi, Ci»
et lanature
(qui peut s’exprimer
parJi
=1pqc,])
du décès. Parmi les 1 080 sourisdu groupe de
contrôle,
361 ont été sacrifiées ainsi que 343parmi
les 1 454du groupe « traitement ». L’étude a pour but
d’analyser
le taux de mortalité dans le groupe de traitement tout aulong
del’expérience
et de le comparer à celui du groupe de contrôle. Les taux de mortalité obtenus montrent que l’irradiationaugmente
le taux de mortalité dans les deuxpremiers jours
etau-delà du
cinquième jour
detraitement,
alors que, entre les 2e et 5ejours,
les taux semblent
identiques.
Ce résultat est illustré par les deuxfigures
ci-dessous
qui
sont extraites de l’article de Yandell(1983)
etqui représentent
pour chacun des deux groupes, en
pointillés,
la fonction de hasard estiméeen
chaque point
parhn,9 (cf.
définition(5.1»
ainsi que, en traitplein,
desintervalles de confiance simultanés de niveau
80 %,
intervalles obtenus à l’aide de lapropriété
de normalitéasymptotique
dehn,9.
Groupe de Contrôle Groupe Traitement
3.
QUELQUES GÉNÉRALITÉS
La
plupart
des estimateurs nonparamétriques
de la fonction de hasardfont intervenir la notion de noyau. Nous donnons tout d’abord la définition d’un noyau, ainsi que d’une 8-suite de fonctions
qui peut
être construite àpartir
d’un noyau.Revue de Statistiques Appliquées. 1986, vol XXXV, n° 4
31 On
appelle
8-suite de fonctions(cf.
WATSON et LEADBETTER( 1964b))
une suite(8n)
de fonctions réelles mesurables vérifiant les conditions suivantesOn
appelle
noyau de R une fonction K définie surR, intégrable
etbornée, qui
vérifieOn supposera dans la suite que le noyau est normé en ce sens que
1
A
partir
d’un noyau normé K ainsi défini onpeut
construire une 8-suite associée de fonctions(Kn)
enposant
où
(bn)
est une suite dans R*+qui
vérifie...--r-
Une 8-suite de fonctions
(8n) (resp.
un noyauK)
est ditecompatible
avec une fonction de
répartition y
si pour tout M >0,
il existeb > 0 tel que pour tout x fixé
est uniformément bornée sur
L’estimation de la fonction de hasard faisant intervenir des estimateurs de la densité
f, signalons
d’abordquelques
revuesbibliographiques
concernantl’estimation non
paramétrique
de la densité : DEHEUVELS(1977),
ERYER(1977),
TAPIA et THOMPSON(1978),
WERTZ(1978),
BEAN et TSAKAS(1980).
Notons enfin les travaux de ROSENBLATT(1956)
et PARZEN(1962) qui
ont introduit l’estimateur à noyau de la densité.4.
RÉSULTATS
CONCERNANT LE CAS DEDONNÉES
NON CENSU-RÉES
On suppose les variables aléatoires
Xl,..., Xn indépendantes,
définies surle même espace
probabilisé
etayant
même loi que X. On noteclassiquement X(i),..., X(n)
lesstatistiques
d’ordre.Revue de Statistiques Appliquées, 1986. vol. XXXV, n° 4
32
4.1. Méthodes utilisant les
statistiques
d’ordreEstimateur de WATSON et LEADBETTER
WATSON et LEADBETTER
(1964
a, 1964b)
ontproposé
l’estimateur suivant de h(x)
n
avec
(8n)
définie en(3.1 ).
Ils établissent que le biais dehn,o
tend vers 0quand
n tend vers l’infini dès que
(8n)
estcompatible
avec F.Si de
plus
alors
Cas
particulier
de l’estimateurhn,o
Un cas
particulier
dehn,o
est celui de l’estimateur notéhn,1
défini paravec
Kn
définie àpartir
d’un noyau K par(3.3).
Le biais de cet estimateurproposé
par RAMLAU-HANSEN(1983)
converge donc vers 0.L’auteur obtient la convergence en moyenne
quadratique simple (resp.
uniforme sur un
compact)
dès que l’on aSINGPURWALLA et WONG
(1983b)
donnent des résultatscomplémentaires
sur le biais et la limite de l’erreur
quadratique
dès que le noyau K estsymétrique (K (x)
= K( - x), Vx)
et h est continuement différentiable à l’ordrem + 1
(m
>0)
sur lecompact [
- c, +c].
Ils montrent alorsEstimateur de RICE et ROSENBLATT
(1976)
Cet estimateur est défini par
Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4
33 RICE et ROSENBLATT
(1976)
montrentqu’il
estasymptotiquement
sans biaiset
qu’on
aSETHURAMAN et SINGPURWALLA
(1981)
donnent lapropriété
deconvergence en loi dite de déviation maximale suivante
sous
l’hypothèse
avec
Les suites réelles
(an), (Pn)
et les constantes A et C sontexplicitées
dansSETHURAMAN et SINGPURWALLA
(1981).
Ce résultat
(4.1) permet
de définir directement desrégions
de sécuritéasymptotique
donnée pour la courbe dehn,2.
Estimateurs de SETHURAMAN et SINGPURWALLA
(1981)
L’estimateur
ci-dessous, appelé
estimateur trivial ou « naïf » a étéproposé
par SETHURAMAN et SINGPURWALLA(1981)
Ces auteurs ont montré la non convergence de cet estimateur et en
introduisant un noyau
symétrique particulier
tel quedéfinissent un nouvel estimateur
Ils obtiennent ainsi sur
hn,4
le même résultat de déviation maximale que celui établi surhn,2 (4.1),
en donnant un théorèmegénéral permettant
d’établir facilement les résultats detype asymptotique
pourhn,4 à partir
de ceux dehn,2.
4.2. Méthodes utilisant les estimateurs de densité Il est naturel d’estimer la fonction de hasard par
où
fn
etFn
sontrespectivement
des estimateurs de la densité f et de la fonction derépartition
F.Quand Fn
sera la fonction derépartition empirique
onadoptera
la notationFn.
Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4
34
Estimateur de WATSON et LEADBETTER
(1964a
etb)
Cetestimateur,
notéhn,5,
est défini par(4.2)
avecet
WATSON et LEADBETTER
(1964,
a etb)
montrent que le biais dehn,5
tendvers 0 et obtiennent les deux résultats suivants
où N est la fonction de
répartition
de la loi normaleréduite, (an)
et(cn)
sontles suites
supposées
finies définies pour un E > 0 paret
avec
l’hypothèse
En
remplaçant 8n
par Kn défini en(3.3)
danshn,5,
MURTHY(1965)
établit laconvergence presque sûre
ponctuelle
dehn,5
sousl’hypothèse
et AHMAD
(1976)
établit la convergence presque sûre uniforme sur uncompact (sur lequel
F(.) 1)
de cet estimateur sousl’hypothèse
assez restric-tive
Notons que AHMAD
(1976)
aproposé
un estimateur de la fonction de hasardgénéralisée
définie paroù g
(resp. G)
est la densité(resp.
la fonction derépartition)
d’une loi connue.Estimateurs à noyau
RICE et ROSENBLATT
(1976)
ont défini un estimateurhn6
àpartir
de(4.2)
oùet
Fn
est la fonction derépartition empirique classique multipliée
par le termen/(n
+1 ).
Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4
35 RICE et ROSENBLATT
(1976)
obtiennent surhn,6 le
résultat de déviationmaximale
suivant,
avec
Pour le détail des suites
(cn), (an), (dn)
et(vn)
on sereportera
à RICE et ROSEMBLATT(1976,
p.69-71).
MURTHY
(1965)
avait introduit un estimateur très voisin.Cet
estimateur,
notéhn,7,
est défini par(4.2)
oùfn
est donné par(4.3)
etFn
est la fonction derépartition empirique classique.
La convergence
ponctuelle
presque sûre est établie par MURTHY(1965)
sous
l’hypothèse
et ce même auteur prouve la normalité
asymptotique
dehn,7.
La convergence uniforme presquecomplète
sur uncompact (sur lequel F(.) 1)
est établiepar COLLOMB et al.
(1986)
sousl’hypothèse
Estimation par la méthode des
k-points
lesplus proches
Cet
estimateur,
notéhn,8,
utiliseFn
comme estimateur de la fonction derépartition
et l’estimateur de f par la méthode desk-points
lesplus proches (LOFTSGAARDEN
etQUESENBERRY (1965»
défini paroù
(kn)
est une suite entièrepositive
vérifiantet
R (kn , x) représente
la distance euclidienne entre x et laknème
observation laplus proche
de x. Dans COLLOMB et al.(1986)
on obtient encore la conver-gence uniforme presque
complète
sur uncompact lorsque
5.
RÉSULTAT
CONCERNANT LE CAS DEDONNÉES CENSURÉES
Pour tout ce
qui
concerne les variablesX, X1,¡:.",
Xn onadopte
les mêmesnotations
qu’au paragraphe 4,
et on noteF (resp. f)
la fonction derépartition (resp.
ladensité)
commune des variablesZi,...,Zn,
ainsi que G(resp. g)
lafonction de
répartition (resp.
ladensité)
commune des variablesCI Cn.
Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4
36
On se
place
dans le cadre d’un modèle où les variablesXI 1... Xn
sontindépendantes puisque
cettehypothèse
a été faite par tous les auteurs dontnous allons donner les résultats.
5.1. Méthode utilisant les
statistiques
d’ordreTANNER et WONG
(1983)
ont introduit un estimateur basé sur lesstatistiques
d’ordreZ(i),..., Z(n)
etqui généralise hn,i
telqu’il
était défini pour desproblèmes
à données non censurées.Cet estimateur est donné à
partir
d’une 8-suite de la forme(3.3)
paroù l’on convient que
Les auteurs établissent leurs résultats pour une suite
(bn)
vérifiantIls montrent que
hn,9 (x)
est un estimateur de h dont le biais tend vers 0 dès que le noyau K estcompatible
avec F. Si le noyau K est aussicompatible
avecG,
ils montrent que
hn,9 (x)
a une distributionasymptotique
normale et quehn,9
estconvergent
en moyennequadratique.
Ils donnent une évaluationasymptotique
de la variance de
hn,9,
Toujours
pour une suite(bn)
vérifiant(5.2),
YANDELL(1983)
donne uneévaluation exacte de la variance de
hn,9
ainsi que de la covariance entrehn,9 (x)
et
hn,9 (y).
Ainsi sous certaines autreshypothèses supplémentaires
il montre queUtilisant l’estimateur défini par
(5.1),
YANDELL(1983)
propose un test nonparamétrique
del’hypothèse
Ho =- «hi = h2 »
oùhi
eth2
sont les fonctions dehasard relatives à deux échantillons
indépendants.
5.2. Méthode utilisant un estimateur de densité
BLUM et SUSARLA
(1980)
ontproposé
un estimateur dehn,6 tel qu’il
était défini pour des
problèmes
à données non censurées. En notant Fn larépartition empirique
desZi,
cet estimateur est défini parSous certaines
hypothèses
de continuité et de dérivabilité def, F,
g etG,
pourun noyau K défini par
(3.2)
absolument continu telque f K(x)
dx 00 etf (K’ (X»2
dx 00, etlorsque
la suite(bn)
vérifieRevue de Statistiques Appliquees, 1986, vol XXXV, n° 4
37 il est montré que
avec
et
Nous renvoyons aux auteurs pour les détails sur les constantes A et
B, qui
ne
dépendent
que du noyau K.Méthode utilisant l’estimateur de K,4PLAN-MEIER
Soient
1 Xi , X2j ,..., Xf } je: 1 ,
k suitesindépendantes
de variables aléatoiresindépendantes
etidentiquement
distribuées(k
est un nombrefixé).
On suppose queXJ
a une densitéf’
continue et une fonction derépartition
F’. BURKE etHORVATH
(1984)
estimentOn pose
L’estimateur
hin,11
deh’ qui
utilise la fonctionempirique
de hasard cumuléeest défini par
où A et B sont des nombres réels convenablement
choisis,
pouvantdépendre
de
i,
et1 y’n
1 des suites de fonctions mesurables sur(A, B)2 .
BURKE etHORVATH
(1984)
définissent trois estimateurs différents enprenant
des suites(03C8in)
différentes. Nousprendrons
pour toute la suiteoù
(bn)
est une suite réelle telle queet
Ki ,
un noyau dont la dérivée est de carréintégrable
sur lesupport
deK’
pouri=l,...,k.
On pose
où
est
supposée
bornéesur 1
Les auteurs
précités
donnent le résultat suivantRevue de Statistiques Appliquees, 1986, vol XXXV, n° 4
38
avec
Lorsque
k =1,
on a unproblème
à données non censurées et on retrouvel’estimateur
hn,4.
Estimation par la méthode des
k-points
lesplus proches
Avec les notations introduites pour l’estimateur
hn,8
on définit un estima-teur des
k-points
lesplus proches
pour des données censurées parLa convergence
ponctuelle
presque sûre de cet estimateur a été établie par TANNER(1983) lorsque
la suite(kn)
est de la formekn = [na] ]
pour 1/2 a1,
h est continue et K est àsupport compact.
Noussignalons
aussila note de
SCHÂFER (1985) qui apporte
une preuvesimplifiée
de ce mêmerésultat.
Estimation par la méthode de
l’histrogramme
Après
avoirremarqué
que hpeut
s’écrire sous la forme oùLIU and Van RYSIN
(1985) proposent
d’estimer h paroù
Fn
est la fonction derépartition empirique
desZ,
etf?
est un estimateur de f*qui
constitue unegénéralisation
del’histogramme.
Nous renvoyons à Van RYSIN(1973)
pour la définition exacte def?.
Dans LIU et Van RYSIN(1985)
est établie la convergence presque sûre
ponctuelle
et la normalitéasymptotique
de
hn,13.
6.
QUELQUES
COMMENTAIRES ET DERNIERSRÉSULTATS
Outre les nombreux résultats sur l’évaluation
asymptotique
du biais etde la variance des estimateurs
introduits,
il a étéprouvé
que laplupart
deces estimateurs sont
asymptotiquement
non biaisés. Par contre il semblequ’il
n’existe pas d’estimateur sans biais de h sous la seule
hypothèse
que f estcontinue. Ce résultat de non existence n’a pas encore été établi à notre
connaissance mais il devrait être une
conséquence
du corollaire du théorème de BICKEL et LEHMAN(1969,
p.1525).
Par ailleurs pour tous les estimateurs introduits
(exceptés hn,o
ethn,l)
desrésultats de déviation maximale ou de normalité
asymptotique
ont été établis.Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4
39 Ces résultats sont intéressants
puisqu’ils permettent
de déterminer des intervalles deconfiance, point
parpoint
et simultanés.Pour ce
qui
concerne lesproblèmes
de convergenced’estimateurs,
lesseuls résultats contenus dans les
paragraphes
4 et 5 sont la convergence- en moyenne
quadratique, ponctuelle
et uniforme pourhn,l,
- en moyenne
quadratique, ponctuelle
pourhn,lO,
- presque
sûre, ponctuelle
pourhn,s, hn,7, hn,12
ethn,13,
- presque
sûre,
uniforme pourhn,s.
Il faut donc constater que très peu de résultats de convergence forte ont été établis.
De
même,
mis à part RICE et ROSENBLATT(1976, p. 66)
dans uneremarque, aucun auteur ne s’est intéressé au
problème
de l’estimation du taux de hasard àpartir
d’observationsdépendantes,
si ce n’est COLLOMB et al.(1986).
Dans ce dernier article on démontre la convergence presque
complète
uniforme sur un
compact
C dehn,7
ethn,8
vers hlorsque (Xn)
est un processus uniformément fortementmélangeant. (Nous
renvoyons à BILLINGSLEY(1968)
pour ladéfinition).
Ces deux résultats de convergence uniforme sur un
compact permettent
d’estimer le mode 8 de la fonction h(lorsque
celui-ci estunique).
Dansl’exemple
introductif duparagraphe 1,
8représente
l’instantauquel
lalampe d’éclairage
a leplus
de chance de tomber en panne, sachantqu’elle
ne l’apas fait
auparavant.
Remarquons
que le modèle dedépendance
introduit pour ces résultatsenglobe
entre autres les processus markoviensqui
vérifient la condition de Doeblin(voir
DOOB(1953) p. 209).
7.
QUELQUES RÉFÉRENCES
POUR DESÉTUDES
PAR SIMULATIONRICE et ROSENBLATT
(1976)
donnent des courbes estimées de la fonction de hasard h parhn,2
en simulant 200 nombres aléatoires suivant la loiexponentielle
et la loi de RAYLEIGH(Loi
de WEIBULL aveca = 1, 2).
YANDELL
(1983)
àpartir
desimulations,
traite les cas non censuré et censuré à50 %,
et obtient des courbes estimées deh,
le nombre d’observations s’élevant à 200.Nous
signalons
aussi les études de RACINE-POON et HOEL(1984).
Ils utilisent dans leurs simulations une
généralisation
au cas censuré de l’estimateur de KAPLAN-MEYER. Ils mettent en évidence lerisque
quereprésente
le choix d’un modèle non censuré en montrant que celui-cipeut
aboutir à uneaugmentation importante
du biaislorsque
les observations sonteffectivement censurées.
Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4
40
RÉFÉRENCES BIBLIOGRAPHIQUES
I.A. AHMAD
(1976). 2014
Uniformstrong
convergence of thegeneralized
failure rate estimated. Bull. Math.
Stat, 17,
p. 77-84.S.J. BEAN et C.P. TSAKAS
(1980).
-Developments
innon-parametric density
estimation. Inter. Stat. Review, 48, p. 267-287.P.J. BICKEL et E.L. LEHMAN
(1969). -
Unbiased estimate in convexe families. Annalsof
MathematicalStatistics,
vol.40,
p. 1523-1525.P. BILLINGSLEY
(1968).
-Convergence
ofProbability
Measures.Wiley.
S.R. BLUM et V. SUSARLA
(1980). -
Maximal deviationtheory
ofdensity
and failure rate function estimates based on censored data. Multivariate
Analysis, V,
p. 213-222.M.D. BURKE et L. HORVATH
(1984).
2014Density
and failure rate estimationin a
Competing
risks model.Sankya,
vol.46,
SérieA,
p. 135-154.G.
COLLOMB,
S.HASSANI,
P. SARDA et P. VIEU(1986).
- Estimationnon
paramétrique
de la fonction de hasard pour des observationsdépendantes. Statistique
etAnalyse
desdonnées,
vol.10,
n°3,
pp. 42-49.P. DEHEUVELS
(1977). 2014
Estimation nonparamétrique
de la densité parhistogrammes généralisés.
Revue deStatistique Appliquée,
vol. XXV, n° 3.J. DOOB
(1953).
- Stochastic processes.Wiley,
New-York.J. ERYER
(1977). 2014
Revue of somenon-parametric
methods ofdensity
estimation. J. Inst. Math.
Applic. 20,
p. 335-354.R. LIU et J. VAN RYZIN
(1985). 2014
Ahistogram
estimator of the hazard rate with censored data. Ann. Stat.13,
p. 592-605.D.O. LOFTSGAARDEN et C.D.
QUESENBERRY (1965).
- A non-parame- tric estimate of a multivariatedensity
function. A.M.S. 36, p. 1049-1051.V.K. MURTHY
(1965).
2014 Estimationof jumps, reliability
and hazard rate.Ann. Stat.
36,
p. 1032-1040.E. PARZEN
(1962). 2014
On estimation ofprobability density
function and mode. Annalsof
MathematicalStatistics, 33,
p. 1065-1076.A.H. RACINE-POON et D.G. HOEL
(1984).
2014Non-parametric
estimationof the survival function when cause of death is uncertain. Biometrics
40, p. 1151-1158.
H. RAMLAU-HANSEN
(1983). - Smoothing counting
processes intensitiesby
means of kernel functions. Ann. Stat.11,
p. 453-466.J. RICE et M. ROSENBLATT
(1976). 2014
Estimation of thelog
survivorfunction and hazard function.
Sankhya,
38A,
p. 60-78.M. ROSENBLATT
(1956).
- Remarks on somenon-parametric
estimates ofa
density
function. Annalsof Mathematical Statistics,
Vol.27,
p. 642-669.H.
SCHÄFER (1985). -
A note ondata-adaptive
kernel estimation of the hazard anddensity
function in the randomcensorship
situation. Annalsof Statistics,
Vol.13,
n°2,
p. 818-820.Revue de Statistiques Appliquées, 1986, vol XXXV, no 4
41 J. SETHURAMAN et N.D. SINGPURWALLA
(1981).
-Large sample
estimates and uniform confidence bounds for the failure rate function based on a naive estimator. Ann. Stat.
9,
p. 628-632.N.D. SINGPURWALLA et M.Y. WONG
(1983 a).
- Estimation of the failure rate : a survey ofnon-parametric
methods. Part I : Nonbayesian
Methods. Commun. Statist. Theor.
Math.,
12(5),
p. 559-588.N.D. SINGPURWALLA et M.Y. WONG
(1983 b).
- Kernel estimators of the failure rate function anddensity
estimation : ananalogy.
J.A.S.A.83,
Vol.78, n°
382.M.A. TANNER
(1983).
- A note on the variable kernel estimator of the hazard function fromrandomly
censored data. Ann.Stat.,
Vol. 11, n°3,
p. 994-998.
M. TANNER et W.H. WONG
(1983).
- The estimation of the hasard function fromrandomly
censored databy
the kernel method. Ann. Stat.11,
p. 989-993.R.A. TAPIA et J.R. THOMPSON
(1978).
-Non-parametric probability density
estimation.Baltimore,
London : JohnsHopkins University
Press.J. VAN RYSIN
(1973).
2014 Ahistogram
method ofdensity
estimation. Comm.Statist.
2, p. 493-506.
G.S. WATSON et M.R. LEADBETTER
(1964 a).
- Hazardanalysis
I.Biometrika, 51,
p. 175-184.G.S. WATSON et M.R. LEADBETTER
(1964 b).
- Hazardanalysis
II.Sankhya,
26A,
p. 110-116.W. WERTZ
(1978).
- Statisticaldensity
estimation a survey. Vandenboecket
Ruprecht, Göttingen.
B.S. YANDELL
(1983).
2014Non-parametric
inference for rates with censored survival data. Ann. Stat.11, 4,
p. 1119-1135.Nous remercions l’I.M.S. pour l’autorisation
qui
nous a été accordéede
reproduire
lesfigures
illustrant nosexemples.
Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4