Approche non paramétrique en théorie de la fiabilité : revue bibliographique

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

S ÂLIMA H ÂSSANI P ÂSCAL S ÂRDA P ^HILIPPE V ÎEU

Approche non paramétrique en théorie de la fiabilité : revue bibliographique

Revue de statistique appliquée, tome 34, n

^o

4 (1986), p. 27-41

<http://www.numdam.org/item?id=RSA_1986__34_4_27_0>

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

27

APPROCHE NON PARAMÉTRIQUE

EN THÉORIE DE LA FIABILITÉ :

REVUE BIBLIOGRAPHIQUE

Salima

HASSANI,

^PascalSARDA,

Philippe

^VIEU

Université Paul Sabatier, Toulouse

A la mémoire de Gérard COLLOMB

qui

fut à l’initiative de ce travail RÉSUMÉ

Nous passons ^{en revue}les estimateurs non paramétriques ^{de la}fonction de hasard

proposés ^à^cejour. Nous donnons quelques exemples pratiques d’utilisation de ces estimateurs, puis ^lesprincipaux ^résultats^lesconcernant selon que le problème ^est^à^données^non^censurées

ou à données censurées. Dans chacun de ces deux cas nous étudions séparément les estimateurs utilisant l’échantillon ordonné des observations et ceux construits directement à partir ^d’esti-

mateurs de la densité. Les résultats concernent le biais, ^ladéviation maximale et la convergence de ces estimateurs _pourdes observations indépendantes. ^Unrésultat de convergence pour des observations dépendantes ^établiparallèlement ^à^cette^étude^estdonné dans la dernière partie.

ABSTRACT

We survey non-parametric estimators of the hazard function proposed ^at^thisday. ^Wegive

some practical examples ôfapplication ôf^theseestimators, ^thenprincipal results for them, ^with uncensored data or censored data. In each case we study estimators built with a orderly sample of observations and those built from density estimators. The results are about the bias, maximum deviation and convergence of these estimators from independant observations. A result of convergence from dependant observations established parallely ^{with this}study îsgiven ⁱⁿ^the

last part. ^-

Mots clés : Fonction de

hasard,

^{Taux de}

défaillance,

Estimation

non-paramétri-

que, Fiabilité.

1. INTRODUCTION

On s’intéresse _par

exemple

à la durée de vie de

lampes d’éclairage.

^En

prenant l’origine

^des

temps

^au^moment^{de la}^mise^enservice de la

lampe

^on

cherche à évaluer la

probabilité qu’une lampe

^tombe^enpanne ^entreles instants

t et t + At sachant

qu’elle

fonctionne encore au

temps

^t

(At

> 0 est

pris

^{au sens}

physique

^du

terme).

^On^note^Xla variable aléatoire réelle

positive

^«^{durée de}

vie d’une

lampe

^».^On

désigne

par f

(resp. F)

la densité

(resp.

la fonction de

répartition)

^{de X.}

Pour t fixé tel que F

(t)

¹^{on a}

Revue de Statistiques Appliquées, 1986, ^volXXXV, n° 4

(3)

28

et dès _quela densité f est continue on a,

Pour une variable aléatoire réelle X

positive

^de

répartition

^F^et^{de densité}

f on

appelle

^fonction^de

hasard,

^ou

parfois

^taux^de

^hasard,

^hasard^ou^bien^taux

de

défaillance,

^la^fonction^{h définie}par

L’interprétation

que l’on

peut

^en^faire^dans^le^cas^d’une^densité^{f continue}

(voir exemple ci-dessus)

^révèle

l’importance

^de^l’étude^de^la^fonction^{de hasard}

dans de nombreux

problèmes pratiques,

^notammentdans les études de fiabilité

ou de survie.

On

appelle

^fonctionde hasard cumulée la fonction H définie _par

Dans les revues de

langue anglaise

^H

porte

^le^nom^de^«

Log-survival

function »

puisque,

Le

problème

^del’estimation de la fonction h ^adonné lieu à de nombreuses études dans le cadre de la

statistique paramétrique. Cependant,

dans la

pratique,

^il^est

parfois

difficile de trouver le modèle

paramétrique

convenable. Les méthodes non

paramétriques

^lèvent^cettedifficulté

puis- qu’aucune hypothèse

restrictive n’est faite sur la loi de X. Cette loi n’est _pas

supposée appartenir

^à^uneclasse de lois indexées _parun nombre fini de

paramètres réels,

mais seulement vérifier des

hypothèses

^très

générales

^de

régularité.

^Le^cas^le

plus général

^est^{celui où}^cette^{loi admet}^unedensité nulle

sur R - et continue sur

R + ;

pour certains résultats nous aurons toutefois besoin

d’hypothèses plus

^fortes.^Il^est^à^noter

cependant

^que^ces^méthodes

nécessitent un nombre

important

d’observations

(disons

^{1 000}^et

plus).

^Les

résultats que ^nousexposons dans la suite trouveront des

applications

immédiates dans des domaines où ce nombre

important

de données

existe,

le

plus

^souventdans le domaine médical

(la

^fonction^{de hasard}

correspond

au

risque

instantané de

décès)

^ou

géophysique (cf. exemple

¹

ci-dessous).

^Le

problème

de défaillance des

logiciels

^est^un

exemple

^d’étude

où,

^au^moins à ce

jour,

^les^modèles

paramétriques

^seront

préférables

^à^cause^du^peu

d’observations

disponibles.

^D’autre

part,

l’estimation non

paramétrique

^{de la}

fonction de hasard

peut permettre

^de^choisir^un^modèle

paramétrique

convenable et donc de déboucher sur une étude

classique.

Nous nous proposons dans ^cetarticle _{de passer}en revue les différents travaux effectués à ce

jour

^enestimation non

paramétrique

^{de la}^fonction^de

hasard. Ce travail

complète

^la^revue

bibliographique

^deSINGPURWALLA

et WONG

(1983a).

Nous donnons dans le

paragraphe

²

quelques applications

^{de l’esti-}

mation de h selon que les données sont censurées ou non

(définitions au § 2).

Dans le

paragraphe

³^nousdonnons des

généralités

^sur^lesnoyaux

puisque

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(4)

29 ceux-ci interviennent dans la

plupart

des estimateurs non

paramétriques

introduits.

Ces estimateurs sont donnés dans le

paragraphe

⁴

(resp. 5)

ainsi que les résultats les concernant à

partir

de données non censurées

(resp.

^censu-

rées)

^et

indépendantes.

^Dans^{chacun de}^ces

paragraphes

les estimateurs sont classés selon

qu’ils

^sontconstruits à

partir

de l’échantillon ordonné ou bien directement à

partir

d’estimateurs de f et F. Cette classification relativement arbitraire trouve son

origine

dans l’état actuel du

développement

^{de l’esti-}

mation non

paramétrique

^du^taux^dedéfaillance. Nous donnons dans le

paragraphe

⁶

quelques

^nouveaux^résultats

qui

^ontété établis

parallèlement

à cette étude et

qui

concernent le cas d’observations

dépendantes.

^Nous

donnons enfin dans le

paragraphe

⁷

quelques

références ^surdes études _par simulation.

2. EXEMPLES D’UTILISATION

Nous donnons brièvement deux

exemples

d’utilisation de l’estimation de h. Nous _renvoyonsaux auteurs pour

plus

de détails. Les estimateurs utilisés dans ces

exemples

^sont^définis^aux

paragraphes

⁴^et^5.

2.1. Problème à données non censurées

On dit que le

problème

^est^{à données}^non^censurées

lorsque

^l’on

peut

observer toutes les variables.

RICE et ROSENBLATT

(1976)

^traitent^un

problème

^relevant^{de la}

géophysique (secousses sismiques).

La fonction de hasard h

(t) représente

^le

risque

^d’avoir^une^nouvellesecousse au

temps

t, l’instant ^{0 étant}

pris

^au

moment de la dernière secousse

enregistrée.

^Ils

disposent

des données des 4 764 dernières secousses

enregistrées

^enCalifornie. Le résultat de leur étude montre que ^ce

risque

^esttrès élevé dans les dix

premières

^minutes

puis

^décroît

pour ^sestabiliser au bout de 25 h environ.

2.2. Problème à données censurées

Dans

beaucoup

^de

problèmes pratiques

^{on ne}

dispose

pas de ^toutesles données

Xi ,...,Xn

^mais

uniquement

^des

couples (Zi, Ji),

ⁱ⁼¹,..., n, où

et

les

Ci

étant des variables aléatoires réelles

positives.

^On^dit

qu’on

ââlorsûn

problème

à données censurées à droite _{par les}variables

CI Cn.

Revue de Statistiques Appliquées, 1986, vol XXXV, nc) 4

(5)

30

YANDELL

(1983)

^traitedes données

provenant

^d’une

expérience

^de

survie,

pour rechercher l’effet d’une dose de 300 rad. d’une irradiation _par les _rayonsgamma ^sur²534 souris. Les animaux sont

répartis

^en^deux

groupes, ^«traitement » et « contrôle ». Ils meurent naturellement ou sont

sacrifiés.

Xi

^estici la durée de vie

(potentielle lorsque

^l’animal^est

sacrifié)

et

Ci

la date à

laquelle

^le

^ième

^animal^estsacrifié s’il est encore en vie. Les données sont constituées par le ^moment

(c’est-à-dire

^{Z; -}^min

(Xi, Ci»

^et^la

nature

(qui peut s’exprimer

^par

^Ji

⁼

1pqc,])

^{du décès.}^Parmi^les^{1 080}^souris

du _{groupe de}

contrôle,

³⁶¹^ont^étésacrifiées ainsi _{que 343}

parmi

^{les 1 454}

du groupe ^«traitement ». L’étude a pour but

d’analyser

^le^tauxde mortalité dans le groupe de traitement ^tout^au

long

^de

l’expérience

^etde le comparer à celui du groupe de contrôle. Les taux de mortalité obtenus montrent que l’irradiation

augmente

^le^taux^demortalité dans les deux

premiers jours

^et

au-delà du

cinquième jour

^de

traitement,

^alorsque, ^entreles 2e et 5e

jours,

les taux semblent

identiques.

Ce résultat est illustré par les deux

figures

ci-dessous

qui

^sont^extraitesde l’article de Yandell

(1983)

^et

qui représentent

pour chacun des deux _groupes,en

pointillés,

^la^fonctionde hasard estimée

en

chaque point

par

hn,9 (cf.

définition

(5.1»

^ainsique, ^entrait

plein,

^des

intervalles de confiance simultanés de niveau

80 %,

intervalles obtenus à l’aide de la

propriété

^de^normalité

asymptotique

^de

hn,9.

Groupe de Contrôle Groupe ^Traitement

3.

QUELQUES GÉNÉRALITÉS

La

plupart

^desestimateurs non

paramétriques

^{de la}^fonction^de^hasard

font intervenir la notion de noyau. Nous donnons ^toutd’abord la définition d’un _noyau,ainsi _qued’une 8-suite de fonctions

qui peut

^êtreconstruite à

partir

d’un noyau.

Revue de Statistiques Appliquées. 1986, vol XXXV, n° 4

(6)

31 On

appelle

^8-suite^de^fonctions

(cf.

^WATSON^et^LEADBETTER

( 1964b))

^une^suite

(8n)

^de^fonctionsréelles mesurables vérifiant les conditions suivantes

On

appelle

noyau de R ^unefonction K définie sur

R, intégrable

^et

bornée, qui

^vérifie

On _supposeradans la suite _quele _noyauest normé en ce sens que

1

A

partir

d’un noyau normé K ainsi défini on

peut

construire une 8-suite associée de fonctions

(Kn)

^en

posant

où

(bn)

^est^une^suite^dans^R*+

qui

^vérifie

...--r-

Une 8-suite de fonctions

(8n) (resp.

^unnoyau

K)

^est^dite

compatible

avec une fonction de

répartition y

^sipour ^toutM >

0,

^il^existe

b > 0 tel que pour ^tout^xfixé

est uniformément bornée sur

L’estimation de la fonction de hasard faisant intervenir des estimateurs de la densité

f, signalons

^d’abord

quelques

^revues

bibliographiques

^concernant

l’estimation non

paramétrique

de la densité : DEHEUVELS

(1977),

^ERYER

(1977),

^TAPIA^et^THOMPSON

(1978),

^WERTZ

(1978),

^BEAN^et^TSAKAS

(1980).

^Notons^enfin^les^travauxde ROSENBLATT

(1956)

^et^PARZEN

(1962) qui

^ont^introduitl’estimateur à noyau de la densité.

4.

RÉSULTATS

CONCERNANT LE CAS DE

DONNÉES

NON CENSU-

RÉES

On suppose les variables aléatoires

Xl,..., Xn indépendantes,

^définies^sur

le même espace

probabilisé

^et

ayant

même loi que X. On ^note

classiquement X(i),..., X(n)

^les

statistiques

^d’ordre.

Revue de Statistiques Appliquées, 1986. ^vol.XXXV, n° 4

(7)

32

4.1. Méthodes utilisant les

statistiques

^d’ordre

Estimateur de WATSON et LEADBETTER

WATSON et LEADBETTER

(1964

a, 1964

b)

^ont

proposé

l’estimateur suivant de h

(x)

n

avec

(8n)

^définie^en

(3.1 ).

Ils établissent _quele biais de

hn,o

^tend^vers⁰

quand

n tend vers l’infini _{dès que}

(8n)

^est

compatible

^avec^F.

Si de

plus

alors

Cas

particulier

de l’estimateur

hn,o

Un cas

particulier

^de

hn,o

^estcelui de l’estimateur noté

hn,1

défini par

avec

Kn

définie à

partir

^d’unnoyau K par

(3.3).

^Le^{biais de}^cet^estimateur

proposé

par RAMLAU-HANSEN

(1983)

converge donc ^vers0.

L’auteur obtient la convergence ^enmoyenne

quadratique simple (resp.

uniforme sur un

compact)

^dèsque l’on ^a

SINGPURWALLA et WONG

(1983b)

^donnentdes résultats

complémentaires

sur le biais et la limite de l’erreur

quadratique

^dèsque le noyau K ^est

symétrique (K (x)

⁼^K

( - x), Vx)

^et^h^estcontinuement différentiable à l’ordre

m + 1

(m

>

0)

^sur^le

compact [

^-^c,⁺

c].

^Ils^montrent^alors

Estimateur de RICE et ROSENBLATT

(1976)

Cet estimateur est défini par

(8)

33 RICE et ROSENBLATT

(1976)

^montrent

qu’il

^est

asymptotiquement

^sans^biais

et

qu’on

^a

SETHURAMAN et SINGPURWALLA

(1981)

donnent la

propriété

^de

convergence ^enloi dite de déviation maximale suivante

sous

l’hypothèse

avec

Les suites réelles

(an), (Pn)

^et^lesconstantes A et C sont

explicitées

^dans

SETHURAMAN et SINGPURWALLA

(1981).

Ce résultat

(4.1) permet

de définir directement des

régions

de sécurité

asymptotique

^donnéepour la courbe de

hn,2.

Estimateurs de SETHURAMAN et SINGPURWALLA

(1981)

L’estimateur

ci-dessous, appelé

estimateur trivial ou « naïf » a été

proposé

par SETHURAMAN ^etSINGPURWALLA

(1981)

Ces auteurs ont montré la ^nonconvergence de ^cetestimateur et en

introduisant un noyau

symétrique particulier

^tel^que

définissent un nouvel estimateur

Ils obtiennent ainsi sur

hn,4

le même résultat de déviation maximale _{que celui} établi sur

hn,2 (4.1),

^en^donnant^un^théorème

général permettant

^d’établir facilement les résultats de

type asymptotique

pour

hn,4 à partir

^de^ceux^de

hn,2.

4.2. Méthodes utilisant les estimateurs de densité Il est naturel d’estimer la fonction de hasard _par

où

fn

et

Fn

^sont

respectivement

des estimateurs de la densité f et de la fonction de

répartition

^F.

Quand Fn

^sera^la^fonction^de

répartition empirique

^on

adoptera

la notation

Fn.

(9)

34

Estimateur de WATSON et LEADBETTER

(1964a

^et

b)

Cet

estimateur,

^noté

hn,5,

^est^définipar

(4.2)

^avec

et

WATSON et LEADBETTER

(1964,

^a^et

b)

montrent que le biais de

hn,5

^tend

vers 0 et obtiennent les deux résultats suivants

où N est la fonction de

répartition

^{de la}^loi^normale

^réduite, (an)

^et

(cn)

^sont

les suites

supposées

^finies^définies^pour^{un E}> 0 _par

et

avec

l’hypothèse

En

remplaçant ⁸ⁿ

par Kn défini en

(3.3)

^dans

hn,5,

^MURTHY

(1965)

^{établit la}

convergence presque sûre

ponctuelle

^de

hn,5

^sous

l’hypothèse

et AHMAD

(1976)

établit la convergence presque sûre uniforme sur un

compact (sur lequel

^F

(.) 1)

^de^cetestimateur sous

l’hypothèse

^assez^restric-

tive

Notons que AHMAD

(1976)

^a

proposé

^unestimateur de la fonction de hasard

généralisée

^définiepar

où g

(resp. G)

^est^la^densité

(resp.

^la^fonction^de

répartition)

^d’une^loi^connue.

Estimateurs à _noyau

RICE et ROSENBLATT

(1976)

^ont^défini^unestimateur

hn6

^à

partir

^de

(4.2)

^où

et

Fn

^est^lafonction de

répartition empirique classique multipliée

par le terme

n/(n

⁺

1 ).

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(10)

35 RICE et ROSENBLATT

(1976)

obtiennent sur

hn,6 le

^résultat^de^déviation

maximale

suivant,

avec

Pour le détail des suites

(cn), (an), (dn)

^et

(vn)

^{on se}

reportera

^{à RICE}^et ROSEMBLATT

(1976,

p.

69-71).

MURTHY

(1965)

avait introduit un estimateur très voisin.

Cet

estimateur,

^noté

hn,7,

^estdéfini par

(4.2)

^où

^fn

^est^donnépar

(4.3)

^et

Fn

^est^la^fonction^de

répartition empirique classique.

La convergence

ponctuelle

presque sûre est établie _parMURTHY

(1965)

sous

l’hypothèse

et ce même auteur prouve la normalité

asymptotique

^de

hn,7.

La convergence uniforme _presque

complète

^{sur un}

compact (sur lequel F(.) 1)

^est^établie

par COLLOMB et al.

(1986)

^sous

l’hypothèse

Estimation _parla méthode des

k-points

^les

plus proches

Cet

estimateur,

^noté

hn,8,

^utilise

Fn

^commeestimateur de la fonction de

répartition

^etl’estimateur de f _parla méthode des

k-points

^les

plus proches (LOFTSGAARDEN

^et

QUESENBERRY (1965»

défini par

où

(kn)

^est^unesuite entière

positive

^vérifiant

et

R (kn , x) représente

^ladistance euclidienne entre x et la

knème

observation la

plus proche

^de^x.Dans COLLOMB et al.

(1986)

ônôbtientêncore^la^conver-

gence uniforme _presque

complète

^{sur un}

compact lorsque

5.

RÉSULTAT

CONCERNANT LE CAS DE

DONNÉES CENSURÉES

Pour tout ce

qui

^concerne^les^variables

^X, X1,¡:.",

^Xn^on

^adopte

^{les mêmes}

notations

qu’au paragraphe 4,

^et^on^note

F _(resp. _f)

la fonction de

répartition (resp.

^la

densité)

^communedes variables

Zi,...,Zn,

ainsi que G

(resp. g)

^la

fonction de

répartition (resp.

^la

densité)

^commune^des^variables

CI Cn.

(11)

36

On se

place

dans le cadre d’un modèle où les variables

XI 1... Xn

^sont

indépendantes puisque

^cette

hypothèse

^a^étéfaite par ^tousles auteurs dont

nous allons donner les résultats.

5.1. Méthode utilisant les

statistiques

^d’ordre

TANNER et WONG

(1983)

ôntîntroduitûnestimateur basé sur les

statistiques

^d’ordre

Z(i),..., Z(n)

^et

qui généralise hn,i

^tel

qu’il

était défini pour des

problèmes

^{à données}^non^censurées.

Cet estimateur est donné à

partir

d’une 8-suite de la forme

(3.3)

par

où l’on convient que

Les auteurs établissent leurs résultats _pourune suite

(bn)

^vérifiant

Ils montrent que

hn,9 (x)

êstûnestimateur de h dont le biais tend vers 0 dès que le noyau K êst

compatible

^avec^{F. Si le}noyau K ^estaussi

compatible

^avec

G,

ils montrent que

hn,9 (x)

^{a une}distribution

asymptotique

^normale^et^que

hn,9

^est

convergent

^enmoyenne

quadratique.

Ils donnent une évaluation

asymptotique

de la variance de

hn,9,

Toujours

pour ^unesuite

(bn)

^vérifiant

(5.2),

^YANDELL

(1983)

^donne^une

évaluation exacte de la variance de

hn,9

ainsi que de la covariance ^entre

hn,9 (x)

et

hn,9 (y).

^Ainsi^sous^certaines^autres

hypothèses supplémentaires

^il^montreque

Utilisant l’estimateur défini _par

(5.1),

^YANDELL

(1983)

propose ^un^test^non

paramétrique

^de

l’hypothèse

^Ho^=-^«

^{hi = h2 »}

^où

^hi

^et

^h2

^sont^les^fonctions^de

hasard relatives à deux échantillons

indépendants.

5.2. Méthode utilisant ^unestimateur de densité

BLUM et SUSARLA

(1980)

^ont

proposé

^unestimateur de

hn,6 tel qu’il

était défini _{pour des}

problèmes

^à^données^noncensurées. En notant Fn ^la

répartition empirique

^des

Zi,

^cetestimateur est défini _par

Sous certaines

hypothèses

^decontinuité et de dérivabilité de

f, F,

g ^et

G,

pour

un noyau ^Kdéfini par

(3.2)

absolument continu tel

que f ^K(x)

^dx⁰⁰^et

f ^(K’ ^(X»2

^dx ^00,^et

^lorsque

^{la suite}

^(bn)

^vérifie

Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4

(12)

37 il est montré _que

avec

et

Nous renvoyons ^aux^auteurspour les détails sur les constantes A et

B, qui

ne

dépendent

que du noyau K.

Méthode utilisant l’estimateur de K,4PLAN-MEIER

Soient

1 Xi , X2j ,..., Xf } je: 1 ,

^{k suites}

indépendantes

^de^variables^aléatoires

indépendantes

^et

identiquement

distribuées

(k

^est^un^nombre

fixé).

On suppose que

XJ

^{a une}^densité

^f’

^continue^et^unefonction de

répartition

^F’.^BURKE^et

HORVATH

(1984)

^estiment

On pose

L’estimateur

hin,11

^de

^h’ qui

utilise la fonction

empirique

^dehasard cumulée

est défini _par

où A et B sont des nombres réels convenablement

choisis,

pouvant

dépendre

de

i,

^et

1 y’n

¹ des suites de fonctions mesurables sur

(A, B)2 .

^BURKE^et

HORVATH

(1984)

définissent trois estimateurs différents en

prenant

^{des suites}

(03C8in)

différentes. Nous

prendrons

^pour^toute^la^suite

où

(bn)

^est^unesuite réelle telle que

et

Ki ,

^unnoyau dont la dérivée ^estde carré

intégrable

^sur^le

support

^de

K’

_pour

i=l,...,k.

On pose

où

est

supposée

^bornée

sur 1

Les auteurs

précités

donnent le résultat suivant

(13)

38

avec

Lorsque

^k⁼

1,

^{on a un}

problème

^à^données^non^censurées^et^on^retrouve

l’estimateur

hn,4.

Estimation _parla méthode des

k-points

^les

plus proches

Avec les notations introduites _pourl’estimateur

hn,8

ôn^définitûnêstima-

teur des

k-points

^les

plus proches

pour des données censurées _par

La convergence

ponctuelle

presque sûre de ^cetestimateur a été établie par TANNER

(1983) lorsque

^{la suite}

(kn)

^estde la forme

kn = [na] ]

pour 1/2 a

1,

^hêst^continueêt^Kêst^à

support compact.

^Nous

signalons

^aussi

la note de

SCHÂFER (1985) qui apporte

^unepreuve

simplifiée

^de^ce^même

résultat.

Estimation _{par la}méthode de

l’histrogramme

Après

^avoir

remarqué

que h

peut

^s’écrire^sous^{la forme} où

LIU and Van RYSIN

(1985) proposent

d’estimer h _par

où

Fn

^estla fonction de

répartition empirique

^des

^Z,

^et

^f?

^est^unestimateur de f*

qui

^constitue^une

généralisation

^de

l’histogramme.

^Nousrenvoyons à Van RYSIN

(1973)

pour la définition exacte de

f?.

^Dans^LIU^et^Van^RYSIN

(1985)

est établie la convergence presque sûre

ponctuelle

^etla normalité

asymptotique

de

hn,13.

6.

QUELQUES

COMMENTAIRES ET DERNIERS

RÉSULTATS

Outre les nombreux résultats ^surl’évaluation

asymptotique

^{du biais}^et

de la variance des estimateurs

introduits,

^il^a^été

prouvé

que la

plupart

^de

ces estimateurs sont

asymptotiquement

^non^biaisés.^Par^contreil semble

qu’il

n’existe _pasd’estimateur sans biais de h sous la seule

hypothèse

que f est

continue. Ce résultat de non existence n’a pas ^encoreété établi à notre

connaissance mais il devrait être une

conséquence

du corollaire du théorème de BICKEL et LEHMAN

(1969,

p.

1525).

Par ailleurs pour ^tousles estimateurs introduits

(exceptés hn,o

^et

hn,l)

^des

résultats de déviation maximale ou de normalité

asymptotique

^ontété établis.

(14)

39 Ces résultats sont intéressants

puisqu’ils permettent

^dedéterminer des intervalles de

confiance, point

par

point

^etsimultanés.

Pour ce

qui

^concerne^les

problèmes

de convergence

d’estimateurs,

^les

seuls résultats contenus dans les

paragraphes

⁴^et⁵^sontla convergence

- en moyenne

quadratique, ponctuelle

^et^uniformepour

hn,l,

- en moyenne

quadratique, ponctuelle

pour

hn,lO,

- presque

sûre, ponctuelle

pour

hn,s, hn,7, hn,12

^et

hn,13,

- presque

sûre,

^uniformepour

hn,s.

Il faut donc constater que très peu de résultats de convergence forte ont été établis.

De

même,

^{mis à}part ^RICE^etROSENBLATT

(1976, p. 66)

^dans^une

remarque, ^aucun^auteur^nes’est intéressé au

problème

de l’estimation du taux de hasard à

partir

d’observations

dépendantes,

^si^cen’est COLLOMB et al.

(1986).

Dans ce dernier article on démontre la convergence presque

complète

uniforme sur un

compact

^{C de}

hn,7

^et

hn,8

^vers^h

lorsque (Xn)

^est^unprocessus uniformément fortement

mélangeant. (Nous

renvoyons à BILLINGSLEY

(1968)

pour la

définition).

Ces deux résultats de convergence uniforme ^{sur un}

compact permettent

d’estimer le mode 8 de la fonction h

(lorsque

^celui-ci^est

unique).

^Dans

l’exemple

introductif du

paragraphe 1,

⁸

représente

^l’instant

auquel

^la

lampe d’éclairage

^a^le

plus

de chance de tomber en panne, sachant

qu’elle

^ne^l’a

pas fait

auparavant.

Remarquons

que le modèle de

dépendance

^introduit^pour^ces^résultats

englobe

entre autres les processus markoviens

qui

^vérifientla condition de Doeblin

(voir

^DOOB

(1953) p. 209).

7.

QUELQUES RÉFÉRENCES

POUR DES

ÉTUDES

PAR SIMULATION

RICE et ROSENBLATT

(1976)

^donnent^descourbes estimées de la fonction de hasard h _par

hn,2

^ensimulant 200 nombres aléatoires suivant la loi

exponentielle

^et^laloi de RAYLEIGH

(Loi

de WEIBULL avec

a = 1, 2).

YANDELL

(1983)

^à

partir

^de

simulations,

traite les cas non censuré et censuré à

50 %,

^etobtient des courbes estimées de

h,

^{le nombre}d’observations s’élevant à 200.

Nous

signalons

^aussiles études de RACINE-POON et HOEL

(1984).

Ils utilisent dans leurs simulations une

généralisation

^{au cas}censuré de l’estimateur de KAPLAN-MEYER. Ils mettent en évidence le

risque

^que

représente

^lechoix d’un modèle non censuré en montrant que celui-ci

peut

aboutir à une

augmentation importante

^du^biais

lorsque

^lesobservations sont

effectivement censurées.

(15)

40

RÉFÉRENCES BIBLIOGRAPHIQUES

I.A. AHMAD

(1976). 2014

^Uniform

strong

convergence of the

generalized

failure rate estimated. Bull. Math.

Stat, 17,

p. 77-84.

S.J. BEAN et C.P. TSAKAS

(1980).

^-

Developments

ⁱⁿ

non-parametric density

estimation. Inter. Stat. Review, 48, p. 267-287.

P.J. BICKEL et E.L. LEHMAN

(1969). -

^Unbiased^estimateⁱⁿ^convexe families. Annals

of

Mathematical

Statistics,

vol.

40,

p. 1523-1525.

P. BILLINGSLEY

(1968).

^-

Convergence

^of

Probability

^Measures.

Wiley.

S.R. BLUM et V. SUSARLA

(1980). -

^Maximal^deviation

theory

^of

density

and failure rate function estimates based on censored data. Multivariate

Analysis, V,

p. 213-222.

M.D. BURKE et L. HORVATH

(1984).

²⁰¹⁴

Density

^and^failure^rate^estimation

in a

Competing

^risks^model.

Sankya,

^vol.

^46,

^Série

^A,

p. 135-154.

G.

COLLOMB,

^S.

HASSANI,

^P.^SARDA^et^P.^VIEU

(1986).

^-^Estimation

non

paramétrique

^de^lafonction de hasard _pourdes observations

dépendantes. Statistique

^et

Analyse

^des

^données,

^vol.

^10,

^n°

^3,

pp. 42-49.

P. DEHEUVELS

(1977). 2014

Estimation non

paramétrique

de la densité par

histogrammes généralisés.

^Revue^de

Statistique Appliquée,

^vol.^XXV,^{n° 3.}

J. DOOB

(1953).

^-Stochastic processes.

Wiley,

^New-York.

J. ERYER

(1977). 2014

^{Revue of}^some

non-parametric

methods of

density

estimation. J. Inst. Math.

Applic. ^20,

p. 335-354.

R. LIU et J. VAN RYZIN

(1985). 2014

^A

histogram

estimator of the hazard rate with censored data. Ann. Stat.

13,

p. 592-605.

D.O. LOFTSGAARDEN et C.D.

QUESENBERRY (1965).

^-^Anon-parametric estimate of a multivariate

density

function. A.M.S. 36, p. 1049-1051.

V.K. MURTHY

(1965).

²⁰¹⁴Estimation

of jumps, reliability

and hazard rate.

Ann. Stat.

36,

p. 1032-1040.

E. PARZEN

(1962). 2014

On estimation of

probability density

function and mode. Annals

of

Mathematical

Statistics, 33,

p. 1065-1076.

A.H. RACINE-POON et D.G. HOEL

(1984).

²⁰¹⁴

Non-parametric

^estimation

of the survival function when cause of death is uncertain. Biometrics

40, p. 1151-1158.

H. RAMLAU-HANSEN

(1983). - Smoothing counting

processes intensities

by

^means^of^kernelfunctions. Ann. Stat.

11,

p. 453-466.

J. RICE et M. ROSENBLATT

(1976). 2014

Estimation of the

log

^survivor

function and hazard function.

Sankhya,

³⁸

^A,

p. 60-78.

M. ROSENBLATT

(1956).

^-^Remarks^on^some

non-parametric

^estimates^of

a

density

function. Annals

of Mathematical Statistics,

Vol.

27,

p. 642-669.

H.

SCHÄFER (1985). -

^A^note^on

data-adaptive

^kernelestimation of the hazard and

density

^functionin the random

censorship

situation. Annals

of Statistics,

Vol.

13,

^n°

2,

p. 818-820.

Revue de Statistiques Appliquées, 1986, vol XXXV, no ⁴

(16)

41 J. SETHURAMAN ^etN.D. SINGPURWALLA

(1981).

^-

Large sample

estimates and uniform confidence bounds for the failure rate function based on a naive estimator. Ann. Stat.

9,

p. 628-632.

N.D. SINGPURWALLA et M.Y. WONG

(1983 a).

^-Estimation of the failure rate : a survey of

non-parametric

^methods.^Part^{I :}^Non

bayesian

Methods. Commun. Statist. Theor.

Math.,

¹²

(5),

p. 559-588.

N.D. SINGPURWALLA et M.Y. WONG

(1983 b).

^-^Kernelestimators of the failure rate function and

density

estimation : an

analogy.

^J.A.S.A.

83,

Vol.

78, n°

382.

M.A. TANNER

(1983).

^-^A^note^onthe variable kernel estimator of the hazard function from

randomly

censored data. Ann.

Stat.,

Vol. 11, ^n°

3,

p. 994-998.

M. TANNER et W.H. WONG

(1983).

^-The estimation of the hasard function from

randomly

censored data

by

the kernel method. Ann. Stat.

11,

p. 989-993.

R.A. TAPIA et J.R. THOMPSON

(1978).

^-

Non-parametric probability density

estimation.

Baltimore,

^{London :}^Johns

Hopkins University

^Press.

J. VAN RYSIN

(1973).

²⁰¹⁴^A

histogram

^{method of}

density

estimation. Comm.

Statist.

2, p. 493-506.

G.S. WATSON et M.R. LEADBETTER

(1964 a).

^-^Hazard

analysis

^I.

Biometrika, 51,

p. 175-184.

G.S. WATSON et M.R. LEADBETTER

(1964 b).

^-^Hazard

analysis

^II.

Sankhya,

²⁶

^A,

p. 110-116.

W. WERTZ

(1978).

^-Statistical

density

estimation a survey. Vandenboeck

et

Ruprecht, Göttingen.

B.S. YANDELL

(1983).

²⁰¹⁴

Non-parametric

inference for rates with censored survival data. Ann. Stat.

11, 4,

p. 1119-1135.

Nous remercions l’I.M.S. pour l’autorisation

qui

^{nous a}^été^accordée

de

reproduire

^les

figures

illustrant nos

exemples.

Revue de Statistiques Appliquées, ^1986,^vol^XXXV,n° 4

Approche non paramétrique en théorie de la fiabilité : revue bibliographique

R EVUE DE STATISTIQUE APPLIQUÉE

S ALIMA H ASSANI P ASCAL S ARDA P HILIPPE V IEU

Approche non paramétrique en théorie de la fiabilité : revue bibliographique

Revue de statistique appliquée, tome 34, n

4 (1986), p. 27-41

APPROCHE NON PARAMÉTRIQUE

EN THÉORIE DE LA FIABILITÉ :

REVUE BIBLIOGRAPHIQUE

HASSANI,

Philippe

qui

hasard,

défaillance,

non-paramétri-

exemple

lampes d’éclairage.

prenant l’origine

temps

lampe

probabilité qu’une lampe

qu’elle

temps

(At

pris

physique

terme).

positive

lampe

désigne

(resp. F)

(resp.

répartition)

(t)

positive

répartition

appelle

hasard,

parfois

hasard,

défaillance,

L’interprétation

peut

(voir exemple ci-dessus)

l’importance

problèmes pratiques,

appelle

langue anglaise

porte

Log-survival

puisque,

problème

statistique paramétrique. Cependant,

pratique,

parfois

paramétrique

paramétriques

puis- qu’aucune hypothèse

supposée appartenir

paramètres réels,

hypothèses

générales

régularité.

plus général

R + ;

d’hypothèses plus

cependant

important

(disons

plus).

applications

important

existe,

plus

(la

correspond

risque

décès)

géophysique (cf. exemple

ci-dessous).

S ÂLIMA H ÂSSANI P ÂSCAL S ÂRDA P ^HILIPPE V ÎEU

^hasard,