• Aucun résultat trouvé

Approche non paramétrique en théorie de la fiabilité : revue bibliographique

N/A
N/A
Protected

Academic year: 2022

Partager "Approche non paramétrique en théorie de la fiabilité : revue bibliographique"

Copied!
16
0
0

Texte intégral

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

S ALIMA H ASSANI P ASCAL S ARDA P HILIPPE V IEU

Approche non paramétrique en théorie de la fiabilité : revue bibliographique

Revue de statistique appliquée, tome 34, n

o

4 (1986), p. 27-41

<http://www.numdam.org/item?id=RSA_1986__34_4_27_0>

© Société française de statistique, 1986, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

27

APPROCHE NON PARAMÉTRIQUE

EN THÉORIE DE LA FIABILITÉ :

REVUE BIBLIOGRAPHIQUE

Salima

HASSANI,

Pascal SARDA,

Philippe

VIEU

Université Paul Sabatier, Toulouse

A la mémoire de Gérard COLLOMB

qui

fut à l’initiative de ce travail RÉSUMÉ

Nous passons en revue les estimateurs non paramétriques de la fonction de hasard

proposés à ce jour. Nous donnons quelques exemples pratiques d’utilisation de ces estimateurs, puis les principaux résultats les concernant selon que le problème est à données non censurées

ou à données censurées. Dans chacun de ces deux cas nous étudions séparément les estimateurs utilisant l’échantillon ordonné des observations et ceux construits directement à partir d’esti-

mateurs de la densité. Les résultats concernent le biais, la déviation maximale et la convergence de ces estimateurs pour des observations indépendantes. Un résultat de convergence pour des observations dépendantes établi parallèlement à cette étude est donné dans la dernière partie.

ABSTRACT

We survey non-parametric estimators of the hazard function proposed at this day. We give

some practical examples of application of these estimators, then principal results for them, with uncensored data or censored data. In each case we study estimators built with a orderly sample of observations and those built from density estimators. The results are about the bias, maximum deviation and convergence of these estimators from independant observations. A result of convergence from dependant observations established parallely with this study is given in the

last part. -

Mots clés : Fonction de

hasard,

Taux de

défaillance,

Estimation

non-paramétri-

que, Fiabilité.

1. INTRODUCTION

On s’intéresse par

exemple

à la durée de vie de

lampes d’éclairage.

En

prenant l’origine

des

temps

au moment de la mise en service de la

lampe

on

cherche à évaluer la

probabilité qu’une lampe

tombe en panne entre les instants

t et t + At sachant

qu’elle

fonctionne encore au

temps

t

(At

&#x3E; 0 est

pris

au sens

physique

du

terme).

On note X la variable aléatoire réelle

positive

« durée de

vie d’une

lampe

». On

désigne

par f

(resp. F)

la densité

(resp.

la fonction de

répartition)

de X.

Pour t fixé tel que F

(t)

1 on a

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(3)

28

et dès que la densité f est continue on a,

Pour une variable aléatoire réelle X

positive

de

répartition

F et de densité

f on

appelle

fonction de

hasard,

ou

parfois

taux de

hasard,

hasard ou bien taux

de

défaillance,

la fonction h définie par

L’interprétation

que l’on

peut

en faire dans le cas d’une densité f continue

(voir exemple ci-dessus)

révèle

l’importance

de l’étude de la fonction de hasard

dans de nombreux

problèmes pratiques,

notamment dans les études de fiabilité

ou de survie.

On

appelle

fonction de hasard cumulée la fonction H définie par

Dans les revues de

langue anglaise

H

porte

le nom de «

Log-survival

function »

puisque,

Le

problème

de l’estimation de la fonction h a donné lieu à de nombreuses études dans le cadre de la

statistique paramétrique. Cependant,

dans la

pratique,

il est

parfois

difficile de trouver le modèle

paramétrique

convenable. Les méthodes non

paramétriques

lèvent cette difficulté

puis- qu’aucune hypothèse

restrictive n’est faite sur la loi de X. Cette loi n’est pas

supposée appartenir

à une classe de lois indexées par un nombre fini de

paramètres réels,

mais seulement vérifier des

hypothèses

très

générales

de

régularité.

Le cas le

plus général

est celui où cette loi admet une densité nulle

sur R - et continue sur

R + ;

pour certains résultats nous aurons toutefois besoin

d’hypothèses plus

fortes. Il est à noter

cependant

que ces méthodes

nécessitent un nombre

important

d’observations

(disons

1 000 et

plus).

Les

résultats que nous exposons dans la suite trouveront des

applications

immédiates dans des domaines où ce nombre

important

de données

existe,

le

plus

souvent dans le domaine médical

(la

fonction de hasard

correspond

au

risque

instantané de

décès)

ou

géophysique (cf. exemple

1

ci-dessous).

Le

problème

de défaillance des

logiciels

est un

exemple

d’étude

où,

au moins à ce

jour,

les modèles

paramétriques

seront

préférables

à cause du peu

d’observations

disponibles.

D’autre

part,

l’estimation non

paramétrique

de la

fonction de hasard

peut permettre

de choisir un modèle

paramétrique

convenable et donc de déboucher sur une étude

classique.

Nous nous proposons dans cet article de passer en revue les différents travaux effectués à ce

jour

en estimation non

paramétrique

de la fonction de

hasard. Ce travail

complète

la revue

bibliographique

de SINGPURWALLA

et WONG

(1983a).

Nous donnons dans le

paragraphe

2

quelques applications

de l’esti-

mation de h selon que les données sont censurées ou non

(définitions au § 2).

Dans le

paragraphe

3 nous donnons des

généralités

sur les noyaux

puisque

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(4)

29 ceux-ci interviennent dans la

plupart

des estimateurs non

paramétriques

introduits.

Ces estimateurs sont donnés dans le

paragraphe

4

(resp. 5)

ainsi que les résultats les concernant à

partir

de données non censurées

(resp.

censu-

rées)

et

indépendantes.

Dans chacun de ces

paragraphes

les estimateurs sont classés selon

qu’ils

sont construits à

partir

de l’échantillon ordonné ou bien directement à

partir

d’estimateurs de f et F. Cette classification relativement arbitraire trouve son

origine

dans l’état actuel du

développement

de l’esti-

mation non

paramétrique

du taux de défaillance. Nous donnons dans le

paragraphe

6

quelques

nouveaux résultats

qui

ont été établis

parallèlement

à cette étude et

qui

concernent le cas d’observations

dépendantes.

Nous

donnons enfin dans le

paragraphe

7

quelques

références sur des études par simulation.

2. EXEMPLES D’UTILISATION

Nous donnons brièvement deux

exemples

d’utilisation de l’estimation de h. Nous renvoyons aux auteurs pour

plus

de détails. Les estimateurs utilisés dans ces

exemples

sont définis aux

paragraphes

4 et 5.

2.1. Problème à données non censurées

On dit que le

problème

est à données non censurées

lorsque

l’on

peut

observer toutes les variables.

RICE et ROSENBLATT

(1976)

traitent un

problème

relevant de la

géophysique (secousses sismiques).

La fonction de hasard h

(t) représente

le

risque

d’avoir une nouvelle secousse au

temps

t, l’instant 0 étant

pris

au

moment de la dernière secousse

enregistrée.

Ils

disposent

des données des 4 764 dernières secousses

enregistrées

en Californie. Le résultat de leur étude montre que ce

risque

est très élevé dans les dix

premières

minutes

puis

décroît

pour se stabiliser au bout de 25 h environ.

2.2. Problème à données censurées

Dans

beaucoup

de

problèmes pratiques

on ne

dispose

pas de toutes les données

Xi ,...,Xn

mais

uniquement

des

couples (Zi, Ji),

i = 1 ,..., n, où

et

les

Ci

étant des variables aléatoires réelles

positives.

On dit

qu’on

a alors un

problème

à données censurées à droite par les variables

CI Cn.

Revue de Statistiques Appliquées, 1986, vol XXXV, nc) 4

(5)

30

YANDELL

(1983)

traite des données

provenant

d’une

expérience

de

survie,

pour rechercher l’effet d’une dose de 300 rad. d’une irradiation par les rayons gamma sur 2 534 souris. Les animaux sont

répartis

en deux

groupes, « traitement » et « contrôle ». Ils meurent naturellement ou sont

sacrifiés.

Xi

est ici la durée de vie

(potentielle lorsque

l’animal est

sacrifié)

et

Ci

la date à

laquelle

le

ième

animal est sacrifié s’il est encore en vie. Les données sont constituées par le moment

(c’est-à-dire

Z; - min

(Xi, Ci»

et la

nature

(qui peut s’exprimer

par

Ji

=

1pqc,])

du décès. Parmi les 1 080 souris

du groupe de

contrôle,

361 ont été sacrifiées ainsi que 343

parmi

les 1 454

du groupe « traitement ». L’étude a pour but

d’analyser

le taux de mortalité dans le groupe de traitement tout au

long

de

l’expérience

et de le comparer à celui du groupe de contrôle. Les taux de mortalité obtenus montrent que l’irradiation

augmente

le taux de mortalité dans les deux

premiers jours

et

au-delà du

cinquième jour

de

traitement,

alors que, entre les 2e et 5e

jours,

les taux semblent

identiques.

Ce résultat est illustré par les deux

figures

ci-dessous

qui

sont extraites de l’article de Yandell

(1983)

et

qui représentent

pour chacun des deux groupes, en

pointillés,

la fonction de hasard estimée

en

chaque point

par

hn,9 (cf.

définition

(5.1»

ainsi que, en trait

plein,

des

intervalles de confiance simultanés de niveau

80 %,

intervalles obtenus à l’aide de la

propriété

de normalité

asymptotique

de

hn,9.

Groupe de Contrôle Groupe Traitement

3.

QUELQUES GÉNÉRALITÉS

La

plupart

des estimateurs non

paramétriques

de la fonction de hasard

font intervenir la notion de noyau. Nous donnons tout d’abord la définition d’un noyau, ainsi que d’une 8-suite de fonctions

qui peut

être construite à

partir

d’un noyau.

Revue de Statistiques Appliquées. 1986, vol XXXV, n° 4

(6)

31 On

appelle

8-suite de fonctions

(cf.

WATSON et LEADBETTER

( 1964b))

une suite

(8n)

de fonctions réelles mesurables vérifiant les conditions suivantes

On

appelle

noyau de R une fonction K définie sur

R, intégrable

et

bornée, qui

vérifie

On supposera dans la suite que le noyau est normé en ce sens que

1

A

partir

d’un noyau normé K ainsi défini on

peut

construire une 8-suite associée de fonctions

(Kn)

en

posant

(bn)

est une suite dans R*+

qui

vérifie

...--r-

Une 8-suite de fonctions

(8n) (resp.

un noyau

K)

est dite

compatible

avec une fonction de

répartition y

si pour tout M &#x3E;

0,

il existe

b &#x3E; 0 tel que pour tout x fixé

est uniformément bornée sur

L’estimation de la fonction de hasard faisant intervenir des estimateurs de la densité

f, signalons

d’abord

quelques

revues

bibliographiques

concernant

l’estimation non

paramétrique

de la densité : DEHEUVELS

(1977),

ERYER

(1977),

TAPIA et THOMPSON

(1978),

WERTZ

(1978),

BEAN et TSAKAS

(1980).

Notons enfin les travaux de ROSENBLATT

(1956)

et PARZEN

(1962) qui

ont introduit l’estimateur à noyau de la densité.

4.

RÉSULTATS

CONCERNANT LE CAS DE

DONNÉES

NON CENSU-

RÉES

On suppose les variables aléatoires

Xl,..., Xn indépendantes,

définies sur

le même espace

probabilisé

et

ayant

même loi que X. On note

classiquement X(i),..., X(n)

les

statistiques

d’ordre.

Revue de Statistiques Appliquées, 1986. vol. XXXV, n° 4

(7)

32

4.1. Méthodes utilisant les

statistiques

d’ordre

Estimateur de WATSON et LEADBETTER

WATSON et LEADBETTER

(1964

a, 1964

b)

ont

proposé

l’estimateur suivant de h

(x)

n

avec

(8n)

définie en

(3.1 ).

Ils établissent que le biais de

hn,o

tend vers 0

quand

n tend vers l’infini dès que

(8n)

est

compatible

avec F.

Si de

plus

alors

Cas

particulier

de l’estimateur

hn,o

Un cas

particulier

de

hn,o

est celui de l’estimateur noté

hn,1

défini par

avec

Kn

définie à

partir

d’un noyau K par

(3.3).

Le biais de cet estimateur

proposé

par RAMLAU-HANSEN

(1983)

converge donc vers 0.

L’auteur obtient la convergence en moyenne

quadratique simple (resp.

uniforme sur un

compact)

dès que l’on a

SINGPURWALLA et WONG

(1983b)

donnent des résultats

complémentaires

sur le biais et la limite de l’erreur

quadratique

dès que le noyau K est

symétrique (K (x)

= K

( - x), Vx)

et h est continuement différentiable à l’ordre

m + 1

(m

&#x3E;

0)

sur le

compact [

- c, +

c].

Ils montrent alors

Estimateur de RICE et ROSENBLATT

(1976)

Cet estimateur est défini par

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(8)

33 RICE et ROSENBLATT

(1976)

montrent

qu’il

est

asymptotiquement

sans biais

et

qu’on

a

SETHURAMAN et SINGPURWALLA

(1981)

donnent la

propriété

de

convergence en loi dite de déviation maximale suivante

sous

l’hypothèse

avec

Les suites réelles

(an), (Pn)

et les constantes A et C sont

explicitées

dans

SETHURAMAN et SINGPURWALLA

(1981).

Ce résultat

(4.1) permet

de définir directement des

régions

de sécurité

asymptotique

donnée pour la courbe de

hn,2.

Estimateurs de SETHURAMAN et SINGPURWALLA

(1981)

L’estimateur

ci-dessous, appelé

estimateur trivial ou « naïf » a été

proposé

par SETHURAMAN et SINGPURWALLA

(1981)

Ces auteurs ont montré la non convergence de cet estimateur et en

introduisant un noyau

symétrique particulier

tel que

définissent un nouvel estimateur

Ils obtiennent ainsi sur

hn,4

le même résultat de déviation maximale que celui établi sur

hn,2 (4.1),

en donnant un théorème

général permettant

d’établir facilement les résultats de

type asymptotique

pour

hn,4 à partir

de ceux de

hn,2.

4.2. Méthodes utilisant les estimateurs de densité Il est naturel d’estimer la fonction de hasard par

fn

et

Fn

sont

respectivement

des estimateurs de la densité f et de la fonction de

répartition

F.

Quand Fn

sera la fonction de

répartition empirique

on

adoptera

la notation

Fn.

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(9)

34

Estimateur de WATSON et LEADBETTER

(1964a

et

b)

Cet

estimateur,

noté

hn,5,

est défini par

(4.2)

avec

et

WATSON et LEADBETTER

(1964,

a et

b)

montrent que le biais de

hn,5

tend

vers 0 et obtiennent les deux résultats suivants

où N est la fonction de

répartition

de la loi normale

réduite, (an)

et

(cn)

sont

les suites

supposées

finies définies pour un E &#x3E; 0 par

et

avec

l’hypothèse

En

remplaçant 8n

par Kn défini en

(3.3)

dans

hn,5,

MURTHY

(1965)

établit la

convergence presque sûre

ponctuelle

de

hn,5

sous

l’hypothèse

et AHMAD

(1976)

établit la convergence presque sûre uniforme sur un

compact (sur lequel

F

(.) 1)

de cet estimateur sous

l’hypothèse

assez restric-

tive

Notons que AHMAD

(1976)

a

proposé

un estimateur de la fonction de hasard

généralisée

définie par

où g

(resp. G)

est la densité

(resp.

la fonction de

répartition)

d’une loi connue.

Estimateurs à noyau

RICE et ROSENBLATT

(1976)

ont défini un estimateur

hn6

à

partir

de

(4.2)

et

Fn

est la fonction de

répartition empirique classique multipliée

par le terme

n/(n

+

1 ).

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(10)

35 RICE et ROSENBLATT

(1976)

obtiennent sur

hn,6 le

résultat de déviation

maximale

suivant,

avec

Pour le détail des suites

(cn), (an), (dn)

et

(vn)

on se

reportera

à RICE et ROSEMBLATT

(1976,

p.

69-71).

MURTHY

(1965)

avait introduit un estimateur très voisin.

Cet

estimateur,

noté

hn,7,

est défini par

(4.2)

fn

est donné par

(4.3)

et

Fn

est la fonction de

répartition empirique classique.

La convergence

ponctuelle

presque sûre est établie par MURTHY

(1965)

sous

l’hypothèse

et ce même auteur prouve la normalité

asymptotique

de

hn,7.

La convergence uniforme presque

complète

sur un

compact (sur lequel F(.) 1)

est établie

par COLLOMB et al.

(1986)

sous

l’hypothèse

Estimation par la méthode des

k-points

les

plus proches

Cet

estimateur,

noté

hn,8,

utilise

Fn

comme estimateur de la fonction de

répartition

et l’estimateur de f par la méthode des

k-points

les

plus proches (LOFTSGAARDEN

et

QUESENBERRY (1965»

défini par

(kn)

est une suite entière

positive

vérifiant

et

R (kn , x) représente

la distance euclidienne entre x et la

knème

observation la

plus proche

de x. Dans COLLOMB et al.

(1986)

on obtient encore la conver-

gence uniforme presque

complète

sur un

compact lorsque

5.

RÉSULTAT

CONCERNANT LE CAS DE

DONNÉES CENSURÉES

Pour tout ce

qui

concerne les variables

X, X1,¡:.",

Xn on

adopte

les mêmes

notations

qu’au paragraphe 4,

et on note

F (resp. f)

la fonction de

répartition (resp.

la

densité)

commune des variables

Zi,...,Zn,

ainsi que G

(resp. g)

la

fonction de

répartition (resp.

la

densité)

commune des variables

CI Cn.

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

(11)

36

On se

place

dans le cadre d’un modèle où les variables

XI 1... Xn

sont

indépendantes puisque

cette

hypothèse

a été faite par tous les auteurs dont

nous allons donner les résultats.

5.1. Méthode utilisant les

statistiques

d’ordre

TANNER et WONG

(1983)

ont introduit un estimateur basé sur les

statistiques

d’ordre

Z(i),..., Z(n)

et

qui généralise hn,i

tel

qu’il

était défini pour des

problèmes

à données non censurées.

Cet estimateur est donné à

partir

d’une 8-suite de la forme

(3.3)

par

où l’on convient que

Les auteurs établissent leurs résultats pour une suite

(bn)

vérifiant

Ils montrent que

hn,9 (x)

est un estimateur de h dont le biais tend vers 0 dès que le noyau K est

compatible

avec F. Si le noyau K est aussi

compatible

avec

G,

ils montrent que

hn,9 (x)

a une distribution

asymptotique

normale et que

hn,9

est

convergent

en moyenne

quadratique.

Ils donnent une évaluation

asymptotique

de la variance de

hn,9,

Toujours

pour une suite

(bn)

vérifiant

(5.2),

YANDELL

(1983)

donne une

évaluation exacte de la variance de

hn,9

ainsi que de la covariance entre

hn,9 (x)

et

hn,9 (y).

Ainsi sous certaines autres

hypothèses supplémentaires

il montre que

Utilisant l’estimateur défini par

(5.1),

YANDELL

(1983)

propose un test non

paramétrique

de

l’hypothèse

Ho =- «

hi = h2 »

hi

et

h2

sont les fonctions de

hasard relatives à deux échantillons

indépendants.

5.2. Méthode utilisant un estimateur de densité

BLUM et SUSARLA

(1980)

ont

proposé

un estimateur de

hn,6 tel qu’il

était défini pour des

problèmes

à données non censurées. En notant Fn la

répartition empirique

des

Zi,

cet estimateur est défini par

Sous certaines

hypothèses

de continuité et de dérivabilité de

f, F,

g et

G,

pour

un noyau K défini par

(3.2)

absolument continu tel

que f K(x)

dx 00 et

f (K’ (X»2

dx 00, et

lorsque

la suite

(bn)

vérifie

Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4

(12)

37 il est montré que

avec

et

Nous renvoyons aux auteurs pour les détails sur les constantes A et

B, qui

ne

dépendent

que du noyau K.

Méthode utilisant l’estimateur de K,4PLAN-MEIER

Soient

1 Xi , X2j ,..., Xf } je: 1 ,

k suites

indépendantes

de variables aléatoires

indépendantes

et

identiquement

distribuées

(k

est un nombre

fixé).

On suppose que

XJ

a une densité

f’

continue et une fonction de

répartition

F’. BURKE et

HORVATH

(1984)

estiment

On pose

L’estimateur

hin,11

de

h’ qui

utilise la fonction

empirique

de hasard cumulée

est défini par

où A et B sont des nombres réels convenablement

choisis,

pouvant

dépendre

de

i,

et

1 y’n

1 des suites de fonctions mesurables sur

(A, B)2 .

BURKE et

HORVATH

(1984)

définissent trois estimateurs différents en

prenant

des suites

(03C8in)

différentes. Nous

prendrons

pour toute la suite

(bn)

est une suite réelle telle que

et

Ki ,

un noyau dont la dérivée est de carré

intégrable

sur le

support

de

K’

pour

i=l,...,k.

On pose

est

supposée

bornée

sur 1

Les auteurs

précités

donnent le résultat suivant

Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4

(13)

38

avec

Lorsque

k =

1,

on a un

problème

à données non censurées et on retrouve

l’estimateur

hn,4.

Estimation par la méthode des

k-points

les

plus proches

Avec les notations introduites pour l’estimateur

hn,8

on définit un estima-

teur des

k-points

les

plus proches

pour des données censurées par

La convergence

ponctuelle

presque sûre de cet estimateur a été établie par TANNER

(1983) lorsque

la suite

(kn)

est de la forme

kn = [na] ]

pour 1/2 a

1,

h est continue et K est à

support compact.

Nous

signalons

aussi

la note de

SCHÂFER (1985) qui apporte

une preuve

simplifiée

de ce même

résultat.

Estimation par la méthode de

l’histrogramme

Après

avoir

remarqué

que h

peut

s’écrire sous la forme

LIU and Van RYSIN

(1985) proposent

d’estimer h par

Fn

est la fonction de

répartition empirique

des

Z,

et

f?

est un estimateur de f*

qui

constitue une

généralisation

de

l’histogramme.

Nous renvoyons à Van RYSIN

(1973)

pour la définition exacte de

f?.

Dans LIU et Van RYSIN

(1985)

est établie la convergence presque sûre

ponctuelle

et la normalité

asymptotique

de

hn,13.

6.

QUELQUES

COMMENTAIRES ET DERNIERS

RÉSULTATS

Outre les nombreux résultats sur l’évaluation

asymptotique

du biais et

de la variance des estimateurs

introduits,

il a été

prouvé

que la

plupart

de

ces estimateurs sont

asymptotiquement

non biaisés. Par contre il semble

qu’il

n’existe pas d’estimateur sans biais de h sous la seule

hypothèse

que f est

continue. Ce résultat de non existence n’a pas encore été établi à notre

connaissance mais il devrait être une

conséquence

du corollaire du théorème de BICKEL et LEHMAN

(1969,

p.

1525).

Par ailleurs pour tous les estimateurs introduits

(exceptés hn,o

et

hn,l)

des

résultats de déviation maximale ou de normalité

asymptotique

ont été établis.

Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4

(14)

39 Ces résultats sont intéressants

puisqu’ils permettent

de déterminer des intervalles de

confiance, point

par

point

et simultanés.

Pour ce

qui

concerne les

problèmes

de convergence

d’estimateurs,

les

seuls résultats contenus dans les

paragraphes

4 et 5 sont la convergence

- en moyenne

quadratique, ponctuelle

et uniforme pour

hn,l,

- en moyenne

quadratique, ponctuelle

pour

hn,lO,

- presque

sûre, ponctuelle

pour

hn,s, hn,7, hn,12

et

hn,13,

- presque

sûre,

uniforme pour

hn,s.

Il faut donc constater que très peu de résultats de convergence forte ont été établis.

De

même,

mis à part RICE et ROSENBLATT

(1976, p. 66)

dans une

remarque, aucun auteur ne s’est intéressé au

problème

de l’estimation du taux de hasard à

partir

d’observations

dépendantes,

si ce n’est COLLOMB et al.

(1986).

Dans ce dernier article on démontre la convergence presque

complète

uniforme sur un

compact

C de

hn,7

et

hn,8

vers h

lorsque (Xn)

est un processus uniformément fortement

mélangeant. (Nous

renvoyons à BILLINGSLEY

(1968)

pour la

définition).

Ces deux résultats de convergence uniforme sur un

compact permettent

d’estimer le mode 8 de la fonction h

(lorsque

celui-ci est

unique).

Dans

l’exemple

introductif du

paragraphe 1,

8

représente

l’instant

auquel

la

lampe d’éclairage

a le

plus

de chance de tomber en panne, sachant

qu’elle

ne l’a

pas fait

auparavant.

Remarquons

que le modèle de

dépendance

introduit pour ces résultats

englobe

entre autres les processus markoviens

qui

vérifient la condition de Doeblin

(voir

DOOB

(1953) p. 209).

7.

QUELQUES RÉFÉRENCES

POUR DES

ÉTUDES

PAR SIMULATION

RICE et ROSENBLATT

(1976)

donnent des courbes estimées de la fonction de hasard h par

hn,2

en simulant 200 nombres aléatoires suivant la loi

exponentielle

et la loi de RAYLEIGH

(Loi

de WEIBULL avec

a = 1, 2).

YANDELL

(1983)

à

partir

de

simulations,

traite les cas non censuré et censuré à

50 %,

et obtient des courbes estimées de

h,

le nombre d’observations s’élevant à 200.

Nous

signalons

aussi les études de RACINE-POON et HOEL

(1984).

Ils utilisent dans leurs simulations une

généralisation

au cas censuré de l’estimateur de KAPLAN-MEYER. Ils mettent en évidence le

risque

que

représente

le choix d’un modèle non censuré en montrant que celui-ci

peut

aboutir à une

augmentation importante

du biais

lorsque

les observations sont

effectivement censurées.

Revue de Statistiques Appliquees, 1986, vol XXXV, n° 4

(15)

40

RÉFÉRENCES BIBLIOGRAPHIQUES

I.A. AHMAD

(1976). 2014

Uniform

strong

convergence of the

generalized

failure rate estimated. Bull. Math.

Stat, 17,

p. 77-84.

S.J. BEAN et C.P. TSAKAS

(1980).

-

Developments

in

non-parametric density

estimation. Inter. Stat. Review, 48, p. 267-287.

P.J. BICKEL et E.L. LEHMAN

(1969). -

Unbiased estimate in convexe families. Annals

of

Mathematical

Statistics,

vol.

40,

p. 1523-1525.

P. BILLINGSLEY

(1968).

-

Convergence

of

Probability

Measures.

Wiley.

S.R. BLUM et V. SUSARLA

(1980). -

Maximal deviation

theory

of

density

and failure rate function estimates based on censored data. Multivariate

Analysis, V,

p. 213-222.

M.D. BURKE et L. HORVATH

(1984).

2014

Density

and failure rate estimation

in a

Competing

risks model.

Sankya,

vol.

46,

Série

A,

p. 135-154.

G.

COLLOMB,

S.

HASSANI,

P. SARDA et P. VIEU

(1986).

- Estimation

non

paramétrique

de la fonction de hasard pour des observations

dépendantes. Statistique

et

Analyse

des

données,

vol.

10,

3,

pp. 42-49.

P. DEHEUVELS

(1977). 2014

Estimation non

paramétrique

de la densité par

histogrammes généralisés.

Revue de

Statistique Appliquée,

vol. XXV, n° 3.

J. DOOB

(1953).

- Stochastic processes.

Wiley,

New-York.

J. ERYER

(1977). 2014

Revue of some

non-parametric

methods of

density

estimation. J. Inst. Math.

Applic. 20,

p. 335-354.

R. LIU et J. VAN RYZIN

(1985). 2014

A

histogram

estimator of the hazard rate with censored data. Ann. Stat.

13,

p. 592-605.

D.O. LOFTSGAARDEN et C.D.

QUESENBERRY (1965).

- A non-parame- tric estimate of a multivariate

density

function. A.M.S. 36, p. 1049-1051.

V.K. MURTHY

(1965).

2014 Estimation

of jumps, reliability

and hazard rate.

Ann. Stat.

36,

p. 1032-1040.

E. PARZEN

(1962). 2014

On estimation of

probability density

function and mode. Annals

of

Mathematical

Statistics, 33,

p. 1065-1076.

A.H. RACINE-POON et D.G. HOEL

(1984).

2014

Non-parametric

estimation

of the survival function when cause of death is uncertain. Biometrics

40, p. 1151-1158.

H. RAMLAU-HANSEN

(1983). - Smoothing counting

processes intensities

by

means of kernel functions. Ann. Stat.

11,

p. 453-466.

J. RICE et M. ROSENBLATT

(1976). 2014

Estimation of the

log

survivor

function and hazard function.

Sankhya,

38

A,

p. 60-78.

M. ROSENBLATT

(1956).

- Remarks on some

non-parametric

estimates of

a

density

function. Annals

of Mathematical Statistics,

Vol.

27,

p. 642-669.

H.

SCHÄFER (1985). -

A note on

data-adaptive

kernel estimation of the hazard and

density

function in the random

censorship

situation. Annals

of Statistics,

Vol.

13,

2,

p. 818-820.

Revue de Statistiques Appliquées, 1986, vol XXXV, no 4

(16)

41 J. SETHURAMAN et N.D. SINGPURWALLA

(1981).

-

Large sample

estimates and uniform confidence bounds for the failure rate function based on a naive estimator. Ann. Stat.

9,

p. 628-632.

N.D. SINGPURWALLA et M.Y. WONG

(1983 a).

- Estimation of the failure rate : a survey of

non-parametric

methods. Part I : Non

bayesian

Methods. Commun. Statist. Theor.

Math.,

12

(5),

p. 559-588.

N.D. SINGPURWALLA et M.Y. WONG

(1983 b).

- Kernel estimators of the failure rate function and

density

estimation : an

analogy.

J.A.S.A.

83,

Vol.

78, n°

382.

M.A. TANNER

(1983).

- A note on the variable kernel estimator of the hazard function from

randomly

censored data. Ann.

Stat.,

Vol. 11,

3,

p. 994-998.

M. TANNER et W.H. WONG

(1983).

- The estimation of the hasard function from

randomly

censored data

by

the kernel method. Ann. Stat.

11,

p. 989-993.

R.A. TAPIA et J.R. THOMPSON

(1978).

-

Non-parametric probability density

estimation.

Baltimore,

London : Johns

Hopkins University

Press.

J. VAN RYSIN

(1973).

2014 A

histogram

method of

density

estimation. Comm.

Statist.

2, p. 493-506.

G.S. WATSON et M.R. LEADBETTER

(1964 a).

- Hazard

analysis

I.

Biometrika, 51,

p. 175-184.

G.S. WATSON et M.R. LEADBETTER

(1964 b).

- Hazard

analysis

II.

Sankhya,

26

A,

p. 110-116.

W. WERTZ

(1978).

- Statistical

density

estimation a survey. Vandenboeck

et

Ruprecht, Göttingen.

B.S. YANDELL

(1983).

2014

Non-parametric

inference for rates with censored survival data. Ann. Stat.

11, 4,

p. 1119-1135.

Nous remercions l’I.M.S. pour l’autorisation

qui

nous a été accordée

de

reproduire

les

figures

illustrant nos

exemples.

Revue de Statistiques Appliquées, 1986, vol XXXV, n° 4

Références

Documents relatifs

Montrer que l’on d´ efinit ainsi deux cartes compatibles de S n , qui munissent la sph` ere d’une structure de vari´ et´ e diff´ erentiable.. Tore de

Ce sont les premiers r´ esultats de convergence dans L q pour des estimateurs robustes dans un mod` ele de r´ egression non-param´ etrique

Cette section détaille notre approche s’appuyant sur une méthode Bayésienne non-paramétrique pour la découverte de comportements émergents à partir de trajectoires : le Processus

La forte diminution des concentrations en sucres rapportées au carbone organique TCH 2 O, observée entre les échantillons de la trappe de fond (à 14 m) et ceux des sédiments de

In the seventh question, it has been noticed that some active students know that the differences between British and American English affect all the levels

Les fonctions rationnelles (dont les fonctions polynômes et la fonction inverse), la fonction racine carrée et les fonctions trigonométriques (sinus, cosinus et tangente)

There are at least three major reasons for incorporating daily mobility in public health research: (i) to identify specific population groups, including socially

Dans toute la feuille, K désigne un corps commutatif..