R EVUE DE STATISTIQUE APPLIQUÉE
D. D ROUET M ARI
La dépendance positive entre deux variables de durées : concepts de dépendance et mesures locales de liaison
Revue de statistique appliquée, tome 47, n
o4 (1999), p. 5-24
<http://www.numdam.org/item?id=RSA_1999__47_4_5_0>
© Société française de statistique, 1999, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LA DÉPENDANCE POSITIVE ENTRE DEUX VARIABLES DE DURÉES :
CONCEPTS DE DÉPENDANCE
ET MESURES LOCALES DE LIAISON.
D. Drouet Mari Laboratoire SABRES, Université de
Bretagne
SudRue Yves
Mainguy,
Tohannic, 56000 Vannesdrouet@iu-vannes.fr
RÉSUMÉ
De nombreux concepts de
dépendance positive
entre deux variables aléatoires ont été introduits dans la littérature. Lehmann [17], parexemple,
discute les concepts dedépendance positive
parquadrant,
dedépendance
par larégression
monotone, et dedépendance
par le rapport de vraisemblance. Shaked [19] a défini d’autres notionsadaptées
au cas des variablesde durées. On montre ici le lien entre ces différents concepts et divers indices de
dépendance
locale définis par
Clayton et
al [3], Anderson et al [1] ] et Dabrowska et al [5] dans le cadre de l’étude de variables de durées.Certains de ces indices permettent en outre d’étudier l’évolution de ladépendance
au cours du temps.Mots-clés :
dépendance positive,
survie bivariée, mesure locale d’association,copule, positivité
totale
ABSTRACT
Various concepts of
positive dependence
between two random variables have beenproposed
in the literature. Forexample
Lehmann [ 17] discussed three concepts ofpositive dependence : positively quadrant dependence, positively regression dependence
and likelihood ratiodependence.
Shaked [ 19] introduceddependence
concepts in the fieldof reliability.
We linkhere these concepts with various
time-dependent
association measures introducedby Clayton
et al [3], Anderson et al [1] ] and Dabrowska et al [5] in the field of bivariate survival
analysis.
We
point
out that these local association measures may be used to come intosight
the time of maximum association.Keywords :
positivedependence,
bivariate survivalanalysis, time-dependent
association measure,copula,
totalpositivity
6 D. DROUET MARI
1. Introduction
De nombreux
concepts
dedépendance positive
entre deux variables aléatoires ont été introduits dans la littérature. Lehmann[17],
parexemple,
pour proposer des testsd’indépendance qui
soient sans biais discute troisconcepts
dedépendance.
Ense limitant aux variables de durées et en utilisant la théorie de la
positivité
totale[ 16],
Shaked
[19],
a construit un cadre unificateur pour ungrand
nombre deconcepts
dedépendance.
Cependant
lesproblèmes
sont souventplus pratiques,
et on aparfois
besoinde
quantifier
cettedépendance :
parexemple
les délaisd’apparition
d’une maladiegénétique
chez unepaire
dejumeaux peuvent
êtreplus
ou moins liés selon ledegré
de ressemblance de ces
jumeaux.
Cette
dépendance peut
évoluer au cours dutemps,
certaines maladiesgénétiques
par
exemple
nes’expriment qu’à
des ages élevés. De même si l’on s’intéresse aux délaisd’apparition
de deux évènements successifs chez un mêmesujet (par exemple
les délais début du
traitement-rechute,
rechute-décès dans le cas d’unemaladie)
onpeut
désirer identifier le moment d’association maximale entre ces durées. Des indices locaux d’association ont étéproposés
dans ce but par Oakes[ 18],
Anderson et al[1] ]
et Dabrowska et al
[5].
Après
avoirrappellé
les différentsconcepts
dedépendance
et leurs emboîte- ments, on montre le lien entre certains d’entre eux et les différents indices. On montre aussi que l’évolution des indices au cours dutemps
est déterminée par ladépendance sous-jacente.
La
dépendance précoce
ou tardivepeut
être étudiée à travers les variations durapport
0 de deuxrisques
conditionnels. Apartir
de laprésentation
de troisdistributions bivariées
classiques,
on illustre les notions dedépendance précoce,
tardive et médiane et le calcul des différents indices.
Une
application,
avec le calcul de trois indices locaux sur des données réelles est aussiprésentée.
2. Le
risque
bivarié et lesrisques
conditionnelsSoient X et Y deux variables aléatoires de durées dont on étudie la liaison.
Elles
prennent
des valeurspositives
ounulles,
et on suppose que leur densitéjointe f (x, y)
existe. Onappelle S(x, y) = P(X
>x, Y
>y),
la fonction de survie ducouple (X, Y)
eth(x, y)
=f (x, y)/S(x, y),
lerisque
bivarié.La liaison entre
(X, Y) peut
s’étudier par l’intermédiaire durisque
conditionnelh X
=x - f(y/X = x) S(y/X = x),
c’est-à-dire lerisque
de Y sachant que X est décédéen x,
désigné
parh2/1,
ou bien parh(y/X
>x),
c’est-à-dire lerisque
de Y sachantque X a survécu au delà de x, ou est censuré en x,
appellé h2 (en
inversant le rôle dex et y, on définit aussi
hl/2
ethl) .
Soit
Dl,
lesymbole 9/&r, D2
lesymbole ~/~y,
et soit L la fonction(x, y)
~- Log S (x, y)
et= 2013DiD2L. Alors,
un calculsimple
montre que :D’où:
Les deux
risques h2/1
ethl
sont liés. En effet :d’où :
3. Les différentes notions de
dépendance
Lehmann
[17]
introduit troisconcepts
deplus
enplus
forts de ladépendance positive :
ladépendance positive
parquadrant (DPQ),
ladépendance
par larégression
monotone
(DRM),
ladépendance
par lerapport
de vraisemblance(DRV) :
où
Sl(x)
=P(X
>x)
etS2(y)
=P(Y
>y) désignent
les fonctions de surviesmarginales.
On a [17] :
Exemple :
SiA, B, C,
sont 3 variables aléatoiresindépendantes
et de mêmeloi, par exemple exponentielle (,(1, 1)), alors X
=A + B et Y
=A + C sont dépendantes,
et de même loi
03B3(1, 2).
Le coefficient de corrélation linéairer(x, y)
=0, 5.
Cecouple (X, Y)
estDRV,
parce que la densitéexponentielle
est une fonctionPolya
d’ordre 2[ 16],
et donc aussi DRM en x et y etDPQ.
A
partir
de la notion de fonction réelle totalementpositive
d’ordre 2 en x eten y
(TP2) [16],
Shaked[19]
propose un ensemble de définitions emboîtées de la8 D. DROUET MARI
dépendance positive
pour deux durées.Appliquée
à la densitéf (x, y),
la définitionTP21
n’est autre queDRV,
Shaked nomme cettedépendance DTP(0,0).
Puis il définit :Shaked montre les
implications
suivantes :Shaked démontre des
propriétés caractéristiques
de certaines de cesdépen-
dances
positives.
Enparticulier :
- la
dépendance DTP(0, 1)
estéquivalente
à la décroissance durisque
conditionnel
h2/1 (x, y)
=h(y/X
=x) selon x,
- la
dépendance DTP(1, 1)
à la décroissance durisque h2(x, y)
=h(ylx
>x)
selon x et aussi durisque hl (x, y)
=h(x/Y
>y)
selon y,- la
dépendance DTP(1,2)
estéquivalente
à la croissance en x del’espérance
de vie restante conditionnelle
m(y/X
>x)
=E(Y - y/Y >
y, X >x).
4. Les indices locaux de
dépendance
4.1
L’espérance
de vie restante conditionnelleA
partir
de la notiond’espérance
de vie restantem(y)
=E(YjY
>y) -
y Anderson et al[ 1 ]
considère un indicenormalisé,
mais nonsymétrique
pourexprimer
la
dépendance :
Cet indice est utilisé par les
démographes,
pourétudier,
parexemple,
le lien entreles durées de vie de deux personnes
apparentées.
Si X et Y sontindépendantes
alors03A6 vaut un. Plus les variables X et Y sont
liées, plus 03A6(x, y)
estgrand.
A y constant q> devrait croître avec x : cette dernière condition estéquivalente
à ladépendance DT P(l, 2).
l
f (x, y)
est TP2 en x et y, sif (x, y) >
Ove, Vy et f remplit la condition DRV4.2 Le
rapport
desprobabilités
de survieAnderson et al. utilise un deuxième indice :
SI
et82
étant les surviesmarginales. 03A8
vaut un si(X, Y)
sontindépendantes.
Lacondition BII > 1
correspond
à la définition deDPQ. Or,
onpeut
aussi écrire :B[1 (x, y)
=S(y/X > x) S2(y). Quand x vaut zéro, B[1
vaut un. Si la liaison est positive,
’Q (x, y)
nepeut
donc décroître selon x : cetteproprieté (RT7 :
queue à droitecroissante)
est mentionnée par Lehmann comme intermédiaire entreDPQ
et DRM.4.3 Le
rapport
de covariance conditionnelle’Q ne traduit pas très finement l’évolution de la
dépendance
au cours dutemps.
A sa
place
Dabrowska et al.[5] propose
d’utiliserl(x, y) :
D’après l’équation 2, l(x, y) - -DID2L
=-Dlh2 == -D2hl.
Si X et Ysont
indépendantes,
lerisque
conditionnelh2
nedépend
pas de x et donc sa dérivée parrapport
à x est nulle. Doncl’indépendance
entre X et Y se traduit par1 (x, y) -
0.Si X et Y sont liées
positivement
alorsl (x, y)
estpositive, donc - Dl h2
>0,
donch2
décroît selon x, cequi équivaut
à ladépendance DT’P(1,1) (S
estTP2).
4.4 Le
rapport
desrisques
conditionnelsClayton [3], puis
Oakes[ 18]
pour étudier ladépendance
entre les deux duréesutilisent le
rapport
c’est-à-dire :
Si X et Y sont
indépendants,
alors :ho
étant lerisque marginal
de Y et leurrapport
Q = 1. Si X et Y sont en associationpositive
alors 8 estplus grand
que un. Contrairement aux deuxrisques
conditionnels10 D. DROUET MARI
0 est
symétrique
en x et y.Remarquons
que e est relié à1,
eneffet, d’après
leséquations
6 et 7 :4.4.1 La condition «8 > 1 »
Cette condition est
équivalente
à S estTP2;
en effet 8 > 1 estéquivalent
àh2/1 - h2
>0,
cequi d’après l’équation (3) équivaut
àD2 h1
0puisque hl
> 0(de
faconsymétrique
on a aussiDi h2 0) ;
ceciéquivaut
alors à S est TP2.D’après l’équation 8,
« O > 1 »équivaut
aussi à «l > 0».4.4.2 La décroissance de 8 selon x
La notion de
dépendance positive
associée à «6 > 1 » est une notion assezsommaire. Une notion
plus
fine est«6 B
1+quand x --->
oo»(resp
y --too) [4].
Eneffet,
auvoisinage
de{X
=0}, h2
estégal
aurisque marginal ho :
Xn’ apporte
aucuneinformation sur
Y, h2/1
est luiprobablement
trèsgrand
si la liaison estpositive.
8 estdonc
grand
aussi.Lorsque x augmente,
les informationsapportées
par les évènements{X = x} et {X > x}
tendent à deveniréquivalentes,
et donc lerapport
0 tend versun par valeurs
supérieures.
Exemple : X = A + B et Y = A + C,
avecA, B,
Cindépendantes
et de mêmeloi
03B3(1,1).
Dans ce cas :Donc,
Q décroîtde |y| +1 |y|.
vers unq uand x
tend vers l’infiniquelque
soit y.A
quelle
notion dedépendance peut
on associer la condition de décroissancevers un de 0 selon x ? Elle
implique, puisque d’après 4.4.1, h2
est une fonctiondécroissante de x, que
h2/1 - h2
décroît vers zéro par valeurspositives.
Ceciimplique d’après l’équation
3 que :Ce
qui correspond
àhl
estTP2,
en utilisant une caractérisation des fonctions TP2d’après
Karlin[16]
Puisque h2/1 - h2
décroît selon x, ainsi queh2,
alors nécessairementh2/1
décroît
aussi,
sinon 6 nepourrait
décroître. Or la condition«h2/1 B» selon x
estéquivalente
à unedépendance DTP(O, 1)
pour lecouple (X, Y).
Donc la condition8 décroît selon x par valeurs
positives
estplus
forte que la conditionDTP(O, 1),
cependant
on nepeut
pas l’ordonner parrapport
àDTP(O, 0) :
nous la noteronsDTPL(0,1).
5. Lien
indices/dépendances
* : propriété
caractéristique d’une fonction TP2.* * : cette condition est nécessaire, mais non suffisante pour que 0 décroisse selon x.
Les
types
dedépendance
sont ordonnées de lapremière
à la dernièreligne
du tableau
(sauf
les deuxdernières,
et saufDT P ( 1, 2)
etRTV).
La condition de décroissance sur 6implique
donc les conditions sur tous les autres indices.Donc,
si l’onpeut
prouver la décroissance de 6 selon x(ou
selony)
ou sa croissance selonS,
alors il n’est pas nécessaire d’étudier les autres indices pour prouver la
dépendance positive.
6.
Exemples :
trois distributions archimédiennes 6.1 Letype de dépendance
Les distributions archimédiennes
désignent
un ensemble de distributions bi- variées dont la fonction de survie Ss’expriment
en fonction des margesSI
etS2
sousla forme :
où p est une fonction
positive
ounulle, décroissante,
vérifiantp(0)
=1,
etayant
une dérivée secondepositive
ounulle, q
étant la fonction inverse de p. Ladépendance s’exprime,
engénéral,
par unparamètre réel,
dont les variationspermettent
d’obtenirtous les
degrés
dedépendance,
del’indépendance
à ladépendance
maximale(borne
supérieure
de Fréchet[8])
12 D. DRO UET MARI
Oakes
[18]
a montré que l’onpouvait
caractériser ces distributions par le fait que 19s’exprime
comme une fonction deS (x, y).
où
g et q"
étant les deuxpremières
dérivées de q.Etudions trois de ces distributions
qui
illustrent les notions dedépendance précoce, tardive,
etmédiane,
et cherchonsquels
sont les indicesqui
rendentcompte
le mieux de cesdépendances.
1)
Le modèle deClayton :
Dans ce modèle
(qui porte
aussi le nom de «Cook etJohnson») :
D’où:
Le
rapport
e des deux fonctions derisques
conditionnels est constant etégal
àcv. Cette
propriété
estcaractéristique
de ce modèle. Cette famille ne vérifie donc pas laproprieté
4.4.2.Cependant
ici :D’où :
D’où :
Quand x augmente, 61 diminue, l’expression
entre crochetaugmente,
donc son inversediminue,
maisD2S2
étantnégatif, D2hl augmente,
cequi
prouve quehl
estTP2
[16].
Cette famille est aussi DRV
(cf.
annexeB).
Lafigure
1-a montre que la densité est concentrée pour les valeurs élevées de x et y.2)
Le modèle deHougaard [ 14] :
On retrouve une famille de distributions aux valeurs extrêmes
proposée
parGumbel
[ 12] .
Dans ce modèle0 tend donc vers un, par valeurs
supérieures quand
S tend vers zéro. Ceciimplique
alors que
hl
est TP2. Comme pour la famille deClayton,
on montre(cf.
annexeC)
que cette famille est DRV. La
figure
1-b illustre ladépendance précoce.
FIGURE 1
densités avec marges
uniformes
et T =0.243, a)
modèle deClayton, b)
modèle deHougaard
3)
le modèle de Frank[7] :
Cette famille a été étudiée en détail par Genest
[9], qui
montre notammentqu’elle
est DRV. Lerapport 0398*(s) = -s.ln(03B3).(1 - 03B3s)-1
décroît deln(03B3) 03B3-1
versun S décroît de un à zéro. La densité est
symétrique
parrapport
aux droites x = y et x = 1 - y. On voit(figure 2)
que la liaison entre X et Y est laplus
forte pour les valeurs médianes de X et Y.14 D. DROUET MARI
dessite Frank arec morges aniformes
genme=,FIGURE 2
Densité modèle de
Frank,
T =0.243,
et margesuniformes
6.2 Evolution des indices
6.2.1 Le rapport 8
La
figure
3représente
l’évolution de 6 en fonction de S pour une même valeur du T de Kendall(T
=0.243),
pour les troisfamilles,
avec les mêmes marges uniformes dans les trois cas.- Pour les valeurs de S élevées
(S
>0.75),
c’est-à-dire au début de l’évolution selon letemps
8 est leplus grand
pour la famille deHougaard, exprimant
ladépendance précoce.
- Pour les valeurs de S inférieures à
0.5,
lerapport
6 est leplus
élevé pour la famille deClayton, exprimant
le fait que la connaissance du décès de l’un des membres ducouple (X, Y), augmente
encorebeaucoup
lerisque
de décès de l’autre membre : il y a donc unedépendance
tardive.- Pour les valeurs
intermédiaires,
c’est dans la famille de Frank que lerapport
6 est leplus élevé,
onparlera
donc dedépendance
médiane.- Pour les valeurs très faibles de S
(S 0.1),
lerapport
Q est voisin de un pour les familles de Frank etHougaard :
la connaissance du décès de l’un des membres ducouple (X, Y) n’apporte plus
d’information sur lerisque
de décès de l’autre membre dans ces deux famillesFIGURE 3
Evolution de 0398 selon S pour les trois
familles,
T = 0.243 et margesuniformes
6.2.2 Evolution de
03A6(x, x)
L’espérance
de vie restantepeut
se calculerpar([6]
etal.,
page24) :
On obtient donc
pour 03A6 :
On a
représenté
ici les variationsde 03A6(x, x),
ensupposant
encore les marges uniformes pour les troisfamilles,
et pour la même valeur der(0.243).
16 D. DROUET MARI
On a vu au
paragraphe
4.1que 03A6(x, y)
est croissant en xquelque
soit y, dès que ladépendance
estDTP(1,2).
Enrevanche,
rien ne prouve que03A6(x, x)
soit croissanten x, parce
que 03A6(x, y)
n’est passymétrique
en x et en y.Dans la famille de
Frank,
cette fonction est, à cause des margesidentiques
et àcause des
symétries
de la densité(par rapport à x = y et à x = 1 - y) symétrique
par
rapport
à la droite x =1/2.
Donc pour cette famille03A6(x, x)
décroît àpartir
dela date médiane : au delà de cette
date,
la connaissance de l’événement{X
>x},
nemodifie
plus beaucoup l’espérance
de vie restante pourY,
et donc le numérateur et le dénominateur de 03A6 tendent à devenirégaux.
Cette situationparaît
assez naturelle.Cependant,
ce n’est pas cequ’on
observe pour les deux autresfamilles,
où03A6(x, x)
esttoujours
croissant.L’opposition précoce/tardif
que l’on avait observé avec 8 pour ces deux famillesn’apparaît
pasici,
si ce n’est par lapente
de03A6, beaucoup plus
élevée dans le cas de la famille deClayton.
6.2.3
Evolution de W (x, x)
On a vu, dans le
paragraphe
4.2que 03A8(x, y)
est croissant en xquelque
soit y, dès que ladépendance
est RTI. Mais 03A8 estsymétrique lorsqu’on échange x
et y.Donc 03A8(x, x)
est croissant en x. C’est bien cequ’on
observe pour les trois familles.On verra au
paragraphe suivant,
que, pour la famille deClayton, IF (x, x)
tend versl’infini
lorsque
x tend vers sa valeursupérieure.
Si les marges sont
uniformes,
lacomparaison
des trois03A8(x, x),
revient à celles des trois fonctions de survie. Ladépendance,
tardive dans le cas de la famille deClayton, précoce
dans le cas deHougaard,et
médiane dans le cas de Frankimplique
que :
SC(x,x)
>SF(x,x)
>SH (X, x)
(où SC,SF
etSH désignent
les fonctions de survie deClayton, Hougaard
etFrank)
à
partir
d’une certaine date x. C’est bien cequ’on
observe sur legraphique
àpartir
de x =
0.6,
mais l’examen seulde W (x, x),
nepermettrait
pas en retour d’en déduire letype
dedépendance.
7. Illustration
Les données suivantes concernent 109
patientes soignées
par deux chimiothéra-pies
successives AV et CMF pour un cancer du sein[13].
Les malades recoivent d’abord AVpendant
huitcycles
ou moins si l’intolérance survient ou si la maladie aprogressé.
Puis elles recoivent CMF pour un total de sixcycles,
ou moins pour les mêmes raisons. Si le traitement estinterrompu
par laprogression
de la maladie oupour des raison non liées au
traitement,
les données sont censurées.Le tableau
(page 17) présente
les effectifs pourchaque
durée de tolérance auxdeux
produits.
Il y aquatre
nombres selon que les duréescorrespondent
ou non à descensures : en haut à
gauche
pour les données noncensurées,
en haut à droite pour des données censurées enT2 uniquement,
en bas àgauche
pour des données censuréesen
Tl uniquement,
et en bas àdroite,
pour les doubles censures.FIGURE 4
Evolution de
03A6(x, x) et 03A8(x, x)
pour lestrois familles,T
= 0.243 et margesuniformes
18 D. DROUET MARI
Afin de savoir si les durées de tolérance aux deux
produits
sontliées,
on calculeles valeurs des trois indices
0398, 03A6
et 03A8 dans les 25 cases du tableau où c’estpossible.
Parce que les données
correspondent
à deux événements successifs pour un mêmeindividu,
avec desphénomènes
de censuredifférents,
la fonction de survie bivariée est difficile à estimer de facon cohérente.Hanley et
al.[13]
propose une estimation itérative en utilisant unalgorithme
EM. Le tableau suivantrappelle
lesprobabilités qu’il
a obtenues.A
partir
de cesprobabilités,
on estime lesS(i, j)
par la somme desprobabilités
dans l’intervalle u
i, 6 ~
X ;nj, 6
~, lesS(j)
par03A3pk,
ondésigne
paret de même pour
D2S(i, j).
On estime alors 8 par :et 03A8 par :
On estime
l’espérance
de vie restante conditionnelle par :et de
façon analogue j.
On estime alors (D par :Les trois
paramètres
ont dans chacune desvingt-cinq
cases des estimationslégèrememt plus grandes
que un montrant ladépendance
entre les durées. Lerapport
03A8(i, i)
est bien croissant avec i. Mais il est difficile d’affirmer que 8 croît avecS,
ou que03A6(z, i)
croît avec i.FIGURE 5
a : Evolution de
log (Theta)
selonS, b : ’W (i, i) (ligne supérieure) et -b (i, i)
selon i8. Discussion
Le
rapport
0 a différentesinterprétations,
Oakes[18]
montre notamment queE) - 1
est une version conditionnelle du r de Kendall. Plusprécisément
si l’ondispose
d’un échantillon de la distribution bivariée :
et si l’on définit la concordance
(resp
ladiscordance)
d’unepaire (Ti, Ti,)
par :(Xi - Xi’)(Yi - Yi’)
0(resp 0)
alors :20 D. DROUET MARI
0 mesure donc la
dépendance
restante au delà de(x, y).
En cas dedépendance positive
ce
rapport
estplus grand
que un.Tant que le moment de
dépendance
maximale n’a pas eulieu,
ce rapport doit resterpratiquement
constant,puis
baisserrapidement juste après.
Ceci est illustrépar le
comportement
des trois familles que l’on vient d’étudier. Dans la famille deClayton,le rapport
8 est constant : lerapport
des nombres depaires
concordantes et discordantes ne varie pas au cours dutemps,
on est donc dans le cas d’unedépendance
tardive. Le cas de la famille de
Hougaard
est inverse : lerapport
6 décroît de l’infini à unquand
la fonction de survie S décroît de un à zéro : on est donc dans le cas d’unedépendance précoce.
La famille de Frank estintermédiaire,
avec unrapport
6qui
décroît d’une valeur finie
ln(03B3) 03B3-1 (0
03B31)
à un dans les mêmes conditions.Le modèle de
Clayton (à
cause de sa définition comme modèle defragilité gamma)
est souvent choisi pourajuster
une distribution bivariée à cause de laplus grande «simplicité»
descalculs,
enparticulier lorsqu’il s’agit
de maximiserla vraisemblance. Il
paraît plus judicieux
de choisir la famille dedistributions,
c’est- à-dire letype
dedépendance après
un examen de l’évolution de Q : Oakes[18]
enpropose une estimation
après discrétisation;
on peut aussi utiliser les estimations nonparamétriques
deh, hl
eth2
de Dabrowska et al.[5]
pour estimer 6.8.1 Lien avec les notions de «upper tail
dependence »
et «lower taildependence » de joe [151
Les familles de
Clayton, Hougaard
et Frank sont des casparticuliers
decopules,
c’est-à-dire ont la
propriété
que :où la fonction C :
[0,1]2 ~ [0,1]
et oùSi
etS2
sont les fonctions de surviemarginales.
Joe
[15]
définit la notion de «upper taildependence»
comme la limite 8 si elle existe deC(u, u) u lorsque u
tend vers zéro(par
valeurssupérieures ) ;
si U et V sontdes variables aléatoires uniformes sur
[0, 1],
alors :Si
C’ désigne
lacopule
associée à la fonction derépartition correspondant
àS,
c’est-à-dire :
alors,
Joe définit la «lower taildependence»
par :r
s’interprète
alors comme la limite dePr(U
>u/V
>u) quand u
tend vers un.On voit que ces deux notions sont très
proches
des notions dedépendance
tardive et
précoce
définies àpartir
de 0. Enparticulier
pour la famille deClayton,
à ladépendance
tardivecorrespond
une valeur de 8 nonnulle, 03B4 = 2-1/(03B1-1), en
revanche03B3 = 0. Pour la famille de
Hougaard,
ladépendance précoce
se traduit par, = 2 - 2a etpar 8
= 0. Pour la famille de Frank ces deux limites sontnulles, exprimant
le faitqu’il n’y
a nidépendance précoce,
nidépendance
tardive. Les indices 03A8 et 8 sont liés. Si lecouple (X, Y)
défini sur[0,1]2
a des marges uniformesSI (x) =
1 - x,S2 (y)
=1 - y alors :
Dans le cas de la famille de
Clayton,
on voitque 03A8
tend versl’infini, quand x
tend vers un,
puisque 8
est non nul.Remerciements
Merci à Michel Bonneu et Evans Gouno pour leurs
commentaires,
ainsiqu’à
Pierre Cazes et aux relecteurs de la R.S.A.Références
[1] ANDERSON J.E.,
LOUIST.A.,
HOLMN.V.,
HARVALDB.,Time-dependent
association
measures for
bivariate survivaldistributions , JASA,
Vol. 87n°419, 641-650, 1992
[2] CAPERAÀ
P. GENESTC., Concepts
dedépendance
et ordresstochastiques
pour des lois
bidimensionelles,
The Canadian Journal ofStatistics, 18,
315-326, 1990.
[3]
CLAYTOND.,
CUZICKJ.,
Multivariategeneralizations of
theproportional
hazards
model,
J.R. Statist. Soc.A, 148,
Part2, 82-117,
1985.[4]
DROUET MARID.,
PETIOTJ.F.,
Etude de la liaison entre deux durèes par le modèle deCox,
Bulletin de l’Institut International de laStatistique,
50esession,
livre
1, 294-295,
1995.[5]
DABROWSKAAD.M.,
DUFYD.L.,
ZHANGD.Z.,
Hazard anddensity
estima-tion from
bivariate censoreddata, Nonparametric
Statist.(in press),
1997.[6]
DROESBEKEJ.J.,
FICHETB.,
TASSIP., Analyse statistique
des durées de vie,Economica, 1989
[7]
FRANKM.J.,
On the simultaneousassociativity of F(x, y)
and x + y -F(x, y), Aequationes Math., 19,194-226,
1979.[8]
FRECHETM.,
Sur les tableaux de corrélation dont les marges sontdonnées,
Annales de l’Université deLyon,
SecA,
Ser3, 14, 53-77,
1951.[9]
GENESTC., Frank’sfamily of bivariate distributions, Biometrika, 74, 3, 549-555,
1987.22 D. DROUET MARI
[10]
GENESTC.,
GHOUDIK.,
RIVESTL.P.,
Asemi-parametric
estimation proce- dureof dependence
parameters in multivariatefamilies of distributions,
Bio-metrika, 82, 3, 543-552,
1995.[11]
GENESTC.,
MACKAYR.J., Copules
archimédiennes etfamilles
de loisbidimensionelles dont les marges sont
données,
the Canadian Journal ofStatistics,
Vol.14, 2, 145-149,
1986.[12]
GUMBEL E.J.,
Bivariateexponential distributions, JASA, 55, 698-707,1960.
[13]
HANLEY J.H.,
PARNESM.N.,
Nonparametric
estimationof
a multivariate distribution in the presenceof censoring, Biometrics, 39, 129-139,1983.
[14]
HOUGAARDP.,
A classof multivariate failure
timedistributions, Biometrika, 73, 671-678, 1986.
[15]
JOEH.,
Parametric Familiesof Mutivariate
Distributions withgiven margins,
Journal of Multivariate
Analysis, 46, 262-282,
1993[16]
KARLINS.,
Totalpositivity,
StanfordUniversity Press, 1968
[ 17]
LEHMANNE.L.,
Some conceptsof dependence,
Annals of MathematicalStatistics, 37, 1137-1153,
1966[18]
OAKESD.,
Bivariate survival models inducedby frailties, JASA, 84, 406,
487-493, 1989.
[ 19]
SHAKEDM.,A family of
conceptsof dependence for
bivariatedistributions, JASA, 72, 359, 642-650,
1977.A. Annexe :
copule
archimédienne etdépendance
DRVMontrons
qu’une copule
archimédienneS(x,y) = (p(q(S1(x)
+q (S2 (y»,
qétant la fonction inverse de p et telle que p a une dérivée
troisième,
est DRV si et seulementsi,
En effet : Soit
v (x, y) = q(Sl(x))
+q(S2(y))
Alors,
La fonction p étant
décroissante,
avec une dérivée secondepositive,
il en est demême de q, donc :
q’(v)
0 etq" (v)
> 0a) v
est une fonction croissante de x. Eneffet, quand x croît, SI (x) décroît,
donc
q(Sl (x)) croît,
ainsi que v.b)
Sif
est la densité associée àS,
alors laproprieté
DRV estéquivalente
àD2 f / f
est une fonction croissante de x[16] :
cette dernière condition estéquivalente
à (12).
En effet:Le deuxième et le troisième terme du membre de droite de
(14)
nedépendent
pas de x. Il suffit donc d’étudier le
premier
terme.Or, q’(S2)
estnégatif
ainsi queD2 S2,
leurproduit
est doncpositif.
La croissance deD2f/f
selon xéquivaut
donc àla croissance de
p’’’(v) p’’(v)
selon x, or v est une fonction croissante de x, d’où la condition annoncée.B. Annexe : la famille de
Clayton
est DRVLa famille de
Clayton
vérifie la condition. Eneffet,
pour cette famille :D’où:
Quand v
croît1/(v
+1) décroît, (1 - a)
estnégatif
car a estplus grand
que un, d’où la croissance dep’’’(v)/p’’(v)
selon v, et donc lapropriété
DRV.24 D. DROUET MARI
C. Annexe : la famille de
Hougaard
vérifie la condition DRV La famille deHougaard
vérifie aussi la condition. En effet ici :D’où: