• Aucun résultat trouvé

2.3 Pr´ esentation du cas d’´ etude

2.3.4 Statistiques sur la dur´ ee avant effet

Dans cette section, ainsi qu’au Chapitre 3, la base de donn´ees ´etudi´ee concerne les contrats dont la date d’acquisition est ant´erieure au 15 janvier 2016. Elle est donc sensiblement diff´erente de la base utilis´ee `a la section pr´ec´edente et au Chapitre 4, o`u seuls les con- trats prenant effet avant le 15 janvier 2016 ´etaient consid´er´es. Finalement, la base de donn´ees ´etudi´ee ici contient 224 897 observations, en prenant en compte le fait que la date d’acquisition n’est pas renseign´ee pour certains contrats.

L’impact de la saisonnalit´e des prises d’effet de contrats

La Fig. 2.10 repr´esente le nombre de prises d’effet de contrats par jour tout le long de la fenˆetre d’´etude. Comme pour les r´esiliations, les prises d’effet de contrats se concentrent en certains jours de l’ann´ee ; environ 37% des contrats prennent effet un 1er janvier. La majorit´e des autres prises d’effet ont lieu le premier jour d’un mois autre que janvier, ou moins souvent le 15e jour du mois.

Nous appelons dur´ee avant effet d’un contrat la dur´ee qui s´epare la date de souscription du contrat et la date de prise d’effet du contrat. Le taux de censure de la dur´ee avant effet, qui correspond `a la proportion de contrats qui prennent effet apr`es le 15 janvier 2016, est de 1.7% dans les donn´ees ´etudi´ees. Cette proportion est faible ´etant donn´e que la dur´ee avant effet n’exc`ede pas un mois en g´en´eral et que la majorit´e des contrats pr´esents dans la base ont plus d’un an d’anciennet´e. Elle serait plus importante si nous avions choisi une date de fin d’observation ant´erieure au 1er janvier 2016. Sur la Fig. 2.11, nous avons repr´esent´e la fonction de survie de la dur´ee avant effet et de la dur´ee de r´esiliation d’un contrat selon que la prise d’effet du contrat se produit un 1er janvier ou bien un autre jour de l’ann´ee. On observe une diff´erence nette entre les deux fonctions de survie, qui s’explique par le fait que les contrats qui prennent effet le 1er janvier ont le plus souvent ´et´e conclus de mani`ere anticip´ee, alors que ce n’est pas le cas pour les contrats qui prennent effet `a une autre date. Remarquons que la valeur m´ediane pour la

Fig. 2.8: Estimateur de Kaplan-Meier de la fonction de survie de la dur´ee de r´esiliation pour chaque modalit´e.

Fig. 2.9: Estimateur de Kaplan-Meier de la fonction de survie de la dur´ee de r´esiliation par ann´ee de prise d’effet.

Fig. 2.10: Nombre de prises d’effet par jour.

dur´ee avant effet est de 98 jours en cas de prise d’effet le 1er janvier, et de 8 jours en cas de prise d’effet un autre jour de l’ann´ee.

Pour l’´etude men´ee au Chapitre 3, qui porte sur la mesure de la d´ependance entre la dur´ee avant effet et la dur´ee de r´esiliation d’un contrat, ainsi que pour les statistiques de- scriptives pr´esent´ees dans la section suivante, nous avons choisi de consid´erer uniquement

Fig. 2.11: En haut : Fonctions de survie de la dur´ee avant effet pour les contrats qui prennent effet le 1er janvier, et les autres. En bas : mˆeme chose mais pour la dur´ee de r´esiliation

les contrats qui prennent effet le 1er janvier. En effet, les ph´enom`enes observ´es sont plus importants sur cette partie de la base de donn´ees.

L’impact des variables explicatives sur la dur´ee avant effet

Comme pour la dur´ee de r´esiliation, les variables explicatives peuvent avoir un impact sur la fonction de survie de la dur´ee avant effet. La Fig. 2.12 donne les diff´erentes fonctions

de survie obtenues pour chaque modalit´e. Notons que, comme nous l’avons signal´e dans

la section pr´ec´edente, nous consid´erons ici seulement les contrats qui prennent effet un 1er janvier. On observe que la dur´ee avant effet est r´eduite pour les assur´es jeunes, de moins de 30 ans, dont une partie sont des ´etudiants. De plus, les contrats haut de gamme pr´esentent une dur´ee avant effet l´eg`erement plus longue. Sur la Fig. 2.13 on a une nouvelle fois repr´esent´e l’effet des variables explicatives sur la dur´ee de r´esiliation, mais en consid´erant ici seulement les contrats qui ont pris effet un 1er janvier.

Au Chapitre 3, nous pr´esentons une m´ethode statistique bas´ee sur l’utilisation des copules qui permet d’´etudier la d´ependance conditionnelle entre la dur´ee avant effet et la dur´ee de r´esiliation, et plus g´en´eralement entre deux dur´ees successives potentiellement censur´ees `a droite. La d´ependance est ´etudi´ee conditionnellement `a l’ˆage de l’assur´e. Remarquons que pour le besoin des repr´esentations graphiques dans ce chapitre, la vari- able ˆAge de l’assur´e a ´et´e d´ecoup´ee en plusieurs modalit´es. Toutefois nous disposons de l’information compl`ete (continue) concernant l’ˆage des assur´es, dont la densit´e est repr´esent´ee `a la Fig. 2.14. L’information sur l’ˆage de l’assur´e est donc trait´ee comme variable continue au Chapitre 3.

Fig. 2.12: Estimateur de Kaplan-Meier de la fonction de survie de la dur´ee avant effet pour chaque modalit´e. Base des contrats prenant effet le 1er janvier.

Fig. 2.13: Estimateur de Kaplan-Meier de la fonction de survie de la dur´ee de r´esiliation pour chaque modalit´e. Base des contrats prenant effet le 1er janvier.

Fig. 2.14: Estimateur `a noyau de la densit´e de la variable ˆAge de l’assur´e, pour les contrats qui prennent effet le 1er janvier, et les autres.

A nonparametric conditional copula

model for successive duration times,

with application to insurance

subscription

We consider two dependent random times T and U, that correspond to two successive events. This setting is motivated by an application to insurance subscription, where a potential dependence exists between a time before effectiveness of the contract T, and a time U before its termination by the policyholder. The setting also extends to various types of applications involving two duration variables with some hierarchical link between the events. Indeed, since a contract can be terminated only after it becomes effective, data are subject to a particular type of censoring, where the variable U is systematically censored when the variable T is. In this framework, a nonparametric conditional copula model is considered, in the spirit of Gijbels et al. (2011). The uniform consistency of the conditional association parameter is obtained under conditions of dependence structure and of censoring mechanism. A simulation study and a real data application show the practical behavior of the method.

3.1

Introduction

In this paper, we consider the estimation of a conditional copula function of a couple of duration variables, in a framework where the two durations are observed successively. In

numerous practical situations, one can be interested in the occurrence of two events that happen in a time succession. The example we have in mind comes from the study of the termination of insurance contracts. From the subscription, the owner may have some random delay T before the contract to be effective, while the termination of the contract occurs at a time T + U, with U ≥ 0. Similar situations occur in biostatistics, where T can be an infection time and U the time before the individual is cured (see for example Wang & Wells (1998), and Meira-Machado et al. (2016) for a detailed review of the applications and techniques in this field). This paper aims to study the dependence structure between

two such times T and U, in presence of covariates X ∈ Rd that may impact the joint

distribution.

Copula theory is a quite popular way to deal with dependence, due to Sklar’s Theorem Sklar (1959) which states that the joint distribution function F (t, u) = P(T ≤ t, U ≤ u) of a bivariate vector (T, U ) can be written as

F (t, u) = C(FT(t), FU(u)),

where FT(t) = P(T ≤ t), FU(u) = P(U ≤ u), and C is a copula function (that is a

distribution function over [0, 1]2 with uniform margins), this decomposition being unique

when the margins are continuous. Hence Sklar’s Theorem ensures a separation between the marginal behaviors of T and U (defined by FT and FU), and the dependence structure,

entirely contained in the function C. Conditional copulas are required when one focus on the influence of covariates X on this dependence structure (see e.g. Gijbels et al. (2011), Veraverbeke et al. (2011), Derumigny & Fermanian (2017)).

When dealing with duration variables, a supplementary difficulty is caused by the censoring phenomenon. In the situation we describe, a unique censoring variable C is involved, representing the time before the end of the statistical study. Indeed, if C < T + U, the policyholder did not stay under observation long enough to observe the whole phenomenon we are interested in. Copulas under censoring have been studied, for instance by Lakhal-Chaieb (2010), Gribkova & Lopez (2015) and Geerdens et al. (2018). In this paper, we correct the effects of the censoring by using appropriate weights that allow our conditional copula estimator to be asymptotically consistent.

The rest of the paper is organized as follows. In Section 3.2, we define the observations and the methodology to estimate conditional copulas under censoring. Then, the Section 3.3 is devoted to the presentation of asymptotic results while we investigate the finite sample behavior of the procedure in a simulation study and a real data analysis, presented

in Section 3.4. Technical arguments are presented in the Appendix section.

Documents relatifs