Mémoire d'actuariat

(1)

Mémoire présenté devant le jury de l’EURIA en vue de l’obtention du Diplôme d’Actuaire EURIA

et de l’admission à l’Institut des Actuaires le 15 décembre 2020

Par : Bryan Gautier

Titre : Développement d’un algorithme individualisé pour le provisionnement en assurance non-vie : la méthode ASICR

Confidentialité : Non

Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus

Membre présent du jury de l’Institut des Actuaires :

Dominique ABGRALL Signature :

Florence PICARD Signature :

Sonia GUELOU Signature :

Hélène GIBELLO Signature :

Entreprise : Addactis France Signature :

Membres présents du jury de l’EURIA : Franck VERMET

Directeur de mémoire en entreprise : Thomas LALLEMENT

Signature :

Invité : Signature :

Autorisation de publication et de mise en ligne sur un site de diffusion de documents actuariels

(après expiration de l’éventuel délai de confidentialité) Signature du responsable entreprise : Signature du candidat :

EURIA 6, avenue le Gorgeu T +33 (0)2 98 01 66 55

EURo Institut CS 93837 [email protected]

d’Actuariat 29238 Brest Cedex 3

(2)

(3)

Remerciements

Je tiens à remercier en premier lieu Thomas LALLEMENT, mon tuteur pendant mes deux stages au sein du cabinet Addactis. Thomas s’est toujours tenu disponible pour moi, ses conseils, son expérience et son soutien m’ont beaucoup apporté lors de la réalisation de mes travaux.

Je remercie également tous les membres de l’équipe Properties and Casualties pour leur accueil et leur contribution pendant mon stage. Et particulièrement Benjamin POU- DRET, responsable de l’équipe, et Romain BOYER-CHAMMARD, senior manager, pour la confiance qu’ils m’ont accordé à travers différentes missions et leurs conseils pour la rédaction de ce mémoire.

J’aimerai aussi remercier tous mes nouveaux collègues pour les bons moments par- tagés avec eux, aussi bien dans le travail que lors d’autres discussions autour d’un café, virtuel ou non. Je tiens en particulier à citer la collègue suivante, qui a contribué à la bonne rédaction de ce mémoire par son soutien et ses conseils : Élise SANTORO.

Merci également à Franck VERMET et toute l’équipe de l’EURIA, qui m’a appris toutes les connaissances actuarielles dont j’ai eu besoin pour réaliser mes travaux, et pour l’ouverture vers le monde de l’assurance.

Merci à Rémi GRABOWSKI, mon tuteur EURIA, pour son suivi et ses conseils lors de la rédaction de ce rapport et de mon mémoire.

Enfin, merci également à toute l’équipe pédagogique de l’INSA Rennes, et en particulier à James LEDOUX, qui m’ont appris la rigueur nécessaire à tout bon Data Scientist et m’ont permis de découvrir et d’intégrer le monde de l’actuariat.

i

(4)

(5)

Glossaire

— IARD : Incendies Accidents et Risques Divers.

— Non-vie : branche légale d’assurance contenant principalement les risques IARD et santé.

— ASTIN :Actuariat STudies In Non-life insurrance.

— Attritionnels : les sinistres dits attritionnels sont les sinistres inférieurs à un certain montant défini par l’entreprise d’assurance.

— Larges : à l’inverse, les sinistres dits larges sont les sinistres supérieurs à un certain montant défini par l’entreprise d’assurance.

— Provisionnement : processus obligatoire ayant pour objectif l’évaluation des provisions techniques relatives aux engagements futurs de l’entreprise d’assurance.

— PSAP : Provision pour Sinitres A Payer. Les PSAP sont composées des IBNR et des provisions dossier/dossier.

— IBNR : Incurred But Not Reported. Les IBNR représentent la différence entre la charge évaluée à l’instant du provisionnement et à celle estimée à l’ultime. Les IBNR peuvent être négatifs (boni) ou positifs (mali).

— Provision dossier/dossier : c’est la différence entre l’évaluation de la charge d’un sinistre et le montant déjà payé.

— ICR :Individual Claims Reserving : méthodologie de provisionnement individuel développée au sein du logiciel addactis^R IBNRS^R.

(6)

(7)

Résumé

Développement d’un algorithme individualisé pour le provisionnement en assurance non-vie : la méthode ASICR

De récentes enquêtes menées auprès de différents acteurs du marché ont pu mettre en évidence que les méthodologies de provisionnement agrégées restent privilégiées dans les calculs de provisions en assurance non-vie. Cependant le développement récent des méthodes d’apprentissage, comme le Machine Learning, apportent des visions nouvelles sur la sinistralité axées sur une évaluation plus individualisée de la provision. Ces mé- thodes permettent notamment de mieux valoriser les données à disposition de l’assureur afin de l’aider à définir une politique de gestion des risques adaptée au regard des profils de risque pouvant dégrader sa profitabilité.

Des méthodologies de provisionnement individuel exploitant ces données et des mé- thodes de Data Science ont déjà fait l’objet de publications ou de mémoire, comme par exemple [De Felice et Moriconi, 2019]. Néanmoins ces approches ne parviennent pas à proposer une estimation de la volatilité des provisions.

Avec une vision différente, les méthodologies stochastiques évaluent quant à elle des distributions individuelles des ultimes des sinistres, comme par exemple la méthodologie ICR (Individual Claims Reserving) inspirée de l’article d’[Antonio et Plat, 2012]. Seule- ment ces approchent stochastiques n’exploitent pas autant les données à disposition.

En partant de ce constat, ce mémoire propose une nouvelle méthodologie de provisionnement individuelle, hybride entre ces deux types d’approche, nommée ASICR (Automatic Segmentation for Individual Claims Reserving).

Des résultats sont obtenus sur deux branches aux risques différents : une branche longue (Responsabilité Civile, dommage corporel) et une branche courte (Habitation, incendie). La méthode ASICR est comparée à la méthode ICR et avec la méthode agrégée déterministe Chain Ladder. Ces comparaisons permettent de vérifier l’adaptabilité des chacune des approches sur des risques différents, et de conclure sur leurs avantages et leurs limites respectives.

Mots clefs : Assurance non-vie, Provisionnement, Provisionnement individuelle, Data Science, CART, Link Ratio

(8)

Recent surveys of market players show that aggregated methodologies remain majori- tary in the calculations of non-life insurance reserves. However, the recent development of Machine Learning in actuarial sciences allows the emergence of new visions of claims and show a growing interest in new ways to estimate reserve based on individual assessment.

In particular, these methods make possible to better use the data available in order to better identify the risk profiles that could degrade the profitability of theirs portfolios, and to deduce adapted and cross-functional risk management policy within the company.

Individual reserving methodolgies using this data and Machine Learning methods have already been the subjet of articles and thesis, for example [De Felice et Moriconi, 2019]. However, these approaches fail to provide an estimate of the volatility of reserves.

With a different approach, stochastic methodologies assess individual distributions of claims ultimate, such as the ICR(Individual Claims Reserving) methodology inspired by the article of [Antonio et Plat, 2012]. However, these stochastic methods do not exploit the available data as much as Data Science approaches.

Based on this observation, this thesis proposes a new individual claims reserving methodology, hybrid between these two types of approach, called ASICR (Automatic Segmentation for Individual Claims Reserving).

Results are obtained on two branches with different characteristics : a long-term branch (bodily liability) and a short-term branch (residential fire). The ASICR method is compared with the ICR method and with the deterministic aggregated method Chain Ladder. These comparisons allow to testify the robustness of the approaches on different risks, and to conclude on their respective advantages and limits.

Keywords : Non-life insurrance, Reserving, Individual Reserving, Data Science, CART, Link Ratio

(9)

Synthèse

De récentes enquêtes menées auprès de différents acteurs du marché ont pu mettre en évidence que les méthodologies de provisionnement agrégées restent privilégiées dans les calculs de provisions en assurance non-vie. Cependant le développement récent des méthodes d’apprentissage, comme le Machine Learning, apportent des visions nouvelles sur la sinistralité axées sur une évaluation plus individualisée de la provision. Ces mé- thodes permettent notamment de mieux valoriser les données à disposition de l’assureur afin de l’aider à définir une politique de gestion des risques adaptée au regard des profils de risque pouvant dégrader sa profitabilité.

Des méthodologies de provisionnement individuel exploitant ces données et des mé- thodes de Data Science ont déjà fait l’objet de publications ou de mémoire, comme par exemple [De Felice et Moriconi, 2019]. Néanmoins ces approches ne parviennent pas à proposer une estimation de la volatilité des provisions.

Avec une vision différente, les méthodologies stochastiques évaluent quant à elle des distributions individuelles des ultimes des sinistres, comme par exemple la méthodologie ICR (Individual Claims Reserving) inspirée de l’article d’[Antonio et Plat, 2012]. Seule- ment ces approchent stochastiques n’exploitent pas autant les données à disposition.

En partant de ce constat, ce mémoire propose une nouvelle méthodologie de provisionnement individuelle, hybride entre ces deux types d’approche, nommée ASICR (Automatic Segmentation for Individual Claims Reserving). La méthodologie développée permet une estimation des IBNeR seulement, mais des approches sont à l’étude pour in- tégrer les IBNyR dans le processus et obtenir ainsi une méthodologie de provisionnement complète.

L’ASICR fonctionne en trois temps :

— Élaboration de groupes de sinistres homogènes en duration à partir de leurs variables caractéristiques.

— Déduction du développement futur des sinistres ouverts, indépendante pour chacune des cohortes constituées.

— Introduction d’un Boostrap afin d’obtenir une densité individuelle de chaque ultime.

Cette synthèse présente les résultats obtenus sur une branche courte (Habitation, incendie), et des analyses complémentaires sont disponibles dans ce mémoire sur une une branche longue (Responsabilité Civile, dommage corporel).

(10)

Il est courant au sein d’une même branche d’observer des sinistres aux développe- ments différents. Ces écarts s’expliquent souvent par les caractéristiques du sinistres, c’est pourquoi la méthodologie ASICR souhaite valoriser ces informations dans le processus de provisionnement.

Pour cela il est proposé de segmenter les sinistres selon leurs caractéristiques à l’aide d’outils de Data Science. Une approche par arbre CART ([Breiman et al., 1999]) est retenue car elle permet de créer des groupes de sinistres homogènes sans connaître à priori les groupes à constituer. Les feuilles de l’arbre sont interprétées par la suite comme des cohortes de sinistres pour lesquelles le provisionnement est réalisé de façon personnalisée.

La variable cible de l’arbre CART est la duration du sinistre. Ce critère permet d’obtenir des segmentations aux durations homogènes, et donc de durée de développement similaire. Cette homogénéité est importante pour l’étape suivante, lors de l’estimation individuelle des développements futurs.

Les arbres sont calibrés à partir de la base des sinistres clos, afin de segmenter les sinistres ouverts à provisionner. Toutes variables descriptives du sinistre peut être utili- sées : le produit impacté, le délais de déclaration, des informations sur les circonstances du sinistre, etc.

L’application sur une branche incendie sur les sinistres larges donnent les résultats suivants. L’arbre constitue ainsi quatre cohortes aux développements différents, en fonction de la cause de l’incendie et des différents délais inhérents aux dossiers.

Figure 1 – Segmentation par arbre CART - Habitation Incendie

(11)

Cela permet alors de classer les différents dossiers ouverts dans la cohorte à laquelle ils appartiennent. Le numéro de groupe correspond ici au numéro du nœud de l’arbre, qui sont attribués de haut en bas puis de gauche à droite.

Figure2 – Attribution des dossiers ouverts aux cohortes - Habitation Incendie Il est alors possible de vérifier la pertinence de ces cohortes en analysant les développe- ments des sinistres de façon agrégée. Cela permet une comparaison avec l’approche Chain Ladder, et également d’aider l’interprétation de cette méthode agrégée. Sur le schéma ci-dessous, les coefficients de développements obtenus par Chain Ladder (en bleu) et pour chacune des cohortes sont affichées. Si certaines cohortes suivent la tendance moyenne obtenue à l’aide de la méthode déterministe, le graphique permet de constater que certains coefficients agrégés sont expliqués essentiellement par une cohorte spécifique. C’est le cas par exemple des coefficient de 3 à 5, qui sont dûs à la seule cohorte 7.

Figure 3 – Développement des différentes cohortes - Habitation Incendie ix

(12)

Pour chacune des cohortes constituées, une adaptation de la méthodologie des Link Ratio ([Vu, 2015]) est utilisée afin d’estimer le développement futur des sinistres.

La méthodologie des Link Ratio peut s’interpréter comme une méthodologie de Chain Ladder individuelle et pondérée. La prédiction du développement futur du sinistre ouvert kest réalisée à partir d’une moyenne pondérée des coefficients de développementf_j^k⁰ des sinistres fermés k⁰ :

ωk,k⁰ = max (

˜ ,

sn−S(k)+1

P

j=1

( ˆC_j^k−C_j^k)² )!^−β

k⁰ ∈ K(k), β,˜∈R fˆ_j^k = P ¹

k0∈K(k)

ω^j

k,k0

P

k⁰∈K(k)

ω_k,k^j 0∗f_j^k⁰ ∀i+j > n+ 1

Cˆ_j+1^k = fˆ_j^kCˆ_j^k ∀S(k) +j > n+ 1

avecS(k)l’année de survenance du sinistrek,i, j= 1, . . . nles années de survenances et de développement.

Le poidsω_k,k⁰ dépend donc de la charge des sinistres considérés, et est contrôlé par les deux paramètres β,˜∈ R. Ces paramètres sont obtenus indépendamment pour chaque cohorte constituée grâce à l’aide l’algorithme d’optimisation L-BFGB-S [Zhuet al., 1997].

— β accentue la proximité des sinistres entre eux, avec comme cas particulier β= 0 représentant une équi-pondération.

— ˜évite que deux sinistres trop proches en charge aient une pondération trop importante. Ainsi, le poids maximum entre deux sinistres est de˜^−β.

Le schéma ci-dessous illustre l’impact de ces deux paramètres sur la pondération :

Figure 4 – Schéma Link Ratio

(13)

Appliqué sur le segment large des sinistres incendies, la paramétrisation des Link Ratio donne les résultats suivants :

Figure 5 – Paramètres Link Ratio - Habitation Incendie

La cohorte 7, qui ajoutait de la volatilité à la méthode Chain Ladder, n’est pas iden- tifié comme particulièrement volatile par la méthodologie au vu des paramètres retenus, égaux aux autres groupes. En revanche, les paramètres de la cohorte 6 montre que la mé- thodologie tend à supprimer les disparités entre les coefficients historiques, pour tendre vers une équi-pondération. Cela est signe d’une forte hétérogénéité dans cette cohorte, et l’analyse de la volatilité des coefficients individuels confirme cette analyse.

Bootstrapping du développement:

Afin d’introduire de la volatilité à la projection, et ainsi déduire une marge de risque sur les provisions estimées, une méthode bootstrap est introduit lors de l’étape des Link Ratio.

Pour tout sinistre ouvert projeté, les sinistres de la cohorte considérée pour le calcul du développement sont tirés de façon aléatoire. Ce processus est itéré un nombre de fois suffisant pour converger en espérance et permet, pour chaque tirage, d’obtenir une estimation différente en fonction des sinistres tirés.

Résultats et comparaison:

La méthodologie permet ainsi d’obtenir une distribution de l’ultime de chacun des sinistres ouverts. Les résultats montrent que la volatilité estimée par l’ASICR est assez faible du fait de la segmentation réalisée et des Link Ratio. Ces deux étapes permettent en effet de provisionner ensemble les sinistres de mêmes caractéristiques, en prenant éga- lement en compte leur charge respective.

xi

(14)

Les résultats ainsi obtenus sont comparés avec la méthodologie Individual Claims Reserving ainsi que la méthodologie agrégée Chain Ladder. La méthodologie agrégée fait l’objet de retraitement pour déduire la charge des IBNeR seulement, et ainsi être comparable avec les méthodologies individuelles. Les hypothèses nécessaires sont détaillés dans le corpus de ce mémoire.

Figure 7 – Comparaison des résultats - Habitation Incendie

Les ultimes sans IBNyR des trois approches sont très similaires au total, mais pré- sentent des disparités entre années. La méthode ASICR est celle qui provisionne le plus.

En revanche, la VaR à75%est plus faible pour cette approche individuelle que pour la méthode Chain Ladder. La volatilité estimée est très inférieure aux autres approches, du fait de la segmentation par arbre et de la méthodologie des Link Ratio. Être capable de segmenter plus finement les sinistres aux développements similaires, comme la cohorte 7, conduit à réduire de façon importante la volatilité de la prédiction.

La méthodologie ne permet pas pour le moment d’évaluer l’ensemble des provisions d’une entreprise. La composante IBNyR n’est pas traitée dans le cadre de ce mémoire,

(15)

mais fait l’objet d’étude pour compléter le processus.

Il est par exemple envisageable d’évaluer la charge d’IBNyR à l’intérieur de chaque cohorte constituée à partir d’une méthode fréquence - coût moyen. Cela permettrait d’anticiper certaines caractéristiques des tardifs, déjà définies par la segmentation, et de capitaliser sur l’application des Link Ratio afin d’obtenir un coût moyen ultime tenant compte des projections réalisées à une maille plus fine. La volatilité peut également être déduite indépendamment pour chacune des cohortes, permettant une analyse plus fine des provisions IBNyR.

xiii

(16)

(17)

Synthesis

Recent surveys of market players show that aggregated methodologies remain majori- tary in the calculations of non-life insurance reserves. However, the recent development of Machine Learning in actuarial sciences allows the emergence of new visions of claims and show a growing interest in new ways to estimate reserve based on individual assessment.

In particular, these methods make possible to better use the data available in order to better identify the risk profiles that could degrade the profitability of theirs portfolios, and to deduce adapted and cross-functional risk management policy within the company.

Individual reserving methodolgies using this data and Machine Learning methods have already been the subjet of articles and thesis, for example [De Felice et Moriconi, 2019]. However, these approaches fail to provide an estimate of the volatility of reserves.

With a different approach, stochastic methodologies assess individual distributions of claims ultimate, such as the ICR(Individual Claims Reserving)methodology inspired by the article of [Antonio et Plat, 2012]. However, these stochastic methods do not exploit the available data as much as Data Science approaches.

Based on this observation, this thesis proposes a new individual claims reserving methodology, hybrid between these two types of approach, called ASICR (Automatic Segmentation for Individual Claims Reserving). The methodology developed allows an estimate of IBNeRs only, but approaches are being studied to integrate IBNyRs into the process and thus obtain a complete reserving methodology.

L’ASICR works in three steps :

— Elaboration of homogeneous groups of claims in duration using their characteristic variables.

— Deduction of the future development of open claims, independent for each cohorts formed.

— Introduction of a Boostrap in order to obtain an individual density of each claims ultimate.

This summary presents the results obtained on a short-term branch (Housing, fire), and additional analyzes are available in this report on a long-term branch (Civil Liability, bodily injury).

Elaboration of homogeneous groups of claims:

It is common within the same branch to observe claims with different developments.

(18)

For this, it is proposed to segment the claims according to their characteristics using Data Science tools. A CART approach ([Breiman et al., 1999]) is adopted because it allows the creation of homogeneous groups of claims without knowing the groups to be formed. The leaves of the tree are interpreted as these cohorts for which the reserving process is realized on a personalized basis.

The target variable of the CART is the duration of the claims. This criterion makes segmentations with homogeneous durations, and therefore of similar development. This homogeneity is important in the next step, during the individual estimation of future developments.

The tree is calibrated from the database of closed claims. All descriptive variables of the incident can be used : the impacted product, the reporting deadlines, information on the circumstances of the incident, etc.

Application to a fire branch on large claims gives the following results. The tree constitutes four cohorts with different developments, depending on the cause of the fire and the different delays inherent in the files.

Figure 8 – CART segmentation - Housing fire

This tree makes possible to classify the various open files in the cohort to which they belong. The group number corresponds here to the number of the node, which are assigned from top to bottom then from left to right.

(19)

Figure 9 – Allocation of open files to cohorts - Housing fire

It is then possible to verify the relevance of these cohorts by analyzing the development of claims in aggregate form. This allows a comparison with the Chain Ladder approach, and also helps the interpretation of this aggregated method. On the graphic below, the development coefficients obtained by Chain Ladder (in blue) and for each of the cohorts are displayed. While some cohorts follow the average trend obtained using the deterministic method on the whole base, the graph shows that some aggregate coefficients are explained essentially by a specific cohort. This is the case, for example, for coefficients from 3 to 5, which are due to cohort 7 alone.

Figure 10 – Claims development inside cohorts - Housing fire Deduction of the future development of open claims:

For each cohort formed, an adaptation of the Link Ratio methodology ([Vu, 2015]) is used in order to estimate the future development of claims.

The Link Ratio methodology can be interpreted as an individual and weighted Chain Ladder. The prediction of the future development of an open claim k is made from a weighted average of the development coefficients f_j^k⁰ of the closed claimsk⁰ :

xvii

(20)

j=1 j j

fˆ_j^k = P ¹

k0∈K(k)

ω^j

k,k0

P

k⁰∈K(k)

ω_k,k^j 0∗f_j^k⁰ ∀i+j > n+ 1

Cˆ_j+1^k = fˆ_j^kCˆ_j^k ∀S(k) +j > n+ 1

withS(k)the occurence year of the claimk,i, j= 1, . . . nthe occurence and development years.

The weightω_k,k⁰ depends on the incurred of the claims considered, and is controlled by two parameters beta,˜∈ R. These parameters are obtained independently for each cohort formed using the L-BFGB-S optimization algorithm. [Zhuet al., 1997].

— β accentuates the proximity of the claims to each other, with β = 0 as a special case representing an equal weighting.

— ˜prevents two claims that are too close in term of incurred from being too weighted. Thus, the maximum weight between two claims is˜^−β.

The schema below illustrates the impact of these two parameters on the weighting :

Figure 11 – Link Ratio Schema

Applied to the large segment of fire claims, the parameterization of the Link Ratio gives the following results :

(21)

Figure 12 – Link Ratio parameters - Housing fire

Cohort 7, which added volatility to the Chain Ladder method, is not identified as particularly volatile by the methodology in view of the parameters used, which are equal to the other groups. On the other hand, the parameters of cohort 6 show that the methodology tends to eliminate the disparities between the historical coefficients, to tend towards an equal weighting. This is a sign of a strong heterogeneity in this cohort, and the analysis of the volatility of the individual coefficients confirms this analysis.

Bootstrap of development:

In order to introduce volatility to the projection, and thus deduce a risk margin on the estimated reserves, a bootstrap is introduced during the Link Ratio step.

For any projected open claim, claims in the cohort considered for the development calculation are drawn randomly. This process is iterated a sufficient number of times to converge in expectation and to obtain a different estimate depending on the claims drawn for each open claim.

Results:

The methodology thus makes it possible to obtain a distribution of the ultimate of each open claim. The results show that the volatility estimated by the ASICR is quite low due to the segmentation carried out and the Link Ratio. These two steps make it possible to evaluate together claims with the same characteristics, and also taking into account their respective charges.

Figure 13 – ASICR results - Housing fire xix

(22)

logy is subject to restatement to be comparable with the individual methodologies, the necessary assumptions are detailed in the corpus of this thesis.

Figure 14 – Comparison of results - Housing fire

The ultimate without IBNyR of the three approaches are very similar on the total amount, but show disparities between years. The ASICR method is the one with the highest reserve amount.

In contrast, the VaR at75%is lower for this individual approach than for the Chain Ladder method. The estimated volatility is much lower than the other approaches, due to the segmentation by tree and the Link Ratio methodology. Being able to segment claims more finely with similar developments, such as cohort 7, leads to a significant reduction in the volatility of the prediction.

On the other hand, the methodology does not currently allow the assessment of all of a company’s reserves. The IBNyR part is not dealt yet within the framework of this thesis, but is the subject of study to complete the process.

For example, it is possible to evaluate the incurred of IBNyR within each cohort formed using a frequency - average cost method. This would make it possible to anticipate certain characteristics of late arrivals, already defined by segmentation, and to capitalize on the application of the Link Ratio in order to obtain an ultimate average cost taking into account the projections made at a finer level. The volatility can also be deduced independently for each cohort, allowing a more detailed analysis of the IBNyR provisions.

(23)

Table des matières

Glossaire iii

Résumé v

Synthèse vii

Introduction 1

1 Contexte et enjeux 3

1.1 Le cadre du provisionnement . . . 3 1.1.1 Les objectifs . . . 3 1.1.2 Les provisions . . . 4 1.1.3 La réglementation . . . 5 1.2 Les méthodes de provisionnement . . . 8 1.2.1 Etat du provisionnement en France et dans le monde . . . 8 1.2.2 Motivations pour le provisionnement individuel . . . 9

2 Méthodologie et algorithmes 11

2.1 Chain Ladder et Mack . . . 12 2.1.1 Évaluation et retraitement des IBNyR . . . 13 2.2 Individual Claims Reserving . . . 15 2.2.1 Généralité sur la méthode . . . 15 2.2.2 Estimation des tardifs . . . 16 2.2.3 Estimation des ouverts . . . 17 2.3 Automatic Segmentation for Individual Claims Reserving . . . 21 2.3.1 Généralités sur la méthode . . . 21 2.3.2 Segmentation par Machine Learning . . . 22 2.3.3 Développement individuel par la méthode des Link Ratio . . . 28 2.3.4 Estimation de la volatilité . . . 31 2.3.5 Synthèse de l’ASICR . . . 32

3 Applications et résultats 35

3.1 Données utilisées . . . 36 3.1.1 Base d’étude qualitative . . . 37

xxi

(24)

3.3 Branche longue - Auto RC . . . 43 3.3.1 Attritionnels . . . 43 3.3.2 Larges . . . 51 3.4 Branche courte - Habitation Incendie . . . 59 3.4.1 Attritionnels . . . 59 3.4.2 Larges . . . 65 3.5 Synthèse de la méthodologie ASICR . . . 72

Conclusion 73

Bibliographie 76

A Formules de Mack et retraitement 81

A.1 Fréquence - coût moyen . . . 81 A.2 Justification de l’hypothèse(H5) . . . 82

(25)

Introduction

Dans le cadre du suivi de leurs engagements, les assureurs non-vie sont amenés à estimer le coût de leurs sinistres ouverts. Classiquement, ce processus est réalisé en deux parties :

— Estimations individuelles du coût des sinistres connus et non réglés (provisions dossier/dossier).

— Estimation statistique au global d’une provision complémentaire (IBNR) couvrant les sinistres tardifs et l’écart entre les provisions dossier/dossier et les coûts réels Le premier point concernant l’estimation initiale et le suivi individuel des sinistres est classiquement confiée aux gestionnaires sinistres, qui réalisent leurs travaux sur la base des pièces disponibles et des guides de provisionnement.

En général, les actuaires se focalisent principalement sur la deuxième partie de ce processus. Même si la politique de provisionnement reste très encadrée au sein de l’entreprise, les actuaires doivent donc adapter les méthodologies sélectionnées afin de maîtriser au mieux les risques sous-jacent auxquels l’entreprise est exposée.

Les approches retenues sont majoritairement basées sur des statistiques agrégées, qui permettent certes le suivi des charges de sinistres et l’établissement des comptes, mais pas une analyse individuelle des sinistres. De plus l’agrégation de toutes ces informations présentent des limites, telle que le manque d’homogénéité constatée sur certaines branches d’activités ou pour certains dossiers.

Ces limites pourraient être levées avec les méthodologies de provisionnement individuel, qui offrent en même temps une nouvelle vision des provisions dossier/dossier. Ces approches permettraient d’apporter un second regard dans l’évaluation des provisions en permettant de détecter d’éventuelles zones de sous-provisionnement, mal gérées par les méthodes classiques.

Ces méthodologies sont relativement récentes en assurance non-vie, toutefois elles ont fait l’objet de nombreuses études et suscité un intérêt croissant au sein des entreprises d’assurance. La part de plus en plus importante de la Data Science dans l’actuariat permet d’accroître l’essor de ces approches, dont l’application constitue un apport com- plémentaire notamment pour :

— le challenge des forfaits d’ouverture à travers l’analyse les zones de sur ou sous

(26)

provisionnement systématiques.

— l’optimisation des guides de provisionnement afin d’affiner le calcul des provisions dossier/dossier.

— l’évaluation plus fine des sinistres graves et de leur cession en réassurance non- proportionnelle, pour lesquels les approches agrégées basées sur la loi des grands nombres telles que la méthode Chain Ladder sont peu opérantes.

L’objectif de ce mémoire est de proposer une nouvelle méthodologie de provisionnement ligne à ligne, nommée par la suite ASICR :Automatic Segmentation for Individual Claims Reserving. Cet algorithme s’appuiera sur un algorithme de Machine Learning, et sur des outils stochastiques et actuariels afin de proposer une estimation individuelle de la densité ultime de chaque dossier ouvert.

La première partie de ce mémoire vise à rappeler le cadre du processus de provisionnement, tant du point de vue pratique que réglementaire. Elle rappelle également les principales méthodes retenues par les actuaires IARD.

Ces premières analyses permettront d’établir un cahier des charges pour la méthode ASICR qui est décrite dans la seconde partie du mémoire. La méthode est ensuite appli- quée à deux jeux de données réels pour l’illustrer et tester sa pertinence : une branche longue (Responsabilité Civile, dommage corporel) et une branche courte (Habitation, garantie incendie).

Pour valider l’ASICR, ses résultats seront comparés avec deux autres méthodologies de provisionnement. La première approche choisie est la méthode de Mack, majoritairement utilisée aujourd’hui par les entreprises d’assurance. La deuxième est une méthodolo- gie individuelle ICR, (Individual Claims Reserving) inspirée de l’article écrit par [Antonio et Plat, 2012] et présente dans le logiciel addactis^R IBNRS^R.

(27)

Chapitre 1

Contexte et enjeux

1.1 Le cadre du provisionnement

Le provisionnement est un processus important pour les entreprises d’assurance, et consiste en l’évaluation des provisions réglementaires liées à la gestion des sinistres. Ces provisions représentent une dette de l’assureur envers ses assurés. Il est donc primordial de s’assurer de leur adéquation avec le risque réel au regard des informations à la disposition de l’assureur.

1.1.1 Les objectifs

En général en assurance non-vie, le montant de charge ultime d’un sinistre n’est pas connu dès son ouverture par le gestionnaire. C’est pourquoi les entreprises doivent réa- liser des provisions qui doivent, à une date donnée, correspondre au mieux à la somme des montants restants à payer. Les dossiers sont en effet amenés à évoluer dans le temps, en fonction des nouvelles informations obtenues ou estimations réalisées.

Voici un exemple de déroulement complet d’un sinistre :

Figure 1.1 – Déroulement d’un sinistre

(28)

Un sinistre survenu mais non déclaré est appelé un sinistre tardif. En effet, pour dé- clarer un sinistre auprès de son assureur, l’assuré dispose d’un délai plus ou moins long en fonction du type de garantie couverte. Avant sa déclaration, bien que les entreprises ne disposent pas d’information précise à ce sujet, la survenance de ce risque est avérée et celui-ci doit être évalué.

Après sa déclaration, un dossier est constitué par un gestionnaire sinistre. La charge du dossier peut être réévaluée régulièrement, suivant l’évolution des paiements et des provisions dossier/dossier. Le dossier sera clos après le règlement de la dette total de l’assureur auprès du sinistré.

Il peut également arriver que des recours aient lieu, procédures pendant lesquelles un assureur peut faire une réclamation contre le tiers responsable du sinistre ou son assureur pour obtenir un remboursement. De part leur nature particulière, ils font l’objet d’une étude à part et les provisions sinistres sont estimées dans un premier temps brutes de tout recours.

Enfin, il est possible qu’un dossier préalablement clôturé se rouvre quelques temps après, lorsqu’une conséquence du sinistre non identifiable jusqu’alors apparaît. Cela amène alors à une ré-estimation de la charge du sinistre et de nouveaux paiements. Cela peut par exemple arriver suite à un accident automobile, si des conséquences tardives sur l’état de santé de la personne sinistrée se déclare. Plutôt rare, cela doit tout de même être considéré dans l’estimation des réserves.

Le provisionnement consiste donc à la réalisation d’un inventaire à une date précise et répertoriant une estimation du reste à charge pour la compagnie d’assurance. Ce montant sera ainsi placé en provision au bilan de l’entreprise.

1.1.2 Les provisions

Les provisions techniques d’un assureur sont appelées les PSAP : Provisions pour Sinistres A Payer. Elles sont la somme de plusieurs éléments :

— Les provisions dossier/dossier. C’est la différence entre l’estimation du coût, réa- lisée par les gestionnaires, et les sommes déjà payées. Ce montant est donc par construction toujours positif ou nul.

— Les IBNR :Incurred But Not Reported. Cela représente la différence entre la charge ultime du sinistre et son estimation actuelle. Cette charge peut donc être positive ou négative.

(29)

1.1. LE CADRE DU PROVISIONNEMENT 5 Plus précisément, les IBNR se décomposent comme suit :

IBN R=IBN eR+IBN yR

⇒P SAP =P rovisionDossier/Dossier+IBN eR+IBN yR

Les IBNeR (Incurred But Not enough Reported) représentent une provision complé- mentaire qui viennent augmenter ou diminuer la provision dossier/dossier existante. Cette provision est donc estimée pour les dossiers ouverts, et peut être positif ou négatif.

Les IBNyR (Incurred But Not yet Reported) représentent quant à eux les provisions liées aux sinistres tardifs, et sont donc nécessairement positifs.

Les provisions dossier/dossier étant connues, l’objectif du provisionnement est d’estimer l’ultime des sinistres pour en déduire les IBNR et donc les PSAP.

Figure 1.2 – Décomposition des provisions 1.1.3 La réglementation

Aujourd’hui encore, plus de la moitié des défaillances d’assureur non-vie sont dues à une mauvaise évaluation de leurs provisions. Différentes normes ont été mises en place pour garantir une gestion saine de l’entreprise, aux niveaux national (Code des assurances) et international (Solvabilité II et IFRS 17).

Une entreprise d’assurance française est de fait soumise à la réglementation sociale et fiscale de l’Etat. Le code des assurances encadre l’ensemble de l’activité, dont le processus de provisionnement comme le montre l’article R354-6 :

La fonction actuarielle mentionnée à l’article L. 354-1 a pour objet de coordonner le calcul des provisions techniques prudentielles, de garantir le caractère approprié des

Bryan Gautier

(30)

méthodologies, des modèles sous-jacents et des hypothèses utilisés pour le calcul des provisions techniques prudentielles, d’apprécier la suffisance et la qualité des données utili- sées dans le calcul de ces provisions, de superviser ce calcul dans les cas mentionnés à l’article R. 351-13 et de comparer les meilleures estimations aux observations empiriques.

Plus récemment, la réglementation européenne est passée de la norme Solvabilité I à la norme Solvabilité II, entrée en vigueur en 2016. Elle se distingue des normes françaises par son caractère prudentiel. La norme est décomposée en trois pilliers :

— Pilier 1 : il regroupe les exigences quantitatives de la norme. L’objectif est d’éva- luer la solvabilité de l’entreprise, soit à travers une formule standard soit par le développement d’un modèle interne (complet ou partiel).

— Pilier 2 : il regroupe les exigences qualitatives liées à la gouvernance des entreprises et leur gestion des risques, et également leur propre évaluation de leur risque (ORSA).

— Pilier 3 : il regroupe les exigences de communications imputées aux entreprises envers le public et l’autorité de contrôle.

Figure 1.3 – Piliers de Solvabilité II

Le provisionnement est impacté principalement par le pilier 1. En plus d’obtenir la meilleure estimation possible de ses engagements par branches d’activités, l’assureur doit également mesurer l’incertitude associée à son évaluation pour en déduire une marge de prudence supplémentaire.

Enfin, la norme internationale IFRS 17 qui entrera en vigueur en 2023 impactera également le processus de provisionnement, en imposant une segmentation par groupe de risques homogènes (contrats onéreux, non onéreux avec risque significatifs de devenir onéreux, non onéreux). Contrairement à Solvabilité II, elle ne se limite qu’aux entreprises

(31)

1.1. LE CADRE DU PROVISIONNEMENT 7 cotées ou émettant de la dette cotée.

Toutes ces normes n’imposent pas de méthodes de calcul, seulement un cadre accom- pagnant l’évaluation des provisions. Le choix de ces méthodes est donc important au vu de cet environnement complexe, et ne se fera qu’après avoir testé différentes approches pour vérifier la robustesse des résultats. Au vu du nombre et de la diversité des calculs à réaliser, les algorithmes de provisionnement détaillés par la suite doivent être adaptables, et également rapides pour ne pas alourdir en temps ce processus déjà complexe.

Bryan Gautier

(32)

1.2 Les méthodes de provisionnement

Deux types de méthodes de provisionnement vont être distingués pour la suite de cette étude : les méthodologies agrégées et individuelles.

Les méthodes agrégées présentent les données sous forme d’un triangle dans lequel les charges de sinistres sont regroupées par année de survenance (ou souscription) et de dé- veloppement. Cela suppose une homogénéité du risque et du développement des sinistres pour que l’agrégation soit pertinente. La projection de ces charges peut être obtenue à l’aide d’approches déterministes ou stochastiques.

Les méthodes individuelles, plus récentes, proposent des approches très variées. Elles se différencient les unes des autres suivant la manière dont les données sont exploitées : certains algorithmes utilisent seulement les données quantitatives du sinistres (les paiements ou les charges), tandis que d’autres utilisent également les données qualitatives du sinistre. L’intérêt des assureurs pour ces méthodologies est de plus en plus fort, comme en atteste les sondages suivant.

1.2.1 Etat du provisionnement en France et dans le monde

D’après une enquête Addactis France réalisée en 2017, le provisionnement sur le marché français de l’assurance est réalisée encore aujourd’hui majoritairement à l’aide de méthodes déterministes agrégées, et plus spécifiquement à l’aide de la méthode Chain Ladder.

Figure 1.4 – Enquête marché Addactis France

Depuis une vingtaine d’années, différentes méthodes stochastiques (paramétriques ou non paramétriques) se sont développées sur le marché comme les méthodes Boostrap Mack, Bootstrap ODP (Over Dispersed Poisson) permettant d’évaluer la volatilité de l’estimation des provisions. Cette notion d’incertitude permet de calculer une marge de risque qui complète l’information apportée par l’estimation moyenne de la provision, en particulier dans le cadre de Solvabilité II, et bientôt de la norme IFRS 17.

Ces méthodologies agrégées n’utilisent que peu d’informations concernant le sinistre : les dates de survenance, de déclaration et l’évolution de la charge ou des paiements du

(33)

1.2. LES MÉTHODES DE PROVISIONNEMENT 9 dossier. Or un certain nombre d’information sont stockées par les entreprises, et certaines peuvent se révéler intéressantes pour expliquer le coût final du sinistre. Par exemple en cas de dommage corporel, l’âge et la catégorie socio-professionnelle sont des facteurs impactant significativement l’évaluation de la charge du sinistre.

Ces informations, combinées à l’essor des approches Data Science dans l’actuariat, accroissent l’intérêt pour des méthodes de provisionnement individuel, comme on peut le voir au niveau mondial avec ce sondage réalisé par l’ASTIN en 2016 (Actuarial STuidies In Non-life insurrance).

Figure 1.5 – Sondage ASTIN sur la part des entreprises intéressées par le provisionnement individuel

Parmi les méthodologies individuelles, l’article [Antonio et Plat, 2012] est régulière- ment cité et propose une méthodologie stochastique permettant d’évaluer disjointement les IBNyR et IBNeR. L’étude de [De Felice et Moriconi, 2019] propose quant à elle une approche basée sur la Data Science, permettant une estimation des IBNeR à partir des caractéristiques des sinistres. L’intérêt pour les méthodologies individuelles se ressent aussi à travers les récents mémoires d’actuariat sur ce sujet, publiés par l’Institut des Actuaires, parmi lesquels [Barbaste, 2017, Orozco, 2016].

1.2.2 Motivations pour le provisionnement individuel

Les méthodes agrégées sont robustes, maîtrisées, auditables et réplicables aisément, et ces qualités font aujourd’hui leur succès. Néanmoins elles présentent aussi certaines limites : les hypothèses des modèles ne sont pas toujours vérifiées, car le risque n’est pas toujours homogène au sein de la même cohorte. Il est alors nécessaire de procéder à un retraitement parfois complexe des coefficients.

Bryan Gautier

(34)

Ce problème est particulièrement observé lors de l’analyse des sinistres graves sous forme agrégée. L’hétérogénéité de ces dossiers et leur charge élevée impactent l’évalua- tion des provisions. Le retraitement des coefficients modifie de façon non négligeable la moyenne de cette évaluation, tandis que leur instabilité augmente la volatilité de la provision estimée.

Un suivi individualisé de ces sinistres donne la possibilité de contourner ces limites.

Les spécificités de chaque dossier permettent d’adapter au mieux le processus de provisionnement et d’évaluer séparément les évolutions futures de chaque dossier. De plus, l’application de méthodes individuelles sur les sinistres graves permet d’estimer une cession de réassurance non-proportionnelle. Estimer ces cessions est important pour le provisionnement et pour justifier l’adéquation de la structure de réassurance au risque de son portefeuille.

En complément, utiliser ce type de méthodes peut permettre de challenger les provisions d’ouvertures. Une projection individuelle de la sinistralité attritionnelle peut permettre de détecter plus facilement d’éventuelle zones de sur ou sous-provisionnement sys- tématique. Cette analyse permettrait alors d’adapter au mieux les forfaits d’ouvertures, et plus largement les guides de provisionnement, aux risques des portefeuilles sous-jacent.

Enfin, les méthodes individuelles peuvent également valoriser les données stockées par les assureurs. Les actuaires utilisent encore peu les caractéristiques des sinistres dans le processus de provisionnement, alors même que les gestionnaires sinistres s’appuient sur ces données pour établir leurs estimations : détails sur l’habitation, caractéristiques de l’accident, etc...

Ces possibilités poussent à la création et l’utilisation des méthodes de provisionnement individuel pour compléter les études réalisées par les méthodes agrégées. L’objectif de ce mémoire est de proposer une nouvelle approche, appelée par la suite Automatic Segmentation for Individual Claims Reserving (ASICR). Les résultats de cette approche seront comparés avec une approche classique qu’est la méthode de Mack, et un autre algorithme individuel,Individual Claims Reserving (ICR).

(35)

Chapitre 2

Méthodologie et algorithmes étudiés

Deux algorithmes de provisionnement ligne à ligne sont étudiés dans le cadre de ce mémoire. La pertinence et la robustesse des deux approches seront évaluées en comparant avec la méthode agrégée de Mack, cette dernière étant encore majoritairement utilisée par les acteurs de l’assurance.

Le premier algorithme individuel est une méthodologie stochastique implémentée au sein du logiciel addactis^R IBNRS^R : Individual Claims Reserving (ICR), basée sur le papier d’[Antonio et Plat, 2012]. Cet algorithme utilise les mêmes données d’entrée que les méthodes classiques, sans procéder à leur agrégation.

Le deuxième est un algorithme proposée dans le cadre de ce mémoire. L’objectif est de valoriser davantage les caractéristiques individuelles des sinistres et d’obtenir une distribution individuelle de la charge ultime. Un outil de Data Science permettra d’établir des cohortes de risques homogènes à une maille plus fine, pour estimer ensuite le développe- ment futur des sinistres à l’aide d’outils stochastiques et actuariels. Cet algorithme a été développé avec le langage R et est appelé par la suite ASICR :Automatic Segmentation for Individual Claims Reserving.

Dans le cadre de l’étude, les approches ne seront comparées que sur les provisions IBNeR, car la méthode ASICR ne propose par pour le moment d’évaluation des IBNyR.

Des possibilités sont néanmoins à l’étude pour permettent à cette approche de réaliser une évaluation complète des provisions.

La méthodologie de Mack estime les IBNR sans proposer de décomposition entre les IBNeR et IBNyR. Un retraitement est alors nécessaire pour que la méthode soit comparable sur la base des IBNeR. Les hypothèses posées pour y parvenir sont détaillées dans la section ci-après.

11

(36)

2.1 Chain Ladder et Mack

Les méthodes de Chain Ladder et Mack sont brièvement présentées dans le para- graphe ci-dessous. Les notations utilisées sont détaillées dans la figure 2.1.

Figure2.1 – Provisionnement - Méthodes agrégées La méthode Chain Ladder repose sur deux hypothèses :

(H1) : Les charges cumuléesCi,j sont indépendants ∀i= 1, ..., n

(H2) : Il existe des facteurs de développementf_j, j= 1, ..., n−1tels que ∀i= 1, ..., n C_i,j+1 =f_jC_i,j

Ces deux hypothèses permettent alors d’estimer les facteurs fj ∀j= 1, ..., n−1:

fˆ_j =

n−j

P

i=1

Ci,j+1 n−j

P

i=1

Ci,j

Cela permet de compléter la partie inférieure du triangle, en posant pour simplifier les notationsCˆi,j=Ci,j, i+j=n+ 1:

Cˆi,j+1 = ˆfjCˆi,j, ∀i+j ≥n+ 1

Les provisions découlent alors simplement du triangle en soustrayant les derniers montants connus aux ultimes projetés, autrement dit la diagonale à la dernière colonne.

(37)

2.1. CHAIN LADDER ET MACK 13 Thomas Mack introduit par la suite une estimation de la volatilité des réserves calcu- lées à partir de la méthode Chain Ladder [Mack, 1993], à l’aide des hypothèses suivantes : (H1) : Les charges cumuléesCi,j sont indépendants∀i= 1, ..., n

(H2) :E h_C

i,j+1

Ci,j |C_1,j, ..., Ci,j

i

=fj, ∀j = 1, ..., n−1, i= 1, ..., n (H3) :V

h_C

i,j+1

Ci,j |C_1,j, ..., Ci,j

i

=σ_j², ∀j= 1, ..., n−1, i= 1, ..., n

Grâce aux hypothèses(H1, H2), il est possible de montrer que les estimateurs des facteursfˆj sont identiques à ceux de la méthode Chain Ladder, qu’ils sont sans biais et non corrélés. L’hypothèse(H3) permet quant à elle d’estimer σ_j²,∀j = 1, ..., n−1 :





 ˆ

σ²_j = _n−j−1¹

n−j

P

i=1

Ci,j(^C_C^i,j+1

i,j −fˆj)², ∀j= 1, ..., n−2 ˆ

σ²_n−1 =min(^σ^ˆ

4 n−2

ˆ

σ_n−3² , min(ˆσ²_n−3,σˆ_n−2² ))

Ces estimateurs sont également sans biais, et permettent de mesurer l’incertitude d’estimation des facteurs fˆ_j et d’obtenir une estimation de la volatilité des IBNR par année de survenance.

Un point d’attention est toutefois portée à cette volatilité. Les méthodologies agré- gées voient parfois leurs coefficientsf_j modifiés par les experts lors du provisionnement.

Ces changements impactent l’estimation de la volatilité des IBNR et, par prudence, la volatilité ensuite considérée est celle obtenue par la méthodologie de Mack avant tout retraitement.

Pour que cette volatilité soit en cohérence avec l’espérance modifiée, il est proposé de la corriger à l’aide du ratio de volatilité sur les provisions estimées :

ˆ

σ_{IBN R}= σˆ_{IBN R}^{M ack}

brut

E[IBN R_brut]·E[IBN R_retrait´_e]

2.1.1 Évaluation et retraitement des IBNyR

La méthodologie de Mack estime les paramètres d’espérance et de volatilité de la totalité des provisions, sans proposer de distinction de ces paramètres pour les IBNeR et les IBNyR.

Dans ce cadre, il est proposé d’estimer les paramètres d’espérance et de variance des IBNyR, afin d’en déduire ceux des IBNeR. Pour cela une approche du type fréquence - coût moyen est utilisée pour le calcul des paramètres des IBNyR, avec X_i la variable aléatoire représentant le coût des sinistres et Ni la variable aléatoire représentant le

Bryan Gautier

(38)

nombre de sinistres tardifs pour chaque année de survenancei: IBN yR_i=

Ni

P

i=1

Xi

⇒E[IBN yR] =

I

P

i=1

E[IBN yRi] =

I

P

i=1

E[Ni]·E[Xi]

⇒σ²_{i,IBN yR}=V[X_i]·E[N_i] +V[N_i]·E[X_i]² La justification de ces résultats est donnée en annexe A.

Les estimations des espérances et variances des variables X_i et N_i sont obtenues à partir de leurs estimateurs empiriques. Il est ainsi possible d’obtenir l’espérance des IBNeR :

E[IBN eR] =E[IBN R]−E[IBN yR]

L’estimation de la volatilité des IBNeR nécessite des hypothèses supplémentaires : (H4) : les IBNyR et IBNeR sont corrélés à100%, et donc

σ_{IBN R}² =σ²_{IBN eR}+σ_{IBN yR}² + 2·σ_{IBN eR}·σ_{IBN yR} = (σ_{IBN eR}+σ_{IBN yR})² Cette hypothèse est posée en cohérence avec la méthodologie du Chain Ladder, car les estimations des IBNR sont réalisées sans distinctions, et sont donc corrélées du fait de leur estimation commune.

La volatilité des IBNyR est estimée par année de survenance à l’aide de la formule ci-dessus. La volatilité totale peut être déduite en posant l’hypothèse suivante, en lien avec l’hypothèse(H1) de Mack :

(H5) : les IBNyR des différentes années de survenances sont indépendants, et donc :

σ_{IBN yR}= v u u t

I

X

i=1

σ_{i,IBN yR}²

Cette hypothèse est vérifiée en annexe A sur un jeu de données précis pour se convaincre de sa pertinence.

D’où l’estimation finale de la volatilité des IBNeR : ˆ

σIBN eR = ˆσIBN R−ˆσIBN yR

.

Ces retraitements permettent une comparaison des IBNeR de la méthode Chain Lad- der avec les méthodes individuelles détaillées par la suite : ICR et ASICR.

(39)

2.2. INDIVIDUAL CLAIMS RESERVING 15

2.2 Individual Claims Reserving

2.2.1 Généralité sur la méthode

La méthode ICR est inspirée de l’article [Antonio et Plat, 2012]. Pour réaliser indivi- duellement la projection de chaque sinistre, elle s’appuie sur le cycle de vie d’un sinistre qui est décomposé en trois étapes de simulation :

Figure 2.2 – Développement d’un sinistre - ICR

Dans un premier temps le nombre de dossiers tardifs est simulé afin de créer autant de nouveaux sinistres que le nombre obtenu.

Les développements de ces sinistres tardifs et des sinistres ouverts sont ensuite simulés en utilisant l’historique de paiements. Sur ce point, la méthodologie d’ICR diverge de celle d’[Antonio et Plat, 2012].

Il est proposé dans l’article de simuler les dates des futurs paiements et de la clôture à l’aide d’un processus de Poisson non-homogène calibré à l’aide de l’historique. ICR préfère une méthodologie s’appuyant sur les périodes de développement, se rapprochant ainsi des interprétations des méthodes agrégées.

Ainsi, pour chaque période de développement, un sinistre se verra attribuer un évé- nement avec une probabilité donnée :

— Événement A : Paiement

— Événement B : Paiement et clôture

— Événement C : Clôture sans paiement

— Événement D : Rien

Puis, si l’événement attribué implique un paiement, celui-ci est simulé.

Voici l’algorithme global utilisé par ICR pour estimer les provisions. Les étapes sont détaillées dans les sections suivantes.

Bryan Gautier

(40)

Algorithme 1Estimation des IBNR avec l’algorithme ICR Pré-requis :

Les données historiques lignes à lignes.

Le nombre d’itérations de Monte Carlo M Pouri= 1, . . . , M :

Déterminer le nombre d’IBNyR

Identifier les sinistres ouverts (IBNeR + IBNyR) Pourchaque sinistre ouvert:

Tant quele sinistre n’est pas clôt:

Projeter un état pour la période de développement suivante parmi les 4 états possibles :

SiÉvénement = Un paiementalors :

Simuler un paiement avec les paramètres appropriés Ou Si Événement = Un paiement et clôture alors :

Simuler un paiement et le sinistre est clôt et n’est plus projeté Ou Si Événement = Clôturealors :

Le sinistre est clôt et n’est plus projeté Ou Si Événement = Rienalors :

Rien ne se produit pour ce sinistre à cette période Fin Si

Fin Tant que Fin Pour Fin Pour

Sortie : Une distribution de l’ultime et des IBNR (IBNyR et IBNeR)

Dans la suite, les notations suivantes sont utilisées :

— i, j : années de survenance et de développementi, j= 1, ..., n

— E : ensemble des événements détaillés précédemment, |E|= 4

— Ne(i, j) : nombre de sinistres dans l’étatesur la période(i, j),e∈E

— N(i, j) =P

e∈EN_e(i, j) : nombre de sinistres totaux sur la période (i, j)

— O(i, j) : nombre de dossiers ouverts en j pour l’année de survenance i

— Ei : l’exposition de la compagnie pour l’année de survenance i

— Px(i, j) : somme des paiements réalisés sur la période(i, j) pour le sinistre x

2.2.2 Estimation des tardifs

L’étude ne portant pas sur les IBNyR, les résultats ne seront pas comparés avec les autres algorithmes proposés. Néanmoins, cet algorithme individuel présente l’avan- tage d’estimer cette partie des provisions, c’est pourquoi elle est brièvement présentée ici.

Pour réaliser l’estimation du nombre d’IBNyR, un triangle de nombres est réalisé à l’aide de l’historique fournit.

(41)

Figure 2.3 – IBNyR ICR - Triangle de nombres Le nombre de sinistres historiques est corrigé de l’exposition¹ :

O(i, j) =˜ O(i, j) E_i

Une moyenne est ensuite réalisée par colonne pour obtenir une estimation de la fré- quence par année de développement, notée O(., j).˜

Finalement le nombre d’IBNyR est simulé avec pour chaque année de développement avec une loi de Poisson :

O(i, j)ˆ ∼ P( ˜O(., j)∗E_i) ∀i+j > n+ 1

Les nombres obtenus sont retenus comme étant le nombre de sinistres tardifs. Ces sinistres vont être artificiellement créés dans la base d’entrée, afin de les projeter comme les autres ouverts et d’obtenir la charge d’IBNyR associée.

2.2.3 Estimation des ouverts

La méthodologie propose ensuite de simuler le développement des sinistres ouverts.

Pour chaque année de développement restant, un sinistre a une certaine probabilité d’avoir un des quatre événements écrit plus haut (Paiement, Paiement et clôture, clôture sans paiement, rien).

ICR propose deux approches pour estimer ces probabilités :

— une approche standard, basée sur les proportions historiques.

— une approche à l’aide d’une modélisation multinomial-logit, afin de retraiter les probabilités historiques.

Approche standard

L’approche standard repose sur les proportions de chaque événement observé par année de survenance et de développement. Celles-ci sont interprétées comme des proba- bilités historiques :

1. Si l’exposition est inconnue ou non utilisée, poserEt= 1 ∀t

Bryan Gautier

(42)

ˆ

pe(i, j) = Ne(i, j)

4

P

m=1

Nm(i, j)

∀1≤e≤4, i+j≤n+ 1

Ces probabilités sont pondérées par le nombre de sinistres dans cet état, et moyennées par années de développement pour en déduire les probabilités futures, en bleu dans l’exemple ci-dessous.

˜

p_e(i, j) =

n−j+1

P

k=1

ˆ

p_e(k, j)·N(k, j)

n−j+1

P

k=1

N(k, j)

∀1≤e≤4, i+j > n+ 1

Figure 2.4 – Triangles proportions états - IBNeR ICR Approche multinomial-logit

Les probabilités historiques ne sont pas toujours représentatives du futur. Elles peuvent alors être adaptées pour tenir compte de certaines spécificités du portefeuille :

— Un changement de procédure interne chez l’assureur impactant les délais de traite- ment des sinistres. Dans ce cas, des changements sont observés sur les probabilités des états entre deux années de survenances.

— Des données peu nombreuses sur les dernières années de projection, pouvant apporter des proportions peu représentatives.

Pour tenir compte de ces effets, les probabilités futures des différents états sont es- timées à l’aide d’un modèle multinomial-logit [Descamps, 2017]. Le schéma ci-dessous permet de visualiser l’impact de chacun des paramètres sur les triangles de probabilités obtenus.

ˆ

pe(i, j) = exp[α_e(j)·1j≤T + (β_0e+β_1e·j)·1_j>T +γ_e·i+σ_e·1_i>R]

4

P

m=1

exp[αm(j)·1j≤T + (β0m+β1m·j)·1j>T +γe·i+σm·1i>R]

, ∀1≤e≤4

avec :

(43)

— R : période de rupture. Elle symbolise une rupture dans le portefeuille pour une année de survenance donnée. Les probabilités estimées avant et après cette année seront différentes.

— T : période de transition. Cela peut être utile lorsque les données sont insuffisantes pour les dernières années de développement. Dans ce cas, l’historique n’est pas utilisé et les proportions sont estimées à l’aide des coefficients β.

— β : ces huit paramètres (deux par type d’événement) sont utilisés pour prédire les proportions pour les périodes de développement situées au-delà de T.

— α : au nombre de n−T + 1 par événement, ils sont ajustés pour correspondre au mieux aux proportions historiques. En ne conservant que ces paramètres, la formule correspond alors à la méthode standard.

— γ : utilisés par période de survenance, ces quatre paramètres représentent une évolution des proportions des événements du portefeuille dans le temps.

— σ : ces quatre paramètres viennent augmenter les γ pour les années les plus ré- centes, supérieures à la période de rupture.

Figure 2.5 – IBNeR ICR - Paramètres du multinomial-logit

Les paramètres R et T sont calibrés par l’utilisateur à partir de sa connaissance du portefeuille : R peut représenter une changement dans la politique de souscription, etT un manque de données pour les années de développement supérieurs.

Les autres paramètres sont estimés pour s’ajuster au mieux à l’historique à l’aide de l’algorithme d’optimisation L-BFGS-B, publié dans l’article de [Zhu et al., 1997].

La sélection de la méthode standard ou multinomial-logit permet d’estimer les pro- babilités futurs des événements. Il est ainsi possible de simuler le développement futur de chaque dossiers tardifs ou ouverts. Si l’événement tiré implique une clôture du sinistre, alors celui-ci n’est plus simulé pour les années de développement restantes. Si l’événement implique un paiement, ce dernier doit alors être simulé.

Bryan Gautier

(44)

Simulation des paiements

Un paiement est simulé lorsqu’un sinistre tombe dans un événement de type paiement (événement A) ou paiement avec clôture (événement B).

Les paiements sont également simulés par année de développement. Ainsi, si un sinistre historique a connu plusieurs paiements la même année de développement, ils sont agrégés pour ne former plus qu’un paiement notéPx(i, j), ∀i+j≤n+ 1.

Les paiements sont simulés à l’aide d’une loi gamma ou log-normale. L’espérance et la variance de la loi retenue sont estimées à l’aide de leurs estimations empiriques

∀1≤j≤J :

Pˆ_x(., j) = P

x

PI−j+1

i=1 Px(i, j) PI−j+1

i=1 NA(i, j) +NB(i, j)

Vˆx(., j) = P

x

PI−j+1

i=1 (Px(i, j)−Px(., j))² PI−j+1

i=1 (N_A(i, j) +N_B(i, j))−1

L’hypothèse sous-jacente est donc que les paiements incrémentaux d’une même année de développement suivent la même loi, et cela indépendamment des autres années.

Les paiements ainsi obtenus sont agrégés par sinistre afin d’obtenir un ultime par dossier.

Résultats

Afin de converger en espérance, le processus est répété un nombre suffisant de fois.

Il est ainsi possible d’obtenir une estimation de la distribution individuelle des coûts ultimes des sinistres, ainsi qu’une distribution agrégée.

Il est relativement simple et rapide d’utiliser cette méthode pour les compagnies, car les données sont les mêmes que pour les méthodes agrégées. Utilisée sur les sinistres graves, elle permet de plus de prendre en compte une réassurance non-proportionnelle pour réaliser une estimation nette de réassurance.

Toutefois il est possible d’aller plus loin avec les méthodes individuelles. Le caractère stochastique de la simulation ne prend pas en compte les caractéristiques des sinistres, ni les paiements passés, or ces informations influencent le développement futur des dossiers.

C’est pourquoi la méthodologie ASICR maintenant détaillée s’intéresse aux variables qualitatives décrivant les sinistres ainsi qu’à leur développement passé pour estimer les charges des IBNeR.