Mémoire d'actuariat

(1)

Mémoire présenté devant l’ENSAE ParisTech pour l’obtention du diplôme de la filière Actuariat

et l’admission à l’Institut des Actuaires le 21/02/2019

Par :

Loup Ortiz

Titre :

Eléments d’Intelligence Artificielle faible en Provisionnement Non-Vie

Confidentialité : NON OUI (Durée : 1 an 2 ans) Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus

Membres présents du jury de la filière Entreprise : Milliman Nom :

Nicolas Baradel Signature :

Membres présents du jury de l’Institut Directeur du mémoire en entreprise : des Actuaires

Nom : Rémi Bellina Signature :

Autorisation de publication et de mise en ligne sur un site de

diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité)

Signature du responsable entreprise Secrétariat :

Signature du candidat Bibliothèque :

Ecole Nationale de la Statistique et de l’Administration Economique (ENSAE) 5, avenue Henry Le Chatelier - 91120 PALAISEAU, FRANCE

(2)

(3)

Résumé

Mots-clés : Automatisation, Intelligence Artificielle faible, Grammaire graphique, Visualisa- tions de données, Génération de langage naturel, Applications web, Data science, Machine Learning, Expressions régulières, Provisionnement individuel, Sinistres graves, Segmentation, Seuil de gravité,Chain Ladder, Modèle de Mack

Le provisionnement est l’un des cœurs de métier de l’actuariat. Du fait des enjeux stratégiques et économiques majeurs qu’il représente pour les compagnies d’assurance, sa pratique fait l’objet de développements toujours plus avancés. Les techniques usuelles d’évaluation des provisions – dont la méthode Chain Ladder fait figure de proue – reposent historiquement sur des données sinistres agrégées. Cependant, l’expansion récente des volumes de données collectées et des algorithmes associés permet aujourd’hui la conception de méthodologies d’estimation innovantes s’appuyant sur des informations à la maille individuelle.

Ces méthodes, proposées en nombre par la communauté actuarielle, constituent des dévelop- pements théoriques novateurs. Toutefois à ce stade, et compte tenu des fortes contraintes opé- rationnelles (délais, disponibilité des données, etc.), celles-ci n’ont pas encore atteint un niveau de maturité suffisant au sein des compagnies. En pratique, la méthode Chain Ladder reste ainsi la référence pour l’évaluation des provisions. Demeurent donc de multiples enjeux tels que l’obtention d’ultimes à la maille individuelle, la détection des graves, ou plus largement la rationalisation des processus et la connaissance approfondie des risques.

Pour accompagner l’actuaire dans ce contexte, plus que la méthode d’estimation employée, nous tenons à repositionner la donnée au centre des développements en présentant de bonnes pratiques d’implémentation et de traitement. Nous proposons une exploitation pragmatique des possibilités offertes par l’Intelligence Artificielle faible : visualisations innovantes, automatisation de tâches répétitives, modélisation via machine learning de processus complexes.

(4)

Abstract

Keywords : Automation, Weak Artificial Intelligence, Grammar of graphics, Data visualiza- tion, Natural Language Generation,Web application,Data science, Machine Learning,Regular expression, Individual reserving, Large claims,Segmentation, Severity threshold,Chain Ladder, Mack model

Reserving is one of the core businesses of the actuarial profession. For insurance companies, it represents major strategic and economic challenges and its practice is subject to ever more advanced developments. Standard claims reserves valuation techniques - including the Chain Ladder method - have historically been based on aggregated claims data. However, the recent expansion of data and analytics now allows a new framework. Innovative estimation methodo- logies based on information at the individual grid level are being designed.

These methods, broadly spread by the actuarial community, are innovative theoretical developments. At this stage, and given the strong operational constraints (deadlines, data availability, etc.), these have not yet reached a sufficient level of maturity within the companies. In practice, the Chain Ladder method thus remains the reference for the valuation of claims reserves.

There are therefore still many challenges to be addressed, such as obtaining individual esti- mates, detecting large claims, or, more generally, streamlining processes and in-depth knowledge of risks.

To support the actuary in this context, and beyond the estimation method, we would like to reposition the data at the center of developments. We propose some best practices and a pragmatic exploitation of the possibilities offered by weak Artificial Intelligence : innovative visualizations, automation of repetitive tasks, machine learning modeling of complex processes.

(5)

Remerciements

Avant toute chose je tiens à adresser ma profonde reconnaissance à mon directeur de mémoire Rémi Bellina, senior consultant du département Non-Vie et co-responsable de l’offre Analytics du cabinet Milliman Paris. Rémi a su me guider dans mes travaux par son encadrement, son expertise et son soutien qui m’ont permis de mener à bien ce projet. J’adresse également mes remerciements au consultant Clément Bourry, pour sa contribution à ce mémoire et sa disponibilité.

Je remercie de plus Fabrice Taillieu, Jean-Philippe Boisseau et Mohamed Benkhalfa, Principals et directeurs du département Non-Vie du cabinet de m’avoir accordé leur confiance et permis d’évoluer dans les meilleures conditions.

Plus généralement, je suis reconnaissant envers l’ensemble des consultants du cabinet Milli- man - en particulier l’équipe P&C - et je salue l’ambiance dynamique dans laquelle il m’est actuellement permis d’évoluer.

Je remercie mon tuteur pédagogique Nicolas Baradel ainsi que le corps professoral de la filière actuariat de l’ENSAE Paris Tech pour la qualité de l’enseignement transmis.

J’ai enfin une pensée pour l’ensemble des personnes qui ont su m’accompagner durant ma scolarité, en particulier mes proches qui ont toujours soutenu mes projets.

(6)

Note de synthèse

Introduction

L’estimation desProvisions pourSinistresA Payer (PSAP) sans marge de prudence permettant d’honorer les engagements liés aux contrats souscrits par ses clients constitue l’un des cœurs de métier d’une compagnie d’assurance. Plus connue sous le nom de provisionnement, cette activité est basée sur l’exploitation d’un historique de données de sinistralité et a pour but d’évaluer le plus précisément possible le montant de charge ultime, autrement dit la résultante des paiements futurs relatifs à l’ensemble des sinistres couverts. A ces flux de paiement s’ajoutent d’autres informations comme les montants de provisions dossiers/dossiers évalués par les gestionnaires,

Période assurée Temps

Flux de prime

Date de survenance

Date de

déclaration Date de

clôture Réouverture Clôture définitive

Flux de recours Évaluation des

provisions dossiers/dossiers Flux de paiements

Développement d’un sinistre les différentes dates marquantes de

la vie d’un sinistre (survenance, dé- claration, clôture, etc.) : ces diffé- rents éléments caractérisent l’évolu- tion des sinistres.

Historiquement, les pratiques d’éva- luation des PSAP reposent sur l’agrégation des données sous forme de triangles de développement et sur l’application de méthodes actuarielles d’estimation des provisions

dont l’approche Chain Ladder fait figure de proue. Néanmoins, c’est tout un processus complexe, de la prise en charge des données jusqu’à l’estimation d’un ultime, qui nécessite d’être considéré aujourd’hui sous un nouveau regard et ce en réponse à de multiples enjeux.

La connaissance approfondie des profils de risques, l’appréhension des sinistres graves, l’évalua- tion objective des charges ultimes, la rationalisation des processus sont autant de thématiques qui façonnent le panorama actuel du provisionnement et qui impactent les différents acteurs.

Qu’ils soient actuaires, gestionnaires, souscripteurs, tous s’accordent sur l’apparente muta- tiondes pratiques induites par l’avènement du numérique, des techniques de Machine Learning et de l’exploitation des données en grande dimension.

Comment les nouvelles technologies et des éléments d’Intelligence Artificielle (IA au sens faible, il en sera question plus loin) peuventapporter un second regard sur le provision- nement des compagnies d’assurance et tirer parti des nombreuses informations récoltées à la maille individuelle des sinistres ? C’est l’une des problématiques qui se pose à l’heure actuelle, dépassant le seul périmètre de calcul d’un montant de charge ultime.

On attend en effet d’une Intelligence Artificielle en provisionnement qu’elle soit en mesure de prendre en charge et de manipuler efficacement des données de différentes natures, d’en extraire les informations pertinentes, d’automatiser certains calculs, d’intervenir en support auprès de l’actuaire en lui fournissant une aide à la décision de qualité, et enfin de restituer les résultats obtenus de façon claire et intelligible.

Les développements doivent cependant être perçus sous l’angle du pragmatisme et du réa- lismeet s’inscrivent humblement au sein duconcept de l’Intelligence Artificielle faiblequi

(7)

Note de synthèse

n’a ni pour but de révolutionner la pratique ni de remplacer l’expertise métier des principaux acteurs. L’IA faible tente de reproduire le plus fidèlement possible les résultats de comportements spécifiques prédéfinis à l’avance, sans même comprendre ce qu’elle fait.

IA faible en provisionnement

Les quatre thématiques suivantes sont autant d’éléments qui jalonnent le processus global de provisionnement.

n Prise en charge, visualisation et extraction d’informations des données

n Identification des sinistres atypiques et segmentation

n Modélisation et estimation des montants de charges ultimes

n Restitution automatisée des résultats

Elles peuvent bénéficier de l’émergence des technologies de l’IA faible qui se concrétisent d’ailleurs par l’édition de logiciels dédiés à la gestion et à la visualisation de données ainsi qu’à la mise en œuvre d’algorithmes de Machine Learning complexes, ce qui suppose une puis- sance de calcul suffisante.

Des langages comme R ou Python répondent à ces différents prérequis, contribuant au projet de développement d’une IA faible en provisionnement. Libres d’accès, leur simplicité de prise en main permettent à ces langages d’être de plus en plus répandus au sein des compagnies d’assurance qui voient leurs équipes dedata scientistsévoluer fortement. Ce mémoire d’actuariat a fait l’objet de la conception d’une telle IA dont les différents modules sont détaillés ci-dessous.

Prise en charge, visualisation et extraction d’informations des données

La prise en charge des données et la réalisation d’analyses descriptives approfondies sont inhé- rentes à toute étude statistique. Elles s’inscrivent directement dans le processus de provisionnement en amont de la modélisation des montants de PSAP du fait de la quantité et

26.8 39.4 39.1 44.4 46 49.3 54.6 59.2 58.1 57.2 57.9 57.7 59.8 59.9 59.8 59.8 60 59.9 59.9 59.9 25 42.5 43.7 48 49.6 53 62 63.7 65.6 65.3 64.7 65.4 64.5 64.3 67.3 69.4 69.1 69.1 68.9 24.8 41.7 39.4 47.3 47.8 56.4 61.9 62.7 62.5 60.7 60.2 60 59.9 59.3 59.9 59.8 59.7 59.8

27 47.3 42.2 46.4 51.3 54.9 59.7 62.6 62.8 62.9 62.7 61.2 62.5 63 62.8 62.8 62.8 31.6 51.9 43.7 58.1 54.9 56.8 59.5 64.1 62.1 65.3 65.6 64.3 62.9 64.9 64.9 64.2 29.4 41 42.3 45.2 44.5 47.5 49.7 50.4 50.5 53 52.4 51.8 51.8 51.6 51.8 27.7 39.5 46.9 49.9 54.4 53.9 54 53 52.4 52.6 52.2 52.4 52 51.8 29.2 45.7 48.7 52.4 52.8 52.8 50.2 50.6 51 50.9 50.3 49.9 49.7 27.1 47.4 55.3 57 58.5 59.5 59 59.7 61.3 62.1 62.7 62.8 26.6 44.5 49.7 54.8 57.3 56.9 58.6 62.4 61.1 61.4 61.4 28.1 45.9 48 49.8 48.9 50.5 53.2 55.2 54.9 56.3 29.4 42.5 47 47.8 51.3 53.9 57.6 58.4 59.3 28.8 47.3 51.7 59 61.7 64 66.9 69 32.1 46.2 48.3 56 58 63 67.6 22.7 35.3 44.1 52.7 66.1 75.7 24.8 43.8 53.8 61.6 69.1 27.3 42.3 48.8 52.4 26.6 40.6 55.5 30.3 48 27.5

INCURRED

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

DEVELOPMENT YEAR

ACCIDENT YEAR 30 M€

40 M€

50 M€

60 M€

70 M€

VALUE

Triangle de développement de la richesse des caractéristiques de

sinistres qu’il est possible de récol- ter.

Couplées aux bibliothèques de manipulation de données, les gram- maires graphiques sont de plus en plus performantes, véritables clés de voûte des visualisations. L’utilisation conjuguée des paquets dplyr et ggplot2 du logiciel R, par exemple, permet d’appréhender efficacement les formats de données agrégés comme individuels.

D’une part, la représentation des triangles de liquidation sous différentes formes permet de rendre compte de leur cadence de développements, du

(8)

Note de synthèse

type d’activité concerné, ainsi que des spécificités du portefeuille notamment en matière de volume de sinistralité. Du fait de son caractère standardisé, ce format de données est d’ailleurs

Visualisation spatiale

d’autant plus à même d’être pris en charge de façon automatisée.

D’autre part, la réalisation de représenta- tions graphiques à l’échelle du sinistre permet d’exploiter la granularité des données individuelles et favorise l’extraction des dossiers atypiques du portefeuille.

La représentation spatiale des données à la maille individuelle permet plus générale- ment d’élargir le spectre des discussions entre les différents acteurs. Actuaires, gestionnaires et souscripteurs peuvent en effet bénéficier d’analyses innovantes tirant parti de l’historique de sinistralité.

Identification des sinistres atypiques et segmentation

La segmentation des données a pour but de constituer des groupes de sinistres homogènes dans une optique de modélisation des montants de provisions. A ce titre, la classification des sinistres dans les catégories des attritionnels et des graves est une problématique centrale en provisionnement. Ces deux classes de sinistres présentent en effet des caractéristiques différentes et font généralement l’objet de traitements spécifiques. Les méthodes agrégées les plus usuelles reposent par exemple sur des hypothèses de stabilité des triangles, aussi est-il nécessaire de disposer d’un périmètre adapté pour garantir un bon ajustement des modèles.

Segmentation par seuil de gravité. La définition d’un seuil de gravité pour la catégorisation des sinistres constitue un premier levier de segmentation. Plutôt que de considérer un niveau

−

50 k€ 100 k€ 150 k€ 200 k€

THRESHOLD

TYPE OF CRITERIA Linearity Test Correlation Test Calendar Effect Test Part of Estimation Error

Intervalles de seuils de seuil parfois arbitraire comme il

est d’usage au sein de certaines compagnies d’assurance, il est intéres- sant d’objectiver ce montant en se basant sur des indicateurs représen- tatifs de la stabilité des données ré- sultantes.

Dans ce cadre, l’application de l’approche Chain Ladder et de sa va- riante stochastique le modèle de Mack sur le triangle d’attritionnels issu de la segmentation constitue un outil intéressant : la simplicité de mise en œuvre de ces méthodes rend envisageable leurs ajustements suc-

cessifs pour une large gamme de valeurs de seuils de gravité. En conséquence, la validité des

(9)

Note de synthèse

hypothèses des modèles ainsi que certains indicateurs peuvent être analysés au regard de ce paramètre :

n Hypothèse de linéarité

n Hypothèse de non corrélation des facteurs de développements successifs

n Absence d’effet calendaire

n Evolution de la MSEP de Mack

L’identification et l’intersection des intervalles de seuils pour lesquels chaque critère est validé permet de définir un ensemble de valeurs admissibles à comparer aux montants retenus en pratique.

Bien que cette démarche n’aboutisse pas nécessairement à l’obtention d’un niveau de seuil, elle se veut objective et a pour but d’apporter de l’information pertinente aux actuaires.

Identification des sinistres déviants. La segmentation en fonction d’un niveau de seuil de gravité a généralement pour effet l’introduction d’une hétérogénéité relative aux sinistres attritionnels les plus récents. Ces derniers sont en effet susceptibles de dévier dans la classe des

●

● ● ● ● ● ●

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

● ●

1 3 8 11 14 17 20 22 27 31 35 43 47 49 55

0.8 0.85 0.9 0.95 1 1.05 1.1

Inf

0.02760.00730.00450.00340.00290.00260.00250.0023 0.0020.00180.00180.00170.00160.0016 size of tree

cp

X−val Relative Error

Validation croisée

graves au cours de leur développement futur.

La mise en œuvre de modèles prédictifs de Machine Learning visant à identifier les sinistres les plus sensibles peut permettre d’affi- ner la segmentation. Dans ce contexte, l’algorithme CART, calibré sur la partie la plus dé- veloppée de l’historique de sinistralité, constitue un outil flexible en matière de prise en charge des données et aboutit à des résultats facilement interprétables. Plus généralement, le fait de disposer d’une vision synthétique de l’ensemble des sinistres a priori sensibles constitue un apport intéressant pour les diffé- rents acteurs.

La combinaison des deux approches de segmentation extrait en définitive des renseignements supplémentaires sur les profils de risque du portefeuille en tirant parti des données individuelles de sinistralité.

Modélisation des montants de charges ultimes

Les problématiques de choix et de mise en œuvre des modèles d’estimation des PSAP sans marge de prudence sont bien évidemment centrales dans un processus de provisionnement. La phase de modélisation est ici considérée sous l’angle de l’Intelligence Artificielle faible et se décline en différentes thématiques autour de l’automatisation et de l’exploitation des données individuelles de sinistralité.

Modélisation automatique par méthodes agrégées. La réalisation de diagnosticsvia l’extraction d’informations ainsi que l’obtention d’un ultime sont des pratiques quotidiennement réalisées au sein des compagnies d’assurance. Dans ce contexte, l’automatisation de ces deux procédés sous la forme d’une IA façonnée comme une aide à la décision pour les actuaires repré-

(10)

Note de synthèse

sente une valeur ajoutée certaine. Bien qu’inapte à remplacer l’expertise métier de ces derniers, une telle IA n’en reste pas moins performante dans le rôle de seconde opinion automatisée.

La standardisation des données nécessaires à son exécution est telle qu’il est envisageable de l’appliquer à tout type de triangle et de bénéficier d’un gain de performance notamment en matière de temps de calcul.

Modélisation des données individuelles par Machine Learning. Les méthodes popu- laires de Machine Learning permettent une prise en charge flexible des données individuelles en vue d’en extraire des informations inaccessibles jusqu’alors, du moins de façon efficace et standardisée.

La segmentation des données permet l’application de méthodes dédiées tirant parti de la nature et des spécificités des groupes homogènes constitués ainsi que des données collectées.

La modélisation de l’occurrence des paiements, basée sur l’exploitation des développe- ments individuels de la masse des sinistres attritionnels, constitue une première étape dans la

0.01716 n = 36 764 First_Incurred < 65.2 k€

0.008563 n = 31 647 Closing_year < 2010

0.05664 n = 4 749 First_paid < 63 k€

0.005285 n = 26 868

0.02397 n = 4 423

0.00198 n = 1 515

0.08225 n = 3 234 Reporting_delay >= 2

0.3373 n = 83

0.2473 n = 368 First_paid >= 31.7 k€

0.05742 n = 209

0.4969 n = 159 0.07553

n = 3 151 Closing_year < 2010

0.1257 n = 732 0.05733

n = 2 407

Yes No

Leaf 1 Leaf 2 Leaf 3 Leaf 4 Leaf 5 Leaf 6 Leaf 7 Leaf 8

Arbre de décision démarche d’estimation des mon-

tants de charges ultimes. Ce cadre structurel peut être étendu à d’autres variables d’intérêt telles que les coef- ficients individuels de passage dont la construction n’est pas sans rap- peler l’approche de référence Chain Ladder.

L’exploitation systématique de commentaires, enregistrés sous forme de texte par les gestionnaires à l’attention des sinistres les plus déviants, permet une appréhension nouvelle des graves dont le nombre

est généralement plus restreint. Les méthodes sophistiquées de text mining, ou plus simple- ment l’emploi pragmatique d’expressions régulières, conduisent à l’extraction d’informations pertinentes et favorisent le dialogue entre actuaires et gestionnaires.

Restitution automatisée des résultats

La mise en forme et l’interprétation intelligentes des résultats obtenus à l’issue de la réalisation des diverses analyses en matière de visualisation, d’extraction d’informations et de modélisation, représentent une composante supplémentaire à intégrer au concept d’IA faible en provisionnement. La plupart d’entre elles viennent en effet enrichir un rapport dont la constitution fait partie du quotidien des compagnies d’assurance.

La génération automatisée de commentaires descriptifs ou conclusifs sous forme de langage naturel représente un gain de temps important et participe à la rationalisation de la pratique de description et d’interprétation des résultats. De nombreux travaux sont en cours sur ce sujet et peuvent être appliqués à l’échelle globale du portefeuille, comme à la maille individuelle des sinistres.

(11)

Note de synthèse

Ledéveloppement d’applications web interactivesest par ailleurs de plus en plus répandu du fait de l’accessibilité de certaines technologies dédiées à leur réalisation (à titre d’exemple, les applications Shiny et Dash sont respectivement adaptées aux langages R et Python). De telles applications sont d’autant plus appropriées dans le cadre du provisionnement qu’elles permettent d’unifier l’ensemble des analyses du processus au sein d’une même interface tout en permettant à l’actuaire d’agir directement sur les choix de modélisation.

En définitive, c’est bien l’intégralité du processus de provisionnement qui peut être repensé sous l’angle de l’Intelligence Artificielle faible, sans dénaturer les techniques actuarielles existantes et en intégrant l’indispensable expertise métier. Ce mémoire a tenté de tirer le meilleur parti des bonnes pratiques de manipulation, de visualisation, de modélisation et de restitution qui y sont associées.

Mots-clés : Automatisation, Intelligence Artificielle faible, Grammaire graphique, Visualisa- tions de données, Génération de langage naturel, Applications web, Data science, Machine Learning, Expressions régulières, Provisionnement individuel, Sinistres graves, Segmentation, Seuil de gravité,Chain Ladder, Modèle de Mack

(12)

Executive summary

Introduction

One of the core businesses of an insurance company is to estimate the reserves for claims outstanding without any safety margin, so that the commitments related to the contracts concluded by its clients can be honored. More commonly known as reserving, this activity is based on the exploitation of a claims data history and aims to assess as accurately as possible

Coverage period Time

Premium Cash Flows

Occurrence date

Reporting

date Closing

date Reopening Final closing

Recovery cash flows Case reserves

assessment Payment cash flows

Claim development the ultimate amount of expense,

that is to say, the result of future payments relating to all cove- red claims. In addition to these cash flows, the evolution of claims is also defined by the amount of case reserves assessed by the claim mana- ger and significant steps such as occurrence, report and closure dates.

Traditionally, reserving practices

have been based on the aggregation of data in the shape of development triangles and the application of actuarial methods for estimating reserves, with the Chain Ladder approach at the forefront. Nevertheless, it is a complex process for which all steps need to be re- considered, from data management to the estimation of an ultimate value, in order to address multiple issues.

In-depth knowledge of risk profiles, understanding of serious claims, objective assessment of ultimate costs, and rationalization of processes are themes that shape the current panorama of reserving practice and have an impact on the various stakeholders. Whether they are actuaries, managers or underwriters, they all agree on the apparent changein practices induced by the advent of digital technology, the Machine Learning techniques and the big data field.

How can new technologies and elements ofArtificial Intelligence(in the weak sense, as it will be discussed below) bring a new vision of reserving and take advantage of the extensive information collected at the individual claims level ? This is one of the main issues that currently arises, going beyond the scope of the ultimate estimation.

Artificial Intelligence in reserving is expected to be able to effectively handle and manipulate different natures of data, extract relevant information, automate calculations, assist the actuary by providing him with quality decision support, and finally display the results in a clear and intelligible manner.

However, the underlying developments must be seen with pragmatism and realism and be congruent with the concept of weak Artificial Intelligence, which is neither intended to

(13)

Executive summary

fundamentally alter the practice nor to replace the business expertise of the main stakeholders.

The purpose of such a narrow AI is to reproduce as accurately as possible the results of specific predefined behaviors, without even understanding what it does.

Weak AI in reserving

The following four steps are key elements of the global reserving process.

n Support, visualization and extraction of data information

n Identification of atypical claims and segmentation

n Modeling and estimation of ultimate amounts

n Automated restitution of results

Each of them can benefit from the emergence of weak AI technologies, which materialize in the software publishing dedicated to data management and visualization, as well as the implementation of complex Machine Learning algorithms, which requires sufficient processing power.

Programming languages such as R or Python meet these prerequisites, thereby contributing to the project of developing a weak reserving AI. Freely available and easy to use, these languages are becoming more widespread within insurance companies, whose data scientist teams are significantly evolving.

This actuarial professional thesis focuses on the design of such an AI, whose different modules are detailed below.

Support, visualization and extraction of data information

Data management and in-depth descriptive analyses are inherent to any statistical study. They are directly embedded in the reserving process prior to the modeling of claim reserve amounts,

26.8 39.4 39.1 44.4 46 49.3 54.6 59.2 58.1 57.2 57.9 57.7 59.8 59.9 59.8 59.8 60 59.9 59.9 59.9 25 42.5 43.7 48 49.6 53 62 63.7 65.6 65.3 64.7 65.4 64.5 64.3 67.3 69.4 69.1 69.1 68.9 24.8 41.7 39.4 47.3 47.8 56.4 61.9 62.7 62.5 60.7 60.2 60 59.9 59.3 59.9 59.8 59.7 59.8

27 47.3 42.2 46.4 51.3 54.9 59.7 62.6 62.8 62.9 62.7 61.2 62.5 63 62.8 62.8 62.8 31.6 51.9 43.7 58.1 54.9 56.8 59.5 64.1 62.1 65.3 65.6 64.3 62.9 64.9 64.9 64.2 29.4 41 42.3 45.2 44.5 47.5 49.7 50.4 50.5 53 52.4 51.8 51.8 51.6 51.8 27.7 39.5 46.9 49.9 54.4 53.9 54 53 52.4 52.6 52.2 52.4 52 51.8 29.2 45.7 48.7 52.4 52.8 52.8 50.2 50.6 51 50.9 50.3 49.9 49.7 27.1 47.4 55.3 57 58.5 59.5 59 59.7 61.3 62.1 62.7 62.8 26.6 44.5 49.7 54.8 57.3 56.9 58.6 62.4 61.1 61.4 61.4 28.1 45.9 48 49.8 48.9 50.5 53.2 55.2 54.9 56.3 29.4 42.5 47 47.8 51.3 53.9 57.6 58.4 59.3 28.8 47.3 51.7 59 61.7 64 66.9 69 32.1 46.2 48.3 56 58 63 67.6 22.7 35.3 44.1 52.7 66.1 75.7 24.8 43.8 53.8 61.6 69.1 27.3 42.3 48.8 52.4 26.6 40.6 55.5 30.3 48 27.5

INCURRED

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

DEVELOPMENT YEAR

ACCIDENT YEAR _{30 M€}

40 M€

50 M€

60 M€

70 M€

VALUE

Development triangle due to the quantity and richness of

the claims characteristics that can be collected.

Coupled with data handling libra- ries, graphical grammars are increa- singly efficient, so that they are considered as keystones of visualization. For instance, the combined use of thedplyr andggplot2 packages of the R software effectively captures both aggregated and individual data formats.

On the one hand, the representation of development triangles in a variety

(14)

Executive summary

of forms reveals patterns, the type of activity, specific features of the portfolio, particularly regarding the loss ratio. Due to its standardized nature, this data format is even more able to

Spatial visualization

be processed automatically and leads therefore to an increase in the number of graphical analysis.

On the other hand, graphical representations at the individual scale make it possible to exploit the granularity of individual data and facilitate the extraction of atypical files from the portfolio.

More generally, the spatial representation of data at the individual grid level can promote wide-ranging discussions between the various stakeholders. Indeed, actuaries, managers and underwriters can benefit from ahead-of-the- curve analyses building on the claims history.

Identification of atypical claims and segmentation

Data segmentation aims to create homogeneous groups of claims in a perspective of modeling reserve amounts. In this respect, the identification of large claims among all attritionals is a central issue in reserving, given that they are generally subject to specific processing and that their features differ. For instance, the most traditional aggregated methods are based on assumptions of triangles stability. It is therefore necessary to have an appropriate perimeter to ensure a good fit of the models.

Segmentation by severity threshold. The fixing of a severity threshold for the categoriza- tion of claims represents a first segmentation lever. Rather than imposing arbitrary thresholds

−

50 k€ 100 k€ 150 k€ 200 k€

THRESHOLD

TYPE OF CRITERIA Linearity Test Correlation Test Calendar Effect Test Part of Estimation Error

Threshold intervals levels, it is worth objectifying this

amount by building on representa- tive indicators of the stability of the resultant data.

In that regard, the use of the Chain Ladder method and its stochastic variant, the Mack model on the triangle of attritional claims resulting from segmentation, is an interesting approach : the simple implementation of these methods makes their successive adjustments for a wide range of gravity threshold values,

(15)

Executive summary

conceivable. Consequently, the validity of the model assumptions as well as some indicators can be analyzed with respect to this parameter :

n Linearity assumption

n Assumption of non-correlation of successive development factors

n No calendar effects

n Evolution of the MSEP of the Mack model

The identification and intersection of the threshold intervals for which each criterion is validated make it possible to define a set of admissible values to be compared with the amounts used in practice.

Although this approach does not necessarily result in a threshold level, it is intended to be objective and to provide relevant information to actuaries.

Identification of deviant claims. The segmentation of claims according to a severity thre- shold level usually generates heterogeneity with respect to the most recent attritional claims.

The latter are likely to deflect in the large claims category during their future development.

The use of Machine Learning predictive models to identify the most sensitive claims can help

●

● ● ● ● ● ●

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

● ●

1 3 8 11 14 17 20 22 27 31 35 43 47 49 55

0.8 0.85 0.9 0.95 1 1.05 1.1

Inf

0.02760.00730.00450.00340.00290.00260.00250.0023 0.0020.00180.00180.00170.00160.0016 size of tree

cp

X−val Relative Error

Cross validation

to refine the segmentation. In this context, the CART algorithm, which is calibrated on the most developed part of the claims history, provides a flexible tool for data management and generates results that can be easily in- terpreted. More generally, having a synthetic vision of all claims that are a priori sensitive provides valuable inputs for the various stakeholders.

Finally, the combination of the two segmentation approaches enables the extraction of ad- ditional information on portfolio risk profiles by making the most of individual claims ex- perience data.

Modeling and estimation of ultimate expense amounts

The issues of choosing and implementing claims reserves estimation models without any safety margin are obviously central in a reserving process. Here, the modeling phase is considered from the perspective of weak Artificial Intelligence and is divided into different themes around the automation and exploitation of individual claims data.

Automatic modeling by aggregated methods. Performing diagnostics through the extrac- tion of information and the providing of a final report are daily practices carried out within

(16)

Executive summary

insurance companies. In this respect, the automation of these two processes in the form of an AI shaped as a decision support for actuaries represents a clear added value. Although unable to replace the business expertise of the latter, such an AI is nevertheless effective as an automated second opinion.

The standardization of the data required for its implementation allows to apply it to any type of triangle and to benefit from a performance gain, particularly in terms of computing time.

Modeling of individual data by Machine Learning. The popular methods of Machine Learning allow flexible handling of individual data in order to extract information that was previously unavailable, at least in an efficient and standardized way.

0.008563 n = 31 647 Closing_year < 2010

0.05664 n = 4 749 First_paid < 63 k€

0.005285 n = 26 868

0.02397 n = 4 423

0.00198 n = 1 515

0.08225 n = 3 234 Reporting_delay >= 2

0.3373 n = 83

0.2473 n = 368 First_paid >= 31.7 k€

0.05742 n = 209

0.4969 n = 159 0.07553

n = 3 151 Closing_year < 2010

0.1257 n = 732 0.05733

n = 2 407

Yes No

Leaf 1 Leaf 2 Leaf 3 Leaf 4 Leaf 5 Leaf 6 Leaf 7 Leaf 8

Decision tree Data segmentation enables the ap-

plication of dedicated methods that build on the nature and specificities of the homogeneous groups formed and the data collected as well.

Based on the exploitation of individual developments of attritional claims, the modeling of the oc- currence of payments process is a first step in the estimation of the ultimate expense amounts. This structural framework can be exten-

ded to other variables of interest such as link-ratios, which could recall the Chain Ladder reference approach.

The systematic use of comments, recorded in text form by claims managers for deviant claims, provides a new understanding of the largest ones. Advanced text mining methods, or simply the pragmatic use of regular expressions, lead to the extraction of relevant information and promote a dialogue between actuaries and managers.

Automated restitution of results

The formatting and interpretation of the results achieved by the practices of visualization, information retrieval and modeling, make a significant contribution to the concept of weak reserving AI, not to mention the fact that insurance companies refer to most of them daily in order to enrich reports.

Firstly, theautomated generation of descriptive or conclusive commentsunder natural language enables a substantial time saving to be achieved and contributes to the rationalization of the practice of describing and interpreting results. Considerable research is currently underway on this subject and can be applied at the global portfolio level, as well as to the

(17)

Executive summary

individual claims grid.

Secondly, thedevelopment of interactive web applicationsis becoming more prevalent due to the accessibility of some technologies dedicated to their implementation (for instance, Shiny and Dash applications are adapted to R and Python languages respectively). Such applications are all the more appropriate for reserving because they unify all process analyses within a single interface while allowing the actuary to directly influence modeling choices.

Ultimately, it is indeed the entire reserving process that can be reconsidered from the perspective of weak Artificial Intelligence, without distorting existing actuarial methodsand byintegrating the essential business expertise. This actuarial professional thesis attempted to make the most of the related good practices of manipulation, visualization, modeling and restitution.

Keywords : Automation, Weak Artificial Intelligence, Grammar of graphics, Data visualiza- tion, Natural Language Generation,Web application,Data science, Machine Learning,Regular expression, Individual reserving, Large claims,Segmentation, Severity threshold,Chain Ladder, Mack model

(18)

Table des matières

Résumé 3

Abstract 4

Remerciements 5

Note de synthèse 6

Executive summary 12

Introduction 21

0 Mise en contexte 25

0.1 Généralités sur le provisionnement . . . 25

0.1.1 Introduction . . . 25

0.1.2 Description de la vie d’un sinistre . . . 27

0.1.3 Provisions techniques . . . 28

0.2 Méthodes classiques d’estimation des provisions . . . 31

0.2.1 Triangles de développement . . . 31

0.2.2 Méthodes déterministes . . . 32

0.2.3 Méthodes stochastiques . . . 35

0.3 Enjeux du provisionnement aujourd’hui . . . 36

0.4 Le provisionnement individuel . . . 38

0.4.1 La communauté scientifique en assurance non-vie . . . 39

0.4.2 Méthodes paramétriques . . . 39

0.4.3 Méthodes non paramétriques . . . 41

0.4.4 Discussion . . . 42

0.5 Le rôle des nouvelles technologies et de l’Intelligence Artificielle . . . 44

0.5.1 Intelligence Artificielle et Assurance . . . 44

0.5.2 Enjeux de l’Intelligence Artificielle en provisionnement . . . 45

0.5.3 Attentes et nuances . . . 46

1 Généralités sur la disponibilité et le conditionnement des données 49 1.1 Données individuelles usuelles . . . 49

1.1.1 Variables de développements des sinistres . . . 49

1.1.2 Caractéristiques intrinsèques . . . 50

1.1.3 Variables exogènes . . . 51

1.2 Données émergentes . . . 52

1.2.1 Commentaires des gestionnaires sinistres . . . 52

1.2.2 Autres données non structurées . . . 53

1.3 Traitement des données et Intelligence Artificielle . . . 54

(19)

Table des matières

1.3.1 Représentation des données . . . 54

1.3.2 Bonnes pratiques d’implémentation . . . 56

1.3.3 Les données disponibles en pratique . . . 58

1.4 Considérations autour du RGPD . . . 59

1.4.1 Présentation du RGPD . . . 59

1.4.2 Assurance, Intelligence Artificielle et RGPD . . . 61

1.4.3 Anonymisation et pseudonymisation . . . 62

2 Analyses descriptives des données de sinistralité 63 2.1 Préambule . . . 63

2.1.1 Introduction et objectifs . . . 63

2.1.2 Outils pour la visualisation de données . . . 65

2.2 Analyses des données sous formes agrégées . . . 67

2.2.1 Triangles de développement . . . 67

2.2.2 Cadences de développement . . . 73

2.2.3 Vecteur de primes . . . 76

2.3 Analyses approfondies des données individuelles . . . 77

2.3.1 De la maille agrégée à la maille individuelle . . . 78

2.3.2 Analyses ciblées de la sinistralité . . . 84

2.3.3 Analyses spatiales et cartographie du risque . . . 90

3 Identification de sinistres atypiques et segmentation 96 3.1 Préambule . . . 96

3.1.2 Méthodologie . . . 102

3.2 Détermination du seuil de gravité . . . 103

3.2.1 Prérequis théoriques . . . 103

3.2.2 Analyses descriptives et qualitatives . . . 106

3.2.3 Analyses quantitatives . . . 109

3.3 Identification des sinistres déviants . . . 118

3.3.1 Estimation du nombre de sinistres déviants . . . 120

3.3.2 Identification des sinistres déviants par arbre de régression . . . 123

4 Modélisation des charges ultimes de sinistres 129 4.1 Modélisation automatique des sinistres attritionnels par méthodes agrégées . . . 129

4.1.1 Introduction de la problématique . . . 129

4.1.2 Observations et diagnostics . . . 130

4.1.3 Choix automatiques de modélisation . . . 135

4.2 Modélisation individuelle des sinistres attritionnels par Machine Learning . . . 140

4.2.1 Modélisation du processus d’occurrence de paiements . . . 140

4.2.2 Démarche de modélisation de l’évolution des sinistres . . . 152

4.3 Traitement des sinistres graves . . . 154

4.3.1 Modélisation par l’approche fréquence / coût . . . 154

(20)

Table des matières

4.3.2 Utilisation des commentaires de textes pour l’estimation des IBNER . . 158

4.4 Synthèse des résultats . . . 163

5 Restitution et interprétation automatisée des résultats d’analyses 165 5.1 Génération automatique de textes . . . 165

5.1.2 Revue succincte des méthodologies existantes . . . 166

5.1.3 Exemple d’application aux données de sinistralité . . . 167

5.2 Interfaces interactives . . . 171

5.2.1 Applications web . . . 171

5.2.2 Technologie RShiny . . . 172

5.2.3 Provisionnement avec Shiny : une approche modulaire . . . 175

Conclusion 176

Références 179

Annexe A Représentation individuelle des données de sinistralité 180 Annexe B Représentation agrégée des données de sinistralité 184

Annexe C Collecte et traitement des données 185

Annexe D Evolutions des développements en fonction du seuil de gravité 186 Annexe E Evolution des charges ultimes en fonction du seuil de gravité 189

Annexe F Spécificités d’une application R Shiny 190

(21)

Introduction

Une compagnie d’assurance doit être en mesure d’évaluer précisément le niveau de ses dettes probables, c’est-à-dire le montant des engagements contractés auprès de l’ensemble de ses as- surés, afin de rester solvable. L’assureur constitue à cette occasion des réserves financières de différentes natures suivant la branche d’activité considérée et le risque associé, appelées provi- sions qui apparaissent au passif de son bilan (à l’exclusion des provisions cédées comptabilisées à l’actif). Ces provisions constituent des enjeux stratégiques et économiques importants pour la compagnie.

Dans le cas de l’assurance non-vie, les Provisions pour Sinistres A Payer (PSAP) sans marge de prudence correspondent à l’un des postes essentiels du bilan d’une compagnie, et font l’objet d’une évaluation aussi précise que possible de la part des actuaires. Elles ont pour but de couvrir les coûts engendrés par les sinistres déjà survenus à la date d’inventaire mais qui n’ont pas encore été réglés, ni même déclarés. Les dates de survenance et de déclaration ainsi que les règlements successifs ou encore les évaluations de provisions dossiers/dossiers sont autant d’élé- ments caractéristiques du développement des sinistres dont l’appréhension est nécessaire dans l’optique de la constitution des PSAP. La littérature actuarielle recense différentes méthodes spécifiques d’estimation des provisions qui exploitent les données de sinistralité.

Les méthodes les plus classiques, dont Chain Ladder fait figure de proue, reposent sur l’exploitation des données agrégées sous forme de triangle de liquidation. Appréciées pour leur simplicité de compréhension et de mise en œuvre, elles sont parmi les plus appliquées au sein des compagnies. Bien que robustes, ces méthodes souffrent néanmoins d’un certain manque de flexibilité et les résultats sont par nature obtenus à une maille agrégée ce qui ne permet pas de répondre à un certain nombre d’enjeux auxquels fait face le provisionnement aujourd’hui.

Il apparaît que des développements supplémentaires capables de fournir une connaissance approfondie des risques des compagnies sont toujours en attente, notamment concernant l’ap- préhension et la modélisation des sinistres graves, et pouvant bénéficier aux problématiques de réassurance ou de tarification. Ce constat est corroboré par les avancées technologiques ré- centes et l’avènement du big data qui permettent aux compagnies de collecter de plus en plus de données. Jusqu’alors peu exploitées dans la pratique, ces données font aujourd’hui l’objet de développements et d’analyses de risques de plus en plus poussés bousculant les techniques traditionnelles de provisionnement.

De nombreuses contributions basées sur l’exploitation des données individuelles de sinistralité ont ainsi été proposées dans le cadre de la modélisation des PSAP. Ces approches innovantes peuvent être classées en deux catégories, bien que la frontière soit parfois floue.

n Les méthodes paramétriques, d’une part, ont généralement pour but de modéliser le dé- veloppement des sinistres via l’utilisation de leurs caractéristiques propres et s’inscrivent dans un cadre probabiliste structurel.

n Les méthodes non paramétriques, d’autre part, tentent de profiter de l’intégralité des informations annexes disponibles dans un environnement plus souple.

Parmi cette dernière catégorie, les algorithmes de Machine Learning font l’objet d’un surcroît d’intérêt car ils s’inscrivent dans le contexte de l’Intelligence Artificielle (IA) et de la science des données. Ces problématiques innovantes sont à l’origine de l’intérêt prononcé pour l’analytics au sein des compagnies qui voient leurs équipes de data scientists se développer fortement.

(22)

Introduction

Toutefois, l’apport des nouvelles méthodes individuelles paramétriques comme non paramé- triques est à nuancer. En effet, la plupart des approches paramétriques de provisionnement ligne à ligne reposent sur des hypothèses fortes de modélisation et souffrent d’une flexibilité limitée de prise en charge des données. Les méthodes d’apprentissage statistiques quant à elles, bien que prometteuses, ne sont pas encore arrivées à maturité au point de remplacer les méthodes classiques dans les pratiques actuarielles. Elles peuvent en revanche s’avérer utiles pour l’exploitation de la multitude d’informations qu’il est possible de collecter à la maille du sinistre.

Plus généralement, les technologies de l’Intelligence Artificielle peuvent constituer des outils performants capables d’apporter de l’information supplémentaire sur la sinistralité et les risques encourus et de faciliter la mise en œuvre des processus. La prise en charge et l’exploration des données comme l’automatisation des pratiques les plus courantes, ou encore l’élaboration de sensibilités ou d’allocations intelligentes à la maille sinistres sont autant d’éléments qu’il est possible d’appréhender sous l’angle d’une intelligence automatisée.

Il convient néanmoins de préciser dans ce contexte que le terme d’Intelligence Artificielle doit être entendu au sens faible et de façon pragmatique : les industries technologiques sont encore loin de la mise en œuvre de véritables intelligences autonomes synonymes d’IA forte. Par consé- quent, l’application de telles méthodologies à l’assurance et au provisionnement a pour but de fournir aux actuaires des outils d’analyses et d’aide à la décision susceptibles d’améliorer la performance.

C’est donc fort de ces divers constats que nous proposons d’orienter ce mémoire d’actuariat selon la problématique des méthodologies innovantes de Machine learning et de l’Intelligence Artificielle au sens faible, dans le but de proposer une nouvelle vision du provisionnement et des pratiques associées.

« Comment les nouvelles technologies et des éléments d’Intelligence Artificielle faible peuvent-ils apporter un se- cond regard sur le provisionnement des compagnies d’as- surance et tirer parti des informations récoltées à la maille individuelle des sinistres ? »

Les travaux réalisés sont présentés sous la forme d’un workflow dont les blocs matérialisent les modules d’une Intelligence automatisée et visent à reconstituer l’enchaînement des différentes étapes réalisées lors d’un processus classique de provisionnement, de la prise en charge des données à la restitution des résultats sous la forme de rapports d’analyses. La structure de l’IA proposée est illustrée par la figure ci-dessous. Les modules qui la constituent seront traités et décrits en autant de parties spécifiques dans la suite du rapport, si bien que cette figure illustre à elle seule la structure du mémoire.

Nous insistons sur le fait que les développements autour du provisionnement qui seront proposés dans ce mémoire s’inscrivent en termes d’IA faible dans une logique d’amélioration continue des pratiques actuarielles en restant fidèle aux processus déjà existants. Ces développements ne sauraient se substituer à l’expertise métier des actuaires dont le rôle est au cœur du processus.

Nous débutons ce mémoire par une mise en contexte qui reprend de façon détaillée et approfondie les différentes considérations exposées dans cette introduction. La première partie met

(23)

Introduction

Eléments d’Intelligence Artificielle faible en provisionnement

1. Informations disponibles et conditionnement des données

 Méthodologies open source

 Manipulation de tidy data

 Bonne pratiques d’implémentation La collecte, la prise en charge et le bon

conditionnement des données sont des prérequis indispensables à la conception d’une Intelligence Artificielle faible en provisionnement qui soit à la fois pertinente et efficace.

2. Analyses descriptives des données de sinistralité

3. Identification des sinistres atypiques et segmentation

4. Modélisation des charges ultimes de sinistres

5. Restitution automatisée des résultats

 Grammaire de manipulation de données

 Grammaire graphique

 Cartographies des risques La réalisation de représentations graphiques

innovantes permet d’extraire l’essentiel des informations des données de sinistralité, qu’elles soient sous format agrégé ou individuel, et aboutit à l’identification de profils caractéristiques des risques sous- jacents.

 Chain Ladder et modèle de Mack

 Calculs automatisés en fonction de seuils

 Algorithme prédictif tree based model La segmentation des sinistres en groupes

homogènes est nécessaire en vue de leur appliquer des méthodes de modélisation adéquates. L’estimation d’un seuil et l’identification de sinistres atypiques favorisent le dialogue entre les différents acteurs.

La rationalisation du processus d’estimation des provisions sous la forme d’une IA d’aide à la décision et la mise en œuvre de modèles prédictifs d’apprentissage répondent aux enjeux d’automatisation et d’exploitation des données individuelles auxquels fait face le provisionnement.

 Calculs automatisés

 Méthode individuelle

 Algorithmes de Machine Learning

 Analyse de texte et expressions régulières

 Générateur de langage naturel

 Interactive web applications La mise en forme et l’interprétation

intelligente des résultats obtenus à l’issue de l’ensemble des analyses concrétisent la notion d’IA faible en provisionnement à travers la génération automatique de rapports et la conception d’interfaces interactives.

Structure de l’intelligence automatisée

(24)

Introduction

ensuite l’accent sur la structure et la prise en charge des données qu’elles soient sous forme individuelle ou agrégée, quand la deuxième est dédiée à leurs analyses exploratoires et descriptives.

La troisième partie traite de la séparation des sinistres en bases de graves et d’attritionnels.

La quatrième s’intéresse ensuite à la modélisation des provisions pour ces deux catégories de sinistres. Enfin, la cinquième et dernière partie porte sur les techniques relatives à la génération automatisée de rapports d’analyses.

En définitive, ce mémoire a pour but de proposer de bonnes pratiques actuarielles concrètes, efficaces, et applicables d’un point de vue métier, basées sur l’exploitation des nouvelles technologies, et à même de répondre à certains enjeux tels que la connaissance approfondie des profils de sinistralité, l’automatisation et la rationalisation des processus ou encore le traitement des sinistres graves.

(25)

0.Mise en contexte

0 Mise en contexte

0.1 Généralités sur le provisionnement

0.1.1 Introduction

L’activité d’assurance repose sur la volonté qu’ont les individus de se prémunir des événements aléatoires dommageables auxquels ils sont exposés. Deux grandes catégories coexistent dans ce contexte : l’assurance dite non vie qui est relative aux dommages et à la protection des biens et l’assurancevie qui concerne les phénomènes liés à la durée de vie des individus assurés.

Le présent mémoire s’inscrit dans le cadre de l’assurance non vie dont nous représentons le mécanisme global par le schéma simplifié de la figure 0.1. Nous y décrivons la relation entre un assuré et son assureur, relation selon laquelle le premier s’engage à verser une prime au second en échange du versement de prestations financières dans le cas où un événement aléatoire, décrit précisément dans les termes du contrat, se réaliserait au cours de la période assurée.

Période assurée

Temps

Prime d’assurance

Survenance aléatoire

Délai aléatoire

Indemnisation aléatoire

Figure 0.1 – Représentation simplifiée de la relation d’assurance

Nous avons représenté lecertainen traits pleins etl’incertain en traits pointillés : à la signature du contrat, le montant de la prime ainsi que la période de couverture sont connus, tandis que la survenance d’un sinistre est aléatoire de même que son coût ou encore la date de l’indemnisation associée. Le prix de revient d’un produit d’assurance ne peut donc être connu qu’à l’issue d’une période de durée indéterminée, ce qui différencie l’activité d’assurance de celle des autres entreprises. On parle souvent de « cycle inversé ». Par conséquent, un assureur engagé auprès d’un grand nombre de clients doit être en mesure d’honorer ses engagements et ce à chaque instant : en souscrivant des contrats, la compagnie s’endette auprès de ses assurés à hauteur d’un montant indéterminé, même si celui-ci peut être anticipévia des études tarifaires (dans le cadre du processus de tarification qui ne sera pas abordé dans ce mémoire).

La problématique de provisionnement est fondée sur le caractère aléatoire sur lequel repose le fonctionnement global d’une assurance : la société ne doit pas uniquement comptabiliser ses dettes certaines, elle doit également estimer de façon précise la dette potentielle dont elle devra s’acquitter envers les assurés en cas de sinistre, et constituer des provisions en conséquence.

Notons cependant que les éléments certains de la figure 0.1 doivent être nuancés : le versement de la prime d’assurance n’est pas totalement certain car une annulation de prime, voire la résiliation du contrat par l’assuré peut par exemple intervenir dans certains cas de figure.

(26)

0.Mise en contexte

Le mécanisme de provisionnement est par conséquent central au sein de l’activité d’une assurance et a des répercussions stratégiques et financières importantes : les provisions constituées apparaissent au passif du bilan, et sont indirectement liées au résultat technique de la compagnie (on se place hors du cadre de la réassurance dans tout le mémoire, et les provisions sont perçues brutes de réassurance). Une situation de sous-provisionnement peut par exemple conduire à la faillite tandis qu’un sur-provisionnement a pour effet un décalage de l’émergence du résultat dans le temps potentiellement néfaste pour la rentabilité de la société.

La lecture d’un bilan d’assurance peut ainsi s’effectuer de droite à gauche en adéquation avec la notion d’inversion du cycle de production : les engagements de l’assureur sont matérialisés par les provisions techniques au passif du bilan, déclinées en différentes catégories que nous explicitons par la suite, et sont couverts par les placements de l’actif. Les fonds propres reflètent quant à eux la situation nette de l’entreprise et n’ont pas pour but de financer l’activité, mais de protéger financièrement les assurés contre des événements défavorables comme une éventuelle dérive de sinistralité par exemple. C’est notamment la raison pour laquelle, dans le cadre de la réglementation prudentielle Solvabilité II, il est exigé des compagnies d’assurance qu’elles disposent d’un niveau réglementaire minimum de fonds propres permettant l’exercice de leur activité. Les principaux éléments du bilan sont représentés de façon très simplifiée sur la figure 0.2.

Fonds Propres

Provisions Techniques

nettes Placements

Actif Passif

PSAPPPNA PRECPM PRCPRE Autres…

Capital Résultat Autres…

Figure 0.2 – Représentation très simplifiée d’un bilan d’une compagnie d’assurance Non-Vie Le calcul des montants provisions est également soumis à différentes réglementations dont les objectifs sont de natures diverses :

n Les bilans statutaires en normes comptables locales présentent les états financiers de l’entreprise sur lesquels sont notamment calculés ses impôts.

n Les bilans économiques sous Solvabilité II reflètent la santé économique de la société et sont établis dans une optique prudentielle. Les provisions enregistrées au bilan des compagnies sont calculées selon une approche dite Best Estimate (meilleure évaluation), tout en prenant en compte les frais de gestion, et l’actualisation par la courbe des taux sans risque.