Analyse de l'impact de la dépendance sur l'évaluation individuelle des réserves en assurances IARD

(1)

© Roxane Turcotte, 2019

Analyse de l'impact de la dépendance sur l'évaluation

individuelle des réserves en assurances IARD

Mémoire

Roxane Turcotte

Maîtrise en actuariat - avec mémoire

Maître ès sciences (M. Sc.)

(2)

Analyse de l’impact de la dépendance sur l’évaluation

individuelle des réserves en assurances IARD

Mémoire

Roxane Turcotte

Sous la direction de:

Hélène Cossette

(3)

Résumé

Dans ce mémoire, il sera question de la modélisation de réserve en assurances générales.

Puis-qu’une base de données provenant de l’industrie a été utilisée dans le cadre de ce projet,

une attention particulière a été portée à des considérations pratiques. Encore aujourd’hui, les

modèles appliqués en pratique sont souvent des modèles simples qui sont utilisés à cause de

leur commodité. Par contre, de plus en plus de données sont disponibles et la possibilité d’en

tirer profit est de plus en plus grande grâce à l’augmentation de la capacité computationnelle.

Les méthodes classiques de provisionnement délaissent donc le potentiel de perfectionnement

que permet le détail des données.

Les modèles dits « individuels », dont il sera question dans ce projet, cherchent à expliquer

la dynamique de l’évolution des sommes payées par réclamation. Ces modèles tirent parti

des informations détaillées de chaque paiement pour modéliser la réserve du portefeuille. Il a

été décidé de reprendre l’idée des facteurs de développement utilisés par Pigeon et al. (2013)

qui sont inspirés de ceux de la méthode de Chain-Ladder. On considérera toutefois une loi

multivariée construite par copule pour modéliser conjointement les variables de ce vecteur

de développement plutôt qu’une loi normale multivariée asymétrique telle qu’utilisée dans

l’article précédemment mentionné.

On s’est également intéressé à la dépendance présente entre certaines composantes

caractéri-sant la réclamation, comme le délai de déclaration (en années), le délai de premier paiement

(en années) et le nombre de paiements.

(4)

Table des matières

Résumé

iii

Table des matières

iv

Liste des tableaux

vi

Liste des figures

viii

Remerciements

x

Introduction

1

1 Modèles classiques collectifs

7

1.1 Méthode déterministe de Chain-Ladder

. . . .

7

1.2 Modèle stochastique de Mack . . . .

8

1.3 Modèles linéaires généralisés pour les réserves . . . .

11

2 Modéliser la dépendance

17

2.1 Distributions multivariées elliptiques . . . .

17

2.2 Définition et propriétés des copules . . . .

20

2.3 Inférence statistique . . . .

29

2.4 Mesures d’association

. . . .

34

3 Modèle de réserve individuel

40

3.1 Composantes temporelles

. . . .

41

3.2 Modèle de fréquence . . . .

43

3.3 Modèle de sévérité . . . .

44

3.4 Méthode d’inférence . . . .

45

3.5 Estimé du montant total de réserve . . . .

49

4 Analyses numériques

51

4.1 Présentation des données

. . . .

51

4.2 Analyse de la dépendance . . . .

55

4.3 Application des modèles collectifs classiques . . . .

63

4.4 Application de modèles individuels . . . .

65

4.5 Discussion des résultats . . . .

88

(5)

(6)

Liste des tableaux

0.1 Triangle de développement incrémental

. . . .

2

0.2 Triangle de développement cumulé . . . .

2

1.1 Triangle de développement cumulé complété . . . .

8

1.2 Triangle de développement exprimé en fonction de g(γ + α

i

+ ψ

j

) . . . .

14

1.3 Quelques exemples de matrices de design

. . . .

14

4.1 Triangle de développement incrémental pour AB (en milliers) . . . .

53

4.2 Triangle de développement incrémental pour BI (en milliers)

. . . .

53

4.3 Triangle de développement incrémental pour APD (en milliers) . . . .

53

4.4 Nombre de dossiers présentant des particularités, selon la classe . . . .

54

4.5 Montant de réserve réalisé . . . .

55

4.6 Adaptation du tau de Kendall à des variables aléatoires discrètes appliquée aux

composantes temporelles . . . .

55

4.7 Adaptation du rho de Spearman à des variables aléatoires discrètes appliquée

aux composantes temporelles . . . .

56

4.8 Rho de Spearman estimés pour chacun des couples de variables composant le

vecteur de développement, respectivement pour les classes de sinistres AB, BI

et APD . . . .

61

4.9 Tau de Kendall estimés pour chacun des couples de variables composant le

vecteur de développement, respectivement pour les classes de sinistres AB, BI

et APD . . . .

62 4.10 Valeurs-p associées au test de significativité pour les rho de Spearman (Table

4.8)

. . . .

62 4.11 Valeurs-p associées au test de significativité pour les tau de Kendall (Table 4.9),

62 4.12 Montant espéré de réserve selon les modèles agrégés classiques

. . . .

64 4.13 Quantiles sélectionnés de la distribution prédictive simulée - Modèle de Mack .

64 4.14 Nombre de dossiers exclus selon la cause et la classe . . . .

66 4.15 Sélection de modèle - délai de déclaration, délai de premier paiement, nombre

de paiements partiels . . . .

67 4.16 Paramètres estimés

. . . .

68 4.17 Moyennes empiriques des composantes du vecteur de développement . . . .

69 4.18 Statistiques descriptives pour réclamations fermées . . . .

71 4.19 Paramètres estimés pour les distributions du premier paiement . . . .

74 4.20 Paramètres estimés pour la structure de variance choisie . . . .

76 4.21 Montant de réserve selon le modèle individuel de Pigeon et al. (2013) (pour

∆ = 0) . . . .

77

(7)

4.22 Quantiles sélectionnés de la distribution prédictive simulée - Modèle de Pigeon

et al. (2013) (pour ∆ = 0)

. . . .

78 4.23 Sélection de lois marginales pour les éléments du vecteur de développement des

sinistres AB . . . .

79 4.24 Sélection de lois marginales pour les éléments du vecteur de développement des

sinistres BI . . . .

80 4.25 Sélection de lois marginales pour les éléments du vecteur de développement des

sinistres APD . . . .

81 4.26 Paramètres estimés des distributions marginales

. . . .

82 4.27 Critère AIC pour l’ajustement de la structure de dépendance . . . .

85 4.28 Paramètres de la copule normale . . . .

86 4.29 Paramètres de la copule de Student . . . .

86 4.30 Montant de réserve selon le modèle individuel proposé . . . .

88 4.31 Quantiles sélectionnés de la distribution prédictive simulée - Modèle proposé

.

88 4.32 Résumé des principaux résultats . . . .

92

(8)

Liste des figures

0.1 Dynamique pour un modèle collectif . . . .

3

0.2 Dynamique pour un modèle individuel . . . .

3

0.3 Développement typique d’un sinistre en assurance générale

. . . .

4

0.4 Développement d’un sinistre en assurance générale dans un cas de réouverture

4

2.1 Fonctions de densité pour des lois normales asymétriques où µ = 0, σ

2 = 1 et

∆ ∈ {−5, 0, 5}. . . .

20

2.2 5000 simulations de la copule d’indépendance . . . .

24

2.3 5000 simulations de la copule de Frank pour α ∈ {∞, 5, 0, −5, −∞}

. . . .

24

2.4 5000 simulations de la copule de Gumbel pour α ∈ {1, 1.5, 2, 10, ∞}

. . . .

25

2.5 5000 simulations de la copule de Clayton pour α ∈ {0, 1, 10, ∞}

. . . .

25

2.6 5000 simulations de la copule de Clayton pour α ∈ {−1, −0.99, −0.60, −0.40, −0.25}

26

2.7 5000 simulations de la copule de AMH pour α ∈ {−1, −0.5, 0, 0.5, 1} . . . .

26

2.8 Quelques structures classiques de la matrice α pour la copule gaussienne . . . .

27

2.9 5000 simulations de la copule gaussienne pour α ∈ {1, 0.95, 0, −0.95, −1} . . . .

28 2.10 5000 simulations de la copule de Student pour α ∈ {1, 0.95, 0, −0.95, −1} et ν = 4

28 2.11 5000 simulations de la copule de Student pour α ∈ {1, 0.95, 0, −0.95, −1} et ν = 1

29 2.12 5000 simulations de la copule de Student pour α ∈ {1, 0.95, 0, −0.95, −1} et

ν = 30 . . . .

29

3.1 Évolution empirique en temps continu du règlement d’un sinistre extrait de la

base de données . . . .

41

3.2 Évolution empirique en temps discret du règlement d’un sinistre extrait de la

base de données . . . .

41

3.3 Évolution d’un sinistre en assurance générale . . . .

43

4.1 Nombre d’unités d’exposition . . . .

54

4.2 Lorsque les variables sont indépendantes, distributions des tau de Kendall

em-piriques pour la classe de sinistres AB . . . .

57

4.3 Lorsque les variables sont indépendantes, distributions des rho de Spearman

empiriques pour la classe de sinistres AB

. . . .

58

4.4 Lorsque les variables sont indépendantes, distributions des tau de Kendall

em-piriques pour la classe de sinistres BI . . . .

59

4.5 Lorsque les variables sont indépendantes, distributions des rho de Spearman

empiriques pour la classe de sinistres BI . . . .

60

4.6 Distribution prédictive pour le modèle de Mack . . . .

65

(9)

4.8 BI - Données observées (ligne pleine) et estimation (ligne brisée) . . . .

69

4.9 APD - Données observées (ligne pleine) et estimation (ligne brisée) . . . .

69 4.10 Matrices de variance-covariance empiriques des composantes du vecteur de

dé-veloppement, respectivement AB, BI et APD. . . .

70 4.11 Matrices de corrélations empiriques des composantes du vecteur de

développe-ment, respectivement AB, BI et APD. . . .

70 4.12 Ajustement d’une loi normale sur le logarithme du premier paiement pour la

classe AB . . . .

72 4.13 Ajustement d’une loi normale sur le logarithme du premier paiement pour la

classe BI . . . .

73 4.14 Ajustement d’une combinaison de lois normales sur le log du premier paiement

pour la classe BI . . . .

73 4.15 Ajustement d’une loi normale sur le logarithme du premier paiement pour la

classe APD . . . .

74 4.16 Sélection d’une structure de variance pour la distribution log-normale

multi-variée (UN pour non structurée (unstructured), TOEP pour Toeplitz, CS pour

échangeable (compound symmetry) et DIAG pour diagonale)

. . . .

75 4.17 Distribution prédictive pour le modèle individuel de Pigeon et al. (2013) (pour

∆ = 0) pour les trois classes de sinistres (ligne pleine : réalisation / lignes

pointillés : moyenne et 99

e

centile) . . . .

77 4.18 Comparaison entre les distributions empiriques et les distributions estimées

pour les marginales du vecteur de développement de la classe AB . . . .

82 4.19 Comparaison entre les distributions empiriques et les distributions estimées

pour les marginales du vecteur de développement de la classe BI . . . .

83 4.20 Comparaison entre les distributions empiriques et les distributions estimées

pour les marginales du vecteur de développement de la classe APD . . . .

84 4.21 Distribution prédictive pour le modèle individuel proposé utilisant une copule

normale pour les classes AB et BI (ligne pleine : réalisation / lignes pointillés :

moyenne et 99

e

centile)

. . . .

86 4.22 Distribution prédictive pour le modèle individuel proposé utilisant une copule

de Student pour les classes BI et APD (ligne pleine : réalisation / lignes

poin-tillés : moyenne et 99

e

centile) . . . .

87 4.23 Comparaison entre les distributions empiriques et les distributions marginales

de la loi normale multivariée estimée pour le vecteur de développement de la

classe AB . . . .

89 4.24 Comparaison entre les distributions empiriques et les distributions marginales

de la loi normale multivariée estimée pour le vecteur de développement de la

classe BI . . . .

90 4.25 Comparaison entre les distributions empiriques et les distributions marginales

de la loi normale multivariée estimée pour le vecteur de développement de la

(10)

Remerciements

Je tiens d’abord à remercier ma directrice et mon co-directeur de mémoire, les professeurs

Hélène Cossette et Mathieu Pigeon. Merci pour vos commentaires et suggestions pour

amé-liorer la qualité du contenu de ce mémoire. Merci également pour votre soutien et le temps

que vous avez pris pour répondre à mes questions.

Je remercie Desjardins Assurances pour le partage des données qui ont servi pour ce projet

et pour son support tout au long de la réalisation de ce mémoire.

Ensuite, je voudrais remercier le Conseil de recherches en sciences naturelles et en génie du

Canada, le Fonds québécois de la recherche sur la nature et les technologies, la Chaire

d’ac-tuariat de l’Université Laval, Intact Assurance et la Banque nationale du Canada pour leur

soutien financier au cours de mes études de maîtrise.

Je remercie également mes camarades aux cycles supérieurs et au laboratoire Act&Risk :

Ihsan, Christopher, Itre, Amine, Anas, Francis, Jean-Thomas et Simon-Pierre. Merci pour

l’amitié, le support et les discussions.

Finalement, je remercie mes parents, Ginette et Richard, pour leur amour, leur support

in-conditionnel et l’aide apportée tout au long de mes études.

(11)

Introduction

Les sociétés d’assurances sont soumises à plusieurs contraintes législatives de solvabilité

ser-vant à garantir leurs engagements financiers envers leurs assurés. Pour les compagnies

d’assu-rance IARD (Incendie, Accidents et Risques Divers), cela se traduit, en partie, par la

constitu-tion d’une réserve de capital couvrant la part encore impayée des pertes assurables encourues.

Pour permettre la mise en place de cette réserve, il faudra prévoir, avec la plus grande précision

possible, les réclamations futures fondées sur des observations passées.

Ces sommes conservées en avance pour assurer le règlement complet futur des réclamations

sont nécessaires pour plusieurs raisons. Entres autres, un assureur vend une police d’assurance

à un certain prix à un grand nombre de clients. Le principe de base de l’assurance est que

l’ensemble des primes recueillies servira au paiement des sinistres encourus par quelques

assu-rés. On parle de mutualisation des risques. Par contre, au moment où les polices d’assurance

sont souscrites et payées, l’assureur ne connait pas encore ce qu’il lui en coûtera pour couvrir

toutes les pertes de ses assurés. L’assureur vend donc un produit dont il ne connaît pas encore

le coût de production, ni l’échéancier des paiements qui pourraient s’échelonner sur plusieurs

années. Par conséquent, l’assureur doit conserver une partie des primes perçues afin d’avoir

les fonds nécessaires pour indemniser des dossiers qui auraient nécessité un délai de règlement

plus long. De plus, il est essentiel de maintenir un certain niveau de capital pour prévenir les

mauvaises années et assurer la solvabilité de la compagnie d’assurance.

L’assurance joue un important rôle dans l’économie des pays développés. En effet, le risque

financier associé à un accident de la route, à la perte d’une habitation ou à la perte d’une

compagnie est, en général, trop important pour être assumé par un seul individu. L’absence

d’assurance retiendrait des investissements nécessaires au bon fonctionnement de l’économie.

Par conséquent, la mise en place d’une réserve actuarielle est essentielle pour assurer la

sol-vabilité d’une compagnie d’assurance et ainsi maintenir la confiance envers ces institutions.

Ultimement, les provisions techniques servent à protéger les assurés, les actionnaires et même

l’État. La plupart des modèles de provisionnement existants peuvent être divisés en deux

catégories, les modèles collectifs et les modèles individuels, basé sur la façon dont le jeu de

données sous-jacent est complet ou détaillé.

(12)

mé-thodes classiques de provisionnement sont des mémé-thodes collectives. Dans cette approche, on

cherche à capter la dynamique de l’évolution d’une agrégation de paiements à une autre pour

estimer le montant de la réserve. On ne tient pas compte des sommes payés individuellement

pour chaque réclamation.

On représente couramment les données à l’aide d’un triangle de développement soit des

paie-ments incrémentaux (voir Table 0.1), soit des montants cumulés (voir Table 0.2). Les triangles

de développement sont une façon classique de représenter l’évolution des sommes payées. Les

rangées correspondent aux années de survenance i et les colonnes aux années de

développe-ment j. On note Y

i,j

le montant incrémental payé pour les sinistres survenus l’année i, mais

dont le paiement a été effectué j années après la survenance. Le paiement cumulé est noté

C

i,j

, où C

i,j

= Y

i,1

+ Y

i,2

+ . . . + Y

i,j

. Chaque diagonale représente une année calendaire.

(i, j)

1

2 . . .

n − 1

n

1 Y

1,1

Y

1,2

. . .

Y

1,n−1

Y

1,n

2 Y

2,1

Y

2,2

. . .

Y

2,n−1

. . .

n − 1

Y

n−1,1

Y

n−1,2

n

Y

n,1

Table 0.1 – Triangle de développement incrémental

(i, j)

1

2 . . .

n − 1

n

1 C

1,1

C

1,2

. . .

C

1,n−1

C

1,n

2 C

2,1

C

2,2

. . .

C

2,n−1

. . .

· · ·

. . .

n − 1

C

n−1,1

C

n−1,2

n

C

n,1

Table 0.2 – Triangle de développement cumulé

Les modèles individuels, quant à eux, cherchent plutôt à expliquer la dynamique au niveau de

la réclamation, c’est-à-dire que l’on cherche à expliquer la dynamique de développement au

niveau de chaque réclamation individuellement plutôt que d’expliquer la dynamique de

déve-loppement d’une agrégation. Ces modèles tirent parti des informations détaillées de chaque

paiement pour modéliser la réserve du portefeuille. Les Figures 0.1 et 0.2 offrent une

repré-sentation schématique de ce qui différencie un modèle individuel d’un modèle collectif.

(13)

Figure 0.1 – Dynamique pour un modèle collectif

Figure 0.2 – Dynamique pour un modèle individuel

La Figure 0.3 présente le développement typique d’un sinistre en assurance générale. Le

pre-mier événement représenté est la survenance d’une perte assurable. Il vient ensuite la

notifica-tion à l’assureur, puis les paiements d’indemnisanotifica-tion. Lorsque le sinistre est réglé, il est alors

fermé. Dans un modèle individuel, chacune de ces composantes sont modélisées et peuvent

servir à prédire le montant de réserve. Aussi, il n’est pas exclu qu’un sinistre puisse être

ré-ouvert. Le développement de la réclamation serait alors plutôt semblable à celui représenté à

la Figure 0.4.

(14)

Survenance

D´eclaration

Paiement(s) d’indemnisation

1 er

_Pmt

...

... (U + 1)

e

Pmt

Fermeture

Figure 0.3 – Développement typique d’un sinistre en assurance générale

Survenance

D´eclaration

Paiement(s) d’indemnisation

1 er

_Pmt

...

Fermeture

R´eouverture du dossier

Paiement(s) d’indemnisation

...

... (U + 1)

e

_Pmt

2 e

_Fermeture

Figure 0.4 – Développement d’un sinistre en assurance générale dans un cas de réouverture

Traditionnellement, un modèle collectif incluait peu ou pas de relations de dépendance entre

ses différentes composantes. En pratique, l’approche la plus utilisée est la méthode collective,

en particulier les modèles inspirés de la méthode algorithmique de Chain-Ladder. L’un des

premiers modèles collectifs est le modèle de Mack (voir Mack (1993) et Mack (1999)) qui est

en quelque sorte une version stochastique de la méthode de Chain-Ladder. Les modèles qui

donnent la même estimation ponctuelle que la méthode de Chain-Ladder ont été largement

étudiés par le passé, notamment par England and Verrall (2002).

Plus récemment, des modèles collectifs plus raffinés ont été développés. Un certain nombre de

modèles collectifs récents se concentraient autour de la modélisation de la dépendance entre

lignes d’affaire. Notamment, on peut nommer Shi and Frees (2011) qui modélise la dépendance

entre différentes lignes d’affaire en associant par une copule deux paiements de deux différents

triangles de développement. Abdallah et al. (2015) a proposé une généralisation de cette

approche. Ils proposent de procéder en deux étapes. D’abord, en reprenant l’idée proposée

par Barnett and Zehnwirth (2000), une dépendance est introduite entre tous les paiements

appartenant à la même année calendaire pour chacune des lignes d’affaires. Ensuite, une autre

structure de dépendance est considérée pour associer les années calendaires de différentes

lignes d’affaire au moyen de copules archimédiennes. On pourrait finalement nommer Côté

et al. (2016) qui propose une approche différente pour inclure de la dépendance entre les

lignes d’affaire : on propose de modéliser les lois marginales en utilisant les modèles linéaires

généralisés, puis les résidus standardisés de ces modèles sont liés au moyen d’une copule

sélectionnée en utilisant des méthodes basées sur les rangs.

Tel que mentionné, une approche alternative aux modèles collectifs sont les modèles

indivi-duels. Des travaux ont d’ailleurs été consacrés à la comparaison des deux approches pour tenter

de départager la plus appropriée, voir, par exemple, Jin and Frees (2013), Huang et al. (2015)

et Charpentier and Pigeon (2016). Bien que l’idée d’utiliser un modèle individuel remonte aux

années 1980, leur implémentation était limitée par le manque de capacité computationnelle

et le manque de mémoire informatique pour conserver des données utilisables sur chacune

(15)

des réclamations. Les avancées technologiques permettent de plus en plus de remédier à ces

limitations.

Parmi les premiers travaux dans ce domaine, on peut nommer Norberg (1986) qui a proposé

un modèle individuel décrivant l’occurrence, le délai de déclaration et la sévérité de chacune

des réclamations séparément. Ces dernières années, différentes méthodes individuelles ont été

proposées. Des modèles autant en temps continu (voir Antonio and Plat (2014)) qu’en temps

discret (voir Antonio et al. (2016)) ont été travaillés et Wüthrich (2018) a étudié la

possibi-lité d’inclure des techniques d’apprentissage automatique. On pourrait également mentionner

Haastrup and Arjas (1996) qui ont développé un modèle Bayésien non-paramétrique dont les

principales hypothèses sont reprises du travail de Norberg (1993). D’ailleurs, depuis le début

des années 2000, beaucoup de travail a été fait pour assouplir les hypothèses d’indépendance

(Larsen (2007)), inclure de la dépendance dans la modélisation en utilisant les copules (Zhao

and Zhou (2010)) ou en utilisant une distribution multivariée asymétrique (Pigeon et al.

(2013)).

Le modèle proposé par Pigeon et al. (2013) considère des facteurs de développement inspirés de

ceux de la méthode de Chain-Ladder pour expliquer l’évolution des paiements d’un dossier de

réclamation. Soit {Y

1 , Y

2 , . . . , Y

U

}, l’ensemble des paiements effectués pour régler un sinistre.

Pigeon et al. (2013) propose de noter l’évolution des paiements par

Λ = [Y

1 λ

1 . . . λ

U −1

],

où

λ

j

=

P

j+1

r=1

Y

r

P

j

r=1

Y

r

.

Les auteurs proposent d’utiliser une loi normale multivariée asymétrique afin de modéliser

conjointement les variables du vecteur Λ.

Dans ce mémoire, on reprend l’idée utilisée par Pigeon et al. (2013) selon laquelle l’évolution

des paiements est décrite par des facteurs de développement. On considère ici plutôt une loi

multivariée construite par copule en remplacement de la loi normale multivariée asymétrique

afin de rendre la structure du modèle plus flexible, en particulier au niveau de la modélisation

des marginales. La modélisation du vecteur Λ constituera la principale question d’intérêt de

ce projet. On s’intéressera également à la dépendance présente entre les éléments du vecteur

Λ et entre les composantes temporelles de la Figure 0.3.

On dispose d’une base de données d’un important assureur au Canada. On utilise ces données

pour analyser la dépendance présente entre les variables et pour tester la qualité du modèle

proposé sur des données réelles. Il s’agit de données d’assurance automobile dont on dispose

des informations pour trois catégories de sinistres : les blessures corporelles de l’assuré, les

(16)

blessures corporelles d’une tierce partie et les dommages au véhicule. Les blessures corporelles

sont des sinistres dont les paiements s’échelonnent régulièrement sur plusieurs années, tandis

que les sinistres concernant les dommages au véhicule sont majoritairement réglés après un

seul paiement. On ajustera les modèles pour chacune des catégories de sinistres, mais on aura

un intérêt plus particulier pour les dommages corporels dont la croissance est plus lente et

dont la perte maximale n’est pas limitée. Puisqu’on dispose de données réelles, on s’attardera

également sur des considérations plus pratiques dans l’application des modèles. Compte tenu

de la quantité de données disponibles, on tronque le jeu de données afin de permettre une

comparaison entre les prédictions des modèles et une estimation de la réserve réelle.

Pour commencer, on aborde au Chapitre 1 les modèles collectifs classiquement utilisés dans

l’industrie pour prédire le montant de réserve. Plus spécifiquement, on aborde la méthode de

Chain-Ladder, le modèle de Mack (1993) et les modèles linéaires généralisés appliqués au

pro-visionnement. Il s’agit de méthodes qui émettent différentes hypothèses d’indépendance entre

les éléments composant le modèle. Ces hypothèses d’indépendance ne peuvent pas toujours

s’avérer réalistes. On s’intéresse donc au Chapitre 2 à différentes façons de mesurer

l’associa-tion entre des variables aléatoires afin de tester les hypothèses d’indépendance. On aborde

également dans cette section différentes distributions multivariées permettant de modéliser un

vecteur aléatoire et on s’intéresse aux façons de juger de l’adéquation du modèle aux données.

Au Chapitre 3, on présente le modèle proposé par Pigeon et al. (2013) et les modifications

suggérées pour que le modèle admette une plus grande flexibilité. La dernière section fournit

une analyse numérique de l’ensemble de concepts traités aux sections précédentes. En

parti-culier, les approches collectives et individuelles présentées seront comparées afin d’examiner

quel type de modèle a le mieux su capter la dynamique de règlement et prédire le montant

de réserve.

(17)

Chapitre 1

Modèles classiques collectifs

Antérieurement aux premiers modèles stochastiques, une méthode intuitive déterministe pour

l’évaluation des réserves en assurance IARD a été développée, nommément la méthode de

Chain-Ladder. Cette méthode a d’ailleurs inspiré de nombreux modèles collectifs stochastiques

parmi les plus connus, dont le modèle de Mack (modèle non paramétrique) et les modèles

linéaires généralisés appliqués à la modélisation des réserves (modèles paramétriques), dont

il sera question dans ce chapitre. Il existe cependant un grand nombre de modèles collectifs

pour les réserves. Pour une revue exhaustive de ces méthodes, on peut consulter Wüthrich

and Merz (2008).

Pour établir le cadre de travail, et en particulier la notation, on présentera d’abord la méthode

de Chain-Ladder. Elle est, par ailleurs, une véritable référence dans le domaine, étant la

méthode de provisionnement ayant été la plus largement adoptée par la pratique.

1.1 Méthode déterministe de Chain-Ladder

L’idée derrière la méthode de Chain-Ladder repose sur l’hypothèse d’une évolution stable des

sommes payées. Ainsi, on suppose que l’ensemble des sinistres survenus à la période d’accident

i seront entièrement réglés n périodes de développement plus tard et surtout que l’évolution

des coûts d’une période de développement j à une autre est représentative de ce qui a été

observé par le passé.

Pour fin de simplicité, on travaillera sur une base annuelle. Cela est d’ailleurs cohérent avec ce

qui est fait en pratique. On parlera donc subséquemment d’année d’accident (ou d’année de

survenance) plutôt que de «période» d’accident et on référera à des années de développement

plutôt qu’à des «périodes» de développement.

Dans la méthode de Chain-Ladder, on utilise le triangle de développement cumulé (voir Table

0.2) pour prédire le montant de réserve. Selon cette méthode, le développement à l’ultime

d’un sinistre est obtenu en multipliant le dernier montant cumulé observé par des facteurs de

(18)

développement λ

_k

, k ∈ {j, . . . , n − 1} où j ∈ {1, . . . , n − 1}, identiques quelque soit l’année

de survenance i concernée, c’est-à-dire

b

C

i,n

= C

i,j

n−1

Y

k=n+1−i

b

λ

k

,

(1.1)

pour i ∈ {2, . . . , n}.

Ces facteurs multiplicatifs sont estimés à partir des observations passées de la manière

sui-vante :

ˆ

λ

k

=

P

n−k

i=1

C

i,k+1

P

n−k

i=1

C

i,k

pour

k = 1, . . . , n − 1.

(1.2)

Avec ces estimations, on peut facilement compléter la partie inférieure du triangle des

paie-ments cumulés tel qu’illustré à la Table 1.1 et prédire le montant de réserve R en utilisant

l’équation (1.3).

(i, j)

1

2 . . .

n − 1

n

1 C

1,1

C

1,2

. . .

C

1,n−1

C

1,n

2 C

2,1

C

2,2

. . .

C

2,n−1

C

ˆ

2,n

. . .

n − 1

C

n−1,1

C

n−1,2

. . .

C

ˆ

n−1,n−1

C

ˆ

n−1,n

n

C

n,1

C

ˆ

n,2

. . .

C

ˆ

n,n−1

C

ˆ

n,n

Table 1.1 – Triangle de développement cumulé complété

b

R =

n

X

i=1

b

R

i

=

n

X

i=1

b

C

i,n

− C

i,n+1−i

=

n

X

i=2

n

X

j=n−i+2

b

Y

i,j

.

(1.3)

La méthode de Chain-Ladder s’avère donc une méthode purement algorithmique dont on ne

peut tirer une mesure de variabilité ou une distribution prédictive. Par contre, une version

stochastique de cette méthode déterministe a été développée et il en sera question à la

sous-section suivante.

1.2 Modèle stochastique de Mack

Le modèle de Mack (voir Mack (1993)) est un modèle non paramétrique, version stochastique

de la méthode de Chain-Ladder. Il fournit exactement la même estimation ponctuelle du

montant de réserve. L’avantage notable de ce modèle est qu’il permet le calcul d’une variance

pour l’estimation de la réserve et, ultimement, d’une approximation de la distribution de la

réserve.

(19)

Définition 1. Les hypothèses du modèle de Mack sont :

1. E[C

_i,j+1

|C

_i,1

, . . . , C

i,j

] = C

i,j

λ

j

, pour i ∈ {1, . . . , n} et j ∈ {1, . . . , n − 1} ;

2. {C

_i,1

, . . . , C

i,n

}, {C

i

0 _,1

, . . . , C

_i

0 _,n

} ∀ i 6= i

0 , sont indépendants ;

3. Var[C

i,j+1

|C

i,1

, . . . , C

i,j

] = σ

j

2 C

i,j

, pour i ∈ {1, . . . , n} et j ∈ {1, . . . , n − 1}.

Dans ce modèle, on suppose d’abord que l’espérance de la variable aléaloire C

i,j+1

est reliée

à la dernière variable aléatoire observée C

i,j

par un facteur multiplicatif λ

j

(Hypothèse 1).

Cela veut dire qu’il est possible de calculer le coût de la prochaine période en connaissant les

observations passées. Les facteurs multiplicatifs λ

j

sont estimés avec (1.2).

Ensuite, on suppose l’indépendance entre les variables appartenant à des années de survenance

différentes (Hypothèse 2).

Sous ces hypothèses, on peut d’abord démontrer que les facteurs de développement λ

_k

sont

non corrélés et que leurs estimateurs sont non biaisés. Ensuite, on peut vérifier que, pour tout

k > n − i + 1, on a

E[C

_i,n

|D] = C

_i,n+1−i

λ

n+1−i

× . . . × λ

n−1

,

(1.4)

où D : {C

_i,j

|i + j < n + 1}. L’ensemble D correspond en fait à toutes les variables observées

jusqu’à présent, c’est-à-dire aux éléments du triangle de développement tel qu’illustré à la

Table 0.2.

Dans un deuxième temps, le calcul de l’erreur de prévision nécessite une troisième hypothèse.

L’estimateur de l’erreur quadratique moyenne conditionnelle de prédiction (MSEP pour Mean

Square Error of Prediction) pour l’ensemble des années de survenance est donné par

\

MSEP

P

i

C

i,n

|D

n

X

i=1

d

C

i,n

!

=

n

X

i=1

\

MSEP

C

_i,n|Dn

(

C

b

_i,n

)

+ 2

X

1≤i<k≤J

C

i,n−i+1

C

b

_k,n−i+1





n−1

Y

j=n−i+1

ˆ

λ

2 _j

+

σ

ˆ

2 j

P

n−1

i=1

C

b

_i,j

!

−

n−1

Y

j=n−i+1

ˆ

λ

2 _j





,

où MSEP

_C

_i,n

|D

n

(

C

b

i,n

) = Var[C

i,n

|D

n

] + (

C

b

i,n

− E[C

i,n

|D

n

])

2 _{. Pour plus de détails, voir}

Wü-thrich and Merz (2008).

Les paramètres σ

_j

2 , j ∈ {1, . . . , n − 2} sont estimés par l’estimateur non biaisé

ˆ

σ

2 _j

=

1 n − j − 1

n−j

X

i=1

C

i,j

C

i,j+1

C

i,j

− ˆ

λ

j

!

2 .

Pour j = n − 1, on extrapole linéairement la suite des σ

2 j

en postulant que

ˆ

σ

_n−3

2 ˆ

σ

_n−2

2 =

ˆ

σ

2 _n−2

ˆ

σ

2 _n−1

, tout

(20)

pratique (voir Wüthrich and Merz (2008)). Cela conduit à l’estimateur suivant pour σ

2 n−1

:

ˆ

σ

2 _n−1

= min

σ

ˆ

4 n−2

ˆ

σ

_n−3

2 , min(ˆ

σ

2 n−3

, ˆ

σ

n−2

2 )

!

.

La popularité de ce modèle dans le domaine pratique est certainement due à sa simplicité et

à son caractère intuitif. Par contre, les hypothèses sous-jacentes à ce modèle peuvent ne pas

toujours être réalistes. Par exemple, en cas de changements majeurs des règles de souscription,

l’indépendance entre années de survenance peut ne plus tenir.

Distribution prédictive

Puisqu’aucune distribution ne sert de base au modèle, il n’est pas possible a priori de construire

des intervalles de confiance. Par contre, on peut toujours supposer une loi normale ou

log-normale (pour plus de conservatisme), mais cela peut ne pas toujours s’avérer adéquat.

Une autre façon de faire serait d’approcher numériquement la distribution en procédant par

ré-échantillonnage. On peut consulter Shao and Tu (2012) pour une description

exhaus-tive des méthodes de échantillonnage les plus couramment utilisées. En résumé, le

ré-échantillonnage est basé sur l’idée d’utiliser l’estimation de la distribution de la population

réelle afin d’en obtenir des échantillons qui pourront permettre, entre autres, de construire

des distributions prédictives. La technique de ré-échantillonnage la plus couramment utilisée

pour la modélisation de réserves est le Bootstrap qui consiste à échantillonner avec remise

dans l’échantillon d’origine.

Concrètement, pour construire une distribution prédictive pour le modèle de Mack, on estime

d’abord par la méthode de Chain-Ladder les facteurs de développement λ

_j

. On calcule ensuite

les facteurs de développement individuels observés f

i,j

=

C

_C

i,j+1

_i,j

. Avec ces deux valeurs, on peut

calculer les résidus de Pearson

r

i,j

=

f

i,j

−

λ

b

_j

c

σ

j

/

p

C

i,j

,

car sous le modèle de Mack, on a

E

"

C

i,j+1

C

i,j

|C

i,1

, . . . , C

i,j

#

= λ

j

et

Var

"

C

i,j+1

C

i,j

|C

i,1

, . . . , C

i,j

#

=

σ

2 j

C

i,j

.

L’échantillon sur lequel on appliquera le Bootstrap un très grand nombre de fois est constitué

de ces résidus. On prédira les pertes futures par la méthode de Chain-Ladder pour chacun

des échantillons. En fait, on calculera les valeurs de f

_i,j

B

telles que

f

_i,j

B

= r

B

_i,j

σ

2 j

C

i,j

+ λ

_j

,

(1.5)

(21)

Ainsi, pour chaque échantillon simulé, on peut alors calculer avec (1.5) les réalisations des

facteurs de développement, dont on se servira pour déterminer le montant de réserve en

utilisant la méthode de Chain-Ladder. On peut ainsi modéliser l’erreur d’estimation.

Dans une seconde étape, on simule l’erreur du processus. On utilise le montant de réserve

obtenu précédemment en tant que l’espérance de la distribution hypothétique (normale,

log-normale, etc.) et on simule une réalisation du montant de réserve à partir de cette distribution.

Les montants de réserve ainsi obtenus forment la distribution prédictive.

On peut voir entre autres England and Verrall (1999) et Pinheiro et al. (2003) pour plus de

détails concernant l’application de ces techniques au provisionnement en assurance.

1.3 Modèles linéaires généralisés pour les réserves

Au contraire de ce qui a été présenté jusqu’à présent, les modèles linéaires généralisés sont

construits en fonction des montants incrémentaux plutôt que des paiements cumulatifs. De

plus, l’utilisation des modèles linéaires généralisés (GLM, pour Generalized Linear Models)

pour l’estimation des provisions nécessite de construire un modèle paramétrique pour les

incréments Y

_i,j

.

On rappelle d’abord les notions de base sur les GLMs. Cela permettra par ailleurs d’introduire

la notation appropriée pour leur application dans le cadre des réserves qui sera abordée par la

suite. Pour une revue plus complète et générale sur les modèles linéaires généralisés, on peut

consulter McCulloch and Searle (2004).

1.3.1 Modèles linéaires généralisés

Dans un modèle linéaire généralisé, on cherche à modéliser l’espérance de la variable d’intérêt

Y

i,j

, c’est-à-dire E[Y

i,j

] = µ

i,j

.

Dans ce type de modèles, l’espérance de la variable d’intérêt n’est pas expliquée linéairement

par les variables exogènes. En effet, on effectue une régression linéaire sur g(µ

i,j

) plutôt

que directement sur µ

_i,j

, où g() est une fonction communément nommée fonction de lien.

(22)

est le vecteur de schéma et β est le vecteur de paramètres.

Définition 2. Les hypothèses du modèle linéaire généralisé sont :

1. Les variables Y

i,j

∀ i, j ∈ {1, . . . , n} sont indépendantes.

2. La fonction de densité de probabilité de Y

_i,j

est de la forme :

f (Y

i,j

; θ

i,j

, φ) = c(Y

i,j

, φ) exp

_Y

i,j

θ

i,j

− a(θ

i,j

)

φ

,

(1.6)

où θ

i,j

est appelé le paramètre naturel, φ est le paramètre de dispersion et c() et a() sont

des fonctions.

Les variables Y

_i,j

sont indépendantes pour toute année de survenance i et pour toute année

de développement j. Elles sont modélisées par une loi de probabilité appartenant à la famille

exponentielle linéaire dont les deux premiers moments sont

E[Y

_i,j

] = µ

_i,j

= a

0 (θ

_i,j

)

(1.7)

et

Var[Y

i,j

] = φ

i,j

a

00 (θ

i,j

),

(1.8)

où a

0 (θ) et a

00 (θ) sont les première et seconde dérivée de a(θ) par rapport à θ. En posant

θ = (a

0 )

−1

(µ) dans (1.8), on obtient

Var[Y

i,j

] = φ

i,j

a

00 (θ

i,j

) = φ

i,j

a

00 ((a

0 )

−1

(µ

i,j

)) = φ

i,j

V (µ

i,j

),

(1.9)

où V () est nommée fonction de variance. Cette fonction permet de lier les expressions de

l’espérance et de la variance pour une distribution appartenant à la famille exponentielle.

Notons que la loi Poisson et la loi gamma sont membres de la famille exponentielle linéaire.

En effet, pour la loi Poisson, on a

Pr(Y

i,j

= y

i,j

) =

µ

y

_i,j

i,j

e

−µ

i,j

y

i,j

!

=

1 y

i,j

!

exp(y

_i,j

ln(µ

_i,j

) − µ

_i,j

)

et par identification à (1.6), on déduit que θ

i,j

= ln(µ

i,j

), a(θ

i,j

) = exp(θ

i,j

) et φ

i,j

= 1. On

mentionne également que la fonction de variance est V (µ

_i,j

) = µ

_i,j

.

(23)

f

Y

(y

i,j

) =

1 Γ(ν)

νy

i,j

µ

i,j

!

ν

exp

−y

i,j

ν

µ

i,j

!

1 y

i,j

!

=

(νy

i,j

)

ν

yΓ(ν)

exp

−y

_i,j

ν

µ

i,j

− ν ln(µ

_i,j

)

!

=

(νy

i,j

)

ν

y

i,j

Γ(ν)

exp







−y

1 µ

i,j

1 ν

+ ν ln

1 µ

i,j

!







=

(νy

i,j

)

ν

y

i,j

Γ(ν)

exp







−y

_i,j

1 µ

i,j

+ ln

1 µ

i,j

!

1 ν







,

où θ

_i,j

=

−1

µ

i,j

, φ =

1 ν

et a(θ) = − ln(−θ). La fonction de variance est V (µ

i,j

) = µ

2 i,j

. On

remarque que sa forme est similaire à ce qui a été présentée pour le modèle Poisson.

En terminant, quelques mots sur la fonction de lien g(). On mentionne d’abord qu’il s’agit

d’une fonction monotone. De plus, on note que le prédicteur linéaire est défini sur l’ensemble

des réels, x

0 _i,j

_{β ∈ R. Toutefois, l’espérance µ}

_i,j

est parfois définie sur un espace S plus restreint,

µ

i,j

∈ S. Par conséquent, les fonctions de lien telles que g : S → (−∞, ∞) sont souvent

privilégiées, bien que ce ne soit pas absolument nécessaire.

Pour expliquer ce qui a été énoncé précédemment, prenons l’exemple du modèle Poisson.

Dans ce modèle, l’espérance doit être positive, c’est-à-dire µ

_i,j

_{∈ R}

+

\{0}. En considérant la

fonction de lien logarithmique, g(µ

i,j

) est alors défini sur les réels.

On note finalement que le lien entre l’espérance de la variable réponse et les variables

expli-catives n’a pas besoin d’être linéaire grâce à la fonction de lien.

1.3.2 Application pour le provisionnement en assurance IARD

On modélisera une fonction de l’espérance de Y

i,j

en incorporant des paramètres dépendant

de l’année de survenance i et de l’année de développement j, respectivement représentés par

α

i

et ψ

j

de la façon suivante :

E[Y

_i,j

] = γ + α

_i

+ ψ

_j

,

(1.10)

pour i, j ∈ {2, . . . , n}.

On suppose les paramètres α

₁

et ψ

₁

égaux à zéro. En effet, on ne peut obtenir une solution

unique pour le vecteur des paramètres sans émettre d’hypothèses supplémentaires, car le

(24)

(1, 1) comme la cellule de référence. Par conséquent, le paramètre γ représente les pertes

incrémentales moyennes pour la cellule de référence.

On peut adapter le triangle de développement à cette modélisation, tel que représenté à la

Table 1.2.

(i, j)

1

2 · · ·

n − 1

n

1 g

−1

(γ)

g

−1

(γ + ψ

2 )

· · ·

g

−1

(γ + ψ

n−1

)

g

−1

(γ + ψ

n

)

2 g

−1

(γ + α

2 )

g

−1

(γ + α

2 + ψ

2 )

· · ·

g

−1

(γ + α

2 + ψ

n−1

)

· · ·

n − 1

g

−1

(γ + α

_n−1

)

g

−1

(γ + α

_n−1

+ ψ

₂

)

· · ·

n

g

−1

(γ + α

n

)

· · ·

Table 1.2 – Triangle de développement exprimé en fonction de g(γ + α

i

+ ψ

j

)

Dans un cas comme celui-ci, le vecteur de paramètres β correspondrait à

β = [γ, α

2 , . . . , α

n

, ψ

2 , . . . , ψ

n

]

0 .

La Table 1.3 présente différents exemples de matrices de design, où chaque rangée correspond

à un exemple.

Valeur incrémentale Y

i,j

X

0 c

2 c

3 c

4 . . .

l

2 l

3 l

4 . . .

Y

1,1

1

0

0 . . .

0

0 . . .

Y

1,2

1

0

0 . . .

0

0 . . .

Y

1,3

1

0

1

0 . . .

0

0 . . .

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

Y

2,1

1

0

0 . . .

1

0

0 . . .

Y

2,2

1

0

0 . . .

1

0

0 . . .

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

Y

4,3

1

0

1

0 . . .

0

1 . . .

Y

4,4

1

0

1 . . .

0

1 . . .

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

..

.

Table 1.3 – Quelques exemples de matrices de design

Explicitement, dans un modèle comme celui-ci, g(µ

_i,j

) est obtenu par

g(µ

i,j

) = γX

0 + ψ

0 C + α

0 L,

où α est le vecteur des α

i

pour i ∈ {2, 3, . . . , n} et ψ est le vecteur des ψ

j

pour j ∈

{2, 3, . . . , n}. Quant à C et L, il s’agit respectivement du vecteur des c

_j

pour j ∈ {2, 3, . . . , n}

et du vecteur des l

i

pour i ∈ {2, 3, . . . , n} avec l

k

= 1 pour Y

i,j

si i = k (et 0 sinon), et c

k

= 1

(25)

On termine en mentionnant qu’utiliser une fonction de lien logarithmique permet d’obtenir

un modèle multiplicatif qui peut être plus facilement interprétable. En effet, si g() = ln(), on

a

ln(E[Y

_i,j

]) = γ + α

_i

+ ψ

_j

et, par conséquent,

E[Y

_i,j

] = exp(γ + α

_i

+ ψ

_j

)

= exp(γ) exp(α

_i

) exp(ψ

_j

).

Modèle Poisson

Tel que mentionné précédemment, la loi Poisson appartient à la famille exponentielle linéaire.

Dans le modèle Poisson, la fonction de variance est V (µ

_i,j

) = µ

_i,j

et g() = ln(). Dans ce

modèle, on suppose que le montant de perte incrémental Y

i,j

est une réalisation d’une loi

Poisson. Implicitement, on suppose que Y

i,j

appartient à N. Bien que Y

i,j

soit en fait une

variable aléatoire continue, les pertes sont généralement élevées dans un modèle agrégé et

arrondir à l’unité consiste en une approximation plus qu’acceptable. Si les hypothèses sont

respectées, l’estimation du niveau de la réserve obtenue par ce modèle est, tout comme le

mo-dèle de Mack, identique à l’estimé obtenu par la méthode de Chain-Ladder. Conséquemment,

le modèle Poisson est une justification supplémentaire, différente de celle du modèle de Mack,

à la méthode de Chain-Ladder.

En pratique, un inconvénient du modèle Poisson est l’égalité entre l’espérance et la variance.

Pour ajouter de la surdispersion dans le modèle, on peut y introduire un paramètre de

dis-persion φ supérieur à 1. On parle alors de modèle quasi-Poisson. La fonction de variance n’est

plus égale à la moyenne µ

i,j

. En effet, on a V (µ

i,j

) = φµ

i,j

. Cela ne modifie pas les estimations

des montants de réserve, associés à l’espérance, mais cela modifie la valeur de la variance.

Autres modèles

Outre le modèle de Poisson, d’autres modèles intéressants sont les modèles Gamma et

Twee-die. En fait, la famille Tweedie de distributions est formée par les membres de la famille

exponentielle dont la fonction de variance a la forme V [µ] = µ

p

. Puisque la fonction de

va-riance d’une loi de Poisson est V [µ] = µ et que celle d’une Gamma est V [µ] = µ

2 , ces deux

distributions sont des cas particuliers de la famille Tweedie. Si p ∈]1, 2[, on retrouve une loi

Poisson composée, avec des sauts obéissant à une loi Gamma.

Distribution prédictive

Un avantage de l’utilisation des modèles linéaires généralisés est que cette approche permet de

faire des tests d’hypothèses sur les paramètres et offre un cadre statistique plus conventionnel

(26)

pour réaliser des tests d’adéquation. Par contre, il faut se préoccuper de la surparamétrisation

et ce modèle comporte des inconvénients similaires à ceux du modèle de Mack, à savoir les

hypothèses d’indépendance et le développement complet en n années de développement.

Dans un modèle linéaire généralisé, on peut démontrer que les paramètres γ, α

i

et ψ

j

sont

asymptotiquement de loi normale. Pour ψ

_j

, on aurait

√

n(

ψ

b

_j

− ψ

_j

)

L

−

→ N (0, I(ψ

_j

)

−1

). La

va-riable aléatoire g(µ

i,j

) est donc de loi asymptotiquement normale, puisqu’elle est une

combinai-son linéaire des premières variables aléatoires mentionnées (voir McCulloch and Searle (2004)).

En notant σ l’écart-type de g(µ

_i,j

) et \

g(µ

i,j

) son estimateur, il est possible de construire un

intervalle de confiance I

µ

pour µ

i,j

de la manière suivante :

\

g(µ

i,j

) − q

z

σ ≤ g(µ

i,j

) ≤ \

g(µ

i,j

) + q

z

σ

⇐⇒ g

−1

( \

g(µ

i,j

) − q

z

σ) ≤ µ

i,j

≤ g

−1

( \

g(µ

i,j

) + q

z

σ).

L’inconvénient avec cette façon de procéder est que l’intervalle ne sera plus nécessairement

centré autour de l’estimation. En effet, \

g(µ

i,j

) − q

z

σ ≤ g(µ

i,j

) ≤ \

g(µ

i,j

) + q

z

σ est un intervalle

centré autour de g(µ

_i,j

). Par contre, en appliquant g

−1

() de chaque côté de l’inégalité, rien

ne garanti que l’intervalle sera toujours symétrique. On pourrait également recourir à une

technique de bootstrap pour remédier à cette situation, de façon similaire à ce qui a été

présenté pour le modèle de Mack à la Section 1.2. Finalement, on pourrait considérer la

delta-méthode basée sur un développement de Taylor et qui permet d’approximer la distribution

asymptotique (voir Casella and Berger (2002)).

(27)

Chapitre 2

Modéliser la dépendance

Plusieurs modèles classiques pour les réserves en actuariat IARD émettent différentes

hypo-thèses quant à l’indépendance de certaines variables. Il a été mentionné au chapitre précédent

que ces hypothèses pouvaient ne pas toujours être réalistes. On cherchera donc à construire un

modèle tenant compte de cette dépendance entre les variables. Dans ce chapitre, on présente

différents concepts permettant de quantifier et de modéliser l’association entre plusieurs

va-riables. On aborde dans un premier temps une classe spécifique de distributions multivariées,

soit les distributions elliptiques. On poursuit avec une brève présentation de la théorie des

copules incluant les méthodes d’inférence. Enfin, on discute de certaines mesures d’association.

2.1 Distributions multivariées elliptiques

Il existe un large éventail de distributions multivariées, continues ou discrètes (voir Johnson

et al. (1997) et Kotz et al. (2000)) permettant de définir une structure de dépendance au

sein d’un vecteur aléatoire. Pour les fins de ce mémoire, on présente la classe de distributions

multivariées elliptiques qui sera utilisée au Chapitre 4.

Les distributions elliptiques sont une famille de distributions qui généralisent la loi normale

multivariée. Dans cette famille, on retrouve les versions multivariées des lois normale, Student

(Cauchy, lorsque la valeur du degré de liberté est 1), stable, logistique et Laplace. Ces

distri-butions sont définies en termes de leur fonction caractéristique (voir Landsman and Valdez

(2003) ou Fang et al. (2017)).

Définition 3. Un vecteur X de dimension d a une distribution sphérique si et seulement si,

pour sa fonction caractéristique ψ() il existe une fonction réelle φ() telle que

ψ(t) = φ(t

0 t),