• Aucun résultat trouvé

BIG DATA et données externes dans les modèles de tarification

N/A
N/A
Protected

Academic year: 2022

Partager "BIG DATA et données externes dans les modèles de tarification"

Copied!
23
0
0

Texte intégral

(1)

BIG DATA et données externes

dans les modèles de tarification

(2)

BIG DATA

  BIG DATA : Quelques clés

  Eric FROIDEFOND – MAAF – MBA CNAM ENASS en cours

  Intégration du BIG DATA dans la tarification en assurances IARD

  Stéphane CHAPPELLIER – ACTUARIS – ISG CEA IA

(3)

Les opportunités pour l’assurance 2

La gouvernance des données 5

3 Le fonctionnement

Conclusion 6

Le Big Data 1

Les moyens techniques pour le Big Data 4

BIG DATA : Quelques clés

(4)

VOLUME VELOCITE

VARIETE

VALEUR

D’après le Gartner, le « Big Data » peut se définir avec le concept des 3V :

Volume des données disponibles

 Variété : données semi structurées voire non structurées complexes et de tous types (textes, images, …)

BIG DATA : Définition

(5)

BIG DATA : Une avalanche de données

(6)

Les Produits Marketing &

Ventes

Gestion des contrats

Gestion Sinistres

Gestion des Actifs

Nouveaux marchés Nouveaux produits Connaissance des risques et meilleure tarification

Optimisation des produits

Gestion de la performance Segmentation plus fine

Nouveaux clients Vente multi-canal Détection résiliation

Optimisation et ciblage des campagnes

commerciales « just in time »

Optimisation de la gestion des réseaux de prestataires Détection des fraudes

Prévention et mitigation des risques

Gestion des paiements

Stratégie de placement Gestion de Portefeuille

Gestion des actifs et passifs

Modélisation des risques

Tarification temps réel

BIG DATA : Principales opportunités pour l’assurance

(7)

BIG DATA : Fonctionnement

(8)

BIG DATA : Intégration

(9)

Calcul du nombre de tweets par utilisateur

BIG DATA : Zoom sur le MapReduce

(10)

BIG DATA : Moyens techniques (le cloud computing)

(11)

BIG DATA : La visualisation

(12)

Exactitude

Objectivité

Plausibilité

Réputation

Pertinence

Quantité appropriée des informations

Actualité Exhaustivité

Représentation concise Représentation cohérente

Interprétabilité Compréhensible

Disponibilité / Opportunité

Restriction d’accès

Les dimensions de la qualité des données

Qualité intrinsèque Qualité liée au contexte et à

la représentation Qualité liée à la sécurité et à l’accessibilité

BIG DATA : Une gouvernance des données obligatoire

(13)

BIG DATA : Conclusion

Support Client

CLIENT

Innovation

Etudes Marketing

Produits & Services assurance

Analyses & Etudes

Stratégie

(14)

Positionnement tarifaire et données 2

Assurances et capteurs / réseaux sociaux 5

3 Quel apport de données externes ?

Conclusion 6

Tarification prime pure et données 1

Challenge BIG DATA : connectabilité & algorithmes 4

BIG DATA dans la tarification en assurances IARD

(15)

Tarification prime pure et données

  Etablissement prime pure : recherche de données permettant d’expliquer la sinistralité grâce au :

  GLM

  Classification pour zonier et véhiculier

  Données traditionnellement utilisées pour l’établissement de la prime pure limitées :

  Données essentiellement internes

  Faible recours à des données externes

  Mouvement vers l’utilisation de plus données :

  Variables croisées : âge x sexe (maintenant banni)

  Interne : croisement de données entre produits :

 Auto / MRH : âge x propriétaire/location résidence principale : variable tarifaire en auto

 Données bancaires / prêt et données assurances

  Externe :

 INSEE : densité, éloignement des services essentiels…

(16)

Positionnement tarifaire et données

  Positionnement tarifaire : recherche de données permettant d’expliquer le choix de l’assuré :

  Modèle d’élasticité au prix de la demande

  Positionnement concurrentiel

  Algorithme de « valeur client »

  Optimisation tarifaire

  Ces modèles très utilisés au Royaume-Uni, sont encore très peu utilisés en France, néanmoins cela devrait évoluer :

  Loi Hamon  potentiel effet ciseau

 Comment fidéliser le portefeuille ?

  Comparateurs  potentiel anti-sélection

 Comment acquérir les profils à valeur ajoutée ?

  Ces modèles sont très gourmands en données :

  Données connaissance du risque

  Données relation client

  Données flux primes / sinistres avec effet retard

  Existe-t-il des données BIG DATA permettant

(17)

Quel apport de données externes ?

  L’utilisation de données externes (sans parler de BIG DATA) est actuellement faible et limité :

  Données INSEE, données délinquance (CartoCrime) …

  Données Véhicules : SRA, constructeurs, SIV …

  Ces données permettent d’acquérir des variables complémentaires qui permettent de qualifier plus finement le risque qu’à partir des données transmises par

le réseau et/ou l’assuré :

  La ville de résidence est-elle en zone rurale peu peuplée ou en zone urbaine ? Est-ce un lieu où la criminalité est faible ou élevée ?

  Le véhicule est-il une :

 citadine : pour aller faire les course le week-end ?

 sportive : pour épater les copains et sortir en boîte ?

 familiale : pour partir en vacances avec la famille ?

 commerciale : pour faire des tournées en province ?

(18)

Challenge BIG DATA : connectabilité & algorithmes

  Il y a plusieurs problèmes majeurs à l’utilisation des données BIG DATA en assurance :

  Connectabilité : il faut pouvoir relier les données à un client en portefeuille ou en affaires nouvelles

  Algorithme : il faut pouvoir disposer d’un algorithme permettant de valoriser ces données

 Quelle influence ce critère a sur la sinistralité ou le comportement de souscrire / renouveler ?

 Pour ce critère, quelles sont les modalités qui permettent de connaitre l’intensité de cette influence ?

  Pouvoir prédictif suffisant :

 Ce critère n’était pas déjà capturé par d’autres variables déjà connues

 Ce critère est-il plus puissant / prédictif que les variables déjà connues ?

  Est-ce que l’investissement nécessaire le mérite ?

(19)

Assurance et capteurs

Port OBD-II

Source : VAG

Capteur de données physiologiques Source: TF1

Parmi les données BIG DATA, il existe une catégorie qui regroupe les qualités

recherchées permettant de mieux caractériser le risque. Plutôt que de se baser sur la recherche de variable permettant de traduire un comportement à risque, cette catégorie cherche à capturer le comportement à risque directement à la source Les capteurs :

  Auto : OBD-II

 comportement de conduite : freinage brusque, coups de volant intempestifs

  MRH : Domotique

 comportement des occupants

  Santé : capteur de données physiologiques

 activité physique, intellectuelle…

De nombreux handicaps empêchent l’exploitation de ces données

  Au-delà d’obtenir des algorithmes permettant de mesurer le comportement et son influence sur le coût du risques

(20)

  Il semble difficile de trouver des données pertinentes qui traduisent un comportement à risque de façon plus pertinente que celles déjà utilisées

  Par contre, les réseaux sociaux peuvent apporter beaucoup concernant le positionnement tarifaire :

  Sensibilité, attentes (écoresponsable, développement durable…)

  Réceptivité aux messages marketing

  Réactivité face aux changements

  Fidélité

  Elasticité au prix…

  Du fait de cet apport, la chaine de répartition de la valeur va-t-elle se recomposer pour prendre en compte l’apport des réseaux sociaux dans l’équation ?

  Réseaux sociaux  réseaux affinitaires ?

  Réseaux sociaux  apporteurs d’affaires / comparateurs / distributeurs ?

Assurance et réseaux sociaux

(21)

Conclusion

Conjoncture favorable aux assurés et défavorable aux assureurs :

  La « génération internet » rentre sur le marché : zapping

  Possibilité de zapper d’assureurs plus facilement (Loi Hamon, comparateurs)

  Pouvoir d’achat en baisse suite à la crise

  Processus tarifaire « français » en retard sur les autres marchés

Opportunités :

  Les assurés n’attendront pas que les assureurs aient

sophistiqué leur processus tarifaire pour changer d’assureur

  Tirer partie des enseignements reçus sur les autres marché pour se positionner / différencier

  Un challenge pour les actuaires

  Expérimentations

  Utilisation de données et de modèles moins bien maitrisés

  Evolutions plus rapides et plus fréquentes des processus tarifaire

Importance cruciale d’un suivi et d’une réactivité aux changements de tendances

Source : L’Argus de l’Assurance

(22)

BIG DATA : Bibliographie

  VINT Research report 2 of 4 – Big Social - Predicting behavior with Big Data – SOGETI

  Site PEGASUSDATA.COM

  Wikipedia

  Livre blanc ISACA : BIG DATA : Impacts et Avantages

  http://www.journaldunet.com/developpeur/outils/les-solutions-du-big-data/principe-de- fonctionnement-de-mapreduce.shtml

  http://datascience.bluestone.fr/blog/les-origines-les-grands-principes-du-big-data

  VINT Research report 1 of 4 – Creating clarity with Big Data – Jaap Bloem, Menno Van Doorn – Sander Duivestein – Thomas Van Manen – Erik Van Ommeren - SOGETI

  Basé sur une analyse du Boston Consulting Group (BCG)

  IDC (International Data Corporation)

(23)

Les intervenants

Stéphane CHAPPELLIER Actuaire IA

Responsable du Pôle IARD Tél. : +33 (0)1 56 89 07 70 Direct : +33 (0)1 56 89 30 72 Fax : +33 (0)1 56 89 07 71

E-mail : stephane.chappellier@actuaris.com Eric FROIDEFOND

Direction Systèmes d’Information Manager Entité DSI Professionnels MBA CNAM – ENASS en cours Direct : +33 (0)5 49 17 55 90 Port : +33 (0)6 83 18 76 53

E-mail : eric.froidefond@maaf.fr

Références

Documents relatifs

1: In summary.mclustBIC(Bic, data, G = G, modelNames = modelNames) : best model occurs at the min or max # of components considered 2: In Mclust(Vcaste2$scores) :. optimal number

création de données et des technologies qui permettent de les traiter afin d’en retirer de l’information;..  Passage d’une société industrielle à une société

Permettre l’accès pour consultation au serveur Mahara depuis une page de cours ou la

Si les n octets nécessaires pour contenir les données ne sont pas un multiple de quatre, les n octets sont alors suivis par assez (de 0 à 3) d’octets résiduels à zéro, r, pour

Risque dans le sens où ça peut être mal exploité, mais c’est toujours plus d’informations […] donc ça peut être une opportunité pour mieux comprendre et déceler de

Christine Sybord déplace ainsi la réflexion relative à la responsabilité des praticiens vers l’hypothèse d’une responsabilité médicale étendue au patient, dans le contexte

Increasing access by integrating the media archives with European on-line digital portals in a digital preservation framework. O1 To research and develop means of ensuring

• Naissance du métier de TIM dans les années 1990 avec la mise en place du PMSI. • Evolution du rôle et