BIG DATA et données externes
dans les modèles de tarification
BIG DATA
BIG DATA : Quelques clés
Eric FROIDEFOND – MAAF – MBA CNAM ENASS en cours
Intégration du BIG DATA dans la tarification en assurances IARD
Stéphane CHAPPELLIER – ACTUARIS – ISG CEA IA
Les opportunités pour l’assurance 2
La gouvernance des données 5
3 Le fonctionnement
Conclusion 6
Le Big Data 1
Les moyens techniques pour le Big Data 4
BIG DATA : Quelques clés
VOLUME VELOCITE
VARIETE
VALEUR
D’après le Gartner, le « Big Data » peut se définir avec le concept des 3V :
Volume des données disponibles Variété : données semi structurées voire non structurées complexes et de tous types (textes, images, …)
BIG DATA : Définition
BIG DATA : Une avalanche de données
Les Produits Marketing &
Ventes
Gestion des contrats
Gestion Sinistres
Gestion des Actifs
Nouveaux marchés Nouveaux produits Connaissance des risques et meilleure tarification
Optimisation des produits
Gestion de la performance Segmentation plus fine
Nouveaux clients Vente multi-canal Détection résiliation
Optimisation et ciblage des campagnes
commerciales « just in time »
Optimisation de la gestion des réseaux de prestataires Détection des fraudes
Prévention et mitigation des risques
Gestion des paiements
Stratégie de placement Gestion de Portefeuille
Gestion des actifs et passifs
Modélisation des risques
Tarification temps réel
BIG DATA : Principales opportunités pour l’assurance
BIG DATA : Fonctionnement
BIG DATA : Intégration
Calcul du nombre de tweets par utilisateur
BIG DATA : Zoom sur le MapReduce
BIG DATA : Moyens techniques (le cloud computing)
BIG DATA : La visualisation
Exactitude
Objectivité
Plausibilité
Réputation
Pertinence
Quantité appropriée des informations
Actualité Exhaustivité
Représentation concise Représentation cohérente
Interprétabilité Compréhensible
Disponibilité / Opportunité
Restriction d’accès
Les dimensions de la qualité des données
Qualité intrinsèque Qualité liée au contexte et à
la représentation Qualité liée à la sécurité et à l’accessibilité
BIG DATA : Une gouvernance des données obligatoire
BIG DATA : Conclusion
Support Client
CLIENT
Innovation
Etudes Marketing
Produits & Services assurance
Analyses & Etudes
Stratégie
Positionnement tarifaire et données 2
Assurances et capteurs / réseaux sociaux 5
3 Quel apport de données externes ?
Conclusion 6
Tarification prime pure et données 1
Challenge BIG DATA : connectabilité & algorithmes 4
BIG DATA dans la tarification en assurances IARD
Tarification prime pure et données
Etablissement prime pure : recherche de données permettant d’expliquer la sinistralité grâce au :
GLM
Classification pour zonier et véhiculier
Données traditionnellement utilisées pour l’établissement de la prime pure limitées :
Données essentiellement internes
Faible recours à des données externes
Mouvement vers l’utilisation de plus données :
Variables croisées : âge x sexe (maintenant banni)
Interne : croisement de données entre produits :
Auto / MRH : âge x propriétaire/location résidence principale : variable tarifaire en auto
Données bancaires / prêt et données assurances
Externe :
INSEE : densité, éloignement des services essentiels…
Positionnement tarifaire et données
Positionnement tarifaire : recherche de données permettant d’expliquer le choix de l’assuré :
Modèle d’élasticité au prix de la demande
Positionnement concurrentiel
Algorithme de « valeur client »
Optimisation tarifaire
Ces modèles très utilisés au Royaume-Uni, sont encore très peu utilisés en France, néanmoins cela devrait évoluer :
Loi Hamon potentiel effet ciseau
Comment fidéliser le portefeuille ?
Comparateurs potentiel anti-sélection
Comment acquérir les profils à valeur ajoutée ?
Ces modèles sont très gourmands en données :
Données connaissance du risque
Données relation client
Données flux primes / sinistres avec effet retard
Existe-t-il des données BIG DATA permettant
Quel apport de données externes ?
L’utilisation de données externes (sans parler de BIG DATA) est actuellement faible et limité :
Données INSEE, données délinquance (CartoCrime) …
Données Véhicules : SRA, constructeurs, SIV …
Ces données permettent d’acquérir des variables complémentaires qui permettent de qualifier plus finement le risque qu’à partir des données transmises par
le réseau et/ou l’assuré :
La ville de résidence est-elle en zone rurale peu peuplée ou en zone urbaine ? Est-ce un lieu où la criminalité est faible ou élevée ?
Le véhicule est-il une :
citadine : pour aller faire les course le week-end ?
sportive : pour épater les copains et sortir en boîte ?
familiale : pour partir en vacances avec la famille ?
commerciale : pour faire des tournées en province ?
Challenge BIG DATA : connectabilité & algorithmes
Il y a plusieurs problèmes majeurs à l’utilisation des données BIG DATA en assurance :
Connectabilité : il faut pouvoir relier les données à un client en portefeuille ou en affaires nouvelles
Algorithme : il faut pouvoir disposer d’un algorithme permettant de valoriser ces données
Quelle influence ce critère a sur la sinistralité ou le comportement de souscrire / renouveler ?
Pour ce critère, quelles sont les modalités qui permettent de connaitre l’intensité de cette influence ?
Pouvoir prédictif suffisant :
Ce critère n’était pas déjà capturé par d’autres variables déjà connues
Ce critère est-il plus puissant / prédictif que les variables déjà connues ?
Est-ce que l’investissement nécessaire le mérite ?
Assurance et capteurs
Port OBD-II
Source : VAG
Capteur de données physiologiques Source: TF1
Parmi les données BIG DATA, il existe une catégorie qui regroupe les qualités
recherchées permettant de mieux caractériser le risque. Plutôt que de se baser sur la recherche de variable permettant de traduire un comportement à risque, cette catégorie cherche à capturer le comportement à risque directement à la source Les capteurs :
Auto : OBD-II
comportement de conduite : freinage brusque, coups de volant intempestifs
MRH : Domotique
comportement des occupants
Santé : capteur de données physiologiques
activité physique, intellectuelle…
De nombreux handicaps empêchent l’exploitation de ces données
Au-delà d’obtenir des algorithmes permettant de mesurer le comportement et son influence sur le coût du risques
Il semble difficile de trouver des données pertinentes qui traduisent un comportement à risque de façon plus pertinente que celles déjà utilisées
Par contre, les réseaux sociaux peuvent apporter beaucoup concernant le positionnement tarifaire :
Sensibilité, attentes (écoresponsable, développement durable…)
Réceptivité aux messages marketing
Réactivité face aux changements
Fidélité
Elasticité au prix…
Du fait de cet apport, la chaine de répartition de la valeur va-t-elle se recomposer pour prendre en compte l’apport des réseaux sociaux dans l’équation ?
Réseaux sociaux réseaux affinitaires ?
Réseaux sociaux apporteurs d’affaires / comparateurs / distributeurs ?
Assurance et réseaux sociaux
Conclusion
Conjoncture favorable aux assurés et défavorable aux assureurs :
La « génération internet » rentre sur le marché : zapping
Possibilité de zapper d’assureurs plus facilement (Loi Hamon, comparateurs)
Pouvoir d’achat en baisse suite à la crise
Processus tarifaire « français » en retard sur les autres marchés
Opportunités :
Les assurés n’attendront pas que les assureurs aient
sophistiqué leur processus tarifaire pour changer d’assureur
Tirer partie des enseignements reçus sur les autres marché pour se positionner / différencier
Un challenge pour les actuaires
Expérimentations
Utilisation de données et de modèles moins bien maitrisés
Evolutions plus rapides et plus fréquentes des processus tarifaire
Importance cruciale d’un suivi et d’une réactivité aux changements de tendances
Source : L’Argus de l’Assurance
BIG DATA : Bibliographie
VINT Research report 2 of 4 – Big Social - Predicting behavior with Big Data – SOGETI
Site PEGASUSDATA.COM
Wikipedia
Livre blanc ISACA : BIG DATA : Impacts et Avantages
http://www.journaldunet.com/developpeur/outils/les-solutions-du-big-data/principe-de- fonctionnement-de-mapreduce.shtml
http://datascience.bluestone.fr/blog/les-origines-les-grands-principes-du-big-data
VINT Research report 1 of 4 – Creating clarity with Big Data – Jaap Bloem, Menno Van Doorn – Sander Duivestein – Thomas Van Manen – Erik Van Ommeren - SOGETI
Basé sur une analyse du Boston Consulting Group (BCG)
IDC (International Data Corporation)
Les intervenants
Stéphane CHAPPELLIER Actuaire IA
Responsable du Pôle IARD Tél. : +33 (0)1 56 89 07 70 Direct : +33 (0)1 56 89 30 72 Fax : +33 (0)1 56 89 07 71
E-mail : stephane.chappellier@actuaris.com Eric FROIDEFOND
Direction Systèmes d’Information Manager Entité DSI Professionnels MBA CNAM – ENASS en cours Direct : +33 (0)5 49 17 55 90 Port : +33 (0)6 83 18 76 53
E-mail : eric.froidefond@maaf.fr