Data Mining
4 – Applications CRM
Françoise Soulié Fogelman francoise@kxen.com
Master MI2 Pro EID- Université Paris 13 Data mining et Business Intelligence FDON
KXEN-Confidential 2
Agenda
Le CRM
Applications au Marketing
Applications au Risque Crédit
KXEN-Confidential 3
Le CRM dans le SI de l’Entreprise
CRM = Customer Relationship Management GRC = Gestion de la Relation Client
KXEN-Confidential 4
Le CRM Analytique
Trois fonctions
KXEN-Confidential 5
Le CRM Analytique
Le CRM vise à animer la relation clients au travers
d’actions multi-canal
La connaissance clients, élaborée à partir des données clients, permet de lancer des actions efficaces
Relation Client
Actions
KXEN-Confidential 6
Win-Back
Share of Wallet
Pénétration des Partenaires
Prospection Taux d’augmen- tation du prix
Best Practice Moyenne du Secteur
50%
100%
50%
50%
50%
33%
25%
3% 18%
18%
20%
15% 35%
11%
5%
Churn 2% 4% 6% 20% 100%
Moyenne du Secteur Best Practice
Moyenne du Secteur
Moyenne du Secteur
Moyenne du Secteur
25% 35%
Best Practice
27% 45%
Best Practice 60%
45%
Best Practice
Moyenne du Secteur
20%
10%
3.5%
0.5%
Best Practice
Les bénéfices attendus du CRM Analytique
Mettre en œuvre des Best Practices et améliorer les KPI
■Définir les KPI, indicateurs significatifs pour le marché,
■Se benchmarker par rapport à la concurrence
■Travailler sur ses processus pour améliorer les KPI Exemple : les Télécommunications
KXEN-Confidential 7
Les bénéfices attendus du CRM Analytique
Cibler et conquérir les clients profitables
Augmenter la valeur et la durée de vie des clients
existants
Diminuer les départs vers la concurrence
Concentrer les efforts sur les segments de clientèle les plus rentables
Surveiller les clients à risque
Comprendre les comportements des clients
Augmenter l'efficacité des campagnes marketing en
améliorant le ciblage
Qu'est ce que le CRM ?
KXEN-Confidential 8
Les bénéfices attendus du CRM Analytique
Connaître le client
Quelques questions
■ Pourquoi dois-je faire cette offre personnalisée à ce client ?
■ Pourquoi ce client répond-il bien à cette campagne ?
■ A qui dois-je envoyer ce mailing pour maximiser le taux de retour ?
■ Puis-je prévoir si ce client va passer à la concurrence et quand ?
■ Quelle est la « valeur » de ce client ?
■ Puis-je déterminer les facteurs caractéristiques de la fraude ?
Dont les réponses permettent d’être :
■ Plus efficace, plus réactif, plus rapide
■ À moindre coût
■ Avec de meilleurs retours
Le data mining permet de répondre à ces questions
KXEN-Confidential 9
Le score
Un score comprend
■Un modèle
■Une régle de décision
Le modèle de score
■Associe un nombre à une observation
La régle de décision est basée sur un seuil s
■Accepter si
■Refuser sinon
Exemples
■Score d’appétence, de churn
■Score d’octroi de crédit …
Contraintes
■On souhaite souvent que le score soit « explicable »
Utilisation de « carte de score »( ) x s
S ≥
( ) x
S x →
( ) x s
S p
KXEN-Confidential 10
Le score
Faire un modèle de score
Règle de décision
■ Positionner le seuil
■ Découper en bandes de score (ex : vingtiles)
■ En déduire
La décision
La probabilité
Score Seuil
0 1
( Tar get )
f get Tar
rr _ =
Target rr_Target decision_
rr_Target proba_decision
_rr_Target
0 -0,014 0 0,869
0 0,226 1 0,555
0 -0,134 0 0,950
0 -0,004 0 0,861
KXEN-Confidential 11
12 € 0 € 2 €
Revenue : Fixed Cost : Variable Cost :
Target Size : 10 000 Budget : 20 000 €
Le score
Positionner le seuil
KXEN-Confidential 12
Le score
Matrice de
confusion
KXEN-Confidential 13
Agenda
Le CRM
Applications au Marketing
■Optimisation de campagne
■Analyses en ligne
Web, centre d’appels
■Distribution sur Internet
■Fraude
■Utilisation du Texte
Applications au Risque Crédit
KXEN-Confidential 14
Les bénéfices attendus du CRM Analytique
Position du Data Mining dans le processus marketing
Plan Marketing Opérationnel Plan Marketing
Gestion des campagnes Marketing
Stratégie Marketing
Planification des Campagnes
Finaliser le Planning des Campagnes Vérifier la pression de Sollicitation Définir la Campagne &
Insérer au Planning
Conception des Campagnes
Construction de la cible et pré- comptage Définition de
la cible Définition de la Campage
Exécution de la Campagne
Suivi de l’Exécution Lancer la Campagne Finaliser la Définition de la Cible Finaliser la Définition de la Campagne
Evaluation des Résultats de la Campagne
Produire l’Analyse finale Produire les
Rapports Collecter les
Résultats
Définition de la cible
KXEN-Confidential 15
Les bénéfices attendus du CRM Analytique
Chaque campagne marketing
■… doit exploiter les données disponibles
■… pour produire un modèle adapté
■… et définir la cible en utilisant ce modèle
Le nombre de modèles nécessaires peut être très grand
… et encore plus pour les utilisations futures
■Sur le Web
■Avec des données non structurées (texte, images, videos )
KXEN-Confidential 16
Types de campagne marketing
Exécution Exécution
Starter
■Nouveau produit
■Données non disponibles
Pilote
■Produit ancien
■Données disponibles
Campagne
récurrente
■Churn …
■Données disponibles
■Modèle existant
KXEN-Confidential 17
Marketing
Les différentes sortes de score
Score de réponse / achat
■A acheté
■A répondu
Score d’appétence
■Est intéressé
Score de propensité
■A une forte probabilité
KXEN-Confidential 18
Starter
KXEN-Confidential 19
Starter
KXEN-Confidential 20
Starter
KXEN-Confidential 21
Starter
KXEN-Confidential 22
Starter
KXEN-Confidential 23
Starter
Courbe de Profit
Données financières
Sélection du seuil
KXEN-Confidential 24
Starter
Index pour l’ensemble de données : permet d’identifier le client sélectionné Variable cible pour l’ensemble de données : le client a-t-il acheté Product_C ?
Scores calculés
par le modèle Décision 1 or 0,
selon le seuil choisi
Probabilité que le client achète Product_C
KXEN-Confidential 25
Opérateur telco US
Campagnes en appels sortants sur 2 mois
■ Vente d’un nouveau téléphone
■ Cible : vente oui / non
■ Détection de « leak variables »
Renseignées après coup uniquement pour les ventes réussies
■ Elimination de ces variables et construction du modèle
KXEN-Confidential 26
Opérateur telco US
Campagnes de cross- sell
■Vente d’une connexion ADSL à des clients du mobile
■Cible : vente oui / non
■9% des clients acceptent
■Données
384 variables
263 961 clients
■Comparaison à un modèle existant en interne
Résultats
Gains
■à 10%: 22% au lieu de 21%
■à 50%: 76% au lieu de 73%
KXEN-Confidential 27
Vodafone
Un opérateur en forte croissance
http://www.teradata.com/teradata-partners/conf2005/
KXEN-Confidential 28
Vodafone
Le problème
■Une équipe experte mais réduite
■Des délais de réaction très courts
■Un environne- ment compétitif évoluant très vite
■Des données très complexes
■Un très grand nombre de modèles nécessaires
KXEN-Confidential 29
Vodafone
Base Teradata
■2500 variables
Call Details subs_id trans_id peak/off-peak
product_id Zero_rated amount duration count
Customers subs_id activation date
Periods Date week
Products product_id description
Demographics subs_id
Age Income Recharge
subs_id channel amount
Cus_id SumVoiceMin
#SMS………#Recharge2Months
Scores
Scoring Parameters Model
Base Sample, Target Variable Definition Data
Quality Process
KXEN-Confidential 30
Vodafone
Résultats
Environnement
analytique
■700 modèles / an
■Résultats d’analyses disponibles en temps réel
Performance
accrue
KXEN-Confidential 31
Eon
World’s largest investor- owned electricity and gas company
6M
Consumer customers and 700k B2B customers
KXEN-Confidential 32
Eon
KXEN-Confidential 33
Eon
KXEN-Confidential 34
Eon
KXEN-Confidential 35
Le Crédit Lyonnais
Etat des lieux
Offre bancaire de LCL : 400 produits
■Produits et services bancaires,
■Produits de gestion d’actifs et d’assurance,
■Gestion de patrimoine.
Campagnes marketing direct : plus de 130 actions
■Équipement en cartes bancaires,
■Assurance-vie,
■Fonds commun de placement ...
par emailings, mailings ou SMS
■soit 10 millions de contacts sur des clients ou des prospects.
Les équipes réalisent leurs campagnes à partir d’une dizaine de scores généralistes
■« Faire fructifier son capital »,
■« Percevoir des Revenus »,
■« S’assurer au quotidien ».
KXEN-Confidential 36
Le Crédit Lyonnais
Le département marketing opérationnel souhaite :
■ Disposer de scores plus précis, facilement évolutifs
■ Spécifiques aux offres intégrées des familles de produits
Avec les outils existants
■ Il faut de 2 à 5 jours pour construire les scores
■ La méthode ne permet pas d’affiner les scores.
Projet pilote sur une opération grandeur réelle (assurance MRH)
■ Deux groupes sont constitués
Le premier utilise les scores KXEN,
L’autre utilise un score généraliste «S’assurer au quotidien ».
■ Résultats
Le taux de retour X 2,5 fois avec KXEN
Score KXEN élaboré en une demi-journée au lieu de plusieurs jours.
Aujourd’hui
■ 160 modèles créés par an avec KXEN
KXEN-Confidential 37
Campagne email
Optimisation de campagnes d’un site e-commerce
■ Combien de jours après l’achat envoyer l’email
Appétence cross-enseigne pour campagnes d’acquisition
Les informations représentées ici sont fictives
Nb jours avant email
Sans ciblage Avec ciblage
Nb emails envoyés 51 968 29 999
Ouvertures totales
Nombre 18 890 34 179
Taux 36,35% 113,93%
Ouvertures uniques totales
Nombre 11 621 16 896
Taux 22,36% 56,32%
Clics totaux
Nombre 3 222 9 538
Taux 6,20% 31,79%
Clics uniques totaux
Nombre 2 619 6 879
Taux 5,04% 22,93%
KXEN-Confidential 38
Agenda
Le CRM
Applications au Marketing
■ Optimisation de campagne
■ Analyses en ligne
Web, centre d’appels
■ Distribution sur Internet
■ Fraude
■ Utilisation du Texte
Applications au Risque Crédit
KXEN-Confidential 39
Exploiter les données d’un site
Données dynamiques Date d’entrée Lien cliqué Navigateur URL d’origine Temps passé …
Données dynamiques Type de projet Montant demandé Mensualité …
Données statiques Nom, prénom Adresse Adresse email Date de naissance Situation familiale … ID Client Date de création En-cours Litiges …
Base Clients
Base Clients / Prospects
KXEN-Confidential 40
Exploiter les données d’un site : appétence au chat
Vente assistée sur le Web Score d’appétence
■ Temps réel
■ Proposition
■ Orientation vers l’agent compétent Résultats
■ Taux d’acceptation / taux « naturel »
■ Taux d’achat
■ Business case
Les informations représentées ici sont fictives Variables
Nb visites / an 1 000 000
Config PC supportée 80% 800 000
Filtrage 30% 240 000
Proposition (modèle - 3 déciles) 30% 72 000
Taux d'acceptation 17% 12 240
Interaction menée à terme 60% 7 344
Acheteurs 5% 367
Valeur de transaction 1 000 € 367 200 € Exemple
0 2 000 4 000 6 000 8 000 10 000 12 000 14 000
-3 sigma -2 sigma 1 sigma 2 sigma 3 sigma 0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
Nb visiteurs Taux de conversion
KXEN-Confidential 41
Exploiter les données d’un site : attrition
Modèle d’attrition des clients de la banque en ligne
■Attrition est défini comme “inactivité de plus de 6 mois”
■Modèle produit en 3 heures
200 variables réduites à 40
■44 % des clients attrités détectés dans le 1erdécile
Caractérisation des clients attrités
■1 million de clients scorés en 43 secondes (en batch sur Teradata)
Les informations représentées ici sont fictives 0%
20%
40%
60%
80%
100%
10 % 20 % 30 %
40 % 50 %
60 % 70 %
80 % 90 %
100 % 0 2 4 6 8 10
1 2 3 4 5 6 7 8 9 10
Décile
Ancienneté
Ancienneté Banque en-ligne Ancienneté Banque
KXEN-Confidential 42
Moteur de recommandations
Appels entrants dans un centre d’appels
Internautes naviguant sur un site
Un score est calculé à la volée :
■ Appétence pour un produit / service
■ Propensité à accepter une offre
Produit, service
Co-browsing
Chat
La/les offres les meilleures sont proposées
KXEN-Confidential 43
Moteur de recommandations
Identifiant du client appelant
KXEN-Confidential 44
Moteur de recommandations
Calcul du score du client # 5
Produits qui intéressent le client # 5
KXEN-Confidential 45
Moteur de recommandations
Informations mises à jour
Produits qui intéressent le client # 5
KXEN-Confidential 46
Agenda
Le CRM
Applications au Marketing
■ Optimisation de campagne
■ Analyses en ligne
Web, centre d’appels
■ Distribution sur Internet
■ Fraude
■ Utilisation du Texte
Applications au Risque Crédit
KXEN-Confidential 47
Distribution sur Internet
De la « boutique » à la boutique électronique
■Brick-and-Mortar
Wall Mart, Barnes and Noble, … Carrefour, Relay
■Boutique électronique de produits matériels
Amazon, Netflix, … fnac.com
■Boutique électronique de produits immatériels
Rhapsody, iTunes
Question
Quel pourcentage de produits est vendu chaque mois ? Réponse
Tous ! (98-99 %)
From Chris Anderson - http://www.wired.com/wired/archive/12.10/tail.html
KXEN-Confidential 48
Distribution sur Internet
From Chris Anderson - http://www.wired.com/wired/archive/12.10/tail.html Rhapsody : 735 000 chansons
Wall Mart : 30 000 chansons Amazon.com : 2.3 M livres Barnes & Noble : 130 000 livres
Netflix : 25 000 DVD BlockBuster : 3 000 DVD
KXEN-Confidential 49
Distribution sur Internet
Offrir « tout »
Aider le client à trouver ce qu’il recherche
KXEN-Confidential 50
Distribution sur Internet
Le système de recommandations
http://blog.recommenders06.com/wp-content/uploads/2006/09/bennett.pdf
65 000 films
KXEN-Confidential 51
Distribution sur Internet
Le système de recommandations
http://blog.recommenders06.com/wp-content/uploads/2006/09/bennett.pdf Satisfaction
Relative Cost
Recs Interest Search NR
KXEN-Confidential 52
Distribution sur Internet
Utiliser les règles d’association
■ Sur des milliers / millions de produits !
0.349 274 2 15 0.251 Red Bell Pepper
416 1
0.349 190 2 16 0.270 Scallions
547 1
0.352 276 2 17 0.271 Green Bell Pepper
456 1
0.262 206 2 18 0.278 Cantaloupe
572 1
0.581 277 2 19 0.331 Bounty 2-Ply Paper Towels 378
1
0.261 205 2 20 0.423 Raspberries
594 1
0.378 297 2 21 0.431 Blueberries
534 1
ar_
Confidence ar_
Support ar_
Length ar_
Rules Left ar_KI ar_Consequent ar_
RuleId CUST
ID
0.349 274 2 15 0.251 Red Bell Pepper
416 1
0.349 190 2 16 0.270 Scallions
547 1
0.352 276 2 17 0.271 Green Bell Pepper
456 1
0.262 206 2 18 0.278 Cantaloupe
572 1
0.581 277 2 19 0.331 Bounty 2-Ply Paper Towels 378
1
0.261 205 2 20 0.423 Raspberries
594 1
0.378 297 2 21 0.431 Blueberries
534 1
ar_
Confidence ar_
Support ar_
Length ar_
Rules Left ar_KI ar_Consequent ar_
RuleId CUST
ID
KXEN-Confidential 53
0 .5 0 .6 0 .7 0 .8 0 .9 1 .0
ki k r
Distribution sur Internet
Faire des milliers / millions de scores d’appétence
■Trouver les niches de produits avec score robuste
KXEN-Confidential 54
Agenda
Le CRM
Applications au Marketing
■ Optimisation de campagne
■ Analyses en ligne
Web, centre d’appels
■ Distribution sur Internet
■ Fraude
■ Utilisation du Texte
Applications au Risque Crédit
KXEN-Confidential 55
Qu’est ce que la fraude ?
Définition
■Une « distortion intentionnelle de la vérité » qui permet de s’approprier un bien ou un service
Exemples
■Carte bancaire
Usurpation d’identité
Utilisation à l’insu du porteur
■Détournement de flux sur Internet (phishing)
■Téléphones mobiles
■Fausses déclarations de sinistres
Assurance
Maladie, arrêt de travail …
KXEN-Confidential 56
Catégorie de fraude spécifique déjà identifiée
Classes de Fraude
Type de fraude spécifique bien identifié
Fraude Connue
Général
Type de fraude jamais identifié précédemment Fraude inconnue
Le plus facile à détecter
Plus difficile à détecter
Le plus difficile à détecter
KXEN-Confidential 57
Détection automatique des outliers (nouveau type de règles) Détection manuelle
Règles automatiques
Modélisation prédictive
Fournit la meilleure précision dans la détection de la fraude Le grand nombre de transactions fait qu’il est impossible à l’expert de les traiter toutes
Difficile de tenir les règles à jour (nouvelles règles) Difficile de détecter de nouveaux types de fraude
Codage partiel de la connaissance de l’expert Parfait pour les règles connues
Définition de profils de fraudes pour les mécanismes de fraude identifiés
Modélisation prédictive
1
2 3
4
Méthodes de détection de fraude
Une méthode efficace d’analyse de fraude est une combinaison de 4 méthodes
KXEN-Confidential 58
Non DC 4h12
Oui NYC 1h20m Patrick
Non NJ 0h45m Bruno
Fraudeur Profil
Données du passé
Profils Client & Transactions
? NY 12h43
? CA 6h12 Victor
? MI 0h45 Bruno
Fraudeur ? Profil
Données actuelles
Processus pour la fraude connue
Profils Client & Transactions
Produire le modèle Apprendre
1
Appliquer le modèle Appliquer
2
Identifier l’infor- mation douteuse Identifier
3
Confirmer avec l’expert Valider
4 5
AgirKXEN-Confidential 59
150 DC 4h12 Bob
100 NYC 1h20m Patrick
50 NJ 0h45m Bruno
Montant Profil
Données
150 68 45 Prévu
0 150
+2 70
-30 75
Erreur ? Montant réel
Processus pour la fraude inconnue
Les “outliers” doivent être examinés
Produire le modèle Apprendre
1
Ré-appliquer le modèle Appliquer
2
0 50 100 150 200
0 50 100 150 200
Montant réel Montant prévu
Identifier les outliers Identifier
3
KXEN-Confidential 60
Exemples
Une Banque canadienne
■ Fraude sur les chèques
■ 0,0016 des chèques sont frauduleux
■ 101 variables
■ 1 750 000 lignes
■ Classification
■ Segmentation
■ Fraude sur les dépôts frauduleux
■ 0,0003 des dépôts sont frauduleux
■ 94 variables
■ 1 045 000 lignes
KXEN-Confidential 61
Exemples
Une Banque turque
Fraude sur les demandes de cartes
■ Augmentation du nombre de demandes frauduleuses de 200
% (de 7 à 21 par jour)
■ Réduction des pertes de 25 000$
par jour
■ Plus de 50 fraudeurs identifiés dans l’année qui a suivi
Fraude sur les transactions de cartes
■ Réduction du nombre de fausses alertes de 300 000 à 30 000 par trimestre
■ Augmentation du nombre de cas de fraude détectés par un facteur 3
KXEN-Confidential 62
Agenda
Le CRM
Applications au Marketing
■ Optimisation de campagne
■ Analyses en ligne
Web, centre d’appels
■ Distribution sur Internet
■ Fraude
■ Utilisation du Texte
Applications au Risque Crédit
KXEN-Confidential 63
Utiliser des données textuelles
Extraction des mots
1 Refinery
1 Us
1 Refineries
1 Damage
1 More
1 One
1 Cause
1 May
1 Mexico
2 Of
1 Hurricane
2 oil
Oil prices rebound to above $67 after fears Hurricane Rita, heading for the Gulf of Mexico, may cause more damage to US oil refineries. One of the refinery…
Oil prices rebound to above $67 after fears Hurricane Rita, heading for the Gulf of Mexico, may cause more damage to US oil refineries. One of the refinery…
1 prices
1 rebound
1 above
2 to
1 fears
1 after
1 67
1 Heading
1 Gulf
2 The
1 For
1 Rita
KXEN-Confidential 64
Utiliser des données textuelles
Utilisation de stop lists
1 Us
1 Refineries
1 Damage
1 More
1 Cause
1 May
1 Mexico
1 Of
1 Hurricane
2 oil
1 prices
1 rebound
1 above
2 to
1 fears
1 after
1 67
1 Heading
1 Gulf
1 The
1 For
1 Rita
1 67
1 Gulf
1 Refinery
1 Damage
1 Rebound
1 Prices
1 Fears
1 Us
1 Refineries
1 Cause
1 May
1 Mexico
1 Rita
1 Hurricane
2 oil
KXEN-Confidential 65
Utiliser des données textuelles
Stemming
1 Refinery
1 Damage
1 Gulf
1 Rebound
1 Prices
1 Fears
1 Us
1 Refineries
1 Cause
1 May
1 Mexico
1 Rita
1 Hurricane
2 oil
2 refinery
1 damage
1 gulf
1 rebound
1 price
1 fear
1 us
1 cause
1 may
1 mexico
1 rita
1 hurricane
2 oil
KXEN-Confidential 66
Utiliser des données textuelles
Vectorisation
■ Ajout de colonnes
yes I am a software engineer
… 8
…
…
…
…
…
no I am an aeronautics engineer
… 1
Target Body
… Title Id
yes
… no Target
0
… 1 KTC_Body_aeronau
tics
1
… 1 KTC_Body_engineer
1 I am a
software engineer
… 8
…
…
…
…
…
0 I am an
aeronautics engineer
… 1
KTC_Body_software Body
… Title Id
Vectorisation avec codage booléen
KXEN-Confidential 67
Utiliser des données textuelles – DataMining Cup’06
eBay Germany (Data Mining Cup 2006)
■8000 enchères sur des produits en vente sur eBay
■Déterminer un modèle pour prévoir, pour chaque nouvelle enchère, si le prix de vente final sera plus grand que le prix moyen de la catégorie du produit proposé
Variables (28)
http://www.data-mining-cup.com/■ auct_id ID An index value
■ Item_leaf_catedory_name Product category (can be considered as textual)
■ listing_title Title of auction (textual field)
■ listing_subtitle Subtitle of auction (textual field)
■ listing_start_date Start date of auction
■ listing_end_date End date of auction
■ listing_durtn_days Duration of auction
■ listing_type_code Type of auction (normal auction, multi-auction, …)
■ feedback_score_at_listing_time Feedback score by the seller at listing time of auction
■ start_price tart price (in EUR)
■ buy_it_now_price Buy-it-now price (In EUR, for buy)
■ buy_it_now_listed_flag Auction listing with buy-it-now option Boolean
■ bold_fee_flag Auction listing with boldface
■ featured_fee_flag Auction listing as homepage top offer
■ category_featured_fee_flag Auction listing as category top offer
■ gallery_fee_flag Auction listing with gallery image
■ gallery_featured_fee_flag Auction listing with gallery (just in gallery view)
■ …
■ gms Achieved sales revenue (In EUR) [CANNOT BE USED]
■ category_avg_gms Average sales revenue (In EUR) of product category
■ gms_greater_avg if gms <= category_avg_gm 0 else 1 Target
KXEN-Confidential 68
Utiliser des données textuelles – DataMining Cup’06
Champs texte
KXEN-Confidential 69
Utiliser des données textuelles – DataMining Cup’06
Mots extraits
KXEN-Confidential 70
Utiliser des données textuelles – DataMining Cup’06
Les variables textuelles extraites sont très significatives
KXEN-Confidential 71
Utiliser des données textuelles – DataMining Cup’06
Critère
■ nombre de Bonnes Classifications – nombre de Fausses Classifications
■ http://www.data-mining-cup.com/2006/News/1162545659/
■ 579 participants de 177 universités de 42 pays
68 4244
KTC DMC
1 5020
DMC winner
5356 KTC – DMC – K2R ordre 2
72 4114
KTC German
113 3104
K2R données supplémentaires
139 2320
K2R
Rang Score
Expérience
KXEN-Confidential 72
Agenda
Le CRM
Applications au Marketing
Applications au Risque Crédit
KXEN-Confidential 73
Score crédit
Le Score crédit est un instrument pour gérer un portefeuille de risques crédit
Il fournit la probabilité de défaut (PD) futur
On l’utilise
■Dès qu’un client entre en base : note de score
■Quand un client demande un crédit (par ex.) : score d’octroi
■Pendant la durée du remboursement : score comportemental
Les risques individuels sont ensuite agrégés pour fournir le risque du portefeuille clients
KXEN-Confidential 74
Score d’octroi
Le score de crédit est un nombre qui mesure, à partir des données fournies par le client dans son dossier de demande de crédit, le risque qu’il fasse « défaut » ultérieurement
Pour établir la note de score, on peut utiliser
■ Une méthode « manuelle » : la carte de score
■ Une méthode basée sur un modèle de score
Dossier de demande de
crédit
Modèle de
Score Note Décision
d’octroi
Accepté
Rejeté
KXEN-Confidential 75
Score d’octroi
Exemple d’une carte de score crédit
AGE
V A L E U R N O T E
NOMBRE D ’ENFANTS
HABITAT 18 ans – 25 ans 26 ans – 40 ans 41 et plus
23 38 46
V A L E U R N O T E
0 1 2 et plus
30 24 38
V A L E U R N O T E
Propriétaire Locataire
Autre
4545 35 35 30 30
MODELE DOSSIER CLIENT
32 ans
1 enfant
Locataire
NOTE
38 + 24
+
35
AGE
NOMBRE D ’ENFANTS
HABITAT
= NOTE DE SCORE 97
KXEN-Confidential 76
Score d’octroi
Pour chaque dossier client , on observe k caractéristiques :
Le « résultat » est
■ si le client fait défaut
■ si le client ne fait pas défaut
La décision est
■ si le crédit est accepté
■ si le crédit est rejeté
■Les données sont manquantes pour
Remarque
■Les échelles de temps :
( x x
k)
x =
1,...,
{ } 0 , 1
∈ y
= 0 y
= 1
y d ∈ { } 0 , 1
= 0 d
= 1 d
= 0 d
M a n q u a n t
x
kx x x
1 2 3...
x
td
t+1y
t+2y
KXEN-Confidential 77
Score d’octroi
Défaut
■Client à rejeter : celui qui fera défaut dans le remboursement
■La définition du défaut
Nb de mois impayés …
Définir un modèle de score : estimation de la proba de non-défaut
Fixer un seuil
Décision
■Accepté
■Rejeté
Évidemment :
■Défaut / Non Défaut est connu seulement pour les Acceptés, pas pour les Rejetés
0 40 80 120 160 200 240 280 320 360 400 440 480 520 560 600 640 680 720 760 800
Score Nb de
Clients
Non défaut
Défaut
( ) x
S x →
( ) x s
S si
d = 1 ≥
( ) x s
S si d = 0 <
( ) ( x P y x )
S = ˆ = 1 /
s
KXEN-Confidential 78
Score d’octroi
Choisir le seuil
■ En fonction du niveau de risque, du taux d’acceptés …
Nb % Nb % Nb %
188 7 202 94,8% 399 5,2% 7 601 5,4% 5,25 94,6%
189 7 074 94,8% 387 5,2% 7 461 5,3% 5,19 89,3%
190 6 987 95,1% 363 4,9% 7 350 5,2% 4,94 84,0%
191 6 783 95,3% 335 4,7% 7 118 5,1% 4,71 78,9%
192 6 650 95,4% 324 4,6% 6 974 5,0% 4,65 74,0%
193 6 567 95,5% 310 4,5% 6 877 4,9% 4,51 69,1%
194 6 494 95,6% 298 4,4% 6 792 4,8% 4,39 64,2%
195 6 410 95,7% 287 4,3% 6 697 4,8% 4,29 59,5%
196 6 331 95,8% 275 4,2% 6 606 4,7% 4,16 54,7%
197 6 209 96,0% 262 4,0% 6 471 4,6% 4,05 50,1%
198 6 066 96,0% 253 4,0% 6 319 4,5% 4,00 45,6%
199 5 981 96,2% 239 3,8% 6 220 4,4% 3,84 41,2%
200 5 804 96,1% 235 3,9% 6 039 4,3% 3,89 36,9%
201 5 678 96,1% 228 3,9% 5 906 4,2% 3,86 32,7%
202 5 489 96,2% 215 3,8% 5 704 4,1% 3,77 28,6%
203 5 318 96,3% 203 3,7% 5 521 3,9% 3,68 24,7%
204 5 143 96,4% 190 3,6% 5 333 3,8% 3,56 20,9%
205 5 040 96,5% 185 3,5% 5 225 3,7% 3,54 17,2%
206 4 916 96,5% 179 3,5% 5 095 3,6% 3,51 13,5%
207 4 784 96,6% 168 3,4% 4 952 3,5% 3,39 10,0%
208 4 642 96,7% 157 3,3% 4 799 3,4% 3,27 6,6%
209 4 531 96,8% 148 3,2% 4 679 3,3% 3,16 3,2%
210 4 398 97,0% 138 3,0% 4 536 3,2% 3,04 0,0%
134 497 5 778 140 275 100,0%
Score
Taux d'acceptés
Good Bad Total
Risque
Score
KXEN-Confidential 79
Score d’octroi
En pratique
■Choisir le Taux de Refusés
■Choisir le rapport Good / Bad …
La stratégie est un mélange automatique / manuel
Figure d’après « Credit Scoring Development and Methods” – J. Marinopoulos
KXEN-Confidential 80
Score d’octroi
Identifiant du client appelant
KXEN-Confidential 81
Score d’octroi
Caractéristiques du client # 325
KXEN-Confidential 82
Score d’octroi
Calcul de la classe de risque du client # 325
La PD du client # 325 est faible
KXEN-Confidential 83
Score d’octroi
Le compte du client # 325 vient de passer en découvert
La PD du client # 325 augmente
KXEN-Confidential 84
Score d’octroi
Le client # 325 veut demander un crédit
KXEN-Confidential 85
Score d’octroi
Renseigner es caractéristiques
du crédit Ce crédit
est accordé
Puis calculer le score
KXEN-Confidential 86
Score d’octroi
Les caractéristiques d’un autre
crédit Ce crédit
est refusé