Thierry Mulot – thierry.mulot@kxen.com
KXEN Analytic Framework
Présentation 8 février 2006
La mission de KXEN est de faire de l’analyse prédictive une étape incontournable de la prise de décision dans l’entreprise
1.
1. INTRODUCTIONINTRODUCTION
2.2. L’L’ENVIRONNEMENT ANALYTIQUEENVIRONNEMENT ANALYTIQUE 3.
3. LE DATA MINING VU PAR KXENLE DATA MINING VU PAR KXEN 4.4. LES DOMAINES D’LES DOMAINES D’APPLICATIONAPPLICATION 5.5. DEMONSTRATIONDEMONSTRATION
6.6. FONCTIONNALITESFONCTIONNALITES AGENDA
AGENDA AGENDA
L! L !environnement de KXEN environnement de KXEN
Concept Technologie Exemple Prédiction
de valeurs
Classification Régression
Appétence à upgrader ? Consommation croisée ? Modélisation
Prédictive
Exploration automatisée des données
Segmentation Associations
Profil des détenteurs Quelle offre promo pour
quel profil client Modélisation
Descriptive
Exploration manuelle des données
Cubes
Analyse de la consommation par couleur de carte par
période OLAP
Agrégation des données et
calculs
SQL Feuilles de calcul
Historique de la consommation des miles
des membres fréquence plus
Requête et Reporting
Analytic Intelligence BusinessIntelligence
Exemple 1: Campagne de Marketing Direct Exemple 1: Campagne de Marketing Direct
Information disponible:
Données démographiques d’Acxiom Données financières d’Experian Données clients du constructeur automobile
Ensemble des données:
214 variables
200 000 enregistrements Données numériques et textes Information disponible:
Information disponible:
DonnDonnéées des déémographiques dmographiques d’’AcxiomAcxiom DonnDonnéées financies financièères dres d’’ExperianExperian DonnDonnéées clients du constructeures clients du constructeur automobile
automobile Ensemble des donn Ensemble des donnéées:es:
214 variables 214 variables
200 000 enregistrements 200 000 enregistrements DonnDonnéées numes numéériques et textesriques et textes
Cas étudié : Un grossiste veut lancer une campagne de marketing direct avec un constructeur automobile pour proposer des kits de téléphone sans fil aux conductrices.
Cas éCas étuditudiéé : : Un grossiste veut lancer une campagne de Un grossiste veut lancer une campagne de marketing direct avec un constructeur automobile pour marketing direct avec un constructeur automobile pour proposer des kits de t
proposer des kits de tééllééphone sans fil aux conductrices.phone sans fil aux conductrices.
Lancer une campagne en
Lancer une campagne en ““aveugleaveugle””
… sans analyse statistique… sans analyse statistique
200 000 * 0,35 = 70 000 " (coût du Mailing)
1,04% = 2070 (taux de réponse)
21,5 " (revenu par réponse)
44 505 " (résultat brut)
- 25 495 " (résultat net)
200 000 * 0,35 = 70 000
200 000 * 0,35 = 70 000 "" (co(coûût du Mailing)t du Mailing)
1,04% = 2070
1,04% = 2070 (taux de r(taux de rééponse)ponse)
21,5
21,5 "" (revenu par r(revenu par rééponse)ponse)
44 505
44 505 "" (r(réésultat brut)sultat brut)
- 25 495
- 25 495 "" (r(réésultat net)sultat net)
Problème: Le lancement de cette campagne a abouti à une perte de 25 495 "
Probl
Problèème: me: Le lancement de cette campagneLe lancement de cette campagne a abouti
a abouti àà une perte de 25 495 une perte de 25 495 ""
Analyser
Le processus Le processus KXEN KXEN
Envoi retour
Base de données
200,000 Cust.
Base de données
200,000 Cust.
X % - échantillon Lancer Test
Echantillon Echantillon
Mailing
Appliquer
Ré R ésultats obtenus sultats obtenus
…avec KXEN…avec KXEN
-25 495 "
20 965 "
-30000 -25000 -20000 -15000 -10000 -5000 0 5000 10000 15000 20000 25000
Résultats Net de la campagne
Aveugle KXEN
Taux de réponse
5,68%
1,04%
0 1 2 3 4 5 6
Aveugle Data Mining
Résultats: Cette campagne a amélioré le résultat net de 46,460 "
avec un taux de réponse de 6 fois supérieur R
Réésultats:sultats: Cette campagne a amé Cette campagne a améliorlioréé le r le réésultat net de sultat net de 46,460 46,460 ""
avec un taux de r
avec un taux de rééponse deponse de 6 fois sup 6 fois supéérieurrieur
Client Marketing ventes Finance Client Marketing ventes
Client Marketing ventes FinanceFinance
Des centaines de questions Des centaines de questions
Style de vie du Client Style de vie
du Client SegmentationSegmentation
Valorisation Client Valorisation
Client RentabilitéRentabilité
Fidélisation
Fidélisation Satisfaction Client Satisfaction
Client
Propension D!achat Propension
D!achat Analyse Tarifaire Analyse Tarifaire
Optimisation Campagnes Optimisation
Campagnes Rétention Client Rétention
Client
Cross Sell Up Sell Cross Sell
Up Sell Satisfaction Client Satisfaction
Client
Segmentation De marché Segmentation
De marché
Analyse du Panier
Moyen Analyse du Panier
Moyen
Optimisation des canaux Optimisation
des canaux Prévisions des ventes Prévisions des ventes
Recomm.
En Temps Réel Recomm.
En Temps Réel
Analyse de l!attrition
en temps réel Analyse de l!attrition
en temps réel
Choix du Canal
de vente Choix du Canal
de vente
Constitution des Offres Constitution
des Offres
Analyse des Profits/Pertes Analyse des
Profits/Pertes Prévisions Financière Prévisions Financière
Gestion du Risque Gestion du
Risque Capital Client
Capital Client
Détection de Fraude Détection de Fraude Rétention
Client Rétention
Client
…et bien d!autres
…et bien d!autres
VAPNIK et le SRM VAPNIK et le SRM
! Problème de l’apprentissage : Régression
! Définition d’un bon modèle ? – SRM
! Du rasoir d’Ockham à Vapnik
! Structured Risk Minimization (SRM) : la solution
Probl
Problèèmeme de de ll!!apprentissageapprentissage : : RRéégressiongression
! Pour un jeu de données fixé, on essaie de trouver un modèle ( f(X,w) ) tel que :
Y
x
f(X,w)
Entrée -> modèle ~ cible X(x1, x2, …) f(X) «proche de» y Entrée -> modèle ~ cible X(x1, x2, …) f(X) «proche de» y
M. X 32 ans Salaire : 100
Pré Pr é cision / Robustesse cision / Robustesse
Modèle construit Données connues Nouvelles données Faible qualité / Haute Robustesse
Modèle avec compromis précision / robustesse
“Sur-apprentissage” /faible Robustesse
Problème de l!apprentissage:
Quelle est la relation entre l!erreur sur l#ensemble d!apprentissage et l!erreur sur de nouvelles données ?
Quelle est la capacité de généralisation du modèle ? Problème de l!apprentissage:
Quelle est la relation entre l!erreur sur l#ensemble d!apprentissage et l!erreur sur de nouvelles données ?
Quelle est la capacité de généralisation du modèle ?
Erreur observée Risque
Compléxité du modèle
Structure
Structure dudu RisqueRisque MinimisMinimiséé(SRM(SRM))
Meilleur modèle Risque Qualité :
! Capacité du modèle à décrire les données d’apprentissage
! Minimisation de l’Erreur observée.
Stabilité :
! Capacité du modèle à prédire des données inconnues
! Minimisation de l’intervalle de confiance.
Qualit Qualitéé : :
!
! CapacitCapacitéé dudu modmodèèlele àà ddéécrirecrire les les donndonnééeses dd’’apprentissageapprentissage
!
! MinimisationMinimisation de de ll’’ErreurErreur observobservééee..
Stabilit Stabilitéé : :
!! CapacitCapacitéé dudu modmodèèlele àà prpréédiredire des des donndonnééeses inconnuesinconnues
!
! MinimisationMinimisation de de ll’’intervalleintervalle de de confianceconfiance..
Intervalle de confiance
SRM =
SRM = Qualit Qualité é + + Robustesse + Robustesse + Rapidit Rapidité é
!Le SRM regroupe 3 étapes en 1
!Utilise toutes les variables disponibles
!Permet d’automatiser le codage des données (Cf.
K2C)
" Encode les Variables – Nominales, Ordinales, et Continues
" Gère les valeurs manquantes
" Détecte les individus atypiques
" Découpe de façon optimale les variables continues
!Teste automatiquement le modèle
!!Le SRM Le SRM regroupe 3 regroupe 3 éétapestapes en 1 en 1
!!UtiliseUtilise toutestoutes les variables disponibles les variables disponibles
!!Permet Permet dd’automatiser’automatiser le le codagecodage des des donndonnéesées (Cf. (Cf.
K2C)K2C)
"
" Encode les Variables –Encode les Variables – NominalesNominales, , OrdinalesOrdinales, et Continues, et Continues
"
" GGèèrere les les valeursvaleurs manquantesmanquantes
"
" DDéétectetecte les les individusindividus atypiquesatypiques
"
" DDéécoupecoupe de de fafaççonon optimaleoptimale les variables continues les variables continues
!!Teste Teste automatiquementautomatiquement le mod le modèèlele
Processus
Processus de de mod modé élisation lisation KXEN KXEN
Analyse des résultats Analyse des résultats
Déploiement Déploiement Model Building Model Building Construction du modèle Construction du modèle
Génération du modèle Génération du modèle Description des données
Definition des rôles Description des données
Definition des rôles Choix de la (des) source(s) de données
Choix de la (des) source(s) de données Choix du type d!analyse : Scoring, Segmentation…
Choix du type d!analyse : Scoring, Segmentation…
Processus
Processus de de modé mod élisation lisation KXEN KXEN
Model Debriefing Model Debriefing
Déploiement Déploiement Construction du modèle Construction du modèle
Analyse des résultats Analyse des résultats
Compréhension des résultats Compréhension des
résultats Evaluation du Modèle (Qualité / Robustesse) Evaluation du Modèle (Qualité / Robustesse)
Modèle généré Modèle généré
Model Deployment Model DeploymentDéploiementDéploiement
Processus
Processus de de mod modé élisation lisation KXEN KXEN
Analyse des résultats Analyse des résultats Construction du modèle Construction du modèle
Deploiement Deploiement
Analyse de la déviation (Back testing) Analyse de la déviation
(Back testing)
Génération de codes sources
Génération de codes sources Application du modèle Application du modèle
Mise à jour Si nécessaire
Mise à jour Si nécessaire Application Batch / Temps réel
Application Batch / Temps réel
Dans un SGBD (UDF, SQL) Dans un SGBD
(UDF, SQL) Hors SGBD
(C, Java, SAS…) Hors SGBD (C, Java, SAS…)
Model Deployment Model DeploymentDéploiementDéploiement
KXEN Consistent Coder
K2C
Nom
Nom –– Fonction Fonction
Préparation des données
Pré Pr éparation paration des des donné donn é es es
K2C dans K2C dans le le processus processus de de mod modé élisation lisation
Transforme rapidement et automatiquement les données pour les rendre analysables
Sélection des variables
Sélection des variables Préparation des données Préparation des données Construction du modèleConstruction du modèle Test du modèleTest du modèle
KXEN Consistent Coder KXEN Consistent Coder
K2C automatise la préparation et le codage des données
! Code les variables nominales et ordinales en données numériques pour les algorithmes de modélisation
! Transforme les variables continues pour prendre en compte les relations non-linéaires avec la cible
! Compresse les variables nominales pour obtenir des catégories robustes (en se basant sur les principes de Vapnik)
! Gère automatiquement les valeurs manquantes et aberrantes
Les diff Les diffé érents rents types de variables types de variables
!
K2C réalise un codage robuste pour :
! Les variables nominales
• Ce sont des valeurs où des catégories discrètes et non ordonnées.
– ex : Couleur des cheveux (brun, blond…) ou le code postal.
! Les variables ordinales
• Ce sont des valeurs discrètes et ordonnées.
– ex : une note de satisfaction (1, 2, …,5)
! Les variables continues
• Ce sont des nombres qui peuvent prendre une infinité de valeurs
– ex: Le montant des achats, la date de naissance
K2C – K2C – Les variables Les variables nominales nominales
! Méthode de codage
# La stratégie dépend de l’algorithme utlisé :
! K2R, K2S supervisé : codage basé sur la moyenne de la cible pour chaque catégorie
! K2S non supervisé : Basé sur la fréquence de chaque catégorie
! Les valeurs manquantes ont leur propre catégorie : KxMissing
! Groupe
# Les valeurs ayant un codage similaires sont groupées ensemble
! e.g : TV, Chaise, VCR, Lampe, Sofa $ [TV,VCR], [Chaise, Sofa], [Lampe]
# Les valeurs sous représentées sont groupées dans une catégorie dediée
! Catégories non robustes compressées dans Kxother
1°) VARIABLES NOMINALES
Exemple : La variable COULEUR, prend 3 valeurs : Bleu, Jaune et Rouge
Codage traditionnel: KXEN :
CODAGE DISJONCTIF CODAGE SELON LA MOYENNE DE LA CIBLE
K2C – K2C – Les variables Les variables nominales nominales
! Pour KXEN Robust Regression
1 0
0
0 1
0
0 0
1
Rouge Jaune
Bleu
0.4 0.4
Valeurs manquantes
0.2 0.1
Rouge
0.25 0.25
TOTAL
0.1 0.2
Jaune
0.3 0.3
Bleu
Cible sur Val.
Cible sur Est.
Couleur
Jaune et rouge ne sont pas robuste Jaune
Jaune et rouge et rouge nene sont
sont pas pas robusterobuste
0.4 KxMissing
0.15 {jaune; rouge}
0.3 Bleu
Cible
Couleur _ Test de non _ Test de non
SignificativitSignificativitéé _
_ NormalisationNormalisation
K2C K2C – Variables continues – Variables continues
! La stratégie de codage dépend de l’algorithme :
# K2R utilise la variable originale et la variable encodée si nécessaire
# K2S utilise seulement la variable encodée
! Codage
# Découpage automatique en “N” segments
# Les valeurs manquantes ont leur propre catégorie : KxMissing
# Groupe
! Les tranches adjacentes avec une moyenne de la cible similaire sont regroupées
• e.g.: 1.5, 2.6, 5.2, 11.8, 12.0, 13.1 $ [1.5 – 12 [, [12.0 – 13.1]
K2C K2C – Variables continues – Variables continues
2°) VARIABLES CONTINUES
Codage traditionnel : KXEN :
Normalisation de chaque variable 2 techniques : Normalisation et encodage linéaire par morceaux
Suppression des valeurs abberrantes
! Pour KXEN Robust Regression
5%5%
5% 5%5%5% 5%5%5% 5%5%5% 5%5%5%
… … …
Variable Variable continue continue Variable
Variable cible cible
20
20 tranchestranches de 5% de la population de 5% de la population totaletotale Regression
Linéaire Y = aX + b Regression Regression LinéLinéaireaire Y = Y = aXaX + b + b
Une nouvelle variable codée est créée : C_Nom_variable
K2C – K2C – variables ordinales variables ordinales
! Méthode de codage
# La stratégie dépend de l’algorithme utlisé mais l’ordre naturel est conservé :
! K2R, K2S supervisé :
• Codage basé sur la moyenne de la cible par catégorie
! K2S non supervisé:
• Basé sur la fréquence
! Les valeurs manquantes sont regroupées dans la catégorie : KxMissing
! Groupe
# Les valeurs adjacentes avec un codage similaire sont regroupées:
! ex : 1, 2, 3, 4, 5 $ [1,2,3], [4,5]
K2C - Options K2C - Options
! KxOther
# Regroupe les catégories sous représentées
# Peut-être désactivé
! Compression
# Regroupe les catégories ayant une moyenne de cible similaire
# Peut-être désactivé
! Nombre de Tranches
# Valeur par défaut : 20
# Peut-être changé
! Codage pour les valeurs continues
# Le codage basé sur la cible peut-être désactivé
! Regroupement
# Il est possible de spécifier ses propres regroupements
KXEN Consistent Coder KXEN Consistent Coder
!Automatise la préparation des donées
!Découpe
automatiquement en tranches les variables continues
!
! AutomatiseAutomatise la la prprééparationparation des des dondonééeses
!!DDéécoupecoupe
automatiquement automatiquement en
en tranchestranches les les variables continues variables continues
Décideurs Métier
!Accélère la préparation des données
!Encode
automatiquement les variables difficiles (ex: code postal)
!Trouve le meilleur compromis entre qualité et robustesse
!
!AccAccééllèèrere la la prprééparationparation des des donndonnééeses
!!EncodeEncode
automatiquement automatiquement les les variables
variables difficilesdifficiles (ex: code postal) (ex: code postal)
!
!TrouveTrouve le le meilleurmeilleur compromis
compromis entreentre qualit
qualitéé et et robustesserobustesse
Expert en Data Mining
!S’intègre facilement dans l’existant
!Aucun travail
supplémentaire lors de l’intégration de K2R
!!SS’’intintèègregre facilementfacilement dansdans ll’’existantexistant
!!AucunAucun travail travail suppl
suppléémentairementaire lorslors de de ll’’intintéégrationgration de de K2RK2R
Informatique interne
KXEN Robust Regression
K2R
NomNom –– FonctionFonction
Présentation, Demo et Formation
Pr Pr é é sentation sentation , Demo et , Demo et Formation
Formation
K2R dans K2R dans le le processus processus de de mod modé élisation lisation
Selection de Variables Selection de Selection de Variables
Variables Preparation des données Preparation Preparation des
des donndonnééeses
Construction du modèle Construction
du modèle Test du ModèleTest du Modèle Manipulation
de données Manipulation Manipulation
de
de donndonnééeses
Construit automatiquement des modèles afin de prédire une variable binaire ou continue et
répondre à une question métier Construit
Construit automatiquementautomatiquement des mod des modèèlesles afinafin de de prpréédiredire uneune variable variable binairebinaire ouou continue et continue et
rérépondrepondre àà uneune question m question méétiertier
KXEN
KXEN R Ré égression gression Robuste Robuste
K2R utilise un algorithme de régression et de classification propriétaire qui :
! Construit automatiquement et rapidement des modèles prédictifs
! Manipule sans risque des centaines de variables
! Fournit des indicateurs pour évaluer la qualité et la robustesse d’un modèle.
! Détermine et classe les variables clés expliquant une question donnée.
! Simule en temps réel de nouveaux cas.
! Détecte les individus atypiques
K2R utiliseK2R utilise un un algorithmealgorithme de de rréégressiongression et et de classification
de classification propripropriéétairetaire qui qui ::
!! Construit Construit automatiquementautomatiquement et et rapidementrapidement des des mod
modèèlesles prpréédictifsdictifs
!
! Manipule sans Manipule sans risquerisque des des centainescentaines de variables de variables
!! Fournit des Fournit des indicateurs pour indicateurs pour éévaluervaluer la la qualitqualitéé et et la robustessela robustesse d d’’un un modmodèèlele..
!! DéDéterminetermine et et classeclasse les variables les variables clclééss expliquantexpliquant une question une question donndonnééee..
!! Simule en temps Simule en temps rrééelel de nouveaux de nouveaux cas.cas.
!! DéDétectetecte les les individusindividus atypiquesatypiques
Des rapports
Des rapports compr compré éhensibles hensibles
! Informations concises sur les modèles construits
" Indicateurs Ki et Kr
! Rapports détaillés
" Variables : Ki individuel, % de valeurs manquantes, et
valeurs de remplacements
" Détail des variables posant problème
" Contributions des variables
! Carte de score complète
!! Informations concises sur les modInformations concises sur les modèèles construitsles construits
"
" Indicateurs Indicateurs KiKi et et KrKr
!! Rapports dRapports déétailltaillééss
"
" Variables : Variables : KiKi individuel, % de valeurs manquantes, et individuel, % de valeurs manquantes, et
valeurs de remplacements valeurs de remplacements
"
" DDéétail des variables posant probltail des variables posant problèèmeme
"
" Contributions des variablesContributions des variables
!! Carte de score complCarte de score complèètete
K2R - M
K2R - Mé éthodologie thodologie
!1 Vérification de la qualité des données et
!Elimination des variables cibles en entrée du modèle
!2 Construction du modèle avec l’ensemble des variables et vérifier Ki Kr
!3 Contrôle des corrélations, choix des variables « leader »
!4 Réduction du nombre de variables
!5 Implémentation de structure de variables selon politique maison
KXEN Robust Regression KXEN Robust Regression
!Des prédictions fiables
!Permet de construire et comprendre facilement des modèles prédictifs
!Contrôle de la qualité du modèle grâce à des
indicateurs de performance
!!Des Des prpréédictionsdictions fiables
fiables
!!PermetPermet de de construire construire et et comprendre comprendre facilement facilement des des modmodèèlesles prpréédictifsdictifs
!!ContrContrôôlele de la de la qualit
qualitéé dudu modmodèèlele grgrââcece àà des des
indicateurs indicateurs de de performance performance
Décideurs Métier
!La rapidité permet plus d!interactions avec les données
!Permet de dégager du temps pour les points importants
!!La La rapiditrapiditéé permetpermet plus
plus dd!!interactionsinteractions avec les
avec les donndonnééeses
!
!PermetPermet de de ddéégagergager dudu temps pour les temps pour les points
points importantsimportants
Expert en Data Mining
!Pas de paramétrage nécessaire
!Résultats
indépendants de la plateforme
!!Pas de Pas de paramparaméétragetrage nnéécessairecessaire
!!RRéésultatssultats
indindéépendantspendants de la de la plateforme
plateforme
Informatique interne
KXEN Analytic Framework 3.3 KXEN Analytic Framework 3.3
Data Sources
Data Manipulation
Data Preparation
Data
Modeling Production
RDBMS
Oracle, Teradata, DB/2, ...
Text Files csv, txt, tab … Native
SAS, SPSS, Excel, …
Data Manipulation
Finalité Création de la
table d’analyse
Finalité Codage et préparation statistique des données pour les
composants de modélisation
K2C
Fonctionnalités
" Jointures
" Création de
nouvelles variables
" Filtres
Fonctionnalités
" Binning (valeurs
nominales)
" Banding (valeurs
continues)
" Gestion des
valeurs manquantes
Fonctionnalités
" Scoring
" Regression
Finalité
" Créer un modèle
prédictif K2R
K2S Fonctionnalités
" Segmentation
Finalité
" Créer un modèle
descriptif
Débriefing Fonctionnalités
" Génération de
rapports Finalité
" Comprendre
" Étudier les
résultats Application du
modèle Fonctionnalités
Via KXEN Via un codre tiers
(SQL, SAS…) Finalité
" Mise en
production
DEMO 2 DEMO 2
KXEN Interface Java
Fonctionnalit
Fonctionnalité és s de KXEN de KXEN
Data Sources Data Sources
Data Manipulation
Data Manipulation
Data Preparation
Data Preparation
Data Modeling
Data
Modeling ProductionProduction RDBMS
Oracle, Teradata, DB/2, ...
Text Files csv, txt, tab … Native
SAS, SPSS, Excel, … RDBMS
Oracle, Teradata, DB/2, ...
Text Files csv, txt, tab … Native
SAS, SPSS, Excel, …
C, JAVA, VB, SAS
… C, JAVA, VB, SAS
…
SQL PMML JAVA
… SQL PMML JAVA
… Générer le Code Oracle Teradata IBM DB2 PMMLJAVA SAS VBC
… G Géénnéérerrer le le Code Code Oracle Oracle Teradata Teradata IBM DB2 IBM DB2 PMML PMML JAVA JAVASAS SAS VB VBC C
…
… Appliquer Scoring Alerts, Deviations Real Time Appliquer Appliquer Scoring Alerts, Deviations Real Time ENCODER
LES VARIABLES
ENCODER LES VARIABLES FUSIONNER
et AGREGER
par dates FUSIONNER
et AGREGER
par dates
RECONSTITUER LES SEQUENCES RECONSTITUER
LES SEQUENCES
SERIE TEMPORELLE
SERIE TEMPORELLE
SCORER SCORER
SEGMENTER SEGMENTER
EXPORTER LES MODELES EXPORTER
LES MODELES
COMPRENDRE LES REGLES D’ASSOCIATION COMPRENDRE
LES REGLES D’ASSOCIATION
KAR :
KAR : L L! !analyse analyse du du panier panier
Transaction 2 Transaction 2
Transaction 1 Transaction 1
Transaction 3 Transaction 3
SESSION
SESSION
=>
(implique ?)
KAR : D
KAR : D étection de combinaisons d é tection de combinaisons d! !achat achat
! Résultats de KAR :
% Détections de règles
! Objectifs de KAR :
% Adapter les méthodes de ventes
&Recommandations, placement des produits
%Adapter la politique tarifaire
%Orienter le comportement d’achat des clients
Sé S é ries ries temporelles temporelles
Prévision d’un signal évoluant avec le temps
! Résultats de KTS :
% Prévision du signal
! Objectifs de KTS :
% Prévision des ventes d’un produit
&Médicaments, jus de fuit…
%Prévision de l’évolution d’un chiffre d’affaire
…
Facilité d!utilisation
! Possibilité de créer et déployer des modèles sans expertise technique
! Préparation des données et processus d!extraction de la connaissance automatisés
! Meilleure compréhension grâce à des graphiques pertinents et des indicateurs de performance
FacilitéFacilité d d!!utilisationutilisation
!
! PossibilitPossibilitéé de cr de crééer et der et dééployer des modployer des modèèles sans expertise techniqueles sans expertise technique
!! PrPrééparation des donnparation des donnéées et processus des et processus d!!extraction de la connaissance automatisextraction de la connaissance automatisééss
!
! Meilleure comprMeilleure comprééhension grhension grââce ce àà des graphiques pertinents et des graphiques pertinents et des indicateurs de performance
des indicateurs de performance
Vitesse
! Construction de modèles analytiques complexes en minutes au lieu d!heures ou jours
! Utilisation plus fréquente, en temps réel pour prendre de meilleures décisions
VitesseVitesse
!
! Construction de modèConstruction de modèles analytiques complexes en minutes au lieu dles analytiques complexes en minutes au lieu d!!heures ou joursheures ou jours
!
! Utilisation plus fréUtilisation plus fréquente, en temps rquente, en temps rééel pour prendre de meilleures del pour prendre de meilleures déécisionscisions
Mise en production aisée : Intégration
! Architecture standard de composants, DCOM, CORBA, PMML, XML
! API documentées pour une intégration facile dans les applications et process existants
Mise en production aiséMise en production aisée : Inte : Intéégrationgration
!! Architecture standard de composants, DCOM, CORBA, PMML, XMLArchitecture standard de composants, DCOM, CORBA, PMML, XML
!
! API documentéAPI documentées pour une intes pour une intéégration facile dans les applications et gration facile dans les applications et processprocess existants existants
Les diff
Les diff érentiateurs KXEN é rentiateurs KXEN
KXEN change les règles du jeu en mettant des techniques avancées d!analyse prédictive à la portée des non-spécialistes
KXEN change les r
KXEN change les rèègles du jeu en mettant des techniquesgles du jeu en mettant des techniques avanc
avancéées des d!!analyse pranalyse préédictive dictive àà la port la portéée des non-spe des non-spéécialistescialistes