L! L !environnement de KXEN environnement de KXEN

(1)

Thierry Mulot – thierry.mulot@kxen.com

KXEN Analytic Framework

Présentation 8 février 2006

La mission de KXEN est de faire de l’analyse prédictive une étape incontournable de la prise de décision dans l’entreprise

1.

1. INTRODUCTIONINTRODUCTION

2.2. L’L’ENVIRONNEMENT ANALYTIQUEENVIRONNEMENT ANALYTIQUE 3.

3. LE DATA MINING VU PAR KXENLE DATA MINING VU PAR KXEN 4.4. LES DOMAINES D’LES DOMAINES D’APPLICATIONAPPLICATION 5.5. DEMONSTRATIONDEMONSTRATION

6.6. FONCTIONNALITESFONCTIONNALITES AGENDA

AGENDA AGENDA

(2)

L! L !environnement de KXEN environnement de KXEN

Concept Technologie Exemple Prédiction

de valeurs

Classification Régression

Appétence à upgrader ? Consommation croisée ? Modélisation

Prédictive

Exploration automatisée des données

Segmentation Associations

Profil des détenteurs Quelle offre promo pour

quel profil client Modélisation

Descriptive

Exploration manuelle des données

Cubes

Analyse de la consommation par couleur de carte par

période OLAP

Agrégation des données et

calculs

SQL Feuilles de calcul

Historique de la consommation des miles

des membres fréquence plus

Requête et Reporting

Analytic Intelligence BusinessIntelligence

Exemple 1: Campagne de Marketing Direct Exemple 1: Campagne de Marketing Direct

Information disponible:

Données démographiques d’Acxiom Données financières d’Experian Données clients du constructeur automobile

Ensemble des données:

214 variables

200 000 enregistrements Données numériques et textes Information disponible:

Information disponible:

DonnDonnéées des déémographiques dmographiques d’’AcxiomAcxiom DonnDonnéées financies financièères dres d’’ExperianExperian DonnDonnéées clients du constructeures clients du constructeur automobile

automobile Ensemble des donn Ensemble des donnéées:es:

214 variables 214 variables

200 000 enregistrements 200 000 enregistrements DonnDonnéées numes numéériques et textesriques et textes

Cas étudié : Un grossiste veut lancer une campagne de marketing direct avec un constructeur automobile pour proposer des kits de téléphone sans fil aux conductrices.

Cas éCas étuditudiéé : : Un grossiste veut lancer une campagne de Un grossiste veut lancer une campagne de marketing direct avec un constructeur automobile pour marketing direct avec un constructeur automobile pour proposer des kits de t

proposer des kits de tééllééphone sans fil aux conductrices.phone sans fil aux conductrices.

(3)

Lancer une campagne en

Lancer une campagne en ““aveugleaveugle””

… sans analyse statistique… sans analyse statistique

200 000 * 0,35 = 70 000 " (coût du Mailing)

1,04% = 2070 (taux de réponse)

21,5 " (revenu par réponse)

44 505 " (résultat brut)

- 25 495 " (résultat net)

200 000 * 0,35 = 70 000

200 000 * 0,35 = 70 000 "" (co(coûût du Mailing)t du Mailing)

1,04% = 2070

1,04% = 2070 (taux de r(taux de rééponse)ponse)

21,5

21,5 "" (revenu par r(revenu par rééponse)ponse)

44 505

44 505 "" (r(réésultat brut)sultat brut)

- 25 495

- 25 495 "" (r(réésultat net)sultat net)

Problème: Le lancement de cette campagne a abouti à une perte de 25 495 "

Probl

Problèème: me: Le lancement de cette campagneLe lancement de cette campagne a abouti

a abouti àà une perte de 25 495 une perte de 25 495 ""

Analyser

Le processus Le processus KXEN KXEN

Envoi retour

Base de données

200,000 Cust.

Base de données

200,000 Cust.

X % - échantillon Lancer Test

Echantillon Echantillon

Mailing

Appliquer

(4)

Ré R ésultats obtenus sultats obtenus

…avec KXEN…avec KXEN

-25 495 "

20 965 "

-30000 -25000 -20000 -15000 -10000 -5000 0 5000 10000 15000 20000 25000

Résultats Net de la campagne

Aveugle KXEN

Taux de réponse

5,68%

1,04%

0 1 2 3 4 5 6

Aveugle Data Mining

Résultats: Cette campagne a amélioré le résultat net de 46,460 "

avec un taux de réponse de 6 fois supérieur R

Réésultats:sultats: Cette campagne a amé Cette campagne a améliorlioréé le r le réésultat net de sultat net de 46,460 46,460 ""

avec un taux de r

avec un taux de rééponse deponse de 6 fois sup 6 fois supéérieurrieur

Client Marketing ventes Finance Client Marketing ventes

Client Marketing ventes FinanceFinance

Des centaines de questions Des centaines de questions

Style de vie du Client Style de vie

du Client SegmentationSegmentation

Valorisation Client Valorisation

Client RentabilitéRentabilité

Fidélisation

Fidélisation Satisfaction Client Satisfaction

Client

Propension D!achat Propension

D!achat Analyse Tarifaire Analyse Tarifaire

Optimisation Campagnes Optimisation

Campagnes Rétention Client Rétention

Client

Cross Sell Up Sell Cross Sell

Up Sell Satisfaction Client Satisfaction

Client

Segmentation De marché Segmentation

De marché

Analyse du Panier

Moyen Analyse du Panier

Moyen

Optimisation des canaux Optimisation

des canaux Prévisions des ventes Prévisions des ventes

Recomm.

En Temps Réel Recomm.

En Temps Réel

Analyse de l!attrition

en temps réel Analyse de l!attrition

en temps réel

Choix du Canal

de vente Choix du Canal

de vente

Constitution des Offres Constitution

des Offres

Analyse des Profits/Pertes Analyse des

Profits/Pertes Prévisions Financière Prévisions Financière

Gestion du Risque Gestion du

Risque Capital Client

Capital Client

Détection de Fraude Détection de Fraude Rétention

Client Rétention

Client

…et bien d!autres

(5)

VAPNIK et le SRM VAPNIK et le SRM

! Problème de l’apprentissage : Régression

! Définition d’un bon modèle ? – SRM

! Du rasoir d’Ockham à Vapnik

! Structured Risk Minimization (SRM) : la solution

Probl

Problèèmeme de de ll!!apprentissageapprentissage : : RRéégressiongression

! Pour un jeu de données fixé, on essaie de trouver un modèle ( f(X,w) ) tel que :

Y

x

f(X,w)

Entrée -> modèle ~ cible X(x1, x2, …) f(X) «proche de» y Entrée -> modèle ~ cible X(^{x1, x2, …}⁾f(X) «proche de» y

M. X 32 ans Salaire : 100

(6)

Pré Pr é cision / Robustesse cision / Robustesse

Modèle construit Données connues Nouvelles données Faible qualité / Haute Robustesse

Modèle avec compromis précision / robustesse

“Sur-apprentissage” /faible Robustesse

Problème de l!apprentissage:

Quelle est la relation entre l!erreur sur l#ensemble d!apprentissage et l!erreur sur de nouvelles données ?

Quelle est la capacité de généralisation du modèle ? Problème de l!apprentissage:

Quelle est la relation entre l!erreur sur l#ensemble d!apprentissage et l!erreur sur de nouvelles données ?

Quelle est la capacité de généralisation du modèle ?

Erreur observée Risque

Compléxité du modèle

Structure

Structure dudu RisqueRisque MinimisMinimiséé(SRM(SRM))

Meilleur modèle Risque Qualité :

! Capacité du modèle à décrire les données d’apprentissage

! Minimisation de l’Erreur observée.

Stabilité :

! Capacité du modèle à prédire des données inconnues

! Minimisation de l’intervalle de confiance.

Qualit Qualitéé : :

!

! CapacitCapacitéé dudu modmodèèlele àà ddéécrirecrire les les donndonnééeses dd’’apprentissageapprentissage

!

! MinimisationMinimisation de de ll’’ErreurErreur observobservééee..

Stabilit Stabilitéé : :

!! CapacitCapacitéé dudu modmodèèlele àà prpréédiredire des des donndonnééeses inconnuesinconnues

!

! MinimisationMinimisation de de ll’’intervalleintervalle de de confianceconfiance..

Intervalle de confiance

(7)

SRM =

SRM = Qualit Qualité é + + Robustesse + Robustesse + Rapidit Rapidité é

!Le SRM regroupe 3 étapes en 1

!Utilise toutes les variables disponibles

!Permet d’automatiser le codage des données (Cf.

K2C)

" Encode les Variables – Nominales, Ordinales, et Continues

" Gère les valeurs manquantes

" Détecte les individus atypiques

" Découpe de façon optimale les variables continues

!Teste automatiquement le modèle

!!Le SRM Le SRM regroupe 3 regroupe 3 éétapestapes en 1 en 1

!!UtiliseUtilise toutestoutes les variables disponibles les variables disponibles

!!Permet Permet dd’automatiser’automatiser le le codagecodage des des donndonnéesées (Cf. (Cf.

K2C)K2C)

"

" Encode les Variables –Encode les Variables – NominalesNominales, , OrdinalesOrdinales, et Continues, et Continues

"

" GGèèrere les les valeursvaleurs manquantesmanquantes

"

" DDéétectetecte les les individusindividus atypiquesatypiques

"

" DDéécoupecoupe de de fafaççonon optimaleoptimale les variables continues les variables continues

!!Teste Teste automatiquementautomatiquement le mod le modèèlele

Processus

Processus de de mod modé élisation lisation KXEN KXEN

Analyse des résultats Analyse des résultats

Déploiement Déploiement Model Building Model Building Construction du modèle Construction du modèle

Génération du modèle Génération du modèle Description des données

Definition des rôles Description des données

Definition des rôles Choix de la (des) source(s) de données

Choix de la (des) source(s) de données Choix du type d!analyse : Scoring, Segmentation…

Choix du type d!analyse : Scoring, Segmentation…

(8)

Processus

Processus de de modé mod élisation lisation KXEN KXEN

Model Debriefing Model Debriefing

Déploiement Déploiement Construction du modèle Construction du modèle

Analyse des résultats Analyse des résultats

Compréhension des résultats Compréhension des

résultats Evaluation du Modèle (Qualité / Robustesse) Evaluation du Modèle (Qualité / Robustesse)

Modèle généré Modèle généré

Model Deployment Model DeploymentDéploiementDéploiement

Processus

Processus de de mod modé élisation lisation KXEN KXEN

Analyse des résultats Analyse des résultats Construction du modèle Construction du modèle

(9)

Deploiement Deploiement

Analyse de la déviation (Back testing) Analyse de la déviation

(Back testing)

Génération de codes sources

Génération de codes sources Application du modèle Application du modèle

Mise à jour Si nécessaire

Mise à jour Si nécessaire Application Batch / Temps réel

Application Batch / Temps réel

Dans un SGBD (UDF, SQL) Dans un SGBD

(UDF, SQL) Hors SGBD

(C, Java, SAS…) Hors SGBD (C, Java, SAS…)

Model Deployment Model DeploymentDéploiementDéploiement

KXEN Consistent Coder

K2C

Nom

Nom –– Fonction Fonction

Préparation des données

Pré Pr éparation paration des des donné donn é es es

(10)

K2C dans K2C dans le le processus processus de de mod modé élisation lisation

Transforme rapidement et automatiquement les données pour les rendre analysables

Sélection des variables

Sélection des variables Préparation des données Préparation des données Construction du modèleConstruction du modèle Test du modèleTest du modèle

KXEN Consistent Coder KXEN Consistent Coder

K2C automatise la préparation et le codage des données

! Code les variables nominales et ordinales en données numériques pour les algorithmes de modélisation

! Transforme les variables continues pour prendre en compte les relations non-linéaires avec la cible

! Compresse les variables nominales pour obtenir des catégories robustes (en se basant sur les principes de Vapnik)

! Gère automatiquement les valeurs manquantes et aberrantes

(11)

Les diff Les diffé érents rents types de variables types de variables

!

K2C réalise un codage robuste pour :

! Les variables nominales

• Ce sont des valeurs où des catégories discrètes et non ordonnées.

– ex : Couleur des cheveux (brun, blond…) ou le code postal.

! Les variables ordinales

• Ce sont des valeurs discrètes et ordonnées.

– ex : une note de satisfaction (1, 2, …,5)

! Les variables continues

• Ce sont des nombres qui peuvent prendre une infinité de valeurs

– ex: Le montant des achats, la date de naissance

K2C – K2C – Les variables Les variables nominales nominales

! Méthode de codage

# La stratégie dépend de l’algorithme utlisé :

! K2R, K2S supervisé : codage basé sur la moyenne de la cible pour chaque catégorie

! K2S non supervisé : Basé sur la fréquence de chaque catégorie

! Les valeurs manquantes ont leur propre catégorie : KxMissing

! Groupe

# Les valeurs ayant un codage similaires sont groupées ensemble

! e.g : TV, Chaise, VCR, Lampe, Sofa $ [TV,VCR], [Chaise, Sofa], [Lampe]

# Les valeurs sous représentées sont groupées dans une catégorie dediée

! Catégories non robustes compressées dans Kxother

(12)

1°) VARIABLES NOMINALES

Exemple : La variable COULEUR, prend 3 valeurs : Bleu, Jaune et Rouge

Codage traditionnel: KXEN :

CODAGE DISJONCTIF CODAGE SELON LA MOYENNE DE LA CIBLE

K2C – K2C – Les variables Les variables nominales nominales

! Pour KXEN Robust Regression

1 0

0

0 1

0

0 0

1

Rouge Jaune

Bleu

0.4 0.4

Valeurs manquantes

0.2 0.1

Rouge

0.25 0.25

TOTAL

0.1 0.2

Jaune

0.3 0.3

Bleu

Cible sur Val.

Cible sur Est.

Couleur

Jaune et rouge ne sont pas robuste Jaune

Jaune et rouge et rouge nene sont

sont pas pas robusterobuste

0.4 KxMissing

0.15 {jaune; rouge}

0.3 Bleu

Cible

Couleur _ Test de non _ Test de non

SignificativitSignificativitéé _

_ NormalisationNormalisation

K2C K2C – Variables continues – Variables continues

! La stratégie de codage dépend de l’algorithme :

# K2R utilise la variable originale et la variable encodée si nécessaire

# K2S utilise seulement la variable encodée

! Codage

# Découpage automatique en “N” segments

# Les valeurs manquantes ont leur propre catégorie : KxMissing

# Groupe

! Les tranches adjacentes avec une moyenne de la cible similaire sont regroupées

• e.g.: 1.5, 2.6, 5.2, 11.8, 12.0, 13.1 $ [1.5 – 12 [, [12.0 – 13.1]

(13)

K2C K2C – Variables continues – Variables continues

2°) VARIABLES CONTINUES

Codage traditionnel : KXEN :

Normalisation de chaque variable 2 techniques : Normalisation et encodage linéaire par morceaux

Suppression des valeurs abberrantes

! Pour KXEN Robust Regression

5%5%

5% 5%5%5% 5%5%5% 5%5%5% 5%5%5%

… … …

Variable Variable continue continue Variable

Variable cible cible

20

20 tranchestranches de 5% de la population de 5% de la population totaletotale Regression

Linéaire Y = aX + b Regression Regression LinéLinéaireaire Y = Y = aXaX + b + b

Une nouvelle variable codée est créée : C_Nom_variable

K2C – K2C – variables ordinales variables ordinales

! Méthode de codage

# La stratégie dépend de l’algorithme utlisé mais l’ordre naturel est conservé :

! K2R, K2S supervisé :

• Codage basé sur la moyenne de la cible par catégorie

! K2S non supervisé:

• Basé sur la fréquence

! Les valeurs manquantes sont regroupées dans la catégorie : KxMissing

! Groupe

# Les valeurs adjacentes avec un codage similaire sont regroupées:

! ex : 1, 2, 3, 4, 5 $ [1,2,3], [4,5]

(14)

K2C - Options K2C - Options

! KxOther

# Regroupe les catégories sous représentées

# Peut-être désactivé

! Compression

# Regroupe les catégories ayant une moyenne de cible similaire

# Peut-être désactivé

! Nombre de Tranches

# Valeur par défaut : 20

# Peut-être changé

! Codage pour les valeurs continues

# Le codage basé sur la cible peut-être désactivé

! Regroupement

# Il est possible de spécifier ses propres regroupements

KXEN Consistent Coder KXEN Consistent Coder

!Automatise la préparation des donées

!Découpe

automatiquement en tranches les variables continues

!

! AutomatiseAutomatise la la prprééparationparation des des dondonééeses

!!DDéécoupecoupe

automatiquement automatiquement en

en tranchestranches les les variables continues variables continues

Décideurs Métier

!Accélère la préparation des données

!Encode

automatiquement les variables difficiles (ex: code postal)

!Trouve le meilleur compromis entre qualité et robustesse

!

!AccAccééllèèrere la la prprééparationparation des des donndonnééeses

!!EncodeEncode

automatiquement automatiquement les les variables

variables difficilesdifficiles (ex: code postal) (ex: code postal)

!

!TrouveTrouve le le meilleurmeilleur compromis

compromis entreentre qualit

qualitéé et et robustesserobustesse

Expert en Data Mining

!S’intègre facilement dans l’existant

!Aucun travail

supplémentaire lors de l’intégration de K2R

!!SS’’intintèègregre facilementfacilement dansdans ll’’existantexistant

!!AucunAucun travail travail suppl

suppléémentairementaire lorslors de de ll’’intintéégrationgration de de K2RK2R

Informatique interne

(15)

KXEN Robust Regression

K2R

NomNom –– FonctionFonction

Présentation, Demo et Formation

Pr Pr é é sentation sentation , Demo et , Demo et Formation

Formation

K2R dans K2R dans le le processus processus de de mod modé élisation lisation

Selection de Variables Selection de Selection de Variables

Variables Preparation des données Preparation Preparation des

des donndonnééeses

Construction du modèle Construction

du modèle Test du ModèleTest du Modèle Manipulation

de données Manipulation Manipulation

de

de donndonnééeses

Construit automatiquement des modèles afin de prédire une variable binaire ou continue et

répondre à une question métier Construit

Construit automatiquementautomatiquement des mod des modèèlesles afinafin de de prpréédiredire uneune variable variable binairebinaire ouou continue et continue et

rérépondrepondre àà uneune question m question méétiertier

(16)

KXEN

KXEN R Ré égression gression Robuste Robuste

K2R utilise un algorithme de régression et de classification propriétaire qui :

! Construit automatiquement et rapidement des modèles prédictifs

! Manipule sans risque des centaines de variables

! Fournit des indicateurs pour évaluer la qualité et la robustesse d’un modèle.

! Détermine et classe les variables clés expliquant une question donnée.

! Simule en temps réel de nouveaux cas.

! Détecte les individus atypiques

K2R utiliseK2R utilise un un algorithmealgorithme de de rréégressiongression et et de classification

de classification propripropriéétairetaire qui qui ::

!! Construit Construit automatiquementautomatiquement et et rapidementrapidement des des mod

modèèlesles prpréédictifsdictifs

!

! Manipule sans Manipule sans risquerisque des des centainescentaines de variables de variables

!! Fournit des Fournit des indicateurs pour indicateurs pour éévaluervaluer la la qualitqualitéé et et la robustessela robustesse d d’’un un modmodèèlele..

!! DéDéterminetermine et et classeclasse les variables les variables clclééss expliquantexpliquant une question une question donndonnééee..

!! Simule en temps Simule en temps rrééelel de nouveaux de nouveaux cas.cas.

!! DéDétectetecte les les individusindividus atypiquesatypiques

Des rapports

Des rapports compr compré éhensibles hensibles

! Informations concises sur les modèles construits

" Indicateurs Ki et Kr

! Rapports détaillés

" Variables : Ki individuel, % de valeurs manquantes, et

valeurs de remplacements

" Détail des variables posant problème

" Contributions des variables

! Carte de score complète

!! Informations concises sur les modInformations concises sur les modèèles construitsles construits

"

" Indicateurs Indicateurs KiKi et et KrKr

!! Rapports dRapports déétailltaillééss

"

" Variables : Variables : KiKi individuel, % de valeurs manquantes, et individuel, % de valeurs manquantes, et

valeurs de remplacements valeurs de remplacements

"

" DDéétail des variables posant probltail des variables posant problèèmeme

"

" Contributions des variablesContributions des variables

!! Carte de score complCarte de score complèètete

(17)

K2R - M

K2R - Mé éthodologie thodologie

!1 Vérification de la qualité des données et

!Elimination des variables cibles en entrée du modèle

!2 Construction du modèle avec l’ensemble des variables et vérifier Ki Kr

!3 Contrôle des corrélations, choix des variables « leader »

!4 Réduction du nombre de variables

!5 Implémentation de structure de variables selon politique maison

KXEN Robust Regression KXEN Robust Regression

!Des prédictions fiables

!Permet de construire et comprendre facilement des modèles prédictifs

!Contrôle de la qualité du modèle grâce à des

indicateurs de performance

!!Des Des prpréédictionsdictions fiables

fiables

!!PermetPermet de de construire construire et et comprendre comprendre facilement facilement des des modmodèèlesles prpréédictifsdictifs

!!ContrContrôôlele de la de la qualit

qualitéé dudu modmodèèlele grgrââcece àà des des

indicateurs indicateurs de de performance performance

Décideurs Métier

!La rapidité permet plus d!interactions avec les données

!Permet de dégager du temps pour les points importants

!!La La rapiditrapiditéé permetpermet plus

plus dd!!interactionsinteractions avec les

avec les donndonnééeses

!

!PermetPermet de de ddéégagergager dudu temps pour les temps pour les points

points importantsimportants

Expert en Data Mining

!Pas de paramétrage nécessaire

!Résultats

indépendants de la plateforme

!!Pas de Pas de paramparaméétragetrage nnéécessairecessaire

!!RRéésultatssultats

indindéépendantspendants de la de la plateforme

plateforme

Informatique interne

(18)

KXEN Analytic Framework 3.3 KXEN Analytic Framework 3.3

Data Sources

Data Manipulation

Data Preparation

Data

Modeling Production

RDBMS

Oracle, Teradata, DB/2, ...

Text Files csv, txt, tab … Native

SAS, SPSS, Excel, …

Data Manipulation

Finalité Création de la

table d’analyse

Finalité Codage et préparation statistique des données pour les

composants de modélisation

K2C

Fonctionnalités

" Jointures

" Création de

nouvelles variables

" Filtres

" Binning (valeurs

nominales)

" Banding (valeurs

continues)

" Gestion des

valeurs manquantes

" Scoring

" Regression

Finalité

" Créer un modèle

prédictif K2R

K2S Fonctionnalités

" Segmentation

Finalité

" Créer un modèle

descriptif

Débriefing Fonctionnalités

" Génération de

rapports Finalité

" Comprendre

" Étudier les

résultats Application du

modèle Fonctionnalités

Via KXEN Via un codre tiers

(SQL, SAS…) Finalité

" Mise en

production

DEMO 2 DEMO 2

KXEN Interface Java

(19)

Fonctionnalit

Fonctionnalité és s de KXEN de KXEN

Data Sources Data Sources

Data Manipulation

Data Preparation

Data Modeling

Data

Modeling ProductionProduction RDBMS

SAS, SPSS, Excel, … RDBMS

SAS, SPSS, Excel, …

C, JAVA, VB, SAS

… C, JAVA, VB, SAS

…

SQL PMML JAVA

… SQL PMML JAVA

… Générer le Code Oracle Teradata IBM DB2 PMMLJAVA SAS VBC

… G Géénnéérerrer le le Code Code Oracle Oracle Teradata Teradata IBM DB2 IBM DB2 PMML PMML JAVA JAVASAS SAS VB VBC C

…

… Appliquer Scoring Alerts, Deviations Real Time Appliquer Appliquer Scoring Alerts, Deviations Real Time ENCODER

LES VARIABLES

ENCODER LES VARIABLES FUSIONNER

et AGREGER

par dates FUSIONNER

et AGREGER

par dates

RECONSTITUER LES SEQUENCES RECONSTITUER

LES SEQUENCES

SERIE TEMPORELLE

SCORER SCORER

SEGMENTER SEGMENTER

EXPORTER LES MODELES EXPORTER

LES MODELES

COMPRENDRE LES REGLES D’ASSOCIATION COMPRENDRE

LES REGLES D’ASSOCIATION

KAR :

KAR : L L! !analyse analyse du du panier panier

Transaction 2 Transaction 2

SESSION

(20)

=>

(implique ?)

KAR : D

KAR : D étection de combinaisons d é tection de combinaisons d! !achat achat

! Résultats de KAR :

% Détections de règles

! Objectifs de KAR :

% Adapter les méthodes de ventes

&Recommandations, placement des produits

%Adapter la politique tarifaire

%Orienter le comportement d’achat des clients

Sé S é ries ries temporelles temporelles

Prévision d’un signal évoluant avec le temps

! Résultats de KTS :

% Prévision du signal

! Objectifs de KTS :

% Prévision des ventes d’un produit

&Médicaments, jus de fuit…

%Prévision de l’évolution d’un chiffre d’affaire

…

(21)

Facilité d!utilisation

! Possibilité de créer et déployer des modèles sans expertise technique

! Préparation des données et processus d!extraction de la connaissance automatisés

! Meilleure compréhension grâce à des graphiques pertinents et des indicateurs de performance

FacilitéFacilité d d!!utilisationutilisation

!

! PossibilitPossibilitéé de cr de crééer et der et dééployer des modployer des modèèles sans expertise techniqueles sans expertise technique

!! PrPrééparation des donnparation des donnéées et processus des et processus d!!extraction de la connaissance automatisextraction de la connaissance automatisééss

!

! Meilleure comprMeilleure comprééhension grhension grââce ce àà des graphiques pertinents et des graphiques pertinents et des indicateurs de performance

des indicateurs de performance

Vitesse

! Construction de modèles analytiques complexes en minutes au lieu d!heures ou jours

! Utilisation plus fréquente, en temps réel pour prendre de meilleures décisions

VitesseVitesse

!

! Construction de modèConstruction de modèles analytiques complexes en minutes au lieu dles analytiques complexes en minutes au lieu d!!heures ou joursheures ou jours

!

! Utilisation plus fréUtilisation plus fréquente, en temps rquente, en temps rééel pour prendre de meilleures del pour prendre de meilleures déécisionscisions

Mise en production aisée : Intégration

! Architecture standard de composants, DCOM, CORBA, PMML, XML

! API documentées pour une intégration facile dans les applications et process existants

Mise en production aiséMise en production aisée : Inte : Intéégrationgration

!! Architecture standard de composants, DCOM, CORBA, PMML, XMLArchitecture standard de composants, DCOM, CORBA, PMML, XML

!

! API documentéAPI documentées pour une intes pour une intéégration facile dans les applications et gration facile dans les applications et processprocess existants existants

Les diff

Les diff érentiateurs KXEN é rentiateurs KXEN

KXEN change les règles du jeu en mettant des techniques avancées d!analyse prédictive à la portée des non-spécialistes

KXEN change les r

KXEN change les rèègles du jeu en mettant des techniquesgles du jeu en mettant des techniques avanc

avancéées des d!!analyse pranalyse préédictive dictive àà la port la portéée des non-spe des non-spéécialistescialistes

L! L !environnement de KXEN environnement de KXEN

L! L !environnement de KXEN environnement de KXEN

Le processus Le processus KXEN KXEN

Ré R ésultats obtenus sultats obtenus

Des centaines de questions Des centaines de questions

VAPNIK et le SRM VAPNIK et le SRM

Pré Pr é cision / Robustesse cision / Robustesse

SRM =

SRM = Qualit Qualité é + + Robustesse + Robustesse + Rapidit Rapidité é

Processus

Processus de de mod modé élisation lisation KXEN KXEN

Processus

Processus de de modé mod élisation lisation KXEN KXEN

Processus

Processus de de mod modé élisation lisation KXEN KXEN

Deploiement Deploiement

KXEN Consistent Coder

K2C

Préparation des données

Pré Pr éparation paration des des donné donn é es es

K2C dans K2C dans le le processus processus de de mod modé élisation lisation

KXEN Consistent Coder KXEN Consistent Coder

Les diff Les diffé érents rents types de variables types de variables

K2C réalise un codage robuste pour :

K2C – K2C – Les variables Les variables nominales nominales

K2C – K2C – Les variables Les variables nominales nominales

K2C K2C – Variables continues – Variables continues

K2C K2C – Variables continues – Variables continues

… … …

K2C – K2C – variables ordinales variables ordinales

K2C - Options K2C - Options

KXEN Consistent Coder KXEN Consistent Coder

KXEN Robust Regression

K2R

Présentation, Demo et Formation

Pr Pr é é sentation sentation , Demo et , Demo et Formation

Formation

K2R dans K2R dans le le processus processus de de mod modé élisation lisation

KXEN

KXEN R Ré égression gression Robuste Robuste

Des rapports

Des rapports compr compré éhensibles hensibles

K2R - M

K2R - Mé éthodologie thodologie

KXEN Robust Regression KXEN Robust Regression

KXEN Analytic Framework 3.3 KXEN Analytic Framework 3.3

DEMO 2 DEMO 2

Fonctionnalit

Fonctionnalité és s de KXEN de KXEN

KAR :

KAR : L L! !analyse analyse du du panier panier

SESSION

SESSION

=>

KAR : D

KAR : D étection de combinaisons d é tection de combinaisons d! !achat achat

Sé S é ries ries temporelles temporelles

Les diff

Les diff érentiateurs KXEN é rentiateurs KXEN

Questions et R

Questions et Ré é ponses, ponses, Merci

Merci