• Aucun résultat trouvé

Approfondir les mesures d’actionnabilité et de profitabilité

Nous envisageons d’améliorer la mesure d’actionnabilité en incorporant des pondé- rations dans la mesure de distance. Le fait que certaines variables aient plus de poids que d’autres dans la mesure des proximités entre clients est en effet conforme à l’in- tuition des experts. De manière générale, le critère d’actionnabilité peut être modulé par la prise de risque que souhaite prendre l’entreprise. Une entreprise présentant des clients « non risqués » (souvent le cas des sites de commerce en ligne) sera moins exigeante sur l’élagage des contre-exemples. En revanche, une entreprise respectant la loi de Pareto [160] illustrant que généralement 20 % des clients représentent envi- ron 80 % de l’activité de l’entreprise, aura tendance à être prudente sur une partie de son portefeuille client.

Nous estimons également pertinent d’améliorer la mesure de profitabilité en consi- dérant le nombre de contre-exemples actionnables de chaque cohorte. En effet, il peut être plus difficile de démarcher 1 000 clients 1 000 =C profitables que 100 clients 10 000 =C profitables. Les coûts afférents ne sont pas forcément proportionnels. De plus, la marge nette des produits et les valeurs de stocks courants pourraient in- fluer sur le système de recommandation, réconfortant ainsi les experts et les objectifs métier de l’entreprise. Enfin, la profitabilité de chaque contre-exemple pourrait être pondérée par la qualité des règles dont il est issu.

Segmenter pour recommander

De nombreuses entreprises possèdent non seulement une typologie produits mais également une typologie de clients. Nous songeons à réaliser une segmentation préalable des clients pour appliquer notre méthodologie CAPRE sur des groupes de clients plus homogènes, et ainsi pouvoir utiliser des catégories de produits plus pré- cises. Le client se verra ainsi recommander des produits plus spécifiques en fonction de son segment d’appartenance. Néanmoins, cette méthode pourrait restreindre la transversalité de l’approche et pourrait masquer des comportements atypiques que nous aurions détecté initialement.

Rétro-action et rétro-profit

Les retours d’expérience des experts et notamment l’explication métier des fausses recommandations constituent des éléments pertinents pour rétroagir sur les recom- mandations. Par exemple, le moteur de recommandation Genius d’Apple permet à l’utilisateur de supprimer ses recommandations d’applications directement sur son mobile. Dès lors, le système impacte sa base de recommandations.

De la même manière, le retour sur investissement de recommandations peut ne pas être rentable pour l’entreprise bien que l’estimation du profit ait été profitable. Nous envisageons de pondérer les recommandations non seulement en fonction du profit estimé mais également du profit effectif. Ainsi, le système rétroagit en fonction des

gains réalisés par l’entreprise. Nous pourrions imaginer que le retour sur investis- sement de certaines recommandations aide au déclenchement de recommandations plus onéreuses.

Dans tous les cas, il faut que le système conserve aussi son rôle d’aiguillon pour les commerciaux, en continuant de fournir des recommandations même lorsque celles- ci sont optimistes (exemple d’un client qui achèterait systématiquement un certain produit à la concurrence). Il y a donc un certain équilibre à trouver entre rétro-action et déviation par rapport au marché réel.

Et du côté applicatif...

Nos perspectives applicatives consistent à poursuivre nos travaux dans le domaine de la fouille de données appliquée aux systèmes de recommandation.

À court terme, notre souhait est d’améliorer l’outil ARKIS en rendant interopérable l’ensemble du processus avec tout système d’information d’entreprise. Nous sou- haitons également interconnecter l’outil avec un ERP pour utiliser les règles de re- commandations et aider à la mise en place d’opérations commerciales ciblées par l’intermédiaire des forces de vente commerciales.

À moyen terme, nous cherchons à optimiser le système pour recommander en temps réel. L’idée est d’actionner les recommandations dès la détection d’un client dans nos magasins et d’assister les forces commerciales pour appuyer leur argumentaire de vente.

À plus long terme, nous souhaitons constituer une base de données des recomman- dations success stories sur lesquelles un retour sur investissement effectif a été me- suré. Nous enrichissons ainsi nos bases de données de connaissances clients / pro- duits issues des recommandations. Dès lors, les collaborateurs du groupe VM Maté- riaux pourront consulter les connaissances qui ont effectivement été profitables. Ceci constitue bien évidemment une liste non exhaustive des perspectives applica- tives pour VM Matériaux. Notre souhait étant de traiter en priorité une intégration et un déploiement d’ARKIS dans le système d’information et une adhésion forte des utilisateurs. Nous avons la conviction que ce point constitue l’élément essentiel d’un système de recommandation fiable et performant.

A

Vue simplifiée de l’entrepôt de données de

VM Matériaux

Cette annexe présente une vue simplifiée de la partie gestion commerciale de l’en- trepôt de données de VM Matériaux. L’entrepôt est composé approximativement de 180 tables pour une volumétrie de 93 gigaoctets. Nous listons dans le tableau A.1 quelques caractéristiques des cinq tables les plus volumineuses de la gestion com- merciale.

Nom de la table Nombre de lignes Nombre de colonnes Place occupée (KB)

Ventes 28 302 535 30 10 131 632

Client 1 110 283 51 564 600

Article 422 776 21 81 096

Fournisseur 32 920 23 5 000

ATC 1 826 15 216

TABLEAUA.1 : Volumétrie des tables les plus représentatives de la gestion commerciale

de l’entrepôt de données de VM Matériaux

B

Rappels sur la théorie statistique de

Vladimir VAPNIK

Cette annexe présente une synthèse des travaux de la théorie de Vapnik [285] à la base des fondements de l’outil KXEN [94,224].

B.1 Notations

Nous disposons de données d’apprentissage (x1, y1),(x2, y2), ...,(xn, yn) où le vec-

teur xi = (xi

1, xi2, ..., xip) est une observation et yi est la variable cible à expliquer.

ypeut être une variable discrète (classification) ou continue (régression). Les(xi, yi)

sont supposés être un échantillon de tirages i.i.d (Independent and Identically-Distributed) issus d’une distribution fixe mais inconnue P(X, Y).

Pour expliquer la variable cible, on utilise une classe de fonctions dépendant d’un paramètre θ : Φθ = {f(., W, θ), W ∈ ℵ}. Il s’agit par exemple de la classe des po-

lynômes de degré θ, étant l’espace des coefficients du polynôme et W un vecteur contenant ces coefficients. Le paramètre θ permet de sélectionner des familles de fonctions plus ou moins complexes alors que W est le paramètre que l’on utilise lors de l’apprentissage pour un θ fixé. Un modèle issu de cette classe produit pour chaque observation x une sortie y= f(x, W, θ). À partir des données(x1, y1),(x2, y2)

, ...,(xn, yn), nous cherchons le meilleur modèle ˆy = f(x, ˆW, θ)produit par un certain

algorithme ou principe d’inférence et correspondant au meilleur paramètre ˆW. 165