• Aucun résultat trouvé

Penteado (2005, p.37) rapporte que

selon Jambu (2000, p.8), le processus de l'exploration de données (datamining- DM) combine plusieurs méthodes mathématiques, statistiques ou ayant origine dans des algorithmes, pour déterminer une solution à un problème, dans un univers décisionnel. Porter (2003, p.3) indique qu'en général, quand nous travaillons avec les techniques de datamining, nous extrayons des informations utiles de n'importe quelle type de données. Mais le plus commun est d'utiliser de données numériques et, pourtant, quantitatives. Une bonne connaissance de Statistique est nécessaire. Cette caractéristique générale influence le choix des outils de datamining, aussi orientées pour le traitement quantitatif (p.37). Parmi ces outils nous pouvons citer des logiciels de statistique qui ont développé des suites spécifiques (SAS3, SPSS4 et Statistica5) et des logiciels libres R6, de statistique et le Weka7, spécialisé dans l'exploration de données.

Le cycle d'analyse dans l'exploration de données

Jambu a nommé 16 étapes pour le cycle d'analyse et de gestion en exploration de données, très semblables au cycle de l'intelligence cité par Faria et Quoniam (2002) :

1. Définition de l'objet de l'étude ;

2. Définition des objectifs à atteindre ;

3. Étude des données existantes ;

Il est considéré que les données doivent être liées à l'objectif et traduire des faits précis en relation à l'objectif. L'analyste doit définir les variables, les entités et les périodes de temps et il a toujours deux difficultés primordiales : La donnée supplémentaire considérée comme erreur et la donnée manquante, considérée comme lacune.

4. Création de données spécialisées/ou de bases externes/particulières pour l'analyse ;

5. Définition des traitements spécialisés nécessaires ;

6. Collecte des données ;

3 Informations en "http : //www.sas.com/" 4 Informations en "http : //www.spss.com/" 5 Informations en "http : //www.statsoft.com/index.htm" 6 Informations en "http : //www.r-project.org/"

7. Traitement ou importation des données ;

8. Contrôle des données ;

9. Gestion des données ;

10. Accès aux données par les utilisateurs ;

11. Analyse interactive des données (par l'utilisateur lui-même) ;

12. Exploration des données :

Un processus itératif, parfois, interactif, qui combine plusieurs méthodes

mathématiques, statistiques ou algorithmiques pour déterminer une solution à un problème, dans un univers décisionnel (Jambu, p.50) ;

13. Elaboration des tableaux et tables d'accompagnement, des rapports (titre, objectif, bref description des données, liste des tableaux, graphes, résultats et, pour chaque résultat, sa relation avec l'objectif, légendes et citation des sources) ;

14. Décisions ;

15. Plans d'action ;

16. Action.

Pereira (2005) rappelle qu'en explorant "des grandes quantités de données" (p.8) on peut identifier les relations systématiques ou normatives entre les variables et ensuite les valider "en appliquant les normes détectées a des nouveaux sous-ensembles de données. Cette étape a trois phases : Exploitation ; Construction du modèle ou définition des normes ;

Validation/vérification" (p.8).

Penteado (2005, pp.37-38) présente les cinq façons utilisées par Sulaiman et Souza (2001, p.267) pour "générer des résultats par l'exploration des données (datamining)" : Des règles d'association ; Des hiérarchies de classification ; Des normes séquentielles, normes de séries temporelles ; Catégorisation et segmentation, que nous analysons ensuite :

1. Des règles d'association. Elles visent à "rencontrer des items en une transaction qui puissent déterminer la présence d'autres items dans la même transaction" (p.267). Exemple : Celui qu'achète du pain et du lait, achète aussi du beurre ;

2. Des hiérarchies de classification. Elles créent "un modèle basé sur les données connus" (p.267) et aident à expliquer le pourquoi d'une classification donnée et aussi permettent de "classer de nouvelles données à partir d'une classification existante" (p.267). Exemple :

Créer des limites pour la concession de crédit basés sur l'historique des transactions de crédit antérieures ;

3. Normes séquentielles. Elles indiquent des comportements ou une séquence de

comportements. Exemple : "Toutes les fois qu'une jeune femme achète des chaussures en cuir, elle achètera aussi des sacs à main et des ceintures dans les prochains trente jours" (p.268) ;

4. Normes de séries temporelles. Elles montrent des occurrences similaires dans un espace de temps. Aux données en dessus, on additionne la saison : À l'automne, les jeunes femmes achètent des chaussures, des sacs à main et des ceintures. Au printemps ce schéma change pour des sandales, des sacs à main et des chapeaux ;

5. Catégorisation et segmentation. Des références avec des caractéristiques similaires sont réunies. Exemple : Un groupe de consommateurs peut être classé comme "peu acheteur", "moyennement acheteur" ou "très acheteur" (p.268) pour un produit déterminé (pp. 37- 38).

Penteado (2005, p.38) poursuit :

Dans la plupart des cas, nous travaillons dans l'exploration de données en cherchant à identifier les profils des différents sujets d'analyse (des usagers et/ou des clients) et ses diverses normes de comportement ou de consommation. Ensuite, en travaillant par segments, il est possible d'identifier le profil des meilleurs clients ; Les produits et services consommés par ou les caractéristiques de chaque segment de clients ; Les normes de consommation des produits, comment et quand deux ou plus produits ou caractéristiques s'associent ou se réunissent dans un seul achat ou événement et aussi les normes de

consommation/comportement par région, arrondissement, age ou sexe (p.38). Pour finir,

Jambu (2000, p.93) rapporte les champs d'applications typiques de l'exploration des données : Les études de cas, l'amélioration de la qualité et de l'efficience du négoce, la satisfaction des employés, la relation avec les clients, le marketing dirigée, le marketing local, les indicateurs de négoce, la prévision, les tendances, la veille de la concurrence, des achats, de la technologie et de l'information, le contrôle des dépenses, les finances et les mouvements financiers et les processus de gestion (p.38).

Exemples d'applications intelligentes de l'exploration de données

Des couches et de la bière

Penteado (2005, p.38) rapporte un cas classique d'exploration de données :

Il a été découvert que le profil du consommateur de bière était similaire à celui du consommateur de couches : Des hommes mariés, avec 25 a 30 ans, qu'achetaient les deux produits les vendredis, période de fin d'après-midi, début de la nuit. La

de couches au côté de celles de bière. Résultat : Les ventes des deux produits ont augmenté de 30% les vendredis.

Des bonnes relations avec le client

La Telemar, une des plus grandes entreprises de télécommunication de l'Amérique Latine, avec une couverture de 64% du territoire brésilien, en 16 des 27 états du Brésil (départements), a intégré sa base de données de presque 25 millions de clients (Balaj, 2005a) dans un entrepôt de données. Selon Balaj (2005b, pp.24-27), le système a permis augmenter les ventes, réduire les débranchements et réduire des coûts. Entre 2003 et 2005, la participation de l'entreprise dans le marché d'Internet à haute vitesse est passé de 7% à 25%, soit un accroissement de 280%. La Telemar a été capable "d'anticiper le potentiel de croissance du marché de portables, en maintenant l'expansion de sa base de clients" (p.26). La part des nouveaux services (portable, transmission de données, Internet haute vélocité et liaisons entre les états), en opposition aux services traditionnels (téléphone, réseaux et téléphones publiques), dans le total des recettes a augmenté de 30% en 2003 de 39% en 2005, même avec une croissance réelle des recettes, en ce dernier an, de 9% (p.27).

Crédit et insolvabilité

Des modèles mathématiques sont crées pour calculer les probabilités d'opérations financières et alimentés avec les variables qu'expliquent l'insolvabilité. Ces modèles sont traités dans les bases de clients des institutions financières. Pereira (2005, pp.15-18) signale que par ce moyen sont identifiés des clients "ayant grande chance de ne pas payer" (p.125) évitant ainsi la concession de crédits de difficile récupération. Une simulation a été faite avec une liste de 252 clients insolvables d'une institution financière et a identifié 196 (78%) comme des mauvais payeurs en potentiel.

Générer plus de négoces

Le Groupe Accor intègre au Brésil 29 marques entre des hôtels, des agences de voyages et des services divers. Les données des clients de tout le groupe ont été concentrées dans un entrepôt de données appelé Table de Négoces. Son objectif, explique Angerame (2005) est de "garantir une vision unique du client corporatif Accor, promouvoir l'intelligence de négoces, des façons des alliances et des synergies entre les marques" (p.7) et favoriser une action intégrée du groupe, développer plus les nouveaux négoces, fidéliser des clients, générer plus

de profit. Angerame observe qu'une analyse intégrant les données disponibles sur le marché hôtelier de la Grande Sao Paulo a permis d'identifier l'impact du commerce et de la concurrence et des régions pour des nouvelles affaires, en générant encore une vision globale de ce marché et en signalisant 2500 entreprises pour prospecter des nouveaux négoces avec le groupe. Des analyses de synergie de négoce intra et extra groupe Accor ont indiqué, par exemple, des chemins pour l'expansion des réseaux d'affaires du groupe soit avec des grandes entreprises, soit avec des secteurs entiers et aussi d'accompagner de prés ses 100 plus grands clients (pp.17-36).

Veiller le marché

Le Groupe Carrefour a un entrepôt de données où sont intégrées des données sous dix perspectives : Lieu de ventes, public-cible, produits, prix, promotion, présentation (dessin), publicité, positionnement, personnes et planification. Inafuco (2005, pp.14-17) affirme que le système d'intelligence de marché génère entre d'autres produits stratégiques, des études du potentiel du marché, de l'impacte des nouveaux magasins, de fusions et d'acquisitions, de profil des clients, des tendances du consommateur, dépenses moyennes, d'offres stratégiques, de compétitivité des prix, d'impacts des promotions et des recherches d'image et de qualité de service.

Des contrats de maintenance

La Sears Roebuck a un système qui veille ses ventes d'électroménager - qui aux États-Unis sont vendus en conjonction avec des contrats de maintien. Le système informe les clients par lettres quand est l'époque de renouveler les contrats, ce qui maintient une importante source de recettes et améliore aussi la qualité du service et la satisfaction des clients (Reynolds, 1992, p.223). Des systèmes similaires sont utilisés partout dans le monde. À Brasilia, un magasin, le

Mundo dos Filtros, a un système pour la maintenance de filtres d'eau douce dans les

résidences opère par téléphone.

Facteurs critiques de succès (FCS)

La Kubota Tractor, entreprise de pièces détachées de ce type de véhicule considère un FCS, minimiser le temps qu'une pièce reste au dépôt, ce qui permet de maintenir bas les coûts de stockage des produits et fait qui les pièces soient délivrées rapidement à leurs partenaires. Des

demande de pièces avec la demande projetée et d'anticiper les réquisitions de pièces sans lever trop le stock et aider aussi à décider sur des quantités à demander en évitant la faute de pièces en stock (Reynolds, 1992, p.240).