Calcul d’un modèle de classification par la méthode des SVM

Chapitre VI. Application : un outil d’aide à la décision pour un gestionnaire de vidéo-club

2. Calcul d’un modèle de classification par la méthode des SVM

La méthode SVM (Support Vector Machines) [Burges et al., 1995; Christianini et al., 2000] est un algorithme d’apprentissage supervisé pour les problèmes de classification à 2 classes. L’ensemble d’apprentissage est donné par un ensemble de vecteurs associé à leur classe

d’appartenance : n

{

}

1 1 u u

(X , ),...,(X , ),y y Xj R ,∈ y_j∈ + −1, 1 , avec :

- yj représente la classe d’appartenance. Dans un problème à deux classes, on peut

considérer que la première classe correspond à une réponse positive (+1), c'est-à- dire y_j égal à +1, et la deuxième classe correspond à une réponse négative(-1),

c'est-à-dire y_j égal à -1 ;

- n

X ∈R , X représente le vecteur du texte numéro j de l’ensemble d’apprentissage. _j La dimension de ce vecteur est n. X est un vecteur occurrence correspondant à la _j définition donnée ci avant.

La méthode SVM sépare les vecteurs à classe positive et les vecteurs à classe négative par un hyperplan défini par l’équation suivante : _{W.X b 0, W R , b R}_{+ =} _∈ n _∈ _{, où « . » représente le} produit scalaire. En général, un tel hyperplan n’est pas unique. La méthode SVM détermine l’hyperplan optimal en maximisant la marge : la marge est la distance entre les vecteurs étiquetés positifs et les vecteurs étiquetés négatifs. L’ensemble d’apprentissage n’est pas nécessairement séparable linéairement, des variables d’écart ξ_jsont introduites pour tous les

X . Ces ξ_j prennent en compte l’erreur de classification, et doivent satisfaire les inégalités suivantes :

- W.X_j+b ≥ − ; 1 ξ_j - W.X_j+b ≤ − +1 ξ_j.

Annexes En prenant en compte ces contraintes, on doit minimiser la fonction d’objectif suivante :

u 2 j j 1 1 W C 2 =

ξ

∑

. Le premier terme de cette fonction correspond à la taille de la marge et le second terme représente l’erreur de classification, avec u représentant le nombre de vecteurs de l’ensemble d’apprentissage.

Trouver la fonction objectif précédente revient à résoudre le problème quadratique suivant : trouver la fonction de décision : f (X) signe(g(X))= dans laquelle la fonction g(X) est :

i i

i 1

g(X)=

∑

₌ λyiX .X b+ , avec :

- Signe(x) représente la fonction suivante : - Si x>0 alors Signe(x)=1 - Si x<0 alors Signe(x)=-1 - Si x=0 alors Signe(x)=0 - yj représente la classe d’appartenance,

- λ_i représente les paramètres à trouver,

- X .X représente le produit scalaire du vecteur _i X avec le vecteur X . _i

La fonction de décision f(X) dépend uniquement des « vecteurs de support » X . Les vecteurs _i des textes de l’ensemble d’apprentissage, excepté ceux correspondant aux « vecteurs de support » n’ont aucune influence sur la fonction de décision à calculer.

Les surfaces de décision non linéaires peuvent être calculées en remplaçant le produit scalaire i

X .X par une fonction de noyau K(X .X) : _i g(X)=

∑

m_{i 1}₌ λ_iy_iK(X .X) b_i + . VI-15

Pour cette fonction K, des fonctions polynomiales donnent de très bons résultats comme par exemple : _{K(X, Y) (X.Y 1)}₌ ₊ d_{, (voir à ce sujet [Joachims, 1998]).}

Ecole Nationale Supérieure des Mines Université Jean Monnet

de Saint-Etienne de Saint-Etienne

N° d’ordre : 411 I

First name, Name: Michel Plantié

Title of the thesis: Automatic Knowledge Extraction pour Multicriteria Decision Making Speciality: Computer Science

Keywords

Decision-Making, Information Decision-Making Support System, Knowledge management, Actionable Knowledge, Information Fusion, Explanation, Decisional Risk, Text-Mining, Data-Mining, Classification, Automated indexation

Summary

This thesis deals with the biased subject of cognitive automation without really coming to a decision. A complete information processing system to support each step of a collective decision-making process (DMP) is proposed. The automation of the learning stage in a DMP is emphasized: the actionable knowledge, i.e. the knowledge relevant for action, becomes a data that can be manipulated by algorithms.

The model that supports our interactive decision-making support system (IDMSS) widely relies on automated knowledge processing. Data-mining, multi criteria decision and optimization techniques are together required in our IDMSS that corresponds to a cybernetic interpretation of the model of decision by the economist Simon. The epistemic incertitude inherent to a decision-making is captured by the notion of decisional risk that analyses the discriminating factors between competing alternatives. Several attitudes in the control of decisional risk may be envisaged: the IDMSS can be used to validate, check or refute an opinion. In every case, the control of epistemic incertitude is not neutral w.r.t. the dynamics of the DMP. The instrumentation of the learning stage in the DMP leads to elaborate the actuator of a retroaction loop that enables to control the dynamics of the DMP. Our approach provides a new framework to formalize the relations between epistemic incertitude, decisional risk and decision stability concepts.

An analysis of the fundamental concepts of actionable knowledge and of automated indexation that support our models and tools is proposed. The actionable knowledge concept acquires a new interpretation in this cybernetic framework: that is the knowledge manipulated by the IDMSS actuator to control the dynamics of a DMP. A brief synthesis of the most popular learning techniques in knowledge discovery is proposed. All these techniques are instantiated for the automated extraction of actionable knowledge in a multi criteria evaluation process. The problem of a video-club manager who tries to optimize his investments w.r.t. the preferences of his customers provides a relevant application that illustrates our whole information processing system.

Ecole Nationale Supérieure des Mines Université Jean Monnet

de Saint-Etienne de Saint-Etienne

N° d’ordre : 411 I

Prénom Nom : Michel Plantié

Titre de la thèse : Extraction automatique de Connaissances pour la décision multicritère Spécialité : Informatique

Mots clefs

Décision, Système d’Aide à la Décision, Gestion des Connaissances, Connaissance Actionnable, Fusion d’Informations, Explication, Argumentation, Risque décisionnel, Text- Mining, Datamining, TALN, Classification, Indexation automatique.

Résumé

Cette thèse, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision. Elle traite en particulier de l’automatisation de la phase d’apprentissage en faisant de la connaissance actionnable—la connaissance utile à l’action—une entité informatique manipulable par des algorithmes.

Le modèle qui supporte notre système interactif d’aide à la décision de groupe (SIADG) s’appuie largement sur des traitements automatiques de la connaissance. Datamining, multicritère et optimisation sont autant de techniques qui viennent se compléter pour élaborer un artefact de décision qui s’apparente à une interprétation cybernétique du modèle décisionnel de l’économiste Simon. L’incertitude épistémique inhérente à une décision est mesurée par le risque décisionnel qui analyse les facteurs discriminants entre les alternatives. Plusieurs attitudes dans le contrôle du risque décisionnel peuvent être envisagées : le SIADG peut être utilisé pour valider, vérifier ou infirmer un point de vue. Dans tous les cas, le contrôle exercé sur l’incertitude épistémique n’est pas neutre quant à la dynamique du processus de décision. L’instrumentation de la phase d’apprentissage du processus décisionnel conduit ainsi à élaborer l’actionneur d’une boucle de rétroaction visant à asservir la dynamique de décision. Notre modèle apporte un éclairage formel des liens entre incertitude épistémique, risque décisionnel et stabilité de la décision.

Les concepts fondamentaux de connaissance actionnable (CA) et d’indexation automatique sur lesquels reposent nos modèles et outils de TALN sont analysés. La notion de connaissance actionnable trouve dans cette vision cybernétique de la décision une interprétation nouvelle : c’est la connaissance manipulée par l’actionneur du SIADG pour contrôler la dynamique décisionnelle. Une synthèse rapide des techniques d’apprentissage les plus éprouvées pour l’extraction automatique de connaissances en TALN est proposée. Toutes ces notions et techniques sont déclinées sur la problématique spécifique d’extraction automatique de CAs dans un processus d’évaluation multicritère. Enfin, l’exemple d’application d’un gérant de vidéoclub cherchant à optimiser ses investissements en fonction des préférences de sa clientèle reprend et illustre le processus informatisé dans sa globalité.

Dans le document Extraction automatique de connaissances pour la décision multicritère (Page 176-181)