• Aucun résultat trouvé

La méthode que nous proposons est illustrée sur la figure 3.1 : elle exploite une base de cas (scénarios simulés du projet en cours ou scénarios archivés) et une base de modèles Produit/Projet précédemment utilisés. La première permet de fournir des cas d’apprentissage tandis que la seconde permet d’obtenir la structure du réseau bayésien (liens entre les nœuds).

Figure 3.1.Démarche proposée

L’algorithme évolutionnaire guidé par les connaissances , présenté dans la partie 3.4, est retenu pour son caractère exploratoire global et pour la large palette de concepts associés permettant de régler la diversité et la qualité des individus obtenus (nichage, archivage, regroupement, etc.). L’injection de connaissances se fait par l’intermédiaire d’une modification des probabilités utilisées par les opérateurs évolutionnaires. Cette injection doit permettre aux opérateurs de manipuler des « blocs complexes » de gènes interdépendants. La méthode doit utiliser l’information disponible le plus efficacement possible, mais également gérer la mesure de performance des solutions trouvées et donc du modèle de connaissances utilisé pour les obtenir. En effet, lorsque le processus de recherche n’améliore plus les solutions obtenues, deux interprétations sont possibles : soit l’optimum est atteint, soit le modèle de connaissances conduit et restreint la recherche vers un optimum local. Le premier cas ne pouvant être vérifié, nous nous placerons systématiquement dans le second cas. Les meilleures solutions « à date » sont conservées et à tout moment disponibles pour l’utilisateur.

Figure 3.2. Cycle d’extraction de l’information selon [Becker et Naim, 1999]

Pour le modèle de connaissance, nous avons retenu une approche bayésienne. Nous avons présenté les réseaux bayésiens comme un modèle possible d’apprentissage (section 2.4.2.1). Mais ils sont également très utilisés comme support d’acquisition pour la connaissance « a priori » d’un expert. En effet, un réseau bayésien peut être perçu comme un système expert dans lequel a été intégrée la notion d’incertitude. Mais, contrairement aux systèmes experts où l’on cherche à modéliser la façon dont l’expert raisonne, un RB est souvent utilisé pour décrire directement le domaine de connaissances [Becker et Naim, 1999]. Contrairement aux autres méthodes, les réseaux bayésiens sont une méthode permettant de répondre à deux problématiques liées à la connaissances illustrées sur la figure 3.2 :

 D'une part, un expert dispose de connaissances entachées d’incertitude. Il les formalise grâce à des descriptions causales pour lesquelles il doit quantifier les incertitudes (pertinence et accessibilité des variables). La modélisation par graphe causal est plus intuitive qu’une formulation de type système expert (règle Si….Alors…).

 D'autre part, dans un processus d’apprentissage, il est possible, à partir d’un ensemble de données contenant des connaissances sous-jacentes, d’alimenter un modèle de causalité donné mettant en évidence les liens entre les variables observées. Ce modèle peut alors être interprété comme une connaissance par l’expert.

La combinaison des deux approches correspond à l’enrichissement d’une base de connaissances « a priori » par la connaissance empirique contenue dans les données de simulation ou réelles : les expériences. Les RB sont donc parfaitement adaptés à notre problématique puisque nous disposons des deux sources d’informations : d’une part, l’expertise et d’autre part les données de simulation et les graphes utilisés. Le principal écueil des algorithmes d’apprentissage automatique est la recherche de structures pour le modèle. Or c’est le point fort du processus d’extraction experte « a priori » pour lequel un expert peut facilement définir la structure des interactions entre variables tandis que le réglage des paramètres va lui paraître fastidieux. Nous souhaitons donc utiliser les avantages de chaque processus. Les modèles seront construits et enrichis de manière incrémentale..

De façon générale, il est difficile d’obtenir rapidement la structure d’un RB uniquement par apprentissage, principalement en raison de l’espace super-exponentiel des structures possibles (toute structure reliant les noeuds du réseau) [François et Le ray, 2004]. Les réseaux obtenus par apprentissage sont néanmoins suffisants pour guider globalement une recherche de solutions dans les algorithmes de type BOA, et c’est là un avantage certain des représentations par réseau probabiliste : même si la structure du réseau n’est pas la meilleure représentation possible, un « rapide » apprentissage fournit le jeu de paramètres le plus pertinent par rapport aux données et à la structure du réseau imposée. Il est possible d’avoir en permanence une « solution opérationnelle », c’est-à-dire un jeu de paramètres le plus adapté à l’instant considéré, mais également une mesure de

la qualité de ce modèle (critères d’évaluation de type BIC ou BDe). Bien évidemment, plus la structure du réseau est proche de la véritable représentation du problème, plus le modèle obtenu est pertinent et ses prédictions sont fiables. De même, la rapidité et la qualité de la recherche de paramètres sont améliorées avec une bonne structure. Le fait de ne pas avoir la structure complète n’est pas gênant et s’avère même nécessaire car il ne s’agit pas de guider finement mais bien d’orienter la recherche dans un vaste espace de recherche, c’est-à-dire de restreindre la recherche aux zones les plus pertinentes. Les algorithmes de type BOA effectuent un échantillonnage aléatoire dans ces zones restreintes. Dans notre étude, nous souhaitons remplacer cet échantillonnage par un algorithme évolutionnaire modifié pour préserver la connaissance injectée tout en optimisant la sélection des individus à l’intérieur des zones restreintes.

Finalement, la principale différence entre les BOA et l’algorithme évolutionnaire guidé concerne le mécanisme de sélection et l’opérateur de croisement. En effet, les algorithmes BOA peuvent être assimilés à un algorithme évolutionnaire guidé avec un taux de croisement nul, un taux de mutation de cent pour cent et une sélection basée uniquement sur la performance des individus. Cette démarche peut sembler paradoxale puisque si le guidage de la recherche est strict et le modèle représentatif des exemples d’apprentissage, une telle méthode conduit à une recherche stationnaire guidant vers les individus existants. Selon C. Pierce [Pierce, 1885], une méthode purement inductive ne permet pas la création de connaissances nouvelles dans le sens où un raisonnement inductif se base sur l’observation d’exemples qui ne sont pas forcément représentatifs des connaissances menant à de meilleures solutions. Les algorithmes BOA ou les « algorithmes guidés par les connaissances » existants obtiennent une forme de généralisation en limitant le modèle dans sa structure, en filtrant les exemples d’apprentissage par rapport à leur pertinence globale et, enfin, en révisant régulièrement le modèle de connaissances. L’hypothèse justifiant cette approche, illustrée sur la figure 3.3.a, est que les connaissances extraites sur les exemples disponibles (population courante représentée par une zone hachurée notée B sur la figure 3.3) sont globalement compatibles avec le reste des individus potentiels (symbolisés par une ellipse notée A sur la figure 3.3.a.) afin de provoquer le mouvement vers de meilleurs individus. Un algorithme évolutionnaire classique relève de la même hypothèse et peut être vu comme un processus inductif. Actuellement, les méthodes bayésiennes les plus efficaces pour établir rapidement un modèle de connaissances fiable limitent en partie la recherche de structure à des représentations probabilistes hiérarchisées de certaines variables. Il s’agit là d’une restriction arbitraire permettant de borner la complexité de l’apprentissage des paramètres. Nous pensons qu’en bénéficiant d’une connaissance experte, il est possible de construire un modèle plus conséquent (nombre de variables, de relations et granularité du modèle) et moins restrictif du point de vue structurel. Le problème d’une approche uniquement inductive dans le cadre d’une réutilisation de connaissances, intervient lorsque les solutions performantes du nouveau cas à résoudre ne relèvent pas de l’expression des connaissances issues d’optimisation passées tel qu’illustré sur la figure 3.3.b. Sur cette figure, la zone optimale (zone C) correspond à des individus qui relèvent de nouvelles connaissances par rapport aux précédentes optimisations. Ces connaissances sont dissociées des connaissances existantes permettant de diriger la recherche dans la zone A et représentées par les individus de la population courante situés dans la zone B.

Une réutilisation à partir d’un mécanisme purement inductif atteindra très difficilement la zone C car il essaye d’utiliser des connaissances acquises dans la zone A pour guider la recherche vers la zone C relevant de connaissances différentes. Selon C. Pierce, seul un processus abductif permet la création de connaissances nouvelles et, par extension, l’obtention d’un modèle permettant de gérer de nouveaux éléments comme de nouveaux paramètres ou une modification des connaissances précédentes dans un contexte différent. Une approche abductive, illustrée sur la figure 3.3.c, utilise l’expérience d’un décideur pour définir les limites de la zone à étudier (zone D) en identifiant au préalable la structure de l’espace de recherche. On remarquera que le décideur identifie les nouveaux éléments sans forcement préjuger de leurs performances.

Quelques études ont étudiée l’injection de connaissances « a priori » sous forme de structures dans un réseau bayésien [Baluja, 1994], [Pelikan et al., 2008], de valeurs de paramètres dans les algorithmes EDA [Mühlenbein et Paass, 1996] ou de règles expertes intégrées dans l’apprentissage [Sebag et Ravise, 1996]. Ces deux derniers systèmes utilisent une modélisation ne permettant pas de représenter des connaissances complexes. Dans le cas des BOA, la structure du réseau fournie par l’expert sert de point de départ au processus de recherche de structure. C’est la principale différence avec notre approche où la structure du modèle est issue d’une simplification d’un modèle global pour le problème spécifique traité incluant au préalable la présence de parties nouvelles dans le modèle. Résultat de la rencontre entre une méthode « abductive experte » descendante, partiellement validée par induction ascendante sur les cas existants, la démarche proposée fournit un modèle capable d’orienter la recherche même lorsque le projet comporte une forte part de connaissances nouvelles. Lors de l’utilisation du modèle par l’AE modifié, nous ferons l’hypothèse que le modèle de connaissances fourni possède une structure robuste quelque soit le degré de nouveauté du problème à traiter en terme de complexité. Les nouvelles connaissances sont supposées accessibles par la recherche puis par apprentissage de paramètres en ligne et seront intégrées lors d’un processus de gestion continue hors ligne par les experts du domaine.

Le principal obstacle à la réutilisation est alors le fait que le réseau est lié au contexte dans lequel il s’exprime mais il n’est pas forcement valable pour d’autres contextes. Dans la section suivante, le processus d’obtention du modèle contextualisé pour le projet courant est spécifié à partir de la démarche ATLAS proposée dans le chapitre 1 et d’un processus d’adaptation du modèle par une mesure de pertinence des connaissances par rapport au contexte.