• Aucun résultat trouvé

3.3 Création du modèle de connaissance contextualisé

3.3.1 Présentation de notre démarche d’acquisition des connaissances

Le but de cette section est de définir le processus d’obtention d’un modèle de connaissances contextualisé, c’est-à-dire d’un réseau bayésien capable de modéliser les connaissances mises en œuvre lors l’optimisation de scénarios de projet. Contrairement aux approches bayésiennes existantes, le modèle doit être capable de prédire le comportement global de façon exhaustive (tous les paramètres sont représentés). Pour l’obtenir, un premier modèle complet du problème est construit en regroupant toutes les décisions à prendre et les objectifs globaux de l’étude (section § 3.3.1.1). Ce modèle est très complexe, ce qui le rend inutilisable tel quel. La solution proposée est alors d’utiliser les connaissances des experts pour simplifier le modèle. Cette approche conduit à définir un format générique de représentation du problème (décisions et objectifs) et des connaissances associées présenté dans la section § 3.3.2. Il permet de recueillir l’analyse des experts associée à un projet dans un contexte donné. La méthode de construction du modèle, en parallèle de l’analyse de décomposition ATLAS, pour un projet donné, est présentée dans la section 3.3.3.1. Elle représente un contexte de génération de connaissances pour un projet spécifique. Lorsqu’un nouveau projet est étudié, les experts utilisent une partie des connaissances exploitées lors des projets précédents (décisions, composants, démarches, etc.) en les adaptant au nouveau contexte. Pour cela, un mécanisme de mesure de pertinence des connaissances par rapport au contexte est proposé dans la section 3.3.3.2. L’ensemble des opérations réalisées sur les modèles est synthétisé dans la section 3.3.

3.3.1.1 Le modèle complet

Le modèle initial utilisé dans notre méthode permet de saisir toute la connaissance disponible sur le problème à résoudre. Une connaissance est ici définie comme un lien entre l’espace de recherche (décisions) et l’espace des objectifs. Contrairement aux méthodes inductives partant d’un modèle de départ vide, nous débutons le processus de construction par un modèle « complet » qui sera simplifié par la suite. Le modèle proposé doit donc permettre de lier les décisions d’un projet représentées par les gènes du chromosome des individus aux objectifs identifiés du projet. Un modèle complet représentant toutes les connaissances existantes concernées correspond donc à un réseau bayésien reliant les nœuds représentant les décisions et les nœuds représentant les objectifs, tel qu’illustré sur la figure 3.4.

Figure 3.4.Modèle « théorique » complet

Le niveau bas de cette structure correspond donc à l’ensemble des décisions présentes dans le graphe de projet reportées dans le modèle. Les décisions issues de l’analyse dans l’environnement Produit correspondent aux nœuds OU du graphe de Projet (représentées par les cercles doubles dans le graphe et par un rectangle double dans le modèle). Tandis que les décisions issues de l’environnement Projet correspondent au choix d’options de réalisation pour chaque tâche (représentés par des rectangles simples dans le graphe et dans le modèle). Les décisions sont donc des nœuds discrets dont le nombre d’états est défini directement par les experts, lors de la construction du graphe de Projet (les états d’un nœud dans le modèle sont représentés par les rectangles gris à l’intérieur des nœuds décisions). Il correspond au nombre de propositions suggérées par les experts pour résoudre chaque problème posé localement, c’est-à-dire les blocs de construction (BC) Produit ou Projet permettant de répondre aux exigences définies pour ces blocs dans les décompositions Produit ou Projet.

Les décisions du graphe sont reliées directement aux objectifs du projet représentés par des losanges. Idéalement, ces objectifs sont des nœuds continus correspondant au résultat de l’évaluation des scénarios de projet par la simulation pour chaque objectif. Par exemple, pour l’objectif « Coût », les coûts unitaires de chaque tâche à réaliser dans un scénario sont additionnés et constituent le coût global du scénario.

Le modèle « théorique » complet de toutes les connaissances relatives à l’influence des décisions sur les objectifs correspond donc à la figure 3.4. Chaque lien entre une décision et un objectif représente l’influence de cette décision sur l’objectif. Le graphe de Projet fournit également les liens entre les décisions selon la forme du graphe. Ces liens traduisent des dépendances entre les décisions. Ce modèle ne peut être utilisé tel quel pour guider la recherche pour plusieurs raisons, notamment la présence de nœuds continus (objectifs).

3.3.1.2 Limites du modèle complet

La première opération qui doit être réalisée pour envisager une utilisation du modèle précédent est de discrétiser les nœuds objectifs. Les valeurs possibles pour chaque objectif sont donc regroupées par intervalles. Chaque intervalle correspond à un état pour le nœud objectif. Se pose alors le choix des bornes inférieures et supérieures pour chaque objectif et le choix du nombre d’intervalles, c’est-à-dire le nombre d’états du nœud. Afin de pouvoir comparer des performances dans des contextes différents, la qualité d’un scénario ou d’une décision doit être jugée relativement par rapport aux autres instances connues du même projet, puis être exprimée dans l’absolu pour la réutilisation. Les individus obtenus sur un projet peuvent être regroupés selon une échelle définie « a priori » par un expert ou selon un ensemble de niveau repartis entre le pire et le meilleur individu connu par objectif. Le nombre de niveaux n permet de régler la granularité du modèle et donc une partie de sa complexité. Dans notre plate-forme, les niveaux correspondent à n intervalles

identiques entre Indmin et Indmax pour chaque objectif. Nous étudierons plus en détail les

conséquences du choix de différents niveaux de granularité pour les objectifs dans le chapitre 4. Une fois le nombre de niveaux déterminé, il est possible de représenter la table de probabilités (TCP) associée à chaque nœud objectif. Lorsque tous les gènes y sont reliés, la TCP d’un nœud objectif est composée d’un nombre de lignes (potentiellement très grand) correspondant à toutes les combinaisons d’états des parents du nœud. L’utilisation d’un tel modèle sera très coûteuse en temps d’inférence ou d’apprentissage. De façon générale, le temps de calcul dépend de la complexité du réseau en termes de taille des TCP associées à chaque nœud. La complexité d’un réseau est alors définie comme la somme de la taille de toutes les tables du réseau. La méthode proposée est alors d'exploiter la connaissance d’un expert pour réduire cette complexité en réduisant le nombre de liens directs entre les nœuds décisions et les nœuds objectifs par insértion d’une structure de connaissances expertes entre les objectifs et les décisions. Nous proposons de remplacer et regrouper les liens entre les décisions et les objectifs en insérant de nouveaux nœuds représentant ces connaissances. Les objectifs sont alors liés aux nouveaux nœuds, moins nombreux.

L’étude réalisée par R. Sharma [Sharma, 2006] sur les réseaux bayésiens fournit un bon exemple d’utilisation d’une connaissance « experte structurante » illustrant le choix « a priori » des niveaux pour les objectifs. L’objet de l’étude est d’intégrer une connaissance pour représenter des nœuds discrets avec de très grands domaines de valeurs possibles puis d’utiliser cette connaissance pour accélérer le calcul d’inférence. Une illustration de cette approche concerne le cas d’une taxinomie des êtres vivants illustrée sur la partie gauche de la figure 3.5. Il existe en effet des millions d’espèces vivantes. Seul l’utilisation d’une connaissance experte permet de représenter une telle variété dans un réseau bayésien en regroupant les exemples en classes hiérarchisées : plantes / animaux, mammifères / poissons / reptiles / oiseaux, etc. La connaissance utilisée permet donc, d’une part, de délimiter le domaine d’une variable, c’est-à-dire de définir un périmètre possible pour les phénomènes (individus) ou les propriétés et, d’autre part, de définir des liens hiérarchisés

entres les individus et/ou les concepts exprimant par exemple des disjonctions exclusives (animal

ou plante) et des probabilités associées à chaque arc (il y a par exemple 55% de chance qu’un être vivant soit un animal). Dans cette étude, le modèle retenu est un arbre de décisions permettant de représenter la hiérarchie et les disjonctions principales. La connaissance de l’expert permet également de sélectionner les groupes ou concepts qui sont représentés dans le modèle. Les concepts ne sont pas représentés lorsqu’ils ne sont pas pertinents par rapport à l’étude ou lorsque l’expert juge que le concept n’est pas représentatif de suffisamment de cas pour servir la recherche efficacement. Nous utiliserons cet aspect de la connaissance experte dans la section 3.3.3.

L’arbre, bien que très avantageux pour le calcul d’inférence, est une représentation tronquée pour certaines connaissances qui ne peuvent s’exprimer par un ordre hiérarchique strict.Nous souhaitons conserver une représentation bayésienne des connaissances, moins restrictive. Notre modèle est donc un réseau bayésien possédant une structure hiérarchisée de nœuds. Le niveau bas regroupe les décisions, le niveau haut représente les objectifs et les nœuds intermédiaires représentent des connaissances liant des groupes de décisions aux objectifs. Ces connaissances correspondent à une description commune aux décisions.

Figure 3.5. Principe de l’approche VLD (Very Large Domain) [Sharma, 2006]

Pour l’exemple de la figure 3.5, certaines espèces sont regroupées par un nœud correspondant à une ou plusieurs caractéristiques communes entre ces espèces : les poissons ont des branchies, etc. En imaginant que toutes les connaissances soient disponibles, ce modèle serait équivalent au modèle complet en termes de performance prédictive, par contre il est beaucoup plus intéressant en termes de temps d’inférence et d’apprentissage. Sa construction est effectuée en intégrant les connaissances capitalisées lors des scénarios analysés. Bien sûr, l’analyse de l’ensemble des scénarios d’un projet n’est pas disponible et sa description complète par des experts sera très fastidieuse et en partie inutile. Le but de notre démarche est d’obtenir une information globale pour guider la recherche en un temps limité. D’une part, la connaissance complète n’est pas nécessaire (et non disponible pour une réutilisation partielle) et, d’autre part, la complexité du modèle résultant doit être bornée pour une utilisation conviviale par l’utilisateur lors de l’analyse des résultats après l’optimisation. Or cette réduction recherchée correspond exactement à la démarche de description abductive d’un expert : il évalue les différents choix possibles selon les attributs les plus pertinents par rapport au contexte courant de façon inconsciente. Nous nous appuierons sur ce constat pour proposer une démarche de réutilisation de cette connaissance permettant d'obtenir le modèle réduit utilisé en optimisation. La démarche complète est présentée dans la section 3.3.4.