Contributions à la composition dynamique de services fondée sur des techniques de planification et diagnostic multi-agents

(1)

HAL Id: tel-01075367

https://hal.archives-ouvertes.fr/tel-01075367

Submitted on 17 Oct 2014

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

fondée sur des techniques de planification et diagnostic multi-agents

Mohamad El Falou

To cite this version:

Mohamad El Falou. Contributions à la composition dynamique de services fondée sur des techniques

de planification et diagnostic multi-agents. Traitement du texte et du document. Université de Caen,

2010. Français. �tel-01075367�

(2)

U.F.R. : Sciences

ECOLE DOCTORALE ´ : SIMEM

TH` ESE

pr´esent´ee par

Mohamad El Falou

et soutenue le 2 juin 2010

en vue de l’obtention du

DOCTORAT de l’UNIVERSIT´ E de CAEN

sp´ ecialit´ e : Informatique (Arrˆ et´ e du 7 aoˆ ut 2006)

Contributions ` a la composition

dynamique de services fond´ ee sur des techniques de planification et

diagnostic multi-agents

MEMBRES du JURY

Mr Rachid Alami Directeur de Recherche CNRS LAAS Toulouse (rapporteur) Mr Olivier BOISSIER Professeur ENS Mines Saint-Etienne (rapporteur) Mr Ren´ e MANDIAU Professeur Universit´e de Valenciennes (rapporteur)

Mr Abdel-Illah Mouaddib Professeur Universit´e de Caen (examinateur)

Mme Maroua Bouzid Professeur Universit´e de Caen (directrice)

Mr Thierry Vidal Maˆıtre de conf´erence ENIT Tarbes (codirecteur)

(3)

(4)

Remerciements

Je tiens ` a remercier toutes les personnes qui m’ont permis de mener `a bien cette th`ese.

Mes remerciements s’adressent tout d’abord ` a ma directrice de thèse Mme Maroua Bouzid, professeur ` a l’université de Caen, qui a encadré ce travail de recherche. Je lui suis reconnaissant pour m’avoir accordé sa confiance. Elle s’est toujours montrée à l’écoute et très disponible tout au long de la réalisation de ce travail, ainsi pour l’inspiration, l’aide et le temps qu’elle a bien voulu me consacrer et sans qui ce mémoire n’aurait jamais vu le jour. J’ai apprécié ses qualités humaines, son dynamisme et ses précieux conseils.

Je tiens ` a remercier mon co-encadrant de thèse M Thierry Vidal, maˆıtre de conférence ` a l’école nationale d’ingénieurs de Tarbes, qui a co-encadré ce travail. Je lui suis reconnaissant pour m’avoir accordé sa confiance et m’avoir laissé une liberté dans mes recherches. Je le remercie pour le temps qu’il m’a consacré ` a Rennes, ` a Tarbes ou quand il déplace lui-même ` a Caen pour discuter et orienter mes recherches.

J’adresse mes sincères remerciements ` a M Rachid Alami, directeur de recherche CNRS au LAAS de Tolouse, ` a M Olivier Boissier, professeur ` a l’école nationale supérieure des Mines de Saint ´ Etienne et ` a Mr René Mandiau, professeur ` a l’université de Valenciennes pour l’intérêt qu’ils ont porté ` a mon travail en acceptant d’être rapporteurs de cette thèse.

Je tiens ` a remercier M Abdel-Illah Mouaddib, professeur ` a l’université de Caen, pour m’avoir fait l’honneur de participer ` a mon jury. J’ai particulièrement apprécié les discussions scientifiques enrichissantes avec lui.

Je remercie également tous les membres de l’équipe MAD pour leur gentillesse et leur bonne humeur. Je remercie particulièrement Laetitia, Benoit et Simon pour le temps qu’ils ont accordé pour lire ma thèse. Mes remerciements s’adressent aux chercheurs et aux membres du personnel du laboratoire GREYC pour leur accueil et leur aide.

Ce long travail fastidieux ponctué par des hauts et des bas a été illuminé par la présence de mes amis. Les soirées, et les repas que je partageais avec Rimond, Zayan, Bilal, Mohamad, Ayman, Abdalla, Nizar m’ont permis d’échapper au stress induit par la thèse et le voyage.

L’engagement au sein de l’association « Etudiants Musulmans de France ´ » qui a donné une valeur ` a mon séjour en France, ainsi que les activités qui m’ont permit d’élargir énormément le réseau de fraternité en France.

Je tiens ` a remercier aussi mes amis au Liban qui m’ont encouragé de continuer mes études en France, qui ont commencé ` a m’appeler docteur EL Falou depuis que j’étais en L1.

Un grand merci à ma mère, mon père, mes sœurs et mes frères qui ont su m’entourer pendant mon cursus doctoral. Leur encouragement, leur soutien et leur amour ne m’ont jamais fait défaut.

Qu’ils trouvent ici l’expression de ma plus profonde gratitude.

Une tendre pensée à mes nièces et neveux qui ont embelli mon existence par leur innocence.

(5)

(6)

Table des mati` eres

Table des figures ix

Liste des tableaux xi

Introduction 3

I Etat de l’art en intelligence artificielle ´ 7

1 Planification classique 9

1.1 Repr´esentation classique du domaine de la planification . . . . 10

1.2 Algorithmes de planification . . . . 14

1.2.1 Planification dans l’espace d’´etats . . . . 15

1.2.2 Planification dans l’espace de plans . . . . 18

1.3 Techniques de planification graphique . . . . 21

1.3.1 Construction du graphe . . . . 21

1.3.2 Conditions de l’accessibilit´e . . . . 22

1.3.3 Planificateur Graphplan . . . . 23

1.4 Techniques de planification hi´erarchique . . . . 24

1.4.1 De STRIPS ` a HTN . . . . 24

1.4.2 Algorithme de r´esolution de HTN . . . . 25

1.5 Extensions des caract´eristiques du domaine de planifcation . . . . 26

1.6 Conclusion . . . . 27

2 Planification distribu´ ee et syst` emes multi-agents 29 2.1 D´efinition de l’agent . . . . 30

2.1.1 Propri´et´es d’agents . . . . 30

2.1.2 Type d’environnement . . . . 31

2.2 Des agents vers les syst`emes multi-agents . . . . 31

2.3 Planification distribu´ee . . . . 34

(7)

2.4 Planification multi-agents par cycles de conjecture/r´efutation . . . . 35

2.4.1 Exemple introductif . . . . 36

2.4.2 Mod`ele formel . . . . 37

2.4.3 Dynamique de l’interaction . . . . 39

2.5 Conclusion . . . . 40

3 Diagnostic et r´ eparation 41 3.1 Diagnostic des plans . . . . 43

3.1.1 Diagnostic de la violation de la structure du plan et de l’´echec des actions . . . . 44

3.1.2 Diagnostic du plan . . . . 44

3.2 Diagnostic et r´eparation des plans multi-agents . . . . 45

3.2.1 Structure du plan multi-agents . . . . 46

3.2.2 R´eparation automatique des plans multi-agents par une strat´egie locale 47 3.3 Diagnostic actif . . . . 48

3.4 Conclusion . . . . 49

II Etat de l’art dans le domaine applicatif des Web services ´ 51 4 Introduction aux Web services 55 4.1 Web services, Web s´emantique et ontologies . . . . 56

4.2 Utilit´e des Web services . . . . 57

4.3 Architecture des Web services . . . . 58

4.4 Probl`eme de composition des Web services . . . . 60

4.5 D´efis de composition de Web services . . . . 61

4.6 Conclusion . . . . 61

5 Composition de Web services fond´ ees sur la planification centralis´ ee 63 5.1 Composition des Web services utilisant le planificateur SHOP2 . . . . 64

5.2 Utilisation du planificateur MBP (Model Based Planner ) . . . . 65

5.3 Utilisation des techniques de grilles . . . . 67

5.4 Travaux de composition dans le projet CASCOM . . . . 71

5.4.1 Agent de composition . . . . 71

5.4.2 Planificateur OWLS-XPlan . . . . 72

5.4.3 Filtres pour la composition de Web services . . . . 73

5.5 Approche de composition bas´ee sur les liens s´emantiques . . . . 77

5.5.1 Web s´emantique et description logique . . . . 78

(8)

5.6 Conclusion . . . . 81

6 Composition de Web services fond´ ees sur la planification d´ ecentralis´ ee 83 6.1 Chor´egraphie dynamique de services bas´ee sur la coordination d’agents in- trospectifs . . . . 84

6.1.1 Complexit´e de communication et compl´etude . . . . 85

6.1.2 Exp´erimentation . . . . 85

6.2 Un mod`ele de composition automatique et distribu´ee de services web par planification . . . . 87

6.3 Conclusion . . . . 88

III Contribution 89 7 Approche centralis´ ee de composition automatique et dynamique de Web services 93 7.1 Exemple introductif . . . . 94

7.2 Limites de la repr´esentation classique du probl`eme de composition . . . . 95

7.3 Cadre formel . . . . 96

7.4 Algorithmes de planification centralis´es . . . 101

7.4.1 Algorithme de composition de Web services Tree-search . . . 101

7.4.2 Algorithme de composition de WS fondé sur la méthode Graphplan . 106 7.5 Implémentation . . . 109

7.5.1 Exemple de sp´ecification de service et de requˆete en PDDL . . . 109

7.5.2 Exp´erimentation de Tree-search et analyse des r´esultats . . . 110

7.5.3 Impl´ementation de Graph Plan . . . 112

7.6 Conclusion et perspectives . . . 112

8 Approche de composition d´ ecentralis´ ee multi-agents avec une heuristique locale 115 8.1 Id´ee basique . . . 116

8.2 Mod`ele formel . . . 117

8.3 Op´eration de fusion des plans . . . 119

8.3.1 Plans compl`etement fusionnables . . . 119

8.3.2 Plans partiellement fusionnables . . . 120

8.3.3 Plans non-fusionnables . . . 121

8.4 Extraction du plan . . . 122

(9)

8.4.1 Extraction du sous-graphe ex´ecutable . . . 122

8.4.2 Extraction du meilleur plan local . . . 125

8.5 Coordination multi-agents . . . 129

8.5.1 Strat´egie de coordination fond´e sur le parcours en chaˆınage avant . . 129

8.5.2 Stratégie de coordination fondée sur le parcours en chaˆınage arrière . 130 8.5.3 Stratégie de coordination mixte . . . 132

8.5.4 Exemple d’application de la strat´egie mixte . . . 132

8.6 Etude des complexit´es des algorithmes ´ . . . 134

8.6.1 Etude de la complexit´e des algorithmes centralis´es ´ . . . 134

8.6.2 Etude de la complexité de l’algorithme décentralisé ´ . . . 135

8.7 Etude de la compl´etude des algorithmes ´ . . . 135

8.8 Tests exp´erimentaux . . . 136

8.9 Discussion . . . 138

8.9.1 Comparaison avec l’´etat de l’art . . . 138

8.9.2 L’utilité de l’approche décentralisée . . . 139

8.9.3 Passage ` a l’échelle de l’approche décentralisée . . . 140

8.10 Conclusion . . . 141

9 Approche de composition d´ ecentralis´ ee multi-agents avec l’heuristique globale 143 9.1 Exemple . . . 144

9.2 Id´ee basique . . . 146

9.3 Algorithme de calcul de l’heuristique globale . . . 147

9.4 Extraction du meilleur plan local . . . 148

9.5 Coordination multi-agents . . . 148

9.5.1 Exemple . . . 149

9.5.2 Utilisation de l’heuristique locale . . . 152

9.5.3 Exemple . . . 153

9.5.4 Complexit´e de l’algorithme complet . . . 155

9.6 Compl´etude de l’algorithme . . . 157

9.7 Impl´ementation . . . 159

9.8 Conclusion . . . 160

10 Diagnostic et r´ eparation de l’ex´ ecution d’un plan de composition 161 10.1 R´eseaux de P´etri . . . 162

10.2 Mod`ele formel . . . 163

10.3 Architecture d’agent autogu´erissant . . . 166

(10)

10.5 Le diagnostiqueur . . . 169

10.5.1 Rˆ ole du diagnostiqueur . . . 169

10.5.2 Notions pr´eliminaires . . . 170

10.5.3 Construction du diagnostiqueur . . . 170

10.6 R´eparateur . . . 172

10.6.1 Rˆ ole du r´eparateur . . . 173

10.6.2 M´ecanisme de r´eparation . . . 173

10.7 Généralisation et maximisation du nombre d’états de croyance couverts . . . 176

10.8 Conclusion et perspectives . . . 178

Conclusion et Perspectives 179

Bibliographie 185

(11)

(12)

Table des figures

1.1 Exemple de repr´esentation d’un ´etat . . . . 11

1.2 Exemple de recherche par chaˆınage avant . . . . 16

1.3 D´eveloppement d’un nœud de l’arbre . . . . 17

1.4 Exemple d’ex´ecution de l’algorithme POP . . . . 20

1.5 Exemple d’ex´ecution de GraphPlan . . . . 22

1.6 R´eseaux de tˆ aches pour un voyage de x ` a y . . . . 25

2.1 Exemple de r´eparation d’une r´efutation . . . . 38

2.2 Mod`ele de construction dialectique de plans . . . . 39

4.1 Architecture Orient´ee Services . . . . 59

5.1 Architecture g´en´erale de composition. . . . . 67

5.2 Repr´esentation non compl`ete du plan . . . . 69

5.3 Modification d’un plan courant . . . . 70

5.4 Exemple d’ex´ecution du planificateur OWLS-XPlan . . . . 72

5.5 Matrice de pertinence . . . . 76

5.6 Correspondance pour la composition de Web services . . . . 79

7.1 Ex´ecution de l’algorithme Tree-search avec heuristique . . . 102

7.2 Plan s´equentiel d’ensemble de services . . . 102

7.3 Ex´ecution de Graphplan . . . 107

8.1 Graphe de WS

1

. . . 118

8.2 Graphe de Web services . . . 124

8.3 Sous-graphe ex´ecutable de Web services . . . 125

8.4 Le graphe d’instanciation du sous-graphe de services ex´ecutable . . . 126

8.5 Graphe de Web services W S . . . 128

8.6 Le graphe d’instanciation du sous-graphe de services ex´ecutable . . . 128

8.7 Strat´egie de parcours en chaˆınage avant . . . 130

(13)

8.8 Strat´egie en chaˆınage arri`ere . . . 131

8.9 Strat´egie mixte . . . 132

8.10 Graphe d’agents de Web services . . . 133

8.11 Plan solution . . . 134

9.1 Agent de Web services . . . 144

9.2 Exemple de calcul de l’heuristique globale . . . 150

9.3 Instantiation du graphe de l’agent A

1

. . . 151

9.4 Agent de Web services . . . 153

10.1 Exemple de r´eseau de Petri . . . 163

10.2 Action non d´eterministe . . . 165

10.3 Architecture d’agent . . . 166

10.4 Plan de fusion des fichiers . . . 167

10.5 Plan d’ex´ecution du plan de fusion des fichiers . . . 168

10.6 Diagramme du diagnostiqueur . . . 172

10.7 q1 et q2 sont ind´ependants . . . 174

10.8 q1 et q2 sont d´ependants . . . 174

10.9 q1 et q2 sont d´ependants . . . 176

(14)

Liste des tableaux

5.1 Exemple d’information sur l’historiques des plans . . . . 74

5.2 Les Web services s´emantique de S

_{W s}

et leurs capabilit´es . . . . 80

5.3 Label des lignes r

_i

et colonnes c

_j

de la matrice M5 × 6 . . . . 80

6.1 Résultats expérimentaux sur le scénario 2. . . . . 87

7.1 R´esultat de l’ex´ecution de Tree-search . . . 111

8.1 R´esultats empiriques . . . 138

9.1 R´esultats exp´erimentaux. . . . 160

(15)

(16)

Cette th`ese porte sur le probl`eme de la composition de services. Nous nous focalisons sur les travaux qui utilisent les techniques de planification et nous proposons deux approches qui permettent de surmonter quelques limites des approches existantes.

La première approche propose deux algorithmes centralisés fondés respectivement sur Tree- search et Graphplan. Ces algorithmes n’assurent pas le passage à l’échelle à cause de leurs complexités.

Dans la seconde approche, cette limite est dépassée en proposant une architecture de plani- fication multi-agents o` u chaque Web service est défini par un groupe de services et est considéré comme un agent. Les agents se coordonnent en fusionnant leurs meilleurs plans partiels qui per- mettent de répondre partiellement ` a une requête. Cette procédure est répétée jusqu’` a atteindre le but en utilisant une fonction heuristique locale. Cette approche est ensuite étendue par une heuristique globale pour assurer sa complétude si les sous-problèmes assignés aux agents sont dépendants. L’heuristique globale d’évaluation du meilleur plan local partiel permet d’éviter les puits en considérant les plans locaux intermédiaires proposés par d’autres agents. L’étude de la complexité des approches décentralisées montre qu’elles sont polynomiales, et les résultats expérimentaux montrent qu’elles sont capables d’assurer le passage ` a l’échelle pour des problèmes complexes.

Enfin, une architecture d’agent de composition auto-guérissant est développée. Cette archi- tecture vise une réelle intégration entre les processus de composition, de diagnostic actif, et de réparation en un seul processus de planification.

Abstract

Title : Contributions to dynamic composition and diagnosis of services based on multi-agents planning techniques.

This thesis addresses the problem of service composition. We focus on the use of planning techniques and we introduce two different approaches that overcome some limitations of the existing approaches.

The first approach has two centralized algorithms based respectively on Tree-seach and Gra-

phplan. These algorithms do not scale up well due to their complexity. In the second approach,

we overcome this limitation by proposing a multi-agents planning architecture where each web

service is defined by a set of services and is considered as an agent. The agents are coordinated by

merging their best partial plans that answer partially to a request. This coordination procedure

is repeated iteratively until reaching the goal using a local heuristic function. This approach is

then extended by a global heuristic to ensure its completeness if the sub-problems assigned to

(17)

the agents are dependent. This global heuristic of evaluating the best local plan avoids the wells by considering the intermediate local plans offered by other agents. The study of the complexity of decentralized approaches shows that they are polynomial, and experimental results show that they are able to scale up well for complex problems.

Finally, a self-healing service composition agent-based architecture is developed. This archi-

tecture is a real integration between the processes of composition, active dignosis, and repair

into one planning process.

(18)

Introduction

Contexte g´ en´ erale

Depuis l’émergence des premiers systèmes experts, l’automatisation de la planification et du diagnostic a inspiré de nombreux travaux en intelligence artificielle. Avec la complexité croissante des systèmes : installations industrielles compliquées nécessitant un mélange de compétences (automatique, électronique, etc), avec l’apparition de grands réseaux, avec l’augmentation des risques (centrales nucléaires), il est de plus en plus crucial d’assister l’homme dans des opérations de planification ou de surveillance. Cette aide ` a la planification et au diagnostic implique d’au- tomatiser un ensemble de tâches afin d’accomplir une tâche complexe, de détecter un fonction- nement anormal du système, puis ` a partir des observations anormales, déterminer les causes du dysfonctionnement du système afin de proposer éventuellement des actions ` a effectuer. Le commerce électronique, qui concerne principalement la vente de biens et de services au client, se situe dans ce contexte géneral. Ces échanges se sont rapidement étendus aux échanges entre entreprises (B2B, Business to Business).

Créés pour faciliter les échanges commerciaux, les Web services prennent leurs racines dans l’informatique distribuée en prenant le réseau internet comme plate-forme d’exécution de compo- sants logiciels interopérables conduisant ` a des interactions complexes ` a grande échelle. L’intérêt des Web services consiste ` a permettre ` a une entreprise d’exporter au travers du réseau internet ses compétences et son savoir-faire, d’interagir avec ses partenaires, de rechercher de nouveaux supports de vente.

Un paradigme ´emergent de l’informatique orient´ee service respose sur la combinaison de

Web services existants dans le but de fournir des services ` a valeur ajout´ee. Un d´efi important

conditionnant une utilisation r´eelle des Web services consiste ` a surveiller leur ex´ecution et ` a

les rendre capables de réagir ` a des dysfonctionnements grˆ ace ` a des stratégies de récupération

sur erreur. Cependant, dans des environnements dynamiques tels qu’internet, les Web services

peuvent être sujets à des dysfonctionnements imprévus. Dans ce cas, il n’est pas possible de

définir des mécanismes de détection ou des stratégies de récupération lors de la phase de concep-

tion qui prennent parfaitement en compte toutes les d´efaillances ` a l’avance de mani`ere robuste.

(19)

D’o` u, la capacité de détecter les fautes pendant l’exécution du service serait très souhaitable dans le but de trouver automatiquement des actions de réparation efficaces, notamment en cas de services complexes.

Objectif

L’un des verrous les plus importants limitant le développement des architectures orientées services réside dans l’élaboration manuelle par un expert de services composites. Pour cela, l’intégration de services dans l’approvisionnement de nouveaux services personnalisés, plus riches et plus intéressants aussi bien pour des applications, d’autres services, ou plus communément pour des utilisateurs humains. Si une application ou un client requièrent des fonctionnalités, et qu’aucun service n’est seul apte ` a les fournir, il doit être possible de composer automatiquement des services existants afin de répondre aux besoins de cette application ou de ce client.

La dissémination de la technologie du Web ` a grande échelle et le nombre énorme de Web services disponibles posent dorénavant la problématique de leur composition automatique. En effet, malgré l’évolution des innovations, la majorité des architectures proposées reposent sur une centralisation de la composition. Par conséquent, le besoin d’améliorer les méthodes existantes est de plus en plus fort afin d’assurer le passage ` a l’échelle et de diminuer le temps de réponse fonction du nombre des services composés. Même l’architecure décentralisée la plus récente [Pellier et Fiorino, 2009] est limitée pour le moment ` a une classe de problèmes nécessitant une dizaine de services.

Le cœur de notre travail consiste ` a fournir une architecture multi-agents de composition de services fondée sur les techniques de planification distribuée. Dans cette architecture, chaque agent raisonne sur ses services afin de déterminer le meilleur plan local pouvant satisfaire en partie l’utilisateur. Ensuite, les agents se coordonnent et fusionnent leurs plans locaux afin d’atteindre un but commun prédéfini par l’utilisateur, créant ainsi un plan global représentant une composition possible de leurs services.

Une autre contribution de ce travail consiste ` a intégrer au processus de planification, un pro- cessus de diagnostic actif et de réparation. Le but est de détecter les fautes pendant l’exécution du service composite, de calculer l’ensemble des états fautifs possibles et de réutiliser le processus de planification pour raffiner les états et réparer les fautes.

Plan synth´ etique de la th` ese

Le présent document se décompose en trois parties. La première partie réalise un état de l’art

des techniques utilisées par la suite dans nos travaux, pour résoudre les problèmes de planifica-

tion, de diagnostic et de réparation orientés plans. La seconde partie introduit le problème de

(20)

de planification utilisées pour résoudre ce problème. Enfin, la troisième partie porte sur notre contribution dans la modélisation et la résolution de ces problèmes.

Partie I : ´ Etat de l’art en intelligence artificielle

En nous appuyant sur une étude bibliographique, nous présenterons en première partie de ce document, les différents concepts et outils utilisés dans nos travaux. Un premier chapitre introduira le problème de la planification classique et les différentes techniques de modélisation et de résolution de ce problème. Dans le second chapitre, nous introduisons le concept d’agent pour, ensuite, présenter les techniques de planification distribuées multi-agents. Dans un troisième chapitre, nous discutons les travaux du diagnostic d’exécution des plans et les techniques de réparation utilisées.

Partie II : ´ Etat de l’art dans le domaine applicatif des Web services

La seconde partie de ce document s’articulera autour de trois chapitres. Nous présenterons dans le premier chapitre les Web services, leurs utilités ainsi que le problème de leur composition.

Le second chapitre portera sur la modélisation et la résolution de ce problème ` a l’aide des techniques de planification centralisées. Le troisième chapitre expose les approches fondées sur les techniques de planification décentralisées pour la résolution du problème de composition.

Partie III : Contributions

La troisième partie de ce mémoire portera sur la résolution des problèmes précédemment modélisés.

Dans le premier chapitre, nous modélisons le problème de composition de Web service comme un problème de planification en surmontant quelques limites des approches existantes.

Nous montrons que la technique de tree-search s’adapte mieux que celle de graphplan ` a notre problématique. Cependant, les deux techniques n’assurent pas le passage ` a l’échelle ` a cause de leur complexités exponentielles.

Nous présenterons ensuite, dans un second chapitre, une formalisation de la phase de com- position comme une phase de planification multi-agents o` u chaque Web service, défini par un groupe de services, est considéré comme un agent. Chaque agent doit proposer son meilleur plan partiel pour répondre partiellement ` a une requête. Ensuite les agents se coordonnent en fu- sionnant leurs plans partiels. Cette procédure de coordination est répétée itérativement jusqu’à atteindre le but en utilisant une fonction heuristique locale.

Cette approche est ensuite étendue dans le troisième chapitre de cette partie en considérant

une heuristique globale de l’approche. Cette extension permet d’assurer la compl´etude dans le

(21)

cas o` u les sous-problèmes assignés aux agents sont dépendants. L’heuristique globale permet de déterminer le meilleur plan local partiel et d’éviter ainsi les puits en considérant les plans locaux intermédiaires proposés par d’autres agents.

L’étude de la complexité des approches décentralisées montre qu’elles sont polynomiales.

Les résultats des expérimentations montrent que celles-ci sont capables d’assurer le passage à l’échelle pour des problèmes complexes.

Enfin, le quatrième chapitre de cette partie est consacré à la modélisation d’une architecture d’agent de composition de services auto guérissant. Cette architecture permet de : répondre aux requêtes par un plan de composition en utilisant les approches développées dans les chapitres précédents, de diagnostiquer les fautes lors de l’exécution d’un plan et de réparer le plan par re-planification, lors de la détection d’une faute d’exécution.

Nous concluons enfin en tirant le bilan des travaux exposés et présenterons différentes pers-

pectives ouvertes par ce travail.

(22)

Etat de l’art en intelligence ´

artificielle

(23)

(24)

Planification classique

Sommaire

1.1 Repr´ esentation classique du domaine de la planification . . . . . 10 1.2 Algorithmes de planification . . . . 14 1.2.1 Planification dans l’espace d’états . . . . 15 1.2.2 Planification dans l’espace de plans . . . . 18 1.3 Techniques de planification graphique . . . . 21 1.3.1 Construction du graphe . . . . 21 1.3.2 Conditions de l’accessibilité . . . . 22 1.3.3 Planificateur Graphplan . . . . 23 1.4 Techniques de planification hi´ erarchique . . . . 24 1.4.1 De STRIPS à HTN . . . . 24 1.4.2 Algorithme de résolution de HTN . . . . 25 1.5 Extensions des caract´ eristiques du domaine de planifcation . . 26 1.6 Conclusion . . . . 27

Introduction

La planification est un domaine central de l’intelligence artificielle qui est défini par le pro- cessus de délibération explicite qui choisit et organise des actions en anticipant leurs résultats attendus. Cette délibération vise ` a générer -le mieux possible- un plan d’un état initial pour atteindre un état but défini a priori. Une donnée nécessaire ` a tout algorithme de planification est la description du problème à résoudre. Le but de cette description n’est pas d’énumérer ex- plicitement les états et les transitions entre les états, mais elle doit faciliter leur calcul à la volée.

De plus, cette description doit être indépendante du domaine afin de fournir un cadre général à

la r´esolution des probl`emes.

(25)

Un problème de planification doit définir une représentation d’une logique pour la description d’un état du domaine, d’une action, d’un problème de planification, un plan solution du problème de planification, etc. Ensuite, plusieurs algorithmes de planification peuvent être appliqués à la même représentation pour chercher les plans solutions.

Dans les sections suivantes, nous d´etaillons la description du probl`eme de la planification classique.

1.1 Repr´ esentation classique du domaine de la planification

Dans la littérature, il y a trois fa¸cons différentes de représenter un problème classique de planification. Elles sont équivalentes en pouvoir d’expression dans le sens o` u chaque domaine de planification représenté dans l’une d’entre elles peut être représenté dans les deux autres, avec au plus une augmentation linéaire de la taille [Nebel, 1998].

1. la représentation dans la théorie des ensembles (Set-theoretic represenation ) [Green, 1969] : chaque état du monde est un ensemble de propositions et chaque action est une expression spécifiant les propositions qui doivent appartenir ` a l’état courant pour que l’action soit exécutable, ainsi que les propositions ` a ajouter ou ` a supprimer de l’état suite ` a l’exécution de l’action ;

2. la représentation classique (Classical representation) [Fikes et Nilsson, 1971] : les états et les actions sont semblables ` a ceux décrits pour la représentation dans la théorie des ensembles. Des prédicats du premier ordre et des connecteurs logiques sont utilisés ` a la place des propositions ;

3. la représentation par des variables d’états (state variable representation) : chaque état est représenté par un tuple de n variables d’états valuées {x

1

, ..., x

_n

} et chaque action est représentée par une fonction partielle pour passer entre deux variables d’états instanciés.

Un avantage de la représentation dans la théorie des ensembles est qu’elle offre une représentation plus lisible du système de transition d’états. Par contre, cette représentation peut prendre plus d’espace mémoire que les deux autres. Au delà des considérations théoriques, il peut y avoir des raisons pratiques pour lesquelles une représentation est préférable ` a l’autre. Par exemple, pour exprimer un concept qui est essentiellement une fonction d’une valeur, il est plus commode d’utiliser la représentation par des variables d’états que la représentation classique.

Dans la suite du chapitre, nous introduisons les principaux concepts du domaine de planifi-

cation en utilisant le formalisme de la repr´esentation classique STRIPS qui utilise des notations

dérivées de la logique du premier ordre [Fikes et Nilsson, 1971]. Nous avons choisi de détailler

cette repr´esentation car nous allons l’´etendre afin de pouvoir l’utiliser dans notre approche de

composition de services dans un domaine dynamique (Web services par exemple).

(26)

fr2en en2ar

lat2doc doc2pdf

F2 (lat F2),(fr F2) F1

(doc F1),(en F1)

Fig. 1.1 – Exemple de repr´esentation d’un ´etat

Nous illustrons les définitions de la représentation classique du domaine de planification par un exemple du domaine de Web services défini dans [Falou et al., 2008]. Considérons le domaine ESW (Figure 1.1) qui contient :

– quatre effecteurs destin´es ` a traiter des fichiers textes : 1. f r2en traduit un texte du fran¸cais vers l’anglais ; 2. en2ar traduit un texte de l’anglais vers l’arabe ;

3. lat2doc transforme le format de fichier de latex en doc ; 4. doc2pdf transforme le format de fichier de doc en pdf . – deux fichiers textes F 1 et F 2 o` u :

1. F 1 est en format doc r´edig´e en anglais ; 2. F 2 est en format latex et en fran¸cais.

D´ efinition 1 Un langage logique L constitu´e d’un ensemble de pr´edicats du premier ordre L = {p

1

, ..., p

_n

} est utilisé pour représenter un domaine de planification. Ce langage est basé sur le prédicat défini par son symbole et une liste d’arguments. Il est utilisé pour représenter les relations fixes et dynamiques entre les différentes variables du domaine.

Remarque 1 Dans ce qui suit, nous utilisons les lettres x, y, z pour d´esigner les variables et les lettres c, p, v pour d´esigner les constantes.

Plusieurs notions attachées ` a la définition de l’atome sont définies :

– expression compl`etement instanti´ee (Ground expression) : expression qui ne contient pas de symboles de variables e.g., in(c1,p3) ;

– expression partiellement instanti´ee (Unground expression) : expression qui contient au

moins un symbole de variable e.g. in(c1,x) ;

(27)

– substitution : une substitution σ = {x

₁

← v

₁

, x

₂

← v

₂

, . . . , x

_n

← v

_n

} dans une expression logique consiste `a remplacer chaque occurrence d’une variable x

_i

dans la proposition, partout o` u elle intervient, par un objet v

i

;

– instance de e : une instance d’expression logique e est le r´esultat de l’application d’une substitution σ ` a e.

Exemple 1 Dans ESW, un sous-ensemble des atomes utilisé pour décrire le domaine est : (en f ) pour designer que le fichier f est rédigé en anglais ; (lat f ) pour designer que le format du fichier f est latex ; etc.

D´ efinition 2 Etat ´ : un ´etat est un ensemble d’atomes instanci´es du langage L.

Un prédicat p est vérifié dans un état q si et seulement si p ∈ q. Dans le cas contraire, p est faux du fait de l’hypothèse du monde clos : un prédicat qui n’est pas explicitement spécifié dans un état, est considéré comme faux dans celui-ci.

Exemple 2 L’état du domaine décrit dans la Figure 1.1 est donné par :

q

₀

=

( (doc F 1), (en F 1) (lat F 2), (f r F 2)

)

D´ efinition 3 Op´ erateur : Un op´erateur est d´efini par

o = (nom(o), precond(o), ef f et

⁺

(o), ef f et

⁻

(o)) avec :

– nom(o) est le nom de l’op´erateur. Il est d´efini par une expression de la forme n(x

₁

, ..., x

_n

) o` u n est un symbole d’op´erateur et x

₁

, ..., x

_k

représentent les paramètres de l’opérateur ; – precond(o) est l’ensemble de préconditions de l’opérateur o, c’est- ` a-dire les propriétés du

monde n´ecessaires ` a son ex´ecution ;

– ef f et

⁺

(o) et ef f et

⁻

(o) définissent respectivement l’ensemble de propriétés décrivant les propriétés ` a ajouter et ` a supprimer de l’état du monde après l’exécution de o.

Exemple 3 L’opérateur en2ar(f ) peut être défini de la fa¸con suivante : en2ar(f)

precond : (en f )

ef f et

⁺

: (ar f )

ef f et

⁻

: (en f )

(28)

D´ efinition 4 Action : Une action est une instance d’un op´erateur.

Si a est une action et q

_i

un ´etat tel que precond(a) ⊆ q

_i

alors a est applicable dans q

_i

, et le r´esultat de cette application est l’´etat :

q

_i+1

= (q

_i

− ef f ets

⁻

(a)) ∪ ef f ets

⁺

(a)

Exemple 4 L’état résultant de l’application de l’action en2ar[F 1] dans l’état q

₀

est :

q

₁

=

( (doc F 1), (ar F 1) (lat F 2), (f r F 2)

)

D´ efinition 5 Un domaine de planification D est défini par : l’ensemble des types des variables, les atomes (prédicats), les états du domaine Q = 2

atomes instanci´es de L

et l’ensemble A des op´erateurs instanci´es de O.

Un exemple d’une partie de description du domaine de planification ESW (Figure 1.1) est donné ci-dessous en utilisant le langage PDDL [McDermott et al., 1998]. PDDL (Planning Domain Definition Language) est un langage standard destiné ` a décrire l’état physique d’un domaine de planification, ` a savoir ses prédicats (atomes), ses actions, les effets des actions et la structure des plans.

Exemple 5

( define (domain(file-transformation-domain) (:types file)

(:predicates

(en ?f -file)(fr ?f -file)(ar ?f -file) (lat ?f -file)(doc ?f -file)(pdf ?f -file)

(:action en2ar

(:parameters (?f -file) (:precondition (en ?f)) (:effet (ar ?f) )

(:action fr2en ...

) etc..

Dans l’exemple ci-dessus, le nom du domaine de planifcation est d´efini dans la premi`ere

ligne, l’ensemble des types des variables est donné dans la deuxième ligne, les différents types

de prédicats sont définis dans la troisième ligne et les actions du domaine sont définis après. Le

sysmbole « ? » est utilis´e pour d´esigner les variables du domaine.

(29)

D´ efinition 6 Un probl`eme de planification P pour un domaine de planification D est d´efini par P = (O, init, but) o` u :

– init : est l’´etat initial ;

– but : est l’état but devant être atteint ; – O : est l’ensemble des opérateurs.

Exemple 6 Un exemple d’un problème de planification peut être défini par P = (O, q

₀

, q

₂

) o` u : O est l’ensemble des op´erateurs du domaine ESW, l’´etat q

₀

(exemple 2) est l’´etat initial init, et q

₂

est l’´etat but d´efini comme suit :

q

2

=

( (doc F 1), (ar F 1) (pdf F 2), (f r F 2)

)

D´ efinition 7 Un plan est d´efini par toute s´equence d’actions Π = ha

1

, a

2

, ..., a

n

i o` u chaque action a

_i

est une instance d’un op´erateur de O.

Soit P = (O, init, but) un probl`eme de planification. Un plan Π est un plan solution si but ⊂ γ(init, Π) o` u γ (init, Π) = γ(q

_n−1

, ...γ(γ (init, a

₁

), a

₂

)...a

_n

) et γ(q, a) est le r´esultat d’application de l’action a dans l’´etat q.

Exemple 7 Un plan solution du probl`eme de planification introduit dans l’exemple 6 est π = hen2ar[F 1], lat2pdf [F 2]i

La représentation classique du domaine de planification introduite ci-dessus est très res- treinte. Par conséquence, des extensions sont nécessaires non seulement pour pouvoir décrire des domaines complexes mais aussi pour faciliter leur description. Ces principales extensions sont le typage des variables, les opérateurs de planification conditionnelle (Forall , Exists, . . .), les expressions de quantification, etc. Le langage de planification PDDL permet d’exprimer ces extensions. Ces dernières permettent d’améliorer l’expressivité des expressions du domaine de planification tout en réduisant leur taille.

Dans la section suivante, nous introduisons les algorithmes de planification pour la r´esolution d’un probl`eme de planification.

1.2 Algorithmes de planification

Les algorithmes de planification peuvent ˆetre regroup´es en deux grandes familles : les al-

gorithmes de planification dans un espace d’´etats (state space planning ) [Fikes et Nilsson,

1971, Zhang, 1999] et les algorithmes de planification dans un espace de plans (plan space

planning ) [Sacerdoti, 1990].

(30)

1.2.1 Planification dans l’espace d’´ etats

Les algorithmes classiques les plus simples sont les algorithmes de recherche dans un espace d’états. Ce sont des algorithmes de recherche dans lesquels l’espace de recherche est un sous en- semble de l’espace d’états. Chaque nœud correspond ` a un état du monde, chaque arc correspond

`

a une transition d’´etat, et le plan correspond ` a un chemin dans l’espace d’´etats.

Les principaux algorithmes de planification dans un espace d’état sont : la recherche par chaˆınage avant, la recherche par chaˆınage arrière, la recherche mixte et l’algorithme STRIPS [Fikes et Nilsson, 1971]. Dans les sections suivantes, nous détaillons ces algorithmes de recherche.

Recherche par chaˆınage avant

L’algorithme par chaˆınage avant prend en entrée un problème de planification P = (O, init, but) et retourne un plan solution π (s’il existe) ou échec (dans le cas contraire) [Hoffmann et Nebel, 2001a]. L’algorithme est illustré dans l’algorithme 1. Partant de l’état initial init (ligne 2), et d’un plan vide π (ligne 3), pour chaque itération, l’algorithme teste si l’état courant q satisfait l’état but (ligne 5), alors le plan résultat est retourné (5). Si non, il choisit une action a parmi les actions applicables dans q d’une manière non déterministe (ligne 8). Il applique cette action pour obtenir un nouvel état q (9) et il ajoute l’action au plan π (ligne 10).

Le choix non déterministe est incorporé dans une boucle ou dans un appel récursif, de sorte que l’algorithme donne une séquence de choix non déterministe. L’ensemble des traces d’exécutions peut être représenté comme un arbre d’exécution o` u chaque nœud est représenté par une itération ou une invocation récursive de l’algorithme. Si une ou plusieurs traces d’exécution réussissent ` a trouver la solution, alors l’algorithme se termine immédiatement et retourne une solution. Autrement, la procédure échoue.

Algorithme 1 : Algorithme de recherche par chaˆınage avant Chaˆınage-avant(O, init, but)

1

q ← init

2

π ← ∅ le plan vide

3

tant que vrai faire

4

si q satisfait but alors retourne π

5

E ← {a|a est une instance d’un op´erateur dans O et precond(a) est vraie dans q}

6

si E = ⊘ alors retourne ´echec

7

Choisir une action a ∈ E d’une mani`ere non d´eterministe

8

q ← γ (q, a)

9

π ← π.a

10

(31)

(doc F1),(en F1) (lat F2), (fr F2)

(doc F1),(ar F1) (lat F2), (fr F2)

(doc F1),(ar F1) (pdf F2), (fr F2)

en2ar [F1] lat2pdf [F2]

Fig. 1.2 – Exemple de recherche par chaˆınage avant L’algorithme de recherche par chaˆınage avant est :

– non d´ eterministe : si une solution du problème de planification existe, l’algorithme peut réussir ou échouer ` a trouver cette solution ;

– consistant : chaque fois qu’il est invoqué sur un problème de planification P et retourne un plan résultat Π, Π est guaranti d’être une solution pour P .

Exemple 8 Dans la figure 1.2, une trace d’exécution de l’algorithme par chaˆınage avant pour le problème de planification défini dans l’exemple 6 est illustrée. Le plan solution obtenu est le même plan que dans l’exemple 7.

Impl´ ementations d´ eterministes de l’algorithme de recherche par chaˆınage avant Une extension pour rendre l’algorithme de recherche par chaˆınage avant d´eterministe consiste

`

a appliquer, ` a partir d’un état, non seulement une action par itération, mais aussi tous les opérateurs exécutables (actions). Par conséquent, développer un état conduit ` a l’obtention d’un ensemble de nouveaux états. Sur la base de la stratégie de parcours de l’arbre de recherche, un des

états non développé est choisi pour le développer. L’algorithme continue le développement des

états afin d’atteindre l’état but (solution trouvée) ou jusqu’à ce qu’aucun état n’est développable (échec). Lorsque l’algorithme trouve l’état but, il extrait le plan solution qui est le chemin entre l’état initial et l’état but.

Plusieurs stratégies de recherche peuvent être utilisées pour choisir, dans chaque itération, l’état ` a développer dans l’arbre de recherche, parmi elles :

– non-d´ eterministe : l’état est choisi d’une manière non déterministe ;

– profondeur : l’état choisi est le premier état voisin jusqu’` a ce qu’un état n’ait plus de voisins, alors l’algorithme revient ` a l’état père ;

– largueur : l’algorithme liste d’abord les voisins de l’état ` a développer s pour ensuite les développer un par un. Par exemple, dans la figure 1.3, le nœud qui contient l’état intial est développé en largeur ;

– heuristique : l’état ayant la meilleure heuristique est développé afin de trouver la solution le plus vite possible. Selon le type du problème, cette heuristique est définie par la distance

à l’état but ; dans ce cas l’algorithme choisit l’état le plus proche du but ;

L’algorithme de recherche par chaˆınage avant en utilisant les strat´egies de recherche par

profondeur ou largeur est complet et consistant. Par contre, l’utilisaton de cet algorithme n’est

(32)

(doc F1),(en F1) (lat F2), (fr F2)

(doc F1),(ar F1) (lat F2), (fr F2)

en2ar [F1]

lat2pdf [F2]

(pdf F1),(en F1) (lat F2), (fr F2)

(doc F1),(en F1) (pdf F2), (fr F2) doc2pdf [F1]

fr2en [F2]

(doc F1),(en F1) (lat F2), (en F2)

Fig. 1.3 – D´eveloppement d’un nœud de l’arbre

pas pratique parce qu’il exige beaucoup de mémoire. La complexité en mémoire est exponen- tielle en fonction de la taille de la solution. L’implémentation en utilisant la stratégie non- déterministe peut perdre beaucoup de temps ` a essayer beaucoup d’actions qui ne progressent pas vers le but. En conséquence, une bonne fonction heuristique avec une procédure d’élagage (pruning-procedure) peut diminuer énormément le nombre des nœuds de l’arbre ainsi que le temps d’exécution de l’algorithme [Hoffmann et Nebel, 2001b].

Recherche par chaˆınage arri` ere

L’idée de l’algorithme de recherche par chaˆınage arrière est de partir du but et d’appliquer l’inverse des opérateurs de planification jusqu’` a atteindre l’état initial [Helmert, 2006]. L’inverse d’un opérateur est défini par γ

⁻¹

(but, a) = (but − ef f ects

⁺

(a)) ∪ ef f ects

⁻

(a) o` u : but est un

état but ou un état sous-but et a est une action. On l’appelle opérateur de régression.

Les mêmes stratégies de recherche utilisées avec l’algorithme en chaˆınage avant peuvent être utilisées avec le chaˆınage arrière [Haslum et Geffner, 2000] : non-déterministe, profondeur, largeur, heuristique. Contrairement au chaˆınage avant, le chaˆınage arrière permet d’éviter les cycles dans l’arbre de recherche ce qui permet de réduire le temps de recherche d’une solution.

Recherche mixte

L’idée basique de la stratégie mixte [lavalle, 2006] est de développer en parallèle deux arbres

de recherche. Le premier arbre est développé en utilisant le chaˆınage avant, le deuxième est

développé en utilisant le chaˆınage arrière. Ce développement se poursuit jusqu’à l’obtention

d’un état commun aux deux arbres et par conséquent, un plan solution est trouvé. L’avantage

(33)

de cette stratégie mixte est de diminuer le temps de recherche parce que les deux arbres sont développés en parallèle.

Recherche dans STRIPS

Un des plus grands problèmes des algorithmes présentés précédemment est de savoir comment améliorer l’efficacité en réduisant la taille de l’espace de recherche. L’algorithme STRIPS est une tentative de le faire [Fikes et Nilsson, 1971]. L’algorithme STRIPS fonctionne de la même fa¸con que l’algorithme de recherche par chaˆınage arrière, son avantage réside dans sa capacité à réduire l’espace de recherche. Cette optimisation est caractérisée par les deux points suivants :

– ` a chaque appel récursif de l’algorithme STRIPS, les sous-buts qui doivent être satisfaits sont les préconditions du dernier opérateur ajouté dans le plan, ce qui a comme conséquence de réduire substantiellement le facteur de branchement de l’algorithme ;

– si l’état courant satisfait toutes les préconditions d’un opérateur, alors STRIPS “marque”

l’opérateur. Ainsi, en cas d’échec, le retour en arrière se fera ` a partir de cet opérateur.

Enfin, STRIPS r´eduit une grande partie de l’espace de recherche, mais il n’est pas complet ni optimal [Fikes et Nilsson, 1971].

1.2.2 Planification dans l’espace de plans

Dans la première partie de ce chapitre, nous avons abordé la planification comme la recherche d’un chemin dans le graphe d’un système de transition d’états. Nous allons examiner, dans cette section, un espace de recherche plus élaboré o` u les nœuds sont des plans partiels [Barrett et Weld, 1994], les arcs sont des opérations de raffinement d’un plan partiel. La règle des raffinements consiste ` a ajouter des actions au plan partiel pour accomplir une proposition ou ` a ajouter des contraintes d’ordre entre les actions.

La planification partielle peut être mise en œuvre comme une recherche dans l’espace des plans d’ordre partiels. Au début, l’algorithme de recherche est initialisé par un plan d’initialisa- tion. Les états de l’algorithme de recherche sont des plans. Ensuite, les moyens de raffinement sont appliqués sur le plan jusqu’` a l’obtention d’un plan complet qui permettra de résoudre le problème. Les actions dans cette recherche ne sont pas des actions du domaine de planification appliquées dans les états, mais des actions appliquées sur les plans comme : l’ajout d’une action au plan, l’ajout d’un ordre entre deux actions, etc.

Chaque plan a les quatre éléments cités ci-dessous. Les deux premiers définissent les étapes du plan et les deux derniers servent à savoir comment les plans peuvent être étendus :

– un ensemble d’actions qui constituent les ´etapes du plan. ` A l’initialisation, un plan initial

contient deux actions a

₀

et a

_∞

. L’action a

₀

n’a pas de pr´econditions et a comme effet

(34)

tous les litt´eraux de l’´etat initial. a

_∞

n’a pas d’effets et a comme pr´econditions tous les litt´eraux du but ;

– un ensemble de contraintes d’ordre d’ex´ecution binaire entre les actions de la forme a ≺ b.

Initialement, a

₀

≺ a

_∞

;

– un ensemble de liens causaux. Un lien causal défini entre deux actions a et b dans le plan, est désigné par a −→

^p

b ; il est lu comme « a accomplit p pour b » .

Une action c ajout´ee au plan est en conflit avec a −→

^p

b si l’action c a (¬p) comme effet et si c vient apr`es a et avant b ;

– un ensemble de préconditions ouvertes. Une précondition est ouverte si elle n’est pas obtenue par une action du plan. Le rˆ ole du planificateur est de réduire l’ensemble des préconditions ouvertes ` a l’ensemble vide, sans l’introduction de contradictions entre les relations d’ordre ni de conflits avec les liens causaux.

Algorithme POP (Partial order planning )

Dans le domaine de planification partielle, le problème de planification est défini, comme d’habitude, par un état initial, un état but, et un ensemble d’actions.

L’´etat initial contient l’action a

0

et l’action a

∞

. La contrainte d’ordre a

0

≺ a

∞

, un en- semble vide des liens causaux, et l’ensemble des pr´econditions ouvertes qui contient toutes les pr´econditions de l’action a

_∞

.

A chaque itération de l’algorithme, la fonction successeur choisit, d’une manière arbitraire, ` une précondition ouverte p d’une action b et génère un plan successeur pour chaque situation consistante possible afin d’accomplir p par une action a. La consistance est forcée par :

1. le lien causal a −→

^p

b et la contrainte d’ordre a ≺ b sont ajout´es au plan. Si a n’appartient pas au plan, alors il faut aussi ajouter a

₀

≺ a et a ≺ a

_∞

;

2. la r´esolution des conflits entre les nouveaux liens causaux et les actions du plan d’une part ; et entre l’action a (si elle est nouvelle) et tous les liens causaux d’autre part. Un conflit entre a −→

^p

b et c est résolu en for¸cant c de s’exécuter ` a un moment en dehors de l’intervalle de protection, soit en ajoutant b ≺ c ou c ≺ a. L’état successeur est ajouté si le résultat est un plan consistant ;

3. le plan solution est trouv´e si le plan ne contient pas de pr´econditions ouvertes.

Exemple 9 La Figure 1.4 illustre un exemple simple d’application de l’algortihme POP. Le problème de planification de cet exemple est défini par : init = {(doc F 1), (en F 1)}, et but = {(pdf F 1), (ar F 1)}. D’o` u l’état initial du graphe de planification qui contient l’action a

₀

et a

_∞

et la relation d’ordre a

0

≺ a

∞

.

A la première étape, l’algorithme choisit parmi les prédicats ouverts ` {(pdf F 1), (ar F 1)}

le pr´edicat (pdf F 1). Ce pr´edicat est accompli par l’action doc2pdf [F 1]. Les deux relations

(35)

a0

(doc F1) (en F1)

(pdf F1) (ar F1)

a0 (doc F1) (en F1)

(pdf F1) (ar F1) doc2pdf

(doc F1) (pdf F1)

a0

(doc F1)

(en F1)

(pdf F1)

(ar F1) doc2pdf

(doc F1) (pdf F1)

en2ar

(en F1) (ar F1)

(pdf F1) est accompli par doc2pdf

(ar F1) est accompli par en2ar

Fig. 1.4 – Exemple d’ex´ecution de l’algorithme POP

d’ordre : a

₀

≺ doc2pdf [F1] ; doc2pdf[F 1] ≺ a

_∞

et les deux liens causaux : (doc F 1) → (doc F 1) ; (pdf F 1) → (pdf F 1) sont ensuite ajout´es.

Ensuite, dans la deuxième étape, l’algorithme choisit le deuxième prédicat ouvert (ar F 1).

Ce pr´edicat est accompli par l’action en2ar[F1]. Les deux relations d’ordre : a

₀

≺ en2ar[F 1] ; en2ar[F1] ≺ a

∞

et les deux liens causaux : (en F 1) → (en F 1) ; (ar F 1) → (ar F 1) sont ensuite ajout´es.

Enfin, le plan solution est trouv´e : hdoc2pdf [F 1], en2ar[F 1]i car le plan ne contient aucun pr´edicat ouvert.

En comparant avec la planification d’ordre total (state-space), la planification d’ordre par- tiel a l’avantage de pouvoir décomposer les problèmes en sous-problèmes. Elle a cependant un inconvénient principal dans la mesure o` u elle ne représente pas directement les états. Par conséquent, il est difficile d’estimer combien le plan d’ordre partiel est loin du but.

Par contre, il est possible de sp´ecifier une heuristique par le coˆ ut r´eel du plan. Cette heuris-

tique est utilis´ee pour choisir quel est le plan `a raffiner. Nous facturons 1 pour chaque action

ajout´ee au plan et 0 pour tous les autres raffinements. Dans ce cas, h(Π) sera ´egal au nombre

des actions réelles du plan, o` u Π est un plan. Un deuxième type d’heuristique peut être défini

par le nombre des pr´econditions ouvertes.

(36)

Un troisième type d’heuristique est défini pour choisir une précondition ouverte pour tra- vailler sur elle. Comme dans le cas de la sélection des variables dans les algorithmes de satisfaction des contraintes[Kumar, 1992]. Cette sélection a un grand impact sur l’efficacité. Ainsi, les mêmes techniques peuvent être appliquées ici.

1.3 Techniques de planification graphique

Blum et Furst ont introduit les techniques de planification graphiques dans un espace de re- cherche très puissant s’appuyant sur les deux types d’espace de recherche présentées précédemment [Blum et Furst, 1995] : planification dans l’espace d’états (section 1.2.1) et planification dans l’espace de plans (section 1.2.2). L’espace d’état fournit un plan comme une séquence d’actions.

Les planificateurs dans l’espace de plans synthétisent un plan comme un ensemble d’actions partiellement ordonné. Les techniques de planification graphique sont basées sur une idée plus puissante : l’analyse de l’accessibilité. L’analyse de l’accessibilité porte sur la question de savoir si un état q

i

est accessible ` a partir d’un ´etat q

j

grˆace ` a un ensemble d’actions, et quelles sont ces actions qui le permettent ?

L’idée de Blum et Furst est de construire un graphe qui est beaucoup plus petit que le graphe de transition d’états. Le graphe de planification est polynomial en espace et peut être construit d’une manière efficace pour certains problèmes difficiles. L’inconvénient est que le graphe de planification contient des états qui peuvent ne pas être atteints. Cet inconvénient est dˆ u aux relations mutex (Définition 9) qui sont définies afin d’exprimer l’impossibilité de certaines combinaisons de propositions ou d’actions.

1.3.1 Construction du graphe

Dans les techniques de planification graphique, un graphe est construit en niveaux. L’idée de base est de considérer ` a chaque niveau i du graphe non pas un état individuel, mais pour une première approximation, l’union des prédicats de tous les états accessibles en appliquant i actions. Ainsi, chaque niveau N

i

contient deux sous niveaux : le sous-niveau d’actions A

i

et le sous-niveau de pr´edicats P

_i

. Ensuite le graphe est construit niveau apr`es niveau, en commen¸cant

`

a partir de P

0

. ` A la premi`ere ´etape, P

0

représente l’état initial. ` A l’étape i, l’ensemble A

i

repr´esente toutes les actions ex´ecutables dans P

_i−1

et tous les no-op (non-op´erateur) actions

(no − op

_p

) pour chaque pr´edicats p ∈ P

_i−1

, l’action no − op d’un pr´edicat p est d´efini par :

prec(no − op

_p

) = ef f et

⁺

(no − op

_p

) = {p} et ef f et

⁻

(no − op

_p

) = ∅. L’ensemble P

_i+1

= P

_i

∪

ef f et(A

_i

) o` u ef f et(A

_i

) est l’union des ef f et

⁺

de tous les op´erateurs dans A

_i

. Les it´erations

continuent jusqu’`a ce que le graphe de planification se stabilise, ce qui signifie que A

i+1

= A

i

et

P

_i+1

= P

_i

, ou alors qu’un plan solution soit trouv´e (section suivante).

(37)

(doc F1)

(pdf F1) (doc F1) doc2pdf [F1]

P0 A1 P1

N1

(en F1)

(ar F1) (en F1) en2ar [F1]

(lat F2)

(doc F2) (lat F2) lat2doc [F2]

(fr F2)

(en F2) (fr F2) fr2en [F2]

no-op

(fr F2)

no-op

(lat F2)

no-op

(en F1)

no-op

(doc F1)

Fig. 1.5 – Exemple d’ex´ecution de GraphPlan

Exemple 10 Dans la Figure 1.5, le premier niveau de construction du graphe du problème de planification défini dans l’exemple 6 de la page 14 est donné.

L’état P 0 est défini par l’ensemble de prédicats de l’état intial. Ensuite, le sous-niveau d’ac- tions N 1 contenant toutes les actions exécutables dans P0 est construit. Les effets de l’exécution des actions de N 1 sont ajoutés ` a P1 qui est intialisé par P 0. Les arcs du graphe sont construits de la manière suivante :

– pour chaque prédicat p du niveau P 0 faisant partie des préconditions d’exécution d’une action a du sous-niveau d’action N 1, un arc sortant de p et entrant dans a est ajouté au graphe ;

– pour chaque prédicat p du niveau P1 faisant partie des effets d’exécution d’une action a du sous-niveau d’action N 1, un arc sortant de a et entrant dans P 1 est ajouté ;

– pour chaque prédicat p du niveau P 0 faisant partie des préconditions d’exécution d’une action a du N 1, un arc pointillé sortant de a et entrant dans p dans le niveau P 1 est ajouté. Cet arc désigne les effets négatifs d’exécution d’une action.

1.3.2 Conditions de l’accessibilit´ e

Avant de poursuivre la pr´esentation de la technique de « graphe de planification » , nous

devons rappeller la d´efinition des exclusions mutuelles mutex pour les actions et les pr´edicats

[Blum et Furst, 1995]. Pour cela, nous introduisons la notion d’ind´ependance des actions comme

suit :

(38)

D´ efinition 8 Deux actions (a, b) sont ind´ependantes si et seulement si : – ef f et

⁻

(a) ∩ [precond(b) ∪ ef f ects

⁺

(b)] = ∅

– ef f et

⁻

(b) ∩ [precond(a) ∪ ef f et

⁺

(a)] = ∅

Exemple 11 f r2en[F1], en2ar[F2] sont ind´ependants, tandis que en2f r[F 2] et en2ar[F 2] sont d´ependants.

D´ efinition 9 Deux actions (a, b) sont mutex ssi : – a et b sont d´ependantes, ou

– si une pr´econdition de a est mutex avec une pr´econdition de b.

Deux pr´edicats : p ∈ P

i

et p

^′

∈ P

i

sont mutex si chaque action dans A

i

admettant p comme un effet positif est mutex avec toute action produisant p

^′

, et il n’y a aucune action dans A

_i

qui produit p et p

^′

simultan´ement.

Ainsi, dans le graphe de planification, deux actions mutex dans un niveau d’actions A

_i

ne peuvent pas apparaˆıtre simultan´ement dans le niveau i d’un plan solution. En fait, les effets positifs de deux actions mutex dans A

_i

sont incompatibles dans le niveau de proposition P

_i

, sauf s’ils sont ´egalement des effets positifs de certaines autres actions.

1.3.3 Planificateur Graphplan

L’algorithme Graphplan est un algorithme itératif pour le développement du graphe de planification et pour l’extraction du plan solution. Il permet de construire le graphe en profondeur en rajoutant un nouveau niveau ` a l’espace de recherche ` a chaque itération. Le développement du graphe se poursuit jusqu’` a obtenir un niveau i tel que P

_i

contient tous les pr´edicats du but ou alors P

_i

= P

_i−1

et A

_i

= A

_i−1

.

Lorsque le niveau atteint contient tous les prédicats du but, ` a partir de celui ci, un parcours en arrière est effectué pour extraire un plan valide ne contenant aucun couple d’actions mutex.

Si c’est le cas, ce plan sera le plan solution, sinon le d´eveloppement de l’arbre se poursuit sauf si deux niveaux du graphe de planification sont ´egaux (c’est- ` a-dire P

_i

= P

_i−1

et A

_i

= A

_i−1

). Dans ce cas, si aucun plan ne peut ˆetre extrait ` a partir de P

i−1

, on parle alors de situation d’´echec.

Dans la Figure 1.5, il est possible d’extraire un plan solution pour atteindre l’´etat but = (pdf F 1), (en F 1), (doc F 2), (f r F 2) ` a partir de l’´etat init = (doc F 1), (en F 1), (lat F 2), (f r F 2).

En effet, les prédicats de l’état but sont inclus dans le sous-niveau de prédicats P

₁

et aucun couple de pr´edicats but n’est mutex. Les actions du sous-niveau d’actions A

₁

permettant d’avoir les pr´edicats du but sont :

– doc2pdf [F 1] pour le pr´edicat (doc F 1) ;

– no − op

_{(en F}₁₎

pour le pr´edicat (en F 1) ;

– lat2doc[F 2] pour le pr´edicat (doc F 2) ;

(39)

– no − op

_{(f r F1)}

pour le pr´edicat (f r F 1).

Le couple d’actions doc2pdf [F 1] et lat2doc[F2] n’est mutex dans A1, par cons´equant le plan

< doc2pdf [F 1], lat2doc[F 2] > est un plan solution.

En outre, dans le graphe illustré dans la figure 1.5 il est impossible d’extraire un plan solution des niveaux N 0, N 1 lorsque but = (pdf F 1), (ar F 1) et init = (doc F 1), (en F 1). En effet, les prédicats de l’état but sont inclus dans P 1, mais ils sont mutex car leurs actions créatrices doc2pdf [F 1], en2ar[F1] sont dépendants. Par contre, il est possible d’extraire un plan solution du niveau N 2 s’il est développé.

1.4 Techniques de planification hi´ erarchique

La technique de planification hiérarchique (Hierarchical Task Network - HTN) [Nau et al., 2003] est une méthodologie d’intelligence artificielle pour la création des plans par la décomposition des tâches. C’est un processus o` u le système de planification décompose les tâches en sous-tâches, jusqu’` a ce que des tâches primitives soient trouvées.

1.4.1 De STRIPS ` a HTN

HTN utilise des définitions des états et des actions du monde qui sont semblables ` a celles uti- lisées dans la planification STRIPS. En effet, chaque état du monde est représenté par l’ensemble des prédicats vrais dans cet état, et chaque action correspond ` a une transition déterministe entre deux états. Les actions HTN sont appelées « tâches primitives » . L’objectif de HTN n’est pas d’atteindre un ensemble de buts (cas de STRIPS, exemple : porte ouverte) , mais d’exécuter un ensemble de tâches (exemple : ouvrir porte).

Les planificateurs HTN cherchent des plans pour réaliser des « réseaux de tâches » qui peuvent inclure des éléments autres que des buts ` a atteindre. Ils planifient par la décomposition des tâches et la résolution des conflits.

Un « réseau de tâches » est une collection de tâches qui doivent être menées ensemble avec des contraintes d’ordre dans lesquelles les tâches peuvent être réalisées. Un réseau de tâches qui ne contient que des tâches primitives est appelé un réseau de tâches primitives. Dans le cas plus général, un réseau de tâches peut contenir des tâches non-primitives, et le planificateur doit savoir comment les exécuter. En effet, les tâches non primitives ne peuvent pas être exécutées directement, parce que les activités qu’elles représentent peuvent impliquer l’exécution d’autres tâches.