Planification avec préférences basée sur la Théorie de l'Utilité Multi-Attribut couplée à une intégrale de Choquet : application à l'interopérabilité des organisations en gestion de crise

(1)

HAL Id: tel-01823824

https://tel.archives-ouvertes.fr/tel-01823824

Submitted on 26 Jun 2018

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires

l’Utilité Multi-Attribut couplée à une intégrale de

Choquet : application à l’interopérabilité des

organisations en gestion de crise

Loïc Bidoux

To cite this version:

Loïc Bidoux. Planification avec préférences basée sur la Théorie de l’Utilité Multi-Attribut couplée à une intégrale de Choquet : application à l’interopérabilité des organisations en gestion de crise. Gestion et management. Ecole des Mines d’Albi-Carmaux, 2016. Français. �NNT : 2016EMAC0005�. �tel-01823824�

(2)

&OWVFEFMPCUFOUJPOEV

**%0$503"5%&-6/7&345²%&506-064&**

%ÏMJWSÏQBS

1SÏTFOUÏFFUTPVUFOVFQBS

5JUSF

²DPMFEPDUPSBMF et discipline ou spécialité 6OJUÏEFSFDIFSDIF %JSFDUFVSUSJDF TEFʾÒTF Jury:

5)µ4&

le

École Nationale Supérieure des Mines d'Albi-Carmaux conjointement avec l'INSA de Toulouse

Loïc Bidoux

mardi 14 juin 2016

Planification avec préférences basée sur la Théorie de l'Utilité Multi-Attribut

couplée à une intégrale de Choquet : application à l'interopérabilité des

organisations en gestion de crise

EDSYS : Génie Industriel 4200046

Centre Génie Industriel - Ecole des Mines d'Albi-Carmaux

Frédérick BENABEN - Maître Assistant HDR, Ecole des Mines d'Albi-Carmaux - Directeur Khaled HADJ-HAMOU - Maître de Conférence, Institut Polytechnique Grenoble - Rapporteur

Jacques LAMOTHE - Professeur, Ecole des Mines d'Albi-Carmaux - Co-directeur Jacky MONTMAIN - Professeur, Ecole des Mines d'Alès - Rapporteur Jean-Paul PIGNON - Ingénieur spécialiste études amont, Thales - Encadrant

(3)

(4)

Je tiens à remercier Khaled Hadj-Hamou, Jacky Montmain et Bartel Van De Walle d’avoir accepter de faire partie de mon jury de thèse. La pertinence de leurs remarques couplée à leur gentillesse ont contribué à faire de ma soutenance de thèse un beau moment d’échange scientifique.

Je remercie chaleureusement Frédérick Bénaben pour la confiance dont il a fait preuve à mon égard (laquelle m’a offert l’opportunité de réaliser ces travaux) ainsi que Jacques Lamothe, Jean-Paul Pignon et Sébastien Truptil pour leur encadrement tout au long de ces trois années de thèse. Ils m’ont fourni un cadre de travail - qu’il soit Albigeois ou Parisien - agréable me permettant de réaliser cette étude dans les meilleures conditions possibles. Par ailleurs, leurs expériences et points de vue respectifs ont forgé à jamais ma vision de la recherche contribuant ainsi à faire de moi le scientifique que je suis aujourd’hui. Je remercie une seconde fois Jean-Paul qui en plus d’avoir été un mentor exemplaire est devenu un ami sincère au fur et à mesure que nous apprenions à nous connaître.

Je remercie également Xavier Lagrenade de m’avoir accueilli au sein de son équipe chez Thales. Je remercie Dominique Attali pour sa bienveillance au cours de ces trois dernières années ainsi que l’ensemble de mes collègues Christophe, Eric, Gilles, Jean-Pierre, Marc, Patrice, Philippe, Sonia, Thierry et tous les membres d’XPS pour leur professionnalisme et leur gentillesse au quotidien. J’ai beaucoup appris à leurs côtés notamment lors de conversations dont les thématiques dépassaient (malheureusement trop souvent) mon domaine d’expertise.

Je souhaite aussi remercier l’ensemble de mes collègues de l’Ecole des Mines d’Albi à savoir Didier, Elise, Franck, Isabelle, Lionel, Matthieu, Michel, Paul ainsi que tous les (post)-doctorants du centre pour leur bonne humeur quotidienne, laquelle

(5)

m’a permis d’apprécier l’ensemble de mes séjours au laboratoire. Impossible de ne pas mentionner plus particulièrement Alexandre, Anne-Marie, Aurélie, Guillaume, Mylène, Nicolas, Sébastien et Tiexin aux cotés desquels j’ai passé de grands moments, toujours agréables bien que parfois un peu stupides (ce qui semble néanmoins conférer à ces derniers un caractère mémorable certain).

J’adresse évidemment un grand remerciement à toute ma famille ainsi qu’à Amélie, Manon, Morgan, Nathanaël mais aussi à Solène et ses proches. Merci à eux de m’avoir supporté (quelque soit l’acception du terme considérée) lors de ces trois dernières années (et les précédentes). Aucun mot ne saurait décrire avec justesse toute l’importance qu’ils ont eu dans ma vie.

Pour finir, je suis reconnaissant envers tous ceux qui ont été oubliés dans les quelques paragraphes précédents à cause de ma maladresse habituelle et qui, à ne pas en douter, me pardonneront cet écart.

(6)

Notations 17

Introduction générale 21

1 Planification avec préférences 27

1.1 De la problématique de la planification . . . 28

1.1.1 Modèle conceptuel de la planification . . . 28

1.1.2 Problème de la planification classique . . . 31

1.1.3 Langage formel pour la planification . . . 33

1.2 De la problématique de la planification avec préférences . . . 46

1.2.1 Objectifs étendus et préférences . . . 46

1.2.2 Problème de la planification avec préférences . . . 48

1.2.3 Langage formel pour la planification avec préférences . . . . 50

1.2.4 Algorithmes de planification avec préférences . . . 58

2 Modélisation de préférences avec la Théorie de l’Utilité Multi-Attribut couplée à une intégrale de Choquet 63 2.1 Aide à la décision multicritère . . . 64

2.1.1 De la problématique de l’aide à la décision multicritère . . . 64

2.1.2 Résolution des problèmes d’aide à la décision multicritère . . 65

2.2 Théorie de l’Utilité Multi-Attribut . . . 70

2.2.1 Modèle MAUT . . . 70

2.2.2 Fonctions d’utilité partielles . . . 71

2.2.3 Fonction d’agrégation . . . 73

(7)

2.3 Intégrale de Choquet . . . 75

2.3.1 Limites de la somme pondérée . . . 75

2.3.2 Modèle basé sur l’intégrale de Choquet . . . 76

2.3.3 Interprétation du modèle . . . 78

2.3.4 Simplification du modèle . . . 80

2.3.5 Retour sur l’exemple illustratif . . . 82

2.4 Réalisation d’un modèle MAUT couplé à une intégrale de Choquet . 85 2.4.1 Construction des fonctions d’utilité partielles . . . 85

2.4.2 Construction de la fonction d’agrégation . . . 87

3 Planification avec préférences basée sur la Théorie de l’Utilité Multi-Attribut couplée à une intégrale de Choquet 91 3.1 _{Extension du pouvoir expressif du langage pddl3 . . . 92}

3.1.1 _{Préférences pddl3 et critères maut . . . 92}

3.1.2 _{Fonction objectif pddl et intégrale de Choquet . . . 95}

3.1.3 _{Langage formel pour l’extension pddl3/maut . . . 97}

3.2 _{Résolution du problème de planification avec préférences maut . . . 104}

3.2.1 Planification par recherche guidée par une heuristique . . . . 104

3.2.2 Règles de sélection pour la planification avec préférences . . 109

3.2.3 Règles de coupe pour la planification avec préférences . . . . 126

3.3 Implémentation et résultats expérimentaux . . . 129

3.3.1 Implémentation et démarche expérimentale . . . 129

3.3.2 Résultats expérimentaux . . . 132

4 De l’interopérabilité des organisations en gestion de crise 145 4.1 De la problématique de la gestion de crise . . . 146

4.1.1 Enjeux et défis associés à la gestion de crise . . . 146

4.1.2 Plans d’action collaboratifs de gestion de crise . . . 148

4.2 De la construction de plans d’action collaboratifs . . . 151

4.2.1 Réalisation d’un système d’aide à la décision . . . 151

4.2.2 Modélisation du problème collaboratif . . . 156

(8)

4.3 Exemple de résolution d’une situation de crise . . . 167

4.3.1 Description du scénario opérationnel . . . 168

4.3.2 Modélisation opérationnelle du problème . . . 169

4.3.3 Résolution du problème de planification . . . 177

Conclusion générale 187

Bibliographie 190

A Syntaxe de la logique du premier ordre 205

(9)

(10)

Introduction générale

1 Mise en exergue d’éléments liés au domaine de la gestion de crise . . 24

2 Relations entre les différentes sections de ce manuscrit . . . 25

Chapitre 1 1.1 Modèle conceptuel de la planification . . . 29

1.2 Exemple Rovers : Situation initiale . . . 32

1.3 Exemple Rovers : Plan 1 . . . 33

1.4 Exemple Rovers : Objets . . . 34

1.5 Exemple Rovers : Prédicats . . . 35

1.6 Exemple Rovers : Action Naviguer . . . 35

1.7 Exemple Rovers : Etat initial . . . 35

1.8 Exemple Rovers : Objectifs . . . 36

1.9 _{Objectifs finaux et préférences finales en pddl . . . 50}

1.10 Objectifs et préférences de trajectoire en pddl . . . 51

Chapitre 2 2.1 _{Couplage d’une procédure A et d’une méthode mcda . . . 69}

2.2 Exemple : Fonctions d’utilité partielles uM P et uL . . . 74

(11)

Chapitre 3

3.1 Fonction d’utilité partielle uEC . . . 93

3.2 _{Description bnf de l’exigence pddl maut-preferences . . . 98}

3.3 _{Syntaxe d’expression numérique primitive en pddl . . . 99}

3.4 _{Syntaxe de préférences finales et de trajectoires en pddl . . . 99}

3.5 _{Syntaxe de l’extension pddl3/maut . . . 100}

3.6 Principe de la recherche en avant dans un graphe . . . 106

3.7 Graphe de planification relaxé . . . 112

3.8 Fonction d’utilité partielle uh . . . 115

3.9 Automates de Büchi de préférences . . . 116

3.10 Implémentation du planificateur ChoPlan . . . 130

3.11 Résultats pour Rovers - Simple Preferences . . . 132

3.12 Résultats pour Rovers - Qualitative Preferences . . . 133

3.13 Résultats pour Rovers - maut Preferences . . . 133

3.14 Résultats pour Openstacks - Simple Preferences . . . 134

3.15 Résultats pour Openstacks - Qualitative Preferences . . . 134

3.16 Comparaison de ChoPlan SR1 - h2 et de Contrôle . . . 140

3.17 Comparaison de ChoPlan SR1 - h2 et de SGPlan 5 . . . 141

3.18 Comparaison de ChoPlan SR1 - h2 et de SGPlan-W . . . 141

3.19 Comparaison de ChoPlan SR1 - h2 et de lprpg-p . . . 142

Chapitre 4 4.1 Cellule de crise et plan d’action collaboratif . . . 149

4.2 Thèmes du projet de recherche MISE . . . 151

4.3 Système de construction de plans d’action collaboratifs . . . 152

4.4 Etape de modélisation du problème collaboratif . . . 153

4.5 Etapes de planification et d’aide à la décision . . . 154

4.6 Etat de réalisation du prototype . . . 155

4.7 Métamodèle de collaboration . . . 157

4.8 Principe de la transformation de modèle . . . 159

4.9 Métamodèle de planification . . . 160

4.10 Evaluation d’un plan par rapport à un modèle de préférence . . . . 167

(12)

4.12 Exemple : Modèle de situation . . . 170

4.13 Exemple : Liste des partenaires . . . 171

4.14 Exemple : Capacités et ressources . . . 172

4.15 Exemple : Arbre de préférence du modèle 1 . . . 175

4.16 Exemple : Critère dans Myriad . . . 175

4.17 Exemple : Fonction d’agrégation dans Myriad . . . 176

4.18 Exemple : Import des modèles de préférences . . . 177

4.19 Exemple : Plan optimisant le modèle de préférence 1 . . . 178

4.20 Exemple : Plan optimisant le modèle de préférences 2 . . . 179

4.21 Exemple : Mécanismes de post-traitement . . . 180

4.22 Exemple : Plan optimisant le modèle de préférences 3 . . . 181

4.23 Exemple : Résumé des scores des plans solutions . . . 182

4.24 Exemple : Comparaison des plans 1 et 2 . . . 183

(13)

(14)

Chapitre 1

1.1 Formalismes pour la planification avec préférences . . . 57

1.2 Algorithmes pour la planification avec préférences . . . 60

1.3 Participation aux IPC des planificateurs de l’art . . . 61

Chapitre 2 2.1 Exemple : Notes des étudiants . . . 73

2.2 Exemple : Valeurs d’utilités partielles . . . 74

2.3 Exemple : Utilités calculées à l’aide d’une somme pondérée . . . 75

2.4 Exemple : Notes des étudiants . . . 82

2.5 Exemple : Fonction de capacité considérée . . . 83

2.6 Exemple : Utilités calculées à l’aide d’une intégrale de Choquet . . . 84

2.7 Illustration d’une procédure de questionnement sur XM . . . 86

2.8 Illustration d’une procédure de questionnement sur XA . . . 88

Chapitre 3 3.1 Graphe de planification relaxé . . . 111

3.2 Evolution de la transformation de Möbius de la capacité ρ . . . 123

3.3 Nombre de solutions identifiées et éfficacité des planificateurs . . . . 136

3.4 Score IPC des planificateurs . . . 137

3.5 _{Synthèse des scores IPC des configurations de ChoPlan . . . 139}

(15)

Chapitre 4

4.1 Correspondances métamodèles de collaboration et de planification . 161

4.2 Exemple : Modèle des objectifs . . . 173

4.3 Exemple : Modèles de préférences . . . 174

(16)

(17)

(18)

R Ensemble des réels

P(E) Ensemble des parties de E

Σ = (S, A, E, γ) Système à événements discrets

S Ensemble des états

A Ensemble des actions

E Ensemble des événements

γ Fonction de transition d’états

P C = (Σ, s0, SG) Problème de planification classique

P T = (Σ, s0, SG0) Problème de planification avec objectifs étendus

P P = (P T, %) Problème de planification avec préférences

s0 Formule qui décrit l’état initial d’un problème

G Formule qui décrit les objectifs restreints d’un problème

G0 Formule qui décrit les objectifs étendus d’un problème

% Relation de préférences

X Ensemble des solutions d’un problème de planification

hˆa1, · · · , ˆani Plan de longueur n

IC Instance d’un problème de planification (classique)

IN Instance d’un problème de planification (numérique)

IP Instance d’un problème de planification (préférences)

(19)

dim Dimension d’un instance d’un problème de planification

AtmI Ensemble des atomes de I

PNEI Ensemble des expressions numériques primitives de I

N (φ)[V ] Forme normalisée de la formule φ par rapport à V

SG Ensemble de préférences

M C _{Ensemble de critères maut}

F A Ensemble des actions aplanies

GA Ensemble des actions closes

ˆ

a Nom de l’action a

Prea Formule qui décrit les préconditions de l’action a

Effa Formule qui décrit les effets de a

Adda Formule qui décrit les effets positifs de l’action a

Dela Formule qui décrit les effets négatifs de l’action a

NEfa Formule qui décrit les effets numériques de l’action a

p Nombre d’attributs

P = {1, · · · , p} Ensemble des attributs

X Ensemble des alternatives

XA Ensemble des alternatives binaires

Ωk⊂ R Espace de définition de l’attribut k ∈ P

Ω = Ω1× · · · × Ωp Espace des attributs

zk : X → Ωk Fonction attribut de l’attribut k ∈ P

z : X → Ω Fonction attribut

Y = {z(x) | x ∈ X} Ensemble des alternatives dans l’espace des attributs

%D Relation de préférence du décideur

ξ ⊂ R Échelle de satisfaction commune

0k ∈ Ωk Élément totalement insatisfaisant pour le critère k

1k ∈ Ωk Élément parfaitement satisfaisant pour le critère k

uk : Ωk → ξ Fonction d’utilité partielle de l’attribut k

(20)

U : Ω → R Fonction d’utilité

Sw : Rp → R Somme pondérée de vecteur de poids w

µ : P(P ) → [0, 1] Fonction de capacité

m : P(P ) → R Transformation de Möbius

Cµ: Rp+→ R+ Intégrale de Choquet

φ(k) Valeur de Shapley du critère k

I(A) Indice d’interactions des critères k ∈ A

FF(IM, s, G) Heuristique Fast-Forward

∆1(IM, s) Estimation de s par rapport aux objectifs

Λ1(IM, s) Estimation de s par rapport aux préférences

Λ2(Im, s) Estimation de s par rapport aux préférences

h1(IM, s) Heuristique h1 de ChoPlan

SR1 Stratégie de recherche 1 de ChoPlan

SR2 Stratégie de recherche 2 de ChoPlan

(21)

(22)

Les travaux présentés dans ce manuscrit de thèse s’intéressent à la problématique scientifique de la planification avec préférences basée sur la Théorie de l’Utilité

Multi-Attribut ( maut) couplée à une intégrale de Choquet. De plus, ils s’intéressent

également à la problématique sociétale de l’interopérabilité des organisations lors de

la gestion de situations de crise. Cette introduction générale souligne les liens entre

ces deux problématiques et précise en quoi l’approche scientifique retenue permet d’adresser le problème sociétal considéré. En outre, cette introduction propose une grille de lecture qui explicite la structure de ce manuscrit.

De la planification avec préférences à l’interopérabilité des organisations

La planification est le processus cognitif qui précède l’action. Elle consiste à choisir et séquencer un ensemble d’actions par anticipation de leurs résultats afin d’atteindre le mieux possible des objectifs fixés [66]. La plupart des actions du quotidien sont suffisamment simples ou intuitives pour ne pas devoir être planifiées explicitement. Néanmoins face à des situations inhabituelles ou à des tâches complexes à réaliser (problèmes intractables, nombreuses contraintes à considérer, pluralité d’acteurs impliqués. . . ), il peut s’avérer nécessaire, voire indispensable, de planifier avant d’agir. De plus, pour résoudre les problèmes de planification les plus complexes (par exemple ceux adressés par la communauté scientifique de la planification

automatisée), il est nécessaire de recourir à la puissance de calcul d’une machine.

Les techniques de planification automatisée peuvent être utilisées pour résoudre de nombreux problèmes comme par exemple le déplacement de robots autonomes, la gestion des pistes de décollage d’un aéroport, l’organisation d’un projet industriel, le choix de l’itinéraire proposé par un GPS ou encore la création de plans d’action pour la gestion de crise.

(23)

La majorité des problèmes de planification admettent plusieurs plans solutions. En conséquence, deux stratégies de résolution sont envisageables. La première consiste à se contenter de n’importe quelle solution (résolution d’un problème de

satisfaisabilité) tandis que la seconde consiste à chercher une bonne solution voire

la meilleure au regard d’un ensemble de préférences (résolution d’un problème

d’optimisation). Une préférence représente un élément de la solution que le décideur

souhaiterait voir satisfait dans la mesure du possible sans que sa violation ne remette en cause la validité de la solution considérée. Les préférences peuvent être vues à la fois comme des contraintes faibles du problème et comme des points de vue selon lesquels les solutions sont évaluées les unes par rapport aux autres. En reprenant l’exemple de l’itinéraire de GPS précédemment mentionné, une préférence pourrait représenter le souhait d’un décideur de passer par un ville spécifique, d’emprunter l’autoroute ou encore de privilégier les trajets à faible coût.

L’originalité de cette étude consiste à utiliser un formalisme issu du domaine de l’aide à la décision multicritère (à savoir un modèle maut couplé à une intégrale de Choquet) pour modéliser les préférences du/des décideurs. Ce formalisme, qui se base sur des préférences floues, est particulièrement intéressant puisqu’il peut être utilisé pour améliorer le pouvoir expressif du langage formel de référence de la planification avec préférences et permet de représenter avec précision les préférences des décideurs. De plus, des techniques issues du domaine de l’aide à la décision permettent de modéliser des préférences selon ce formalisme uniquement à partir d’informations préférentielles opérationnelles. Par conséquent, des experts opéra-tionnels peuvent représenter leurs préférences sans avoir à renseigner explicitement les paramètres du modèle mathématique sous-jacent.

Les travaux réalisés ont une portée générique et peuvent être utilisés pour résoudre n’importe quel problème de planification avec préférences. Ils sont particulièrement indiqués dans les cas où les préférences du problème peuvent être complexes à appré-hender. Cette étude a été appliquée à la problématique de la gestion de crise dans le domaine de la sécurité des citoyens (sécurité civile, catastrophes naturelles, acci-dents industriels. . . ). Lorsqu’une telle crise survient, de nombreuses organisations (services publics tels que les pompiers ou la gendarmerie, associations, entreprises...) sont mobilisées pour y apporter une réponse collective. Le management de cette réponse est généralement placé sous la responsabilité d’une cellule de crise composée

(24)

des différentes parties prenantes de la gestion de crise : un ou plusieurs décideurs assistés par des représentants des partenaires mobilisés et des experts pertinents au vu de la situation. Dans la plupart des cas, les organisations mobilisées sont relativement hétérogènes (au niveau culturel, fonctionnel et technologique) et peu, voire pas du tout, entrainées à travailler ensemble. Ceci génère inévitablement des problèmes de collaboration (définition des objectifs difficile, partage d’informations incomplet, mauvaise coordination des acteurs...) qui peuvent grandement limiter l’efficacité des actions entreprises sur le terrain ; et ce malgré la compétence certaine et indéniable des différents partenaires mobilisés. En cela, les résultats de cette étude peuvent être utilisés pour construire des plans d’action collaboratifs de gestion de crise qui sont susceptibles d’adresser ces difficultés.

La problématique de la gestion de crise intéresse à la fois la société Thales Communi-cations and Security et le laboratoire de Génie Industriel de l’Ecole des Mines d’Albi qui collaborent, plus ou moins étroitement, sur ce sujet depuis 2006. Cette collabo-ration a été initialisée dans le cadre du projet ANR ISyCri (Interopérabilité des Systèmes en situation de Crise) [137, 139] puis s’est poursuivie par l’intermédiaire de ces travaux de thèse et du projet européen DRIVER (FP7/607798).

Les trois questions présentées ci-dessous sont étudiées dans ce manuscrit. Les réponses qui y sont apportées constituent les contributions scientifiques de cette étude comme mentionné sur la figure 2.

Comment utiliser le modèle maut avec une intégrale de Choquet pour améliorer le pouvoir expressif du langage formel utilisé en planification avec préférences ?

Comment résoudre des problèmes de planification avec préférences formalisés à l’aide d’un modèle maut et d’une intégrale de Choquet ?

Comment construire des plans d’action collaboratifs pour supporter l’interopé-rabilité d’un ensemble d’organisations lors de la gestion d’une crise ?

(25)

Grille de lecture du manuscrit

Ce manuscrit est structuré selon une approche de type « du plus générique au par-ticulier ». En conséquence, les chapitres 1, 2 et 3 ont été rédigés sans considération particulière pour le domaine de la gestion de crise alors que le chapitre 4 lui est entièrement consacré. De manière à cependant guider le lecteur sensible à cette problématique applicative, des paragraphes spécifiquement dédiés au domaine de la gestion de crise jalonnent les trois premiers chapitres. Ces derniers sont identifiables par leur mise en forme particulière (cf. figure 1).

Domaine de la gestion de crise

. . .

Figure 1 – Mise en exergue d’éléments liés au domaine de la gestion de crise La figure 2 présente les relations entre les différentes sections de ce manuscrit et précise leurs rôles respectifs. Les chapitres 1 et 2 constituent des états de l’art mis au service des chapitres 3 et 4 ; lesquels exposent les contributions et les résultats de cette étude.

Le chapitre 1 est un état de l’art qui présente les problèmes de la planification dite classique (section 1.1) et de la planification avec préférences (section 1.2). Ces deux problèmes sont introduits à l’aide d’un exemple illustratif (inspiré de l’un des problèmes de référence utilisé par la communauté de la planification) avant d’être décrits formellement.

Le chapitre 2 est également un état de l’art. Il s’intéresse à l’un des formalismes employés en aide à la décision multicritère pour modéliser des préférences. Après avoir brièvement présenté le domaine de l’aide à la décision multicritère (section 2.1), il introduit la Théorie de l’Utilité Multi-Attribut (section 2.2) ainsi que l’intégrale de Choquet (section 2.3). Pour finir, une méthode permettant de construire des modèles de préférences sur la base de ces éléments est décrite (section 2.4). Le chapitre 3 propose quant à lui une approche originale pour la planification avec préférences qui s’appuie sur les éléments du domaine de l’aide à la décision multicritère présentés dans le chapitre 2. Il s’intéresse dans un premier temps au

(26)

gain de pouvoir expressif lié à l’utilisation d’un modèle maut et d’une intégrale de Choquet pour représenter les préférences d’un problème de planification (section 3.1). Un algorithme et des heuristiques permettant de résoudre ce type de problèmes sont ensuite proposés (section 3.2). Ces résultats ont conduit à l’implémentation du planificateur ChoPlan dont les performances ont été comparées à celle des planificateurs de l’art (section 3.3).

Enfin, le chapitre 4 s’intéresse à la question de l’interopérabilité des organisations lors de la réponse à une crise. Après avoir introduit les enjeux associés à cette problématique (section 4.1), il présente une démarche de construction de plans d’action collaboratifs (section 4.2). Cette dernière a été utilisée pour implémenter un prototype logiciel dont le fonctionnement est illustré à l’aide d’un exemple qui met en œuvre un scénario de grandes inondations en Europe du Nord (section 4.3).

Th is d o c u m e nt m a y no t b e re p ro d u c e d , m o d ifi e d , a d a p te d , p u b lis he d , t ra ns la te d , in a ny w a y, in w ho le o r i n p a rt o r d isc lo se d t o a th ird p a rty w ith o u t th e p rio r w rit te n c o ns e nt o f T ha le s -© T ha le s 20 15 A ll rig ht s re se rv e d . SECTOR – 04/2015 2.1 2.2 2.3 2.4 1.1 1.2 3.1 3.2 3.3 4.1 4.2 4.3 Résultats et Prototype Contributions Etat de l’art

(27)

(28)

Planification avec préférences

Ce chapitre s’intéresse au problème de la planification qui consiste à élaborer des plans d’action afin d’atteindre des objectifs préalablement définis. Il se focalise prin-cipalement sur la problématique de la planification avec préférences dont le but est de produire des plans qui maximisent la satisfaction des décideurs. En conséquence, ce chapitre propose une introduction à la planification (cf. section 1.1) ainsi qu’un état de l’art du domaine de la planification avec préférences (cf. section 1.2). Les deux parties qui composent ce chapitre sont construites symétriquement de sorte à se répondre l’une à l’autre. Ainsi, la section 1.1.1 présente les principaux concepts de la planification tandis que la section 1.2.1 traite de la notion de préférence. De même, les sections 1.1.2 et 1.2.2 introduisent respectivement le problème de la planification classique et celui de la planification avec préférences. Les sections 1.1.3 et 1.2.3 s’intéressent quant à elles aux langages formels utilisés pour représenter et résoudre les problèmes de planification. Finalement, la section 1.2.4 présente les principaux algorithmes de planification avec préférences de l’art.

(29)

1.1 De la problématique de la planification

La planification automatisée est un domaine de l’Intelligence Artificielle qui consiste à choisir et séquencer un ensemble d’actions par anticipation de leurs résultats afin d’atteindre des objectifs fixés [66]. Si cette tâche est souvent triviale pour un certain nombre de problèmes du quotidien, elle demeure néanmoins complexe lorsque les problèmes considérés sont fortement combinatoires. Cette section introduit le modèle conceptuel de la planification (cf. section 1.1.1) ainsi que le problème dit de planification classique (cf. section 1.1.2). De plus, le langage formel utilisé pour spécifier et résoudre les problèmes de planification est également présenté (cf. section 1.1.3).

1.1.1 Modèle conceptuel de la planification

La planification a pour objectif de faire évoluer un système Σ dans un état initial connu vers un état final satisfaisant un ensemble d’objectifs fixés. Dans son acception la plus générique, l’activité de la planification englobe à la fois l’élaboration du plan d’action considéré ainsi que l’exécution de ce dernier. Le modèle conceptuel de la planification formalise l’activité de la planification et a été proposé dans l’ouvrage de référence Automated Planning : Theory and Practice [66]. Il repose sur les interactions de trois composants : un planificateur, un contrôleur et un système Σ (cf. figure 1.1a).

1. Le planificateur construit le plan d’action en se basant sur la description du système Σ, de son état initial et des objectifs à atteindre.

2. Le contrôleur exécute le plan qui lui est transmis produisant ainsi des actions sur le système. Il s’appuie sur les informations (éventuellement incomplètes) qu’il possède sur l’état actuel du système.

3. Le système Σ évolue en réponse aux actions qui sont exécutées par le contrôleur ou aux événements extérieurs qui surviennent.

Le contrôleur est généralement supposé assez robuste pour gérer les différences qui peuvent exister entre le monde réel et son modèle Σ. Si cette hypothèse n’est pas acceptable, le contrôleur peut retourner un statut d’exécution au planificateur permettant à ce dernier de produire un nouveau plan lorsque la situation observée

(30)

et la situation attendue divergent. Le terme de planification dynamique est alors employé puisque la création du plan et son exécution deviennent intimement liées (cf. boucle de rétroaction sur la figure 1.1b).

Planificateur Système Σ Contrôleur Plans Actions Observations Evénements Description de Σ Etat initial Objectifs

(a) Version statique

Planificateur Système Σ Contrôleur Plans Actions Observations Evénements Description de Σ Statut d’exécution Etat initial Objectifs (b) Version dynamique

Figure 1.1 – Modèle conceptuel de la planification [66]

D’un point de vue formel, le modèle des systèmes à événements discrets [40] est utilisé pour spécifier et capturer l’évolution dynamique du système Σ.

Définition 1.1 - Système à événements discrets [40]

Un système à événements discrets est un quadruplet Σ = (S, A, E, γ) avec : • S un ensemble fini ou récursivement énumérable d’états ;

• A un ensemble fini ou récursivement énumérable d’actions ; • E un ensemble fini ou récursivement énumérable d’événements ; • γ : S × A × E → P(S) une fonction de transition d’états.

Modéliser Σ comme un système à événements discrets revient à caractériser ce dernier par l’état s ∈ S dans lequel il se trouve. Une évolution du système Σ

correspond donc à un changement d’état s → s0. Dans le modèle conceptuel de la

planification, la transition d’un état s vers un état s0est représentée par l’application

(31)

neutre sont introduits afin de décrire des transitions provoquées uniquement par des actions ou des événements. Dans de tels cas, les notations γ(s, a) et γ(s, e) sont utilisées en lieu et place de γ(s, a, ) et γ(s, α, e). Il convient de remarquer que bien que les actions et les événements contribuent tous deux à l’évolution du système, leur sémantique diffère. Les actions sont contrôlées par les personnes en charge de l’exécution du plan alors que les événements sont des transitions qui échappent à leur contrôle. Ces derniers peuvent être causés par la dynamique interne du système ou encore par l’évolution de l’environnement du système.

La fonction γ précise l’ensemble des états s0 vers lesquels le système Σ est susceptible

d’évoluer à partir de l’état s en réponse à une action a, un événement e ou un couple action/événement (a, e). Ainsi, la taille de l’ensemble retourné par γ(s, a) notée |γ(s, a)| fournit plusieurs informations quant à l’exécution de a dans s. Si |γ(s, a)| > 0, l’action a est dite applicable dans s puisque le système Σ peut évoluer

vers au moins un état s0lors de l’exécution de a dans s. De plus, si |γ(s, a)| ≤ 1 alors

l’application de a dans s est dite déterministe. En effet, si l’action a est exécutable

et qu’elle est exécutée dans s, Σ ne peut alors évoluer que vers un unique état s0.

Le modèle conceptuel de la planification [66] propose également huit hypothèses pour caractériser les différentes classes de problèmes de planification.

Hypothèse H1 (Σ fini). L’ensemble S des états de Σ est fini.

Hypothèse H2 (Σ complètement observable). L’état du système Σ est

en-tièrement observable. Par conséquent, les observations du système sur lesquelles s’appuie le contrôleur sont toutes parfaites.

Hypothèse H3 (Σ déterministe). Le système Σ est déterministe si pour tout

état s, pour toute action a et pour tout événement e, |γ(s, a, e)| ≤ 1. Ainsi, en réponse à un couple action/événement (a, e) applicable dans s, le système Σ ne

peut évoluer que vers un unique état s0.

Hypothèse H4 (Σ statique). L’ensemble E des événements de Σ est vide. Hypothèse H5 (Plans séquentiels). Un problème de planification admet des

plans solutions représentés par une séquence d’actions finie ordonnée linéairement, il n’y a donc aucune parallélisme dans les plans solutions.

(32)

Hypothèse H6 (Objectifs restreints). Les objectifs à atteindre ne portent que

sur l’état final du système. Ainsi, une solution est une séquence de transitions

d’états qui aboutit à un état final s ∈ SG avec SGl’ensemble des états dans lesquels

les objectifs sont vérifiés.

Hypothèse H7 (Temps implicite). Les actions et événements n’ont aucune

durée intrinsèque, les transitions sont donc considérées instantanées.

Hypothèse H8 (Planification statique). Aucun mécanisme de planification

dynamique n’est mis en œuvre.

1.1.2 Problème de la planification classique

Le terme planification classique fait référence à la classe des problèmes obtenue lorsque les huit hypothèses du modèle conceptuel de la planification sont considérées simultanément. L’étude de ce problème est fondamentale puisque la majorité des problèmes de planification sont définis par extension de ce dernier à l’image de la problématique de la planification avec préférences.

Problème de la planification classique [66] Étant donné un système à

événements discrets Σ = (S, A, γ), un problème de planification classique est

défini par le triplet P C = (Σ, s0, SG) où s0 est un état initial et SG ⊂ S est

l’ensemble des états qui vérifient les objectifs G.

Une solution de P C est une séquence d’actions ha1, · · · , ani qui correspond à

une séquence d’états hs0, · · · , sni telle que :

s1 = γ(s0, a1), · · · , sn= γ(sn−1, an) et sn ∈ SG.

Exemple illustratif

Pour illustrer la problématique de la planification classique, une version simplifiée du problème Rovers [42] est utilisée. Dans ce problème, des robots réalisent une exploration planétaire. Ils doivent prendre des photographies et récolter des

(33)

échan-tillons de sols ou de roches de plusieurs lieux différents. La récolte des échanéchan-tillons de sols et de roches est modélisée par deux actions distinctes dans ce problème pour préciser que les robots utilisent des outils différents dans les deux cas. L’exemple considéré ici s’intéresse au cas d’un unique robot N 1 qui évolue à travers six lieux Li différents. L’ensemble { robot, planète } constitue le système Σ et évolue en fonction des actions A du robot : déplacement d’un lieu à un autre, prise de photographies et récolte d’échantillons. Tous les lieux ne sont pas accessibles les uns des autres en raison de la présence d’obstacles infranchissables par le robot. En outre, pour pouvoir prendre la photographie d’un lieu L1, le robot doit soit se situer dans L1 soit dans un lieu L2 à partir duquel L1 est visible. Dans l’état

initial s0 (représenté sur la figure 1.2), le robot est en L5, des échantillons de

sols sont présents dans tous les lieux mais seuls les lieux L2, L3 et L6 possèdent des échantillons de roches. Enfin, les objectifs G sont notés [S4], [R3] et [P1] et désignent respectivement l’acquisition d’un échantillon de sol de L4, l’acquisition d’un échantillon de roche de L3 et la prise d’une photographie de L1.

Cet exemple sera enrichi (utilisation de plusieurs robots...) tout au long de ce chapitre pour présenter les mécanismes de la planification ainsi que pour illustrer le problème de la planification avec préférences (cf. sections 1.2.2, 1.1.3 et 1.2.3).

L1 S L4 S L2 S R L3 S R L5 S N1 L6 S R N1 R Li Visibilité & Accessibilité Robot S Sol Roche Lieu Visibilité

Figure 1.2 – Situation initiale de l’exemple Rovers

Le plan 1 est l’une des solutions du problème considéré. En effet, la séquence d’actions proposée est valide au regard de la fonction de transition γ et les objectifs [S4], [R3] et [P1] sont tous atteints dans l’état final.

(34)

Plan 1

1. Naviguer avec N1 de L5 vers L3

2. Prélever échantillon roche avec N1 en L3 3. Naviguer avec N1 de L3 vers L5

4. Naviguer avec N1 de L5 vers L4

5. Prélever échantillon sol avec N1 en L4 6. Photographier L1 avec N1 en L4

Figure 1.3 – Plan 1 : Solution de l’exemple Rovers

Du fait de l’objectif d’illustration de cette section, l’exemple retenu a été volontai-rement choisi de sorte à être très facile à appréhender et à résoudre. Les problèmes de planification sont généralement plus complexes et fortement combinatoires à l’image de celui mentionné dans l’annexe B.5. Pour prendre la mesure de cette complexité, un exemple inspiré des problématiques rencontrées dans les plateformes de transports multimodales est considéré. Dans ce problème, on cherche à déplacer un certain nombre de containers d’un point de stockage à un autre. Les containers peuvent être empilés les uns sur les autres formant ainsi des piles. Chaque point de stockage peut abriter un certain nombre de piles. Pour résoudre le problème, plusieurs robots capables de soulever et transporter des containers sont mis à dis-position. Lorsque ce problème est instancié avec cinq points de stockage, trois piles par point de stockage, trois robots et cent containers, le système peut se trouver

dans approximativement 10277 états différents [66]. A titre de comparaison, l’âge

de l’univers est estimé à 1017 secondes [19] et l’univers observable serait constitué

de 1080 atomes [46].

1.1.3 Langage formel pour la planification

Afin de standardiser la représentation des problèmes de planification, le langage pddl (Planning Domain Definition Language) a été proposé en 1998 par la commu-nauté de la planification [107]. Le pddl est couramment utilisé et a connu quatre évolutions majeures depuis sa création [49, 61, 64, 91]. Cette section a pour but de présenter en détails les mécanismes de la planification. A cette fin, la syntaxe du pddl et la sémantique qui y est associée sont introduits. Les éléments de

(35)

sémantique présentés traitent de la planification classique et de l’exploitation de variables numériques. En outre, ils sont illustrés à l’aide de l’exemple introduit dans la section 1.1.2.

Syntaxe pour la planification

Le pddl a été élaboré en s’inspirant de plusieurs travaux antérieurs dont notamment les langages strips [99] et adl [114], le formalisme ucpop [11] ainsi que le situation

calculus [106, 120]. Par ailleurs, le pddl présente de nombreuses similarités avec la

logique du premier ordre. Les notions de prédicats, d’arité, de formules, d’atomes, de littéraux et de formules closes qui sont utilisées dans la suite de cette section sont définies dans l’annexe A qui présente la syntaxe de la logique du premier ordre. L’ensemble des états caractérisant un problème de planification ne peut générale-ment pas être énuméré explicitegénérale-ment au vu de sa grande taille. Pour contourner ce problème et représenter de façon compacte les problèmes de planification, les états sont donc caractérisés à l’aide de formules de la logique du premier ordre dont les variables peuvent éventuellement être typées. Ainsi, pour formaliser un problème de planification en pddl, les principaux éléments à renseigner sont des prédicats et des objets, des actions, une situation initiale et des objectifs et contraintes. La notation bnf [4] est utilisée pour décrire avec précision et sans ambigüité la syntaxe du pddl [63, 91]. Quelques extraits du langage pddl sont exposés ci-dessous. Des exemples complets sont disponibles dans l’annexe B.

(:objects N1 - robot

L1 - lieu L2 - lieu L3 - lieu

L4 - lieu L5 - lieu L6 - lieu

)

(36)

(:predicates

(presence_echantillon_sol ?x - lieu) (presence_echantillon_roche ?x - lieu) (visible ?x - lieu ?y - lieu)

(accessible ?x - lieu ?y - lieu) (position ?x - robot ?y - lieu)

(possede_echantillon_sol ?x - robot ?y - lieu) (possede_echantillon_roche ?x - robot ?y - lieu) (possede_photographie ?x - robot ?y - lieu) )

Figure 1.5 – Prédicats de l’exemple Rovers

(:action Naviguer

:parameters (?x - robot ?y - lieu ?z - lieu) :precondition (and

(position ?x ?y) (accessible ?y ?z)) :effect (and

(not (position ?x ?y)) (position ?x ?z)) )

Figure 1.6 – Action Naviguer de l’exemple Rovers

(:init (presence_echantillon_sol L1) (presence_echantillon_sol L2) (presence_echantillon_roche L2) ... (visible L1 L2) (visible L2 L1) (accessible L1 L5) (accessible L5 L1) ... (position N1 L5) )

(37)

(:goal (and

(possede_echantillon_sol N1 L4) (possede_echantillon_roche N1 L3) (possede_photographie N1 L1) ))

Figure 1.8 – Objectifs pour l’exemple Rovers

Sémantique pour la planification classique

La syntaxe du pddl définit l’ensemble des symboles utilisables pour formaliser un problème de planification. Il convient à présent d’introduire la sémantique qui y est associée afin de préciser le sens de ces symboles. Cette dernière permet d’expliquer comment les problèmes de planification sont résolus d’un point de vue conceptuel. En conséquence, elle constitue une étape fondamentale de la résolution des problèmes de planification.

Les définitions présentées sont issues de la version 2.1 du pddl [61]. Elles ont été simplifiées afin de se limiter aux seuls éléments utilisés dans le cadre de cette étude. En particulier, les aspects temporels formalisés dans [61] n’ont pas été retenus. La notion d’instance d’un problème de planification est présentée par la définition 1.2. Les définitions 1.3 et 1.4 précisent la structure des états S du système Σ considéré. Les définitions 1.5 à 1.9 s’intéressent quant à elles aux actions du problème. Finalement, la notion de plan valide est introduite à l’aide des définitions 1.10 à 1.13.

Définition 1.2 - Instance d’un problème de planification [61]

Une instance d’un problème de planification classique IC est une paire (Dom, P rob)

définie telle que :

• Dom = (R, A) est le domaine de planification. Il est constitué d’un ensemble de prédicats R et d’un ensemble d’actions A.

• P rob = (O, s0, G) est le problème de planification. Il est constitué d’un

ensemble d’objets O et des formules s0 et G qui décrivent respectivement

(38)

L’objet Dom constitue une caractérisation générique de l’instance IC (prédicats considérés et actions réalisables) tandis que P rob précise les caractéristiques

spéci-fiques de l’instance IC (état initial et objectifs du problème). Par conséquent, un

domaine de planification peut être utilisé par plusieurs problèmes de planification différents définissant alors autant d’instances de planification.

L’ensemble AtmIC des atomes de IC est formé par l’application des prédicats du

domaine R aux objets du problème O (en respectant l’arité des prédicats).

Les notions de structure d’état et de valeur de vérité d’une formule dans un état sont à présent introduites. Considérées conjointement, ces deux définitions permettent de décrire l’ensemble des états dans lequel un système à événements discrets Σ peut se trouver sans pour autant devoir les énumérer explicitement.

Définition 1.3 - Structure d’un état [61]

Étant donné une instance IC, un état s est défini par la donnée d’un ensemble

Atm ∈ P(AtmIC). Atm est appelé l’état logique de s et constitue un sous-ensemble

des atomes de IC.

Définition 1.4 - Valeur de vérité d’une formule [61]

Soit un état s = (Atm), la formule atomique φ est vraie dans s si et seulement si

φ ∈ Atm. La notation s |= φ est utilisée pour dénoter que φ est vraie dans s.

La valeur de vérité d’une formule φ quelconque (qui peut contenir des connecteurs et quantificateurs logiques comme précisé dans l’annexe A) est déterminée à partir des valeurs de vérité des formules atomiques qui la composent en utilisant l’interprétation usuelle de la logique du premier ordre [37].

Dans l’exemple de la section 1.1.2, le lieu L4 est accessible et visible depuis le

lieu L5 (cf. figure 1.2). Soit s0 = (Atm0) l’état initial du problème et φ1, φ2 les

formules atomiques qui correspondent aux prédicats pddl (accessible L4 L5) et

(visible L4 L5) . Les formules φ1 et φ2 sont vraies dans s0 (φ1, φ2 ∈ Atm0) ce qui

(39)

De la même façon que les prédicats sont instanciés avec les objets du problème, les actions d’une instance sont successivement transformées en actions aplanies puis en actions closes (cf. définition 1.5 à 1.7). Une fois ces transformations effectuées, il devient possible d’introduire les notions d’applicabilité d’une action dans un état et de résultat de l’exécution d’une action dans un état (voir définitions 1.8 et 1.9).

Définition 1.5 - Structure d’une action [61]

Une action a ∈ A d’une instance IC est un triplet (ˆa, Prea, Effa) avec :

• ˆa : le nom de l’action

• Prea : une formule qui décrit les préconditions de a

• Effa : une formule qui décrit les effets de a

Définition 1.6 - Actions aplanies [61]

Étant donné une instance IC, l’ensemble des actions aplanies F A est défini comme

l’ensemble contenant initialement A et construit de la façon suivante :

Tant que F A contient une action a ayant une formule avec un quantificateur, remplacer a par une version dans laquelle la formule quantifiée (Q (v1, · · · , vk) P ) est remplacée par la conjonction (si Q est le quantificateur universel) ou la disjonction (si Q est le quantificateur existentiel) des atomes obtenus par toutes

les substitutions possibles des objets de IC dans les variables v1, · · · , vk du

prédicat P .

Afin d’illustrer le mécanisme de génération des actions aplanies, l’action a1

Panorama_planète ?x - robot ?y - lieu est considérée. Pour que a1 soit

exé-cutable, le robot doit se trouver dans un lieu à partir duquel tous les lieux de la

planète sont visibles. Ainsi, Prea1 est représenté par la formule :

(and (position ?x ?y) (forall (?z - lieu) (visible ?y ?z)))

Après aplanissement de a1, la forme de Prea1 devient :

(and (position ?x ?y) (visible ?y L1) (visible ?y L2)

(40)

Définition 1.7 - Actions closes [61]

Soit une instance IC et une action aF ∈ F A formée par aplanissement de a ∈ A.

L’ensemble des actions closes de a noté GAa est formé en réalisant l’ensemble des

substitutions possibles de variables de aF par des objets de IC. De plus, l’ensemble

GA = S a∈A

GAa est l’ensemble des actions closes de IC.

Par construction (et par définition de la syntaxe du pddl [63]), si aG est une action

close, alors EffaG est une conjonction de littéraux. Une action close peut donc être

vue comme un quadruplet ( ˆaG, PreaG, AddaG, DelaG) avec :

• ˆaG : le nom de l’action et des objets substitués aux variables de a

• GPreaG : les préconditions de aG représentées par une formule close

• AddaG : les effets positifs de aG constitués de l’ensemble des atomes qui sont

considérés comme des littéraux positifs dans EffaG

• DelaG : les effets négatifs de aG constitués de l’ensemble des atomes qui sont

considérés comme des littéraux négatifs dans EffaG

L’action a2 Naviguer ?x - robot ?y - lieu ?z - lieu présentée sur la

fi-gure 1.6 est utilisée pour illustrer la construction des actions closes. Dans le cadre

de l’exemple de la section 1.1.2, l’ensemble GAa2 contient 36 actions (1 robot

× 6 lieux × 6 lieux) dont notamment l’action Naviguer N1 L3 L4. L’atome (position N1 L4) est l’unique effet positif de cette action de même que l’atome (position N1 L3) est l’unique effet négatif de cette dernière.

Définition 1.8 - Applicabilité d’une action [61]

Étant donné une action a ∈ GA, a est applicable dans s si s |= Prea.

Définition 1.9 - Execution d’une action [61]

Soit un état s et une action a ∈ GA. Si a est applicable dans s, la fonction

γ : S × GA → S définit l’état résultant de l’exécution de a dans s par : γ(s, a) = (Atm \ Dela) ∪ Adda

L’action a3 Naviguer N1 L5 L3 a pour préconditions GP rea3 = φ4 ∧ φ5 avec

(position N1 L5) et (accessible L5 L3) les prédicats correspondants respec-tivement à φ4 et φ5. Puisque s0 |= φ4 et s0 |= φ5, il en résulte que a3 est exécutable

(41)

dans l’état initial s0. De plus, Dela3 et Adda3 sont respectivement caractérisés

par les atomes (position N1 L5) et (position N1 L3) . Ainsi, l’exécution de

a3 dans s0 conduit à un état s1 dans lequel le robot N 1 n’est plus dans le lieu L5

mais dans le lieu L3.

A présent que les mécanismes de transition d’états ont été précisés, il est possible de définir la notion de plan exécutable et de plan valide.

Définition 1.10 - Structure d’un plan [61]

Étant donné une instance IC, un plan de IC est une séquence hˆa1, · · · , ˆani telle

que pour tout i ∈ {1, · · · , n}, ˆai est le nom d’une action close.

Définition 1.11 - Trajectoire d’un plan [64]

Étant donné un plan x = hˆa1, · · · , ˆani, la séquence d’états hs0, · · · , sni définie telle que s1 = γ(s0, a1), · · · , sn= γ(sn−1, an) est appelée trajectoire de x.

Définition 1.12 - Exécutabilité d’un plan [61]

Soit une instance IC et un plan x = hˆa1, · · · , ˆani de trajectoire hs0, · · · , sni. Si

pour tout i ∈ {1, · · · , n}, ai est applicable dans si−1 alors x est exécutable.

Définition 1.13 - Validité d’un plan [61]

Soit une instance IC et un plan x = hˆa1, · · · , ˆani de trajectoire hs0, · · · , sni. Le

plan x est valide s’il est exécutable et si sn|= G.

Le lecteur peut vérifier que le plan 1 présenté dans la section 1.1.2 est valide. En effet, il vérifie les objectifs présentés par la figure 1.8 tout en étant exécutable par

rapport à la situation initiale s0 (voir figures 1.2 et 1.7).

Sémantique pour les expressions numériques

Cette section enrichit la sémantique de la planification classique avec la notion d’expressions numériques. Ces dernières permettent de représenter des problèmes de planification plus complexes et sont notamment utilisées dans le chapitre 3. Les définitions 1.14 à 1.21 complètent la sémantique introduite par les définitions 1.2 à 1.13 en lui ajoutant les éléments liés aux expressions numériques. Pour illustrer

(42)

ces nouvelles notions, l’exemple précédent est étendu en considérant plusieurs robots et en tenant compte de la quantité d’énergie qu’ils consomment lors de leurs déplacements. Afin de simplifier le problème, il sera considéré que chaque déplacement consomme 10 unités d’énergie. De plus, un robot est autorisé à se déplacer uniquement s’il a consommé moins de 75 unités d’énergie depuis le début de la mission.

Définition 1.14 - Instance d’un problème de planification [61]

Une instance d’un problème de planification avec expressions numériques IN est

redéfinie par extension de la définition 1.2 en ajoutant un ensemble F de fonctions

numériques à Dom = (F, R, A).

L’ensemble PNEIN des expressions numériques primitives de IN est formé par

l’application des fonctions F du domaine aux objets O du problème (en respectant

l’arité des fonctions). La dimension de IN notée dim est le nombre d’expressions

numériques qui peuvent être construites dans IN et vaut |PNEIN|.

Il convient de ne pas confondre les fonctions de F qui retournent un réel et les

fonctions de la logique du premier ordre qui retournent un objet de IN. De telles

fonctions existent en pddl [91] mais ne sont pas décrites ici puisqu’elles ne sont pas considérées dans le cadre de cette étude.

Pour prendre en compte cette modification, un vecteur de valeurs numériques doit maintenant être associé à chaque état. De plus, les formules peuvent à présent contenir des opérateurs de comparaison (=, ≥, ≤, >, <, ...).

Définition 1.15 - Structure d’un état [61]

Par extension de la définition 1.3, un état s est une paire (Atm, v) avec v ∈ Rdim

⊥

où R⊥ = R ∪ {⊥} et ⊥ désigne une valeur non définie.

Soit deux variables e1 et e2 correspondant à l’énergie consommé par les robots

N 1 et N 2 lors de leurs déplacements. Chaque état s contient à présent un vecteur v = (e1, e2) qui précise les valeurs de e1 et e2 dans s.

(43)

Définition 1.16 - Normalisation d’une formule [61]

Étant donné une instance IN de dimension dim, une formule φ et un vecteur

V ∈ Rdim_{, soit Ind : PNE}

IN → {1, · · · , dim} une fonction qui associe à toute

expression numérique de IN l’indice d’un élément de V .

La forme normalisée de φ par rapport à V notée N (φ)[V ] est obtenue en substituant

chaque expression numérique primitive f de φ par le réel VInd(f ).

Définition 1.17 - Valeur de vérité d’une formule [61]

Soit un état s = (Atm, v), la valeur de vérité d’une formule φ est définie par extension de la définition 1.4 à partir de N (φ)[V := v] la forme normalisée de φ dans s en utilisant l’interprétation usuelle des opérateurs de comparaison.

Soit (<= (energy ?x - robot) 75) la condition supplémentaire de

déplace-ment des robots. Dans le cas de l’action a3 Naviguer N1 L5 L3, cette formule φ6

s’écrit (<= (energy N1) 75) où (energy N1) représente l’expression numérique primitive qui associe au robot N 1 sa consommation d’énergie. Ainsi, la forme

normalisée de φ6 par rapport à un vecteur v = (e1, e2) est (<= e1 75) puisque

Ind(energy N1) = 1. La précondition φ6 est vraie dans un état s si s |= N (φ6)[v]

ce qui s’interprète naturellement par e1 ≤ 75.

Les actions peuvent modifier les valeurs numériques des états par l’intermédiaire d’effets numériques qui sont constitués de l’opérateur d’affectation assign, d’une expression numérique primitive notée lvalue et d’une expression numérique (ex-pression arithmétique quelconque dont les termes sont des réels ou des ex(ex-pressions numériques primitives) notée rvalue [61].

Définition 1.18 - Formule d’affectation [61]

La formule d’affectation associée à un effet numérique est formée en remplaçant l’opérateur d’affectation assign par l’opération arithmétique = et en annotant l’expression numérique primitive lvalue d’un symbole « prime ».

La forme normalisée d’une formule d’affectation φ par rapport à (V0, V ) notée

N (φ)[V0_{, V ] est obtenue en substituant chaque expression numérique primitive f}

de φ par le réel V_{Ind(f )}0 _{si f est annotée d’un symbole « prime » et par le réel V}Ind(f )

(44)

A titre d’exemple, soit l’effet numérique (assign (energy ?x - robot) (+ (energy ?x - robot) 10)) qui représente la consommation d’énergie des robots lors de leurs

déplacements. Dans le cas de l’action a3, l’expression numérique primitive lvalue

est (energy N1) et l’expression numérique rvalue est (+ (energy N1) 10) . La

formule d’affectation φ7 associée à cet effet numérique est (= (energy N1)’ (+

(energy N1) 10)) . Par conséquent, la forme normalisée de φ7 par rapport à (v0, v)

avec v0 = (e0₁, e0₂) et v = (e1, e2) s’exprime (= e1’ (+ e1 10)) ce qui s’interprète

par l’affectation e0₁ = e1+ 10.

Définition 1.19 - Actions closes [61]

Une action close est redéfinie par extension de la définition 1.7 à l’aide d’un quintuplet ( ˆaG, PreaG, AddaG, DelaG, NEfaG) avec :

• NEfaG : les effets numériques de aG constitués de l’ensemble des formules

d’affectation associées aux effets numériques de EffaG

Définition 1.20 - Applicabilité d’une action [61]

La notion d’applicabilité d’une action a ∈ GA dans un état s est redéfinie par extension de la définition 1.8 en ajoutant la condition suivante : aucune expression numérique primitive n’est annotée d’un symbole « prime » plus d’une fois lors de

la construction des effets numériques de NEfa.

Définition 1.21 - Execution d’une action [61]

La fonction γ : S ×GA → S qui précise l’état s0 = (Atm0, v0) résultant de l’exécution

d’une action a ∈ GA dans un état s = (Atm, v) est redéfinie par extension de la définition 1.9 par l’ajout de la fonction NF obtenue par composition des fonctions

de l’ensemble { NFφ : Rdim⊥ → Rdim⊥ | φ ∈ NEfa} avec :

• NFφ(v) = v0 où v_{Ind(f )}0 est défini tel que N (φ)[V0 := v0, V := v] soit satisfaite si f est une expression numérique primitive annotée d’un symbole « prime » ; et v0

Ind(f ) = vInd(f ) dans le cas contraire.

La condition supplémentaire d’applicabilité permet à toutes les affectations de valeurs numériques d’une action d’être consistantes entre elles. Il en résulte que la

loi de composition des fonctions est commutative pour l’ensemble des fonctions NFφ

ce qui permet de construire NF sans se soucier de l’ordre dans lequel les fonctions

(45)

La définition 1.21 peut sembler complexe de prime abord mais son interprétation est relativement naturelle. En effet, la fonction NF est définie de sorte que les affectations de variables réalisées coïncident avec l’effet numérique considéré. Ainsi, dans un problème avec deux robots N 1 et N 2 dont les consommations d’énergie

sont nulles dans l’état initial s0, cette définition garantit que l’exécution de l’action

a3 (à savoir un déplacement de N 1) conduit effectivement à un état s1 dans lequel

e1 = 10 et e2 = 0.

A l’exception des considérations sur les expressions numériques, cette première section s’est focalisée sur le problème de la planification classique. Ce dernier est parfois trop limité pour modéliser correctement certains problèmes réels. Dans ce cas, il est nécessaire de considérer des classes de problèmes plus complexes qui ne reposent que sur un sous-ensemble des hypothèses du modèle conceptuel de la planification (cf. section 1.1.1). Ces nouvelles classes de problèmes forment autant de sous-domaines de la planification à l’image de la planification temporelle qui ne considère pas H7, de la planification dans l’incertain qui ne considère pas H2, H3 et H5 ou encore de la planification avec préférences qui ne considère ni H1 ni H6.

Domaine de la gestion de crise

L’élaboration d’une réponse à une situation critique par les membres d’une cellule de crise constitue un problème de planification. En effet, à partir d’une situation initiale connue (la situation de crise), les décideurs se fixent des objectifs puis essayent de déterminer un plan d’action permettant de les atteindre. Le plan solution séquence les différentes actions qui doivent être mises en œuvres par les partenaires mobilisés afin de résoudre la crise. Il précise à ces derniers ce qu’ils doivent faire mais les laisse entièrement autonomes quant à la réalisation des actions qui leurs sont assignées (principe de subsidiarité).

Les définitions proposées s’appuient sur les notions d’objet, d’état, d’action et d’expressions numériques. En gestion de crise, un état représente simplement l’état du monde à un instant donné et constitue donc une description de l’ensemble des éléments qu’il est pertinent de considérer au vu du problème à

(46)

résoudre. Par exemple, pour représenter qu’un bâtiment b0 est en feu au début

de la crise, il est possible de créer un objet bâtiment b0et un prédicat (enF eu ?b)

(pouvant caractériser n’importe quel bâtiment). L’atome (enF eu b0) qui est

obtenu par combinaison de ces deux éléments appartient alors à l’état initial s0.

L’action « Eteindre incendie » des pompiers pourrait être utilisée pour passer

de l’état s0 à un état s1 qui ne contiendrait plus l’atome (enF eu b0). Un autre

exemple d’action que les pompiers peuvent être amenés à exécuter consiste à inonder une infrastructure en eau propre dans le but de la protéger (métro, bâtiment. . . ) en cas d’inondation. Par ailleurs, les expressions numériques peuvent être employées pour dénombrer les ressources gérées par la cellule de crise à l’image de denrées alimentaires par exemple.

Pour finir, il convient de discuter de la pertinence des hypothèses du modèle conceptuel de la planification pour le domaine de la gestion de crise. L’approche de planification avec préférences retenue dans cette étude (cf. section 1.2) ne considère pas les hypothèses H1 et H6. Par ailleurs, les hypothèses H2, H3 et H4 ne sont pas toujours compatibles avec la gestion de crise puisque le système Σ n’est pas nécessairement observable, déterministe ou statique. Elles peuvent néanmoins être considérées si l’hypothèse H8 est relaxée. En effet, si de nouveaux éléments concernant l’état de Σ sont portés à la connaissance des décideurs lors de l’exécution du plan solution (violation de H2) ou qu’une action ne produit pas les effets attendus (violation de H3) ou encore qu’un événement inattendu survient (violation de H4), il est possible, dans le cas où l’hypothèse H8 est relaxée, de ré-exécuter le processus de planification pour adresser ces problèmes (approche de type planification dynamique, voir section 4.1.2 pour une discussion à ce propos). De plus, les hypothèses H5 et H7 peuvent également être considérées trop restrictives pour le domaine de la gestion de crise. Il est néanmoins possible de les relaxer en s’appuyant sur des mécanismes d’ordonnancement et des mécanismes de planification temporelle (voir discussion section 4.2.3). Ainsi, des plans d’action pour la gestion de crise peuvent être construits en ne considérant que les hypothèses H2, H3 et H4 dans le cas où une démarche de planification dynamique est utilisée. Dans le cadre de cette étude, l’hypothèse H7 est également retenue puisqu’aucun mécanisme de planification temporelle n’est considéré.

(47)

1.2 De la problématique de la planification avec préférences

La thématique des préférences a été très étudiée par la communauté de l’Intelligence Artificielle [32, 44, 67, 117, 121]. Il apparait clairement que les préférences d’un décideur peuvent être modélisées avec beaucoup de diversité. En conséquence, un grand nombre de formalismes au pouvoir expressif varié ont été proposés dans la littérature. Le domaine de la planification automatisée ne déroge pas à cette règle et plusieurs approches ont été suggérées pour résoudre les problèmes de planification avec préférences.

La planification avec préférences se distingue de la planification classique par l’utilisation d’objectifs dits étendus. Ces derniers surclassent les objectifs restreints considérés dans le cadre de l’hypothèse H6 et sont présentés dans la section 1.2.1. Le problème de la planification avec préférences est ensuite introduit dans la section 1.2.2. La section 1.2.3 précise quant à elle les divers formalismes utilisés pour représenter ce type de problèmes. Elle se focalise principalement sur la sémantique du pddl3 qui est le formalisme le plus employé mais présente également quelques langages alternatifs. Pour finir, les méthodes et algorithmes de l’art employés pour résoudre les problèmes de planification avec préférences sont exposés dans la section 1.2.4.

1.2.1 Objectifs étendus et préférences

Les objectifs étendus peuvent être de natures différentes. On distingue les objectifs (ou contraintes fortes) qui doivent nécessairement être vérifiés par les solutions du problème des préférences (ou contraintes faibles) qui peuvent ne pas être vérifiées par un plan solution.

Il est possible de subdiviser à nouveau les objectifs en deux catégories. Les objectifs

finaux correspondent exactement aux objectifs restreints de l’hypothèse H6. Des objectifs de trajectoires peuvent également être considérés afin de contraindre les

séquences d’action solutions d’un problème. Ils permettent par exemple d’interdire les transitions vers certains états spécifiques ou encore de forcer le système à passer par un état avant un autre. . .