Travaux voisins - Belief-HATP : planification avec croyances mutuelles

Belief-HATP : planification avec croyances mutuelles

4.1 Travaux voisins

La planification avec croyances mutuelles a été utilisée dans plusieurs approches. Dans le chapitre 2 nous avons abordé l’approche par planification réactive, et plus précisément le

mod`ele STEAM [Tambe 97] qui utilise la th´eorie de l’intention jointe afin de construire des

plans pour la résolution de problème multi-agents. Nous avons pu constater que ce modèle utilise une structure hiérarchisée appelée TOP (Team Oriented Plan) pour l’élaboration de ses plans. Nous avons également établi que le modèle fait une distinction entre les tâches jointes appelées “opérateurs d’équipe” et les tâches individuelles appelées “opérateurs individuels”. Cette distinction va servir au moment d’instancier le plan. En effet, pour instancier un opérateur et vérifier ses préconditions, il est nécessaire de connaˆıtre son type. Si c’est un opérateur d’équipe,

cela implique qu’il doit être décomposé en sous-tâches ; si c’est un opérateur individuel, cela

implique que l’agent concerné va utiliser ses croyances pour réaliser la tâche. Quand tous les opérateurs individuels d’un opérateur de groupe sont réalisés, les agents impliqués reconstruisent une croyance mutuelle consistante pour conclure que l’opérateur de groupe est réalisé.

Dans cette approche, trois éléments importants sont à noter :

– Chaque agent a une croyance individuelle. La croyance mutuelle est l’union des croyances des diff´erents agents.

– Utilisation des croyances individuelles pour la réalisation des tâches individuelles. – Utilisation d’une structure hiérarchique pour la construction du plan.

Une autre approche est l’approche dite planification continue [Brenner 09], [Clement 03].

Elle repose sur l’id´ee du (active knowledge-gathering [Knoblock 95]), o`u l’agent ne planifie pas

seulement pour atteindre un but, mais également pour acquérir les informations nécessaires à

la r´ealisation de ce but. Ce type de planification utilise l’entrelacement entre planification et ex´ecution [Ambros-Ingerson 90], ce qui lui permet de palier au manque d’information en passant

d’une phase `a une autre jusqu’`a l’obtention d’un plan complet et correct.

Ce type de planification utilise un langage appel´e MAPL pour (Multi-Agent Planning

Language) [Brenner 03], qui est dérivé du langage PDDL. Ce langage décrit le domaine de planification qui inclut des actions physiques, des actions d’observations et des actions de communications. Sa représentation du monde inclut les croyances propres et les croyances mutuelles des agents.

La représentation du monde s’appuie sur les variables d’états multi-valeurs [Bäckström 93].

Dans ce mod`ele, chaque agent a sa propre base de croyances, et pour avoir une croyance mutuelle, il faut qu’il y ait une correspondance entre toutes les croyances individuelles de tous les agents.

Le modèle a été également étendu à la notion de unknown qui permet de spécifier si un agent

Dans cette approche, on a enrichi le mod`ele d’action par la notion (Know if), qui est une condition de re-planification qui permet de d´etecter la connaissance ou la non-connaissance d’une

certaine information, permettant ainsi `a un agent de raisonner sur la r´ealisation d’une action.

La figure 4.1 illustre un exemple de d´eclaration d’une action dans le langage MAPL. Dans

cette action, l’agent a besoin de connaˆıtre si la porte est ouverte ou non, information qui est

repr´esent´ee par “:replan (KIF ?a (doorstate ?d))”. Il faut savoir que cette condition n’intervient

pas directement lors de la planification. Elle est utilisée lors de l’exécution pour permettre à

l’acteur de l’action de re-planifier si la condition n’est pas respectée. Dans notre exemple si la porte n’est pas ouverte ou si l’agent ne connaˆıt pas l’état de la porte, il peut alors re-planifier pour ouvrir la porte ou bien observer l’état de cette dernière.

1 ( :action move A

2 : a g e n t ( ? a − a g e n t )

3 : p a r a m e t e r s ( ? t o ₋ l o c a t i o n )

4 : v a r i a b l e s ( ? from − l o c a t i o n ?d − door )

5 : r e p l a n ( KIF ? a ( d o o r s t a t e ?d ) )

6 : p r e c o n d i t i o n ( and ( pos ? a : ? from )

7 ( e n t r a n c e ?d ? from ) ( e n t r a n c e ?d ? t o ) )

8 : e f f e c t ( pos ? a : ? t o )

9 )

Figure 4.1 – Exemple de d´eclaration d’une action avec l’approche planification continue

L’algorithme pour la planification continue se d´ecompose en trois phases :

1. (Re-)planification pour atteindre un état but à partir d’un état initial. Cette phase utilise

un algorithme classique de recherche en avant.

2. Exécution des actions produites par la phase précédente.

3. Á l’exécution, l’algorithme compare l’état du monde courant avec l’état du monde estimé

en se servant des observations que l’agent peut faire.

Cet algorithme a été étendu au cas du multi-agent en utilisant un algorithme distribué qui permet la communication entre agents. L’idée est la suivante : durant la planification d’un agent, s’il rencontre un état bloquant, il envoie aux autres agents un message sous forme d’un but pour

d´ebloquer la situation et cela jusqu’`a construire un plan complet.

Cette approche a été testée sur un scénario dans le cadre d’un dialogue entre agents

[Brenner 08] [Kruijff 07]. Dans le sc´enario on suppose que nous avons deux agents MrChips

et MrData.MrChips peut se d´eplacer et prendre des objets, MrData peut aussi se d´eplacer et

ouvrir les portes. Le but de MrData est d’avoir un caf´e et le but de MrChips est de satisfaire

MrData. La figure 4.2 illustre le plan produit et ex´ecut´e par les deux agents.

A l’ex´ecution, MrChips ne connaˆıt pas la position du caf´e alors il fait intervenir MrData

pour obtenir l’information (ligne 3). Puis, MrChips se dirige vers la porte et observe qu’elle est

ferm´ee. De nouveau il fait intervenir MrData pour lui ouvrir la porte (lignes 5 `a 7). MrChips

Figure 4.2 – Exemple de dialogue entre agents en utilisant la planification continue

Dans l’approche de la planification continue, nous devons noter quatre points importants : – Chacun des agents a sa croyance individuelle. La croyance mutuelle est une fusion entre les croyances individuelles de chaque agent.

– La notion de variable d’état à valeur multiple, qui permet de créer les croyances

individuelles des agents.

– La notionunknown qui permet de mod´eliser le fait qu’un agent ignore une information.

– La condition de re-planification (Know if) qui permet de g´en´erer un but de recherche

d’information.

– Le mod`ele des actions de communication et la notion de copr´esence qui permettent le passage des informations entre agents.

Pour la conception d’un planificateur avec croyance mutuelle et d’après ce que nous avons pu noter des différentes approches, le planificateur doit intégrer certaines propriétés qui peuvent améliorer l’interaction homme-robot.

– Il doit intégrer le fait que chaque agent doit avoir ses croyances individuelles. Cela permettra au planificateur de ne plus raisonner que sur les croyances du robot, mais également de prendre en compte les croyances des humains partenaires pour pouvoir produire des plans compréhensibles par ces derniers, même en cas de croyances individuelles divergentes.

– Il doit compl´eter son domaine de planification par des actions de communication, qui vont permettre la transmission d’information en cas d’absence d’information ou divergence de croyances entre le robot et les humains. Cela permettra ´egalement de rendre plus clair les plans produits par le robot.

– Il doit intégrer le fait qu’un agent connaisse ou non une information, ce qui permettra au robot de générer des buts pour la recherche d’information, et de connaˆıtre les raisons de son échec, mais également de pouvoir renseigner l’humain quand ce dernier en a besoin.

Dans la suite du document nous présentons le modèle de planification avec gestion des croyances multiples et règles sociales proposé et mis en œuvre pour l’interaction homme-robot.

Dans le document Interaction décisionnelle Homme-Robot : planification de tâche pour un robot interactif en environnement humain (Page 79-82)