• Aucun résultat trouvé

4.2 La décomposition du problème

4.2.1 La décomposition hiérarchique

Nous allons voir plusieurs différences fondamentales entre les architectures existantes et essayer de voir lesquelles nous semblent répondre de façon plus pertinente à notre problématique. Nous allons également étudier leur composition et voir quelles sont leurs limites.

La décomposition des ressources ou des objectifs

On retrouve deux types de décomposition : • celles qui sont centrées sur les ressources, • celles centrées sur les objectifs.

1

Un blackboard est une structure partagée accessible en lecture et en écriture par plusieurs modules permettant ainsi de partager des informations.

4.2. LA DÉCOMPOSITION CHAPITRE 4. LA STRATÉGIE DANS LES JEUX

Galvao Madeira(2007) a choisi la première pour construire son approche STRADA en s’in-spirant de la structure militaire pour créer des ensemble d’unités avec plusieurs niveaux de commandement. Nous avons mis en avant le besoin de flexibilité des jeux 4X, qui peut s’appli-quer sur les actions mises en place, comme le propose Galvao Madeira (2007), mais également sur les ressources allouées. Il semble cependant que les groupes d’unités dans STRADA soient fixes. Une telle structure rend difficile la possibilité de faire varier la quantité de ressources allouées à chaque tâche, et nécessite un niveau de coordination supplémentaire complexe.

A l’inverse une structure hiérarchique des objectifs poursuivis guide la décision, et l’allocation des ressources s’effectue dans un deuxième temps en fonction des besoins des objectifs sélection-nés. Cette structure supporte une prise de décision flexible sur les actions mises en place, sans contraindre la répartition des ressources qui peut alors s’adapter aux décisions. Nous allons donc nous intéresser davantage aux travaux qui utilisent une décomposition des objectifs poursuivis.

Les décompositions fixes et les décompositions variables

Certains travaux proposent une décomposition en plusieurs niveaux prédéfinis. Ceux-ci sont souvent inspirés de la décomposition militaire bien connue en niveaux stratégique, tactique et opérationnel présentée dans la section 3.1.1. C’est le cas du Multi-Tiered AI Framework (MTAIF) proposé parKent(2004) et de l’architecture ADAPTA deBergsma(2008). Cependant nous avons déjà déterminé que dans cette thèse nous nous intéressons uniquement à la décision stratégique et que nous souhaitons la simplifier en lui apportant également une structure hiérar-chique. Ces approches n’utilisent pas de hiérarchie à l’intérieur de leur niveau stratégique, elles ne nous intéressent donc pas dans cette partie.

Sharma et al. (2007) propose une décomposition hiérarchique dont le principe consiste en plusieurs niveaux composés d’un unique module qui font le lien entre le niveau qui leur est directement supérieur et le niveau qui leur est directement inférieur. Chaque niveau reçoit un objectif pour lequel il construit un plan de sous-objectifs à l’aide d’une base d’actions et d’un planificateur. Le niveau va alors effectuer le plan en fournissant le sous-objectif à réaliser au niveau inférieur. La propagation se fait jusqu’au niveau le plus bas qui crée alors un plan d’actions directement exécutables dans le monde virtuel du jeu. L’architecture ne permet pas d’envisager la parallélisation d’actions, pourtant indispensable à la mise en place d’une stratégie, à cause de sa hiérarchie linéaire (chaque module possède un seul module directement supérieur et un seul module directement inférieur). De plus elle suppose que tous les objectifs pouvant être sélectionnés nécessitent un nombre identique de niveaux de décomposition puisque le nombre de modules est prédéfini. Cette hypothèse ne semble présenter aucune justification et limite inutilement la flexibilité du système.

Nous allons nous intéresser aux travaux proposant une décomposition des objectifs plus flexible, notamment en n’imposant aucune contrainte de profondeur de hiérarchie.

Les architectures proposant une décomposition variable des objectifs

Les architectures qui évoluent dans leur profondeur ou largeur en fonction des besoins utilisent en général une base de méthodes, correspondant à des façons de résoudre un objectif, dans laquelle ils vont chercher pour créer une hiérarchie d’objectifs. Ces méthodes se composent de sous-objectifs, nécessitant la création d’un nouveau niveau hiérarchique, et d’actions applicables dans le monde virtuel, qui signifient que le niveau le plus bas est atteint. Plusieurs formes de méthodes existent :

• Johnson(2006) propose d’utiliser les FSM pour représenter la résolution d’un objectif. Les états du FSM correspondent alors à des sous-objectifs ou à des actions applicables dans le monde virtuel. Les transitions permettent de passer d’un état à l’autre en fonction de conditions sur l’état du monde et/ou du résultat retourné par l’état du FSM (succès ou échec). Lorsqu’aucune transition n’est déclenchée à la fin de la réalisation d’un état, le résultat retourné par l’état sélectionné est remonté dans la hiérarchie.

• Hinrichs and Forbus (2007) et Laagland (2008) utilisent les Hierarchical Task Network (HTN). La résolution d’un objectif est décrite par un task network tel qu’expliqué par Erol et al.(1994). Un objectif est décrit par un ensemble de tâches qui doivent toutes être effectuées pour atteindre l’objectif. Un ensemble de contraintes vient également définir comment exécuter les tâches. Dans ces contraintes nous retrouvons notamment des con-traintes d’ordre entre les tâches et des concon-traintes sur l’état du monde.

Le case-based planning (CBP) utilisé par le système DARMOK (Mehta et al.,2008;Virmani et al., 2008), de même que le dynamic scripting (DS) comme les HTN, définit plusieurs plans pour atteindre un objectif. Afin de choisir lequel choisir, les méthodes utilisées sont différentes : • Les HTN utilisent un ensemble de préconditions qui doivent être vraies pour permettre d’exécuter le plan. Les plans sont définis dans un ordre qui détermine celui choisi si plusieurs ont leurs pré-conditions satisfaites.

• Le CBP associe un contexte d’application à chaque plan et c’est celui dont se rapproche le plus le contexte courant qui est choisi. Des conditions doivent également rester satisfaites pendant l’application du plan, ce sont les alive-conditions.

• Pour le DS, un poids est associé à chaque méthode et évolue en fonction de la réussite de son utilisation. Ce poids vient ensuite influencer la probabilité que la méthode soit choisie. Ainsi plus une méthode est efficace, plus elle aura de chance d’être choisie. Il faut cependant noter que ce choix n’est pas effectué au moment où l’objectif est choisi, mais de façon régulière. Lorsque l’objectif est choisi, une seule méthode déjà sélectionnée est disponible.

Nous avons donc des objectifs qui peuvent être résolus avec plusieurs méthodes décomposées en sous-objectifs. Les FSM telles que Johnson (2006) les utilise ont l’avantage de regrouper

4.2. LA DÉCOMPOSITION CHAPITRE 4. LA STRATÉGIE DANS LES JEUX

les différentes méthodes pour résoudre l’objectif et la manière de les choisir. Les méthodes ne sont pas découpées mais imbriquées les unes aux autres pour les représenter ensemble et permettre la sélection d’un sous-objectif. Ce formalisme présente également l’avantage de pro-poser un contrôle graphique facile à prendre en main. Les task networks permettent également une représentation graphique mais nécessite d’en avoir un par méthode et d’y ajouter des pré-conditions. En revanche ils permettent l’exécution en parallèle de plusieurs états, ce qui n’est pas permis dans les FSM telles que les utiliseJohnson(2006).