Les automates de Mealy - Quelques classes de strat´egies

5.2 Quelques classes de strat´egies

5.2.4 Les automates de Mealy

La seconde famille de stratégies automate que nous définissons, est celle se basant sur l’idée des automates de Mealy. Un rappel de la définition des automates de Mealy a été fait dans le chapitre 1, page 15.

En résumé, on peut dire que les automates de Mealy sont de simples automates d’états finis avec sorties. La sortie de l’automate dépend de l’état courant de l’automate et des entrées qui lui sont présentées, via une fonction de sortie. Les transitions d’états, quant à elles, dépendent des valeurs d’entrées de l’automate et de son état courant.

Ce type d’automates est lui aussi bien adapté à la définition de stratégies pour le dilemme itéré du prisonnier pour les mêmes raisons que les automates de Moore. Ils ne nécessitent guère plus d’aménagements que les automates de Moore, même si ces aménagements sont légèrement différents. Les automates de Mealy, comme les automates de Moore sont eux aussi souvent utilisés pour la représentation des stratégies pour le dilemme du prisonnier dans des approches d’algorithmes génétiques ou évolutionnaires, [Fog93], [Fog95, chapitre 5, section 3, page 205].

La seule différence entre un automate de Moore et un automate de Mealy réside dans la définition d’une transition. Nous utilisons le même codage en adaptant la représentation pour prendre en compte la définition nouvelle de la fonction de sortie.

En fait, désormais la sortie de l’automate est intimement liée à la fonction de transitions. On peut dire que les deux fonctions n’en font plus qu’une, une transition pouvant être désormais comprise comme :

(( étant donné l’état courant et une entrée, la sortie est faite par une carte particulière, puis l’état courant de l’automate est modifié. ))

Nous utilisons donc les transitions dans ce sens plus simple à exprimer. Pour représenter une telle transition il nous faudra donc deux caractères, un pour désigner la sortie de l’automate et un autre pour désigner le nouvel état que l’automate doit atteindre.

Pour ce qui est de l’amorce de la partie, nous utilisons exactement le même principe que celui que nous avons utilisé pour les automates de Moore, à savoir des transitions d’amor¸cage.

Le nom d’une stratégie est donc créé par concaténation : 1. du préfixe mealy ; 2. du caractère _ ; 3. de la valeur de M ; 4. du caractère _ ; 5. de la valeur de O ; 6. du caractère _ ;

7. des transitions d’amorce à utiliser pour chaque coup de l’amorce de la partie. Chaque transition est représentée par un caractère pour la carte à jouer, suivi d’un autre caractère correspondant à l’état vers lequel l’automate doit se déplacer, en considérant que l’état de départ est l’état courant. La chaˆıne représentant ces transitions comporte donc 2 max(M,O) caractères représentant autant de transitions amor¸cant l’automate.

Ces transitions ne sont pas des transitions d’états classiques dans le sens où elles n’utilisent pas d’entrées. Elles correspondent plus à un changement d’états, un déplacement, qu’à une transition au sens formel du terme.

8. de la fonction des transitions de l’automate. Les transitions sont ici dans l’ordre croissant des états de départ, puis pour chaque état de départ dans l’ordre lexicographique des représentations des entrées de l’automate, comme nous l’avons défini page 82 pour les stratégies de la famille memory.

En utilisant cet ordre, une transition peut être représentée simplement par le caractère correspondant à la sortie de l’automate et à l’état d’arrivée : l’état de départ et l’entrée sont déductibles de la position dans la chaˆıne de caractères.

Cette convention permet donc de repr´esenter la fonction de transition de l’automate par une chaˆıne de (ss2n × 2(M+O)) caract`eres.

Une seule et même chaˆıne de caractères est utilisée pour les points 7 et 8. Cette chaˆıne est donc composée de (2 max(M,O) + 2n × 2(M+O)_{) caractères.}

Le nombre d’états n’est pas spécifié dans le nom de la stratégie mais il peut être déduit simplement en utilisant M, O, et la longueur de la chaˆıne de caractères finale.

La stratégie mealy 1 1 c0c1d1c1d1c0d0d0d0, par exemple, est une stratégie de la famille mealy. Elle appartient à la classe des stratégies utilisant en entrée la valeur de la dernière carte jouée par le joueur et la dernière carte jouée par l’adversaire.

L’automate qui détermine son comportement est constitué de deux états. L’alphabet de sortie, comme pour les automates de la famille moore et tous ceux de la famille mealy, est ∆ = {C,D}. L’alphabet des symboles d’entrées Σ est alors :

Σ = {cc,cd,dc,dd}

Par exemple, l’entrée cd est présentée à l’automate quand le joueur vient de jouer C, c’est-à-dire qu’il a coopéré et que l’adversaire a trahi dans le dernier coup. L’automate change d’état à chaque coup.

Plus formellement, l’ensemble des ´etats est

Q = {0,1} l’alphabet des symboles d’entr´ee est

Σ = {cc,cd,dc,dd} l’alphabet des symboles de sortie est

∆ = {C,D} la fonction de sortie de l’automate est

λme : (0,cc) 7→ C (0,cd) 7→ D (0,dc) 7→ C (0,dd) 7→ D (1,cc) 7→ C (1,cd) 7→ D (1,dc) 7→ D (1,dd) 7→ D

la fonction des transitions est

δ : (0,cc) 7→ 1 (0,cd) 7→ 1 (0,dc) 7→ 1 (0,dd) 7→ 1 (1,cc) 7→ 0 (1,cd) 7→ 0 (1,dc) 7→ 0 (1,dd) 7→ 0 mealy 1 1 c0c1d1c1d1c0d0d0d0 J’utilise un automate à deux états pour déterminer ce que je dois jouer.

1. Au premier coup je joue C puis l’automate passe dans l’´etat 1 , 2. ensuite si l’automate est dans l’´etat 0 et

– si j’ai joué C et qu’il a joué C alors je joue C et l’automate passe dans l’état 1 – si j’ai joué C et qu’il a joué D alors je joue D et l’automate passe dans l’état 1 – si j’ai joué D et qu’il a joué C alors je joue C et l’automate passe dans l’état 1 – si j’ai joué D et qu’il a joué D alors je joue D et l’automate passe dans l’état 1

Si l’automate est dans l’´etat 1 et

– si j’ai joué C et qu’il a joué C alors je joue C et l’automate passe dans l’état 0 – si j’ai joué C et qu’il a joué D alors je joue D et l’automate passe dans l’état 0 – si j’ai joué D et qu’il a joué C alors je joue D et l’automate passe dans l’état 0 – si j’ai joué D et qu’il a joué D alors je joue D et l’automate passe dans l’état 0 D’où finalement on obtient la partie intéressante du génotype en concaténant le tout :

C 0 || C 1 D 1 C 1 D 1 | C 0 D 0 D 0 D 0

L’automate correspondant est donc :

cd/D cc/C dd/D cc/C dc/D dd/D dc/C C ₀ ₁ cd/D

Chaque classe de stratégies de la famille mealy, permet donc de définir Nmealy(M,O,n) stratégies complètement différentes, puisque chaque caractère de la chaˆıne du génotype d’une stratégie peut être choisi pour certains dans l’ensemble {c,d} et pour d’autres dans l’ensemble des caractères représentant les états :

Nmealy(M,O,n) = (2n)max(M,O)×

(2n)2(M+O)n (5.7)

Nous avons maintenant défini toutes les familles de stratégies utilisées pour faire des simulations sur des classes complètes. Avant d’examiner les expériences qui ont été faites, nous allons décrire les relations qui existent entre les différentes familles ainsi que quelques classes particulières.

Dans le document Modèles et simulations informatiques des problèmes de coopération entre agents (Page 108-111)