4.4 Impl´ementation
4.5.2 Backgammon
Le probl`eme pour le jeu de backgammon est le suivant : gagner le plus
de parties possibles parmi 7 contre un adversaire jouant avec la fonction
d’´evaluation suivante :
– Plus le nombre de sauts `a effectuer par son adversaire pour finir est
grand, meilleure est la position. Ceci rend le joueur glouton puisque
pour augmenter la distance de l’autre il faut capturer ses pions.
– Moins il y a de positions o`u l’adversaire peut lui prendre un pion,
meilleure est la situation. Ceci rend le joueur prudent puisqu’il cherche
`
a ne pas exposer ses pions.
Le crit`ere d’arrˆet est le suivant : un agent heuristique ne peut pas
d´epasser un total de 100 appels au testeur, il ne peut pas non plus d´epasser
50 appels sans avoir progress´e.
Heuristiques isol´ees
La premi`ere comparaison est celle entre des populations constitu´ees d’un
seul agent. Cette comparaison permet d’´evaluer chaque type d’agent
indivi-duellement avant de l’´evaluer en collectivit´e. Le r´esultat correspond au gain
produit par la recherche pris en moyenne sur les 100 ex´ecutions effectu´ees
pour chaque population.
classe moyenne (´ecart type)
Genetic 1.249 (0.979)
Recuit 1.167 (0.877)
Tabou 0.708 (0.577)
Direct 0.730 (0.629)
Exhaustif 0.643 (0.409)
Deux classes d’heuristiques semblent se distinguer : les heuristiques
Ex-haustif Direct et Tabou d’une part et les heuristiques Genetic et Recuit
d’autre part. Ce premier r´esultat est int´eressant car il semble sugg´erer
que parmi les diff´erences existant entre les diff´erentes heuristiques, la
ca-ract´eristique la plus discriminante est la mani`ere dont les points `a explorer
sont produits. En effet, Genetic et Recuit tirent des points au hasard dans
l’ensemble des voisinages alors que les trois autres construisent un seul
voi-sinage `a chaque tour.
Ce crit`ere semble plus discriminant que certaines hypoth`eses qui peuvent
sembler plus naturelles comme la distinction habituelle entre heuristique `a
base de population (Genetic) et heuristique fond´ee sur un unique individu.
Populations homog`enes
Les collectifs homog`enes sont des populations de recherche qui sont tous
de la mˆeme classe. Pour chaque heuristique, nous avons men´e les exp´eriences
avec des populations de 1, 4 et 5 agents.
Recherches en parall`ele Nous commen¸cons par des populations
ho-mog`enes en parall`ele.
classe 1 4 5
Genetic 1.249 (0.979) 2.223 (1.668) 2.277 (1.603)
Recuit 1.167 (0.877) 2.250 (1.796) 2.347 (1.705)
Tabou 0.708 (0.577) 1.533 (1.739) 1.434 (1.359)
Direct 0.730 (0.629) 1.146 (0.730) 1.276 (0.982)
Exhaustif 0.643 (0.409) 1.046 (0.724) 1.068 (0.437)
Le gain de performance est normal puisque nous comparons les meilleurs
points trouv´es par une population de recherche : ainsi un nouvel agent ne
peut qu’am´eliorer la meilleure solution.
La ligne de l’heuristique Tabou illustre un probl`eme de notre syst`eme.
En effet, notre syst`eme contient de nombreuses sources de non-d´eterminisme
dont les effets peuvent ˆetre importants. Pour des valeurs proches comme dans
le cas pr´esent, le hasard peut provoquer ce type de r´esultat aberrant. Nous
discutons en fin de chapitre de nos pistes pour r´egler ce type de probl`eme.
Recherches en concurrence Nous donnons maintenant les r´esultats de
nos exp´eriences quand les interactions sont activ´ees dans ces populations de
recherche. Les agents sont maintenant tous inform´es de la d´ecouverte d’un
progr`es et int`egrent ce progr`es dans leur recherche.
classe 1 4 5
Genetic 1.249 (0.979) 2.189 (1.669) 2.095 (1.369)
Recuit 1.167 (0.877) 2.683 (2.020) 3.680 (2.448)
Tabou 0.708 (0.577) 1.760 (2.024) 1.663 (1.722)
Direct 0.730 (0.629) 1.576 (1.645) 1.465 (1.428)
Exhaustif 0.643 (0.409) 1.634 (1.603) 1.428 (1.370)
On observe une tendance g´en´erale qui montre encore une fois un gain `a
syner-gie entre agents de recherche dans le cas o`u ceux-ci cherchent de mani`ere
concurrente.
L’autre point int´eressant est que la performance diminue pour certaines
heuristiques quand on passe de 4 `a 5 agents. Cela montre qu’il n’est pas
tou-jours bon d’ˆetre nombreux si l’interaction est activ´ee car cela peut provoquer
le partage de solutions peu prometteuses qui handicapent la recherche
en-suite.
Finalement, le nombre optimal d’agents change selon l’heuristique, cela
pose la question du nombre optimal sur l’ensemble des entiers pour chaque
heuristique et en particulier, on peut se demander si on gagne toujours `a
rajouter un agent de recuit simul´e.
Populations h´et´erog`enes
Les collectifs h´et´erog`enes sont constitu´es d’agents faisant partie de
classes diff´erentes. A travers ces exp´eriences, nous cherchons `a savoir si il
existe une relation entre la qualit´e d’une heuristique lorsqu’elle est utilis´ee
seule et sa qualit´e dans un cadre collectif. Pour cela, pour chaque heuristique
nous comparons sa qualit´e seule (Seul), la qualit´e de la population contenant
un agent de chaque classe (Tous) et finalement la qualit´e de la population
o`u nous avons retir´e l’agent de la classe ´etudi´ee (Sans).
Comme nous ´etudions maintenant des populations d’agents, nous
d´etaillons les r´esultats selon que les recherches sont parall`eles ou
concur-rentes.
Recherches en parall`ele Ces r´esultats correspondent aux populations
sans communications.
classe Seul Sans Tous
Genetic 1.249 (0.979) 1.482 (1.237) 2.114 (1.386)
Recuit 1.167 (0.877) 1.541 (1.203) 2.114 (1.386)
Direct 0.730 (0.629) 1.794 (1.411) 2.114 (1.386)
Tabou 0.708 (0.577) 1.756 (1.506) 2.114 (1.386)
Exhaustif 0.643 (0.409) 1.790 (1.483) 2.114 (1.386)
Ces r´esultats correspondent `a l’intuition puisque la population priv´ee
d’un bon agent perd en qualit´e alors que la perte d’un mauvais agent d´egrade
moins la performance de la population.
Recherches en concurrence Les r´esultats en concurrence correspondent
au cas o`u les agents envoient un message `a chaque progr`es r´ealis´e. Les autres
agents peuvent alors int´egrer ces progr`es au cours de leur recherche.
classe Seul Sans Tous
Genetic 1.249 (0.979) 1.742 (1.606) 2.345 (1.925)
Recuit 1.167 (0.877) 1.521 (1.420) 2.345 (1.925)
Direct 0.730 (0.629) 2.103 (1.806) 2.345 (1.925)
Tabou 0.708 (0.577) 2.028 (1.602) 2.345 (1.925)
Exhaustif 0.643 (0.409) 2.074 (1.821) 2.345 (1.925)
Nous observons ici une tendance g´en´erale qui montre un gain `a
l’in-teraction dans ces populations de recherche h´et´erog`enes. Il s’agit ici d’une
synergie de recherche observ´ee : nous avons des r´esultats qui montrent qu’un
gain de performance est obtenu dans un syst`eme qui ne diff`ere du syst`eme de
r´ef´erence que par des interactions suppl´ementaires. On peut alors affirmer
que nous avons ici un tout sup´erieur `a la somme de ses parties.
Par ailleurs, nous observons que l’introduction de notre interaction ne
semble pas changer l’ordre entre les heuristiques ce qui sugg`ere que les
per-formances individuelles d’agents sont corr´el´ees `a leurs performances en
col-lectivit´e.
Dans le document
Intégration de l' émergence au sein des systèmes multi-agent <br />Une étude appliquée à la recherche heuristique
(Page 123-126)