Le protocole de publication

5.3 Eleusis+Nobel

5.3.3 Le protocole de publication

L’analogie entre le joueur qui se proclame Sage et le scientifique qui publie, soulevée en 5.1, se précise puisque le joueur qui pense avoir trouvé une règle cachée a désormais la possibilité d’éditer et de publier un ensemble de clauses logiques décrivant sa théorie (voir 6.2.3.3), les soumettant ainsi au jugement de ses pairs. Pour destituer un sage, il faut donc trouver un contre-exemple à sa théorie et le publier sous la forme d’une réfutation. Les gains P et R sont immédiats et fixés selon les règles du jeu Nobel (P = 1, R = 2). Cette

fa¸con d’interagir pour établir une théorie et la soumettre à une validation correspond au protocole d’apprentissage interactif défini au Chapitre 4 et étend l’apprentissage à partir de requêtes.

5.4 Synth`ese

Le jeu d’ Éleusis a été mis au point pour simuler le phénomène de décou- verte d’une unique règle cachée déterminant les séquences de cartes pouvant être jouées par les participants. Le jeu Nobel propose un protocole de publication inspiré de la théorie des jeux et permettant d’étudier l’évolution des stratégies d’exploration et de publication dans une communauté de chercheurs. En fusionnant ces deux jeux, Éleusis+Nobel offre un environnement de type « jeu sérieux » pour illustrer les différents paradigmes d’apprentissage présen- tés au Chapitre 2, mettre en oeuvre la formalisation proposée au chapitre 4, et fournir une plate-forme robuste d’expérimentation.

Je vais maintenant présenter la modélisation et l’implantation de ce prototype au Chapitre 6 avant de présenter les résultats obtenus au Chapitre 7.

Chapitre 6

Implantation

Les instruments ne sont que des théories ma- térialisées

Gaston Bachelard.

L

a mod´site l’implantation d’un certain nombre de fonctionnalités. En outre, leselisation qui a fait l’objet de ce document jusqu’à présent néces- cadres formels d’apprentissage sur lesquels je me suis appuyé pour spécifier le mode d’interaction entre les acteurs d’une résolution de problème distribuée utilisent naturellement les termes et les concepts du paradigme agent. En ef- fet, ces paradigmes décrivent comment un agent apprenti interagit avec son environnement pour recueillir des données et tester ses hypothèses. L’exten- sion que j’ai présentée étend cette interaction à une communauté d’agents et introduit un deuxième niveau d’interaction entre les apprentis eux-mêmes. Ce capitre, qui constitue ma deuxième contribution, montre comment la distribu- tion des requêtes d’un apprenti sur une communauté d’apprentis permet de rendre opérationnel les paradigmes d’apprentissage dans le cadre de la décou- verte scientifique.

Il convient tout d’abord de respecter ce paradigme de modélisation lors de l’implantation de la plate-forme ([Michel, 2004]). Pour des raisons de clarté et pour sa simplicité de mise en oeuvre, je me suis tourné vers le formalisme AGR19

, spécifié par [Ferber & Gutknecht, 1998] en vue d’identifier et de mani- puler les niveaux d’organisation d’un système ainsi que les comportements des entités du système au sein de ces niveaux d’organisation. J’aurais pu utiliser un autre paradigme tel que Voyelles [Demazeau, 2001], qui offre une mé- thode de modélisation d’un système multi-agents sous la forme d’un ensemble d’Agents (A) plongé dans un environnement (E), soumis à une organisation (O), interagissant entre eux (E), et centré utilisateur (U). Cependant, cette

méthode, qui n’est pas si différente, n’est pas accompagnée d’un outil facili- tant la mise en oeuvre et l’implantation du système comme l’est MadKit pour AGR.

En plus de gérer la communication entre les agents, la plate-forme doit proposer des interfaces de saisie et de visualisation de ces communications, à savoir les publications et réfutations d’une part, les expériences et leur résultat d’autre part. J’ai dû garder à l’esprit que cette implantation devait rester la plus générique possible afin de pouvoir adapter l’outil à d’autres contextes d’utilisation (que celui des cartes), et ce à moindre coût. La modélisation agent présentée dans ce chapitre facilite cette généricité en garantissant l’autonomie des agents, et donne un cadre organisationnel à l’interaction sans créer de dépendance aux objets représentant les phénomènes étudiés par les agents (leur environnement). Le code spécifique dédié à la problématique choisie se trouve donc efficacement séparé de celui déployé pour gérer la plate-forme multi-agents et son fonctionnement.

La Section 6.1 présente une modélisation AGR de notre protocole, et l’implantation d’un prototype est détaillée en Section 6.2.

6.1 Vers une Mod´elisation AGR d’un Proto-

cole d’Apprentissage Distribu´e

Le modèle formel d’interaction dont nous avons discuté au Chapitre 2 sous- entend une certaine organisation des agents, et une communication par re- quêtes. Selon le formalisme AGR les agents peuvent créer, joindre, ou quitter des groupes au sein desquels ils jouent un rôle donné. L’interaction se fait par envoi de messages prévus par un protocole d’interaction, ce qui assure l’inté- grité des agents. En d’autre termes, les agents peuvent influencer le comporte- ment des autres agents via l’interaction, mais ne les contrôlent pas directement et les agents restent maˆıtres de leurs actions. Un message peut être :

– envoyé directement à l’agent concerné si son identité est connue, – envoyé à l’agent jouant un rôle connu,

– diffusé à l’ensemble des membres d’un groupe.

Les alias d’interaction que sont les noms de rôles et de groupes garantissent l’autonomie des agents et le respect du protocole d’interaction en différen- ciant la fonction d’un agent de son fonctionnement interne. Par exemple, si un agent Voyageur a besoin d’obtenir un horaire de train, de la part d’un agent Che f DeGare, alors quel que soit l’agent qui joue ce rôle dans le système, et quel que soit son fonctionnement ou la méthode qu’il utilise pour retrouver l’information voulue, Voyageur peut envoyer un message à Che f DeGare qui lui répondra selon le protocole établi. Imaginons maintenant qu’une défaillance

Figure 6.1 – Mod´elisation AGR d’ ´Eleusis+Nobel

technique retarde un train TrainX , Che f DeGare peut alors diffuser un message au groupe VoyageursTrainX afin de prévenir tous les agents de ce groupe, quels qu’ils soient, du retard de leur train. Ce formalisme permet de modéliser facilement des systèmes ouverts et hétérogènes. Le terme « ouvert » désigne un système dont le nombre d’agents est variable, que de nouveaux agents peuvent intégrer de fa¸con dynamique (en cours de simulation), et le terme « hétéro- gène » désigne des agents dont les architectures internes ne sont pas forcément identiques. En contraignant l’interaction entre agents en termes d’organisation et de rôle, le formalisme AGR permet de s’abstraire des détails d’implantation de chaque agent pour spécifier un protocole d’interaction, un vocabulaire de communication, des actes de langage [Searle, 1969, McCarthy, 1992].

La modélisation AGR d’ Éleusis+Nobel présentée dans la suite de cette section est schématisée par la Figure 6.1.

Dans le document Conception d'un Cadre Formel d'Interaction pour la Découverte Scientifique Computationelle (Page 107-112)