• Aucun résultat trouvé

5.3 Eleusis+Nobel

5.3.3 Le protocole de publication

L’analogie entre le joueur qui se proclame Sage et le scientifique qui publie, soulev´ee en 5.1, se pr´ecise puisque le joueur qui pense avoir trouv´e une r`egle cach´ee a d´esormais la possibilit´e d’´editer et de publier un ensemble de clauses logiques d´ecrivant sa th´eorie (voir 6.2.3.3), les soumettant ainsi au jugement de ses pairs. Pour destituer un sage, il faut donc trouver un contre-exemple `a sa th´eorie et le publier sous la forme d’une r´efutation. Les gains P et R sont imm´ediats et fix´es selon les r`egles du jeu Nobel (P = 1, R = 2). Cette

fa¸con d’interagir pour ´etablir une th´eorie et la soumettre `a une validation correspond au protocole d’apprentissage interactif d´efini au Chapitre 4 et ´etend l’apprentissage `a partir de requˆetes.

5.4

Synth`ese

Le jeu d’ ´Eleusis a ´et´e mis au point pour simuler le ph´enom`ene de d´ecou- verte d’une unique r`egle cach´ee d´eterminant les s´equences de cartes pouvant ˆetre jou´ees par les participants. Le jeu Nobel propose un protocole de pu- blication inspir´e de la th´eorie des jeux et permettant d’´etudier l’´evolution des strat´egies d’exploration et de publication dans une communaut´e de chercheurs. En fusionnant ces deux jeux, ´Eleusis+Nobel offre un environnement de type « jeu s´erieux » pour illustrer les diff´erents paradigmes d’apprentissage pr´esen- t´es au Chapitre 2, mettre en oeuvre la formalisation propos´ee au chapitre 4, et fournir une plate-forme robuste d’exp´erimentation.

Je vais maintenant pr´esenter la mod´elisation et l’implantation de ce proto- type au Chapitre 6 avant de pr´esenter les r´esultats obtenus au Chapitre 7.

Chapitre 6

Implantation

Les instruments ne sont que des th´eories ma- t´erialis´ees

Gaston Bachelard.

L

a mod´site l’implantation d’un certain nombre de fonctionnalit´es. En outre, leselisation qui a fait l’objet de ce document jusqu’`a pr´esent n´eces- cadres formels d’apprentissage sur lesquels je me suis appuy´e pour sp´ecifier le mode d’interaction entre les acteurs d’une r´esolution de probl`eme distribu´ee utilisent naturellement les termes et les concepts du paradigme agent. En ef- fet, ces paradigmes d´ecrivent comment un agent apprenti interagit avec son environnement pour recueillir des donn´ees et tester ses hypoth`eses. L’exten- sion que j’ai pr´esent´ee ´etend cette interaction `a une communaut´e d’agents et introduit un deuxi`eme niveau d’interaction entre les apprentis eux-mˆemes. Ce capitre, qui constitue ma deuxi`eme contribution, montre comment la distribu- tion des requˆetes d’un apprenti sur une communaut´e d’apprentis permet de rendre op´erationnel les paradigmes d’apprentissage dans le cadre de la d´ecou- verte scientifique.

Il convient tout d’abord de respecter ce paradigme de mod´elisation lors de l’implantation de la plate-forme ([Michel, 2004]). Pour des raisons de clart´e et pour sa simplicit´e de mise en oeuvre, je me suis tourn´e vers le formalisme AGR19

, sp´ecifi´e par [Ferber & Gutknecht, 1998] en vue d’identifier et de mani- puler les niveaux d’organisation d’un syst`eme ainsi que les comportements des entit´es du syst`eme au sein de ces niveaux d’organisation. J’aurais pu utiliser un autre paradigme tel que Voyelles [Demazeau, 2001], qui offre une m´e- thode de mod´elisation d’un syst`eme multi-agents sous la forme d’un ensemble d’Agents (A) plong´e dans un environnement (E), soumis `a une organisation (O), interagissant entre eux (E), et centr´e utilisateur (U). Cependant, cette

m´ethode, qui n’est pas si diff´erente, n’est pas accompagn´ee d’un outil facili- tant la mise en oeuvre et l’implantation du syst`eme comme l’est MadKit pour AGR.

En plus de g´erer la communication entre les agents, la plate-forme doit proposer des interfaces de saisie et de visualisation de ces communications, `a savoir les publications et r´efutations d’une part, les exp´eriences et leur r´esultat d’autre part. J’ai dˆu garder `a l’esprit que cette implantation devait rester la plus g´en´erique possible afin de pouvoir adapter l’outil `a d’autres contextes d’utilisation (que celui des cartes), et ce `a moindre coˆut. La mod´elisation agent pr´esent´ee dans ce chapitre facilite cette g´en´ericit´e en garantissant l’autonomie des agents, et donne un cadre organisationnel `a l’interaction sans cr´eer de d´ependance aux objets repr´esentant les ph´enom`enes ´etudi´es par les agents (leur environnement). Le code sp´ecifique d´edi´e `a la probl´ematique choisie se trouve donc efficacement s´epar´e de celui d´eploy´e pour g´erer la plate-forme multi-agents et son fonctionnement.

La Section 6.1 pr´esente une mod´elisation AGR de notre protocole, et l’im- plantation d’un prototype est d´etaill´ee en Section 6.2.

6.1

Vers une Mod´elisation AGR d’un Proto-

cole d’Apprentissage Distribu´e

Le mod`ele formel d’interaction dont nous avons discut´e au Chapitre 2 sous- entend une certaine organisation des agents, et une communication par re- quˆetes. Selon le formalisme AGR les agents peuvent cr´eer, joindre, ou quitter des groupes au sein desquels ils jouent un rˆole donn´e. L’interaction se fait par envoi de messages pr´evus par un protocole d’interaction, ce qui assure l’int´e- grit´e des agents. En d’autre termes, les agents peuvent influencer le comporte- ment des autres agents via l’interaction, mais ne les contrˆolent pas directement et les agents restent maˆıtres de leurs actions. Un message peut ˆetre :

– envoy´e directement `a l’agent concern´e si son identit´e est connue, – envoy´e `a l’agent jouant un rˆole connu,

– diffus´e `a l’ensemble des membres d’un groupe.

Les alias d’interaction que sont les noms de rˆoles et de groupes garantissent l’autonomie des agents et le respect du protocole d’interaction en diff´eren- ciant la fonction d’un agent de son fonctionnement interne. Par exemple, si un agent Voyageur a besoin d’obtenir un horaire de train, de la part d’un agent Che f DeGare, alors quel que soit l’agent qui joue ce rˆole dans le syst`eme, et quel que soit son fonctionnement ou la m´ethode qu’il utilise pour retrouver l’information voulue, Voyageur peut envoyer un message `a Che f DeGare qui lui r´epondra selon le protocole ´etabli. Imaginons maintenant qu’une d´efaillance

Figure 6.1 – Mod´elisation AGR d’ ´Eleusis+Nobel

technique retarde un train TrainX , Che f DeGare peut alors diffuser un mes- sage au groupe VoyageursTrainX afin de pr´evenir tous les agents de ce groupe, quels qu’ils soient, du retard de leur train. Ce formalisme permet de mod´eliser facilement des syst`emes ouverts et h´et´erog`enes. Le terme « ouvert » d´esigne un syst`eme dont le nombre d’agents est variable, que de nouveaux agents peuvent int´egrer de fa¸con dynamique (en cours de simulation), et le terme « h´et´ero- g`ene » d´esigne des agents dont les architectures internes ne sont pas forc´ement identiques. En contraignant l’interaction entre agents en termes d’organisation et de rˆole, le formalisme AGR permet de s’abstraire des d´etails d’implantation de chaque agent pour sp´ecifier un protocole d’interaction, un vocabulaire de communication, des actes de langage [Searle, 1969, McCarthy, 1992].

La mod´elisation AGR d’ ´Eleusis+Nobel pr´esent´ee dans la suite de cette section est sch´ematis´ee par la Figure 6.1.