• Aucun résultat trouvé

Une Dynamique Sociale de R´efutation `a la Limite

4.5 Apprentissage Interactif et Validation Sociale de D´ecouvertes

4.5.2 Une Dynamique Sociale de R´efutation `a la Limite

Au lieu de supposer l’existence d’un oracle capable de r´epondre `a des re- quˆetes co-semi-d´ecidables, nous pr´ef´erons supposer que les apprentis peuvent publier leurs conjectures afin de demander `a leur pairs de les r´efuter. La pu- blication d’une conjecture ne garantit pas qu’une r´eponse sera apport´ee, et cette requˆete reste co-semi-d´ecidable : aucune r´eponse positive ne sera jamais apport´ee. Comme dans l’identification `a la limite, un apprenti n’a donc jamais de certitude quant `a la validit´e de sa conjecture. Toutefois, si cette conjec- ture est fausse, alors un contre-exemple apparaˆıtra apr`es un temps fini. La distribution de la r´esolution de requˆetes ne sera pas moins efficace que sa r´e- solution par un oracle seul, mais pourrait ˆetre fortement acc´el´er´ee dans le cas d’une grande communaut´e d’apprentis. Pour assurer que les conjectures incor- rectes seront r´efut´ees, nous cr´eons une dynamique sociale comme cela est fait en th´eorie des jeux depuis [Neumann & Morgenstern, 1944]. Notons que plu- sieurs programmes cibles peuvent ˆetre mis `a disposition des apprentis poser des probl`emes strat´egiques d’exploration de l’espace d’hypoth`ese ou de politique de publication, comme cela est pr´esent´e aux Chapitres 6 et 7.

Nous symbolisons le produit de l’ interaction sociale par une fonction de gain, en attribuant ou en ˆotant des points pour chaque requˆete en fonction de la r´eponse fournie par la communaut´e (r´efutation ou non), de fa¸con `a pouvoir cr´eer une atmosph`ere collaborative ou comp´etitive parmi les apprentis. Cette fonction de gain motive les apprentis `a chercher les ´eventuels contre-exemples aux conjectures publi´ees par leurs pairs afin d’ assurer que ces conjectures se- ront r´efut´ees `a la limite ou qu’elles demeureront en tant que r´ef´erences consen- suelles et gagneront en cr´edibilit´e et en importance.

Mode Mod`ele Dur´ee Type d’interaction de r´ealit´e du processus d’apprentissage

Identification Passif Infini Non-born´ee Exact [R´ealit´e]

`a la Limite (simulation)

PAC Passif Fini Finie Approximatif [R´ealit´e]

(simulation)

Apprentissage Actif Infini Born´ee Exact [R´ealit´e]

par requˆetes (simulation)

Learning from Actif Infini Born´ee Exact [Tuteur]

different teachers (Imitation)

Apprendre les Actif / Interactif Infini Non-born´ee Exact [pairs]

uns des autres et Participatif mais biais´e (consensus)

Table 4.1 – Synth`ese des diff´erences entre paradigmes d’apprentissage

chapitre.

La colonne « temps de r´eflexion » concerne le temps laiss´e `a l’apprenti pour formuler son hypoth`ese. Le fait qu’il soit polynomial dans le cas de l’apprentis- sage PAC repr´esente le fait que le temps laiss´e `a l’apprenti est d´efini a-priori en fonction du nombre d’exemples, du crit`ere de confiance et du taux d’ap- proximation comme d´efinit au chapitre 2, alors que dans les autre paradigmes, aucune contrainte n’est impos´ee. Dans la colonne « dur´ee du processus », je fais une distinction entre un temps fini d´etermin´e en fonction du nombre d’exemples et un temps born´e, c’est `a dire fini mais inconnu a-priori. On constate l’´evo- lution du rˆole passif de l’apprenti `a un rˆole actif, et le caract`ere interactif d´efinissant le protocole propos´e semble naturel au regard de cette ´evolution. Cependant, il peut ´egalement ˆetre qualifi´e de participatif, puisque la d´ecou- verte d’un contre-exemple est d´ependante de la motivation des apprentis. Le mod`ele de r´ealit´e est caract´eris´e d’infini mais biais´e, ce qui exprime le fait qu’aucune restriction n’est pos´ee `a ce sujet. Cependant, les repr´esentations de l’apprenti seront biais´ees par son mod`ele de description si celui-ci n’est pas correct. Enfin, le crit`ere d’apprentissage peut sembler surprenant. Dans tous les autres paradigmes, une entit´e connaˆıt la r`egle cach´ee et peut d´eterminer si l’apprentissage est correct ou non. [Angluin & Krikis, 2003] d´efinit un appren- tissage vis-`a-vis du tuteur, c’est `a dire que la solution adopt´ee par l’apprenti est suppos´ee ´equivalente `a celle du tuteur, mˆeme si celle-ci n’est pas optimale. Dans le cadre de la d´ecouverte scientifique, il n’existe aucune entit´e poss´edant la connaissance absolue, et personne n’est donc en mesure de d´ecider si l’ap- prentissage est correct. Le crit`ere de r´eussite est donc l’atteinte d’un consensus

au sein de la communaut´e d’apprentis.

4.6

Perspectives

Le jeu ´Eleusis+Nobel pr´esent´e au Chapitre 5, et qui est le sujet des cha- pitres suivants, est une illustration parfaite de ce formalisme. Toutefois, je me suis limit´e ici `a pr´esenter une interaction fond´ee sur la publication et la r´efu- tation de conjectures, et il me semble int´eressant d’introduire la diversit´e des jugements d´efinis au Chapitre 3 afin de mettre en oeuvre un v´eritable d´ebat scientifique au sein d’une communaut´e d’apprentis. Cette perspective de travail est tout `a fait r´ealiste et trouverait des applications concr`etes sous la forme d’outil de collaboration au sein d’un groupe de travail, ou sous la forme d’une plate-forme de d´ebats publiques, afin de proposer une alternative au classiques forums de discussions qui deviennent trop souvent de v´eritables labyrinthes d’informations. Cette perspective repr´esente d´ej`a un projet concret, Intermed, auquel je m’associerai tr`es prochainement.

L’introduction d’un niveau social dans les paradigmes d’apprentissage ouvre la voie `a l’exp´erimentation de diff´erentes fonctions de gains afin de d´eterminer dans quelles conditions une communaut´e d’apprentis converge le plus efficace-

ment vers une solution acceptable. Nous avons propos´e dans [Dartnell et Sallantin, 2005] d’associer un gain P = 1 `a la publication d’une conjecture, et un transfert de

R= 2 points de l’auteur d’une publication r´efut´ee vers l’auteur de la r´efutation. L’interaction avec les autres apprentis est donc n´ecessaire pour acqu´erir des points, mais elle est associ´ee `a une prise de risque directement li´ee au rapport

P

R, et il appartient `a chaque apprenti de g´erer cette prise de risque. Nous verrons

au Chapitre 7 que mˆeme si cette fonction de gain est tr`es simple, elle permet d’observer chez des joueurs humains des comportements vari´es assurant une dynamique sociale (altruisme, prudence, opportunisme, etc.). Pourtant, des si- mulations automatis´ees doivent ˆetre men´ees pour v´erifier que ce protocole est r´eellement adapt´e `a un apprentissage efficace, et je reviendrais sur ce sujet en Section 6.3.

Chaque apprenti devant optimiser ses propres gains, cette fonction de gain ouvre ´egalement la voie vers des probl`emes de gestion du risque et de strat´egies d’exploration, mais nous n’explorerons pas ces pistes dans ce document.

Enfin, l’inspiration multi-agent pourrait ˆetre poursuivie afin de mat´erialiser une r´esolution distribu´ee de probl`emes dans un espace `a trois dimensions. En repr´esentant l’espace des hypoth`eses comme un espace physique, et en modi- fiant l’altitude de l’espace dans les zones soumises `a des conflits d’opinion, on pourrait ainsi maintenir une cartographie de la r´esolution de probl`eme. Outre l’utilit´e d’un tel visuel, cette cartographie pourrait ´eventuellement ˆetre utilis´ee

pour guider une r´esolution de probl`emes par des techniques courantes de la communaut´e mutli-agents, telles que les algorithmes de type fourmi, afin de guider des agents r´eactifs se d´epla¸cant au gr´e des pentes vers les zones basses repr´esentant le manque d’information ou les conflits d’opinions.

4.7

Synth`ese

J’ai propos´e dans ce chapitre une formalisation logique simple mais suffi- sante pour repr´esenter les difficult´es li´ees au contexte de d´ecouverte dans lequel nous nous pla¸cons. Cette formalisation du probl`eme m’a permis de pr´eciser les diff´erences qui existent entre les principaux paradigmes d’apprentissage, et de positionner de fa¸con plus claire les extensions que je propose afin de rendre ces paradigmes op´erationnels dans un tel contexte, sous la forme d’un apprentis- sage interactif effectu´e par une communaut´e d’apprentis. Comme le propose Popper, ce protocole place la preuve exp´erimentale hors de port´ee des appren- tis, et s’oriente vers la r´efutation `a la limite des conjectures et l’accr´editation sociale de celles qui r´esistent `a la r´efutation. J’ai pr´esent´e plusieurs perspec- tives de travail, `a plus ou moins long terme, parmi lesquelles figurent bien sur l’introduction des jugements modaux d´efinis au Chapitre 3 pour diversifier l’interaction et les formes de publication. Je n’ai malheureusement pas encore exploit´e cette formalisation comme je l’aurais souhait´e, par manque de temps. Elle est cependant suffisamment ´elabor´ee pour caract´eriser un prototype de plate-forme de r´esolution distribu´ee.

La seconde partie de ce document pr´esente les aspects pratiques li´es `a la d´efinition de ce prototype, et en particulier comment mes choix de mod´elisa- tion m’ont amen´e `a d´efinir un mod`ele AGR de ce protocole d’apprentissage interactif.

Deuxi`eme partie

Aspects Pratiques

Chapitre 5

Pr´esentation du Prototype

´

Eleusis+Nobel

« Il semble que le savoir scientifique soit tou- jours essay´e, toujours contrˆol´e, toujours cri- tiqu´e... en critiquant sans cesse son propre savoir »

G. Bachelard.

L

a premi`riques de ma recherche. Je vais d´esormais pr´esenter des aspects plus pra-erepartie de ce document m’a permis de traiter les aspects th´eo- tiques : la mod´elisation et l’implantation d’un prototype, ´Eleusis+Nobel (Cha- pitre 6), et les r´esultats obtenus grˆace `a ce dernier (Chapitre 7). Ce prototype, que j’ai d´evelopp´e tout au long de ma th`ese, a servi de support concret aux formalismes propos´es et a permi de concentrer les efforts des diff´erents colla- borateurs. Je vais donc avant toute chose d´ecrire dans ce chapitre comment l’id´ee originale a vu le jour.

´

Eleusis+Nobel est le fruit d’un travail pluri-disciplinaire d´ebut´e avec Syl- vain Charron et David Chavalarias14

, sur les bases du m´emoire de DEA de ce dernier [Chavalarias, 1997]. Les aspects conceptuels et formels pr´esent´es en premi`ere partie de ce document ont pu ˆetre approfondis grˆace `a l’aide pr´ecieuse de Dominique Luzeaux15

, ´Eric Martin16

et Jean Sallantin17

, et vont mainte- nant ˆetre illustr´es. Enfin, la r´ecente exploitation de ce jeu par H´el`ene Hag`ege18

14. Centre de Recherche en ´Epist´emologie Appliqu´ee, UMR 7656, ´Ecole Polytechni- que/CNRS

15. Centre Technique des Syst`emes d’Information, Arcueil, France

16. School of Computer Science and Engineering, University of New South Wales, Sydney, Australie

17. Laboratoire d’Informatique, de Robotique et de Micro´electronique de Montpellier, Uni- versit´e Montpellier II, France

lors de simulations a permis de valider ses int´erˆets ´epist´emiques et didactiques. Les r´esultats encourageants de ces simulations nous laissent esp´erer que ce pro- totype pourra servir de base `a des outils p´edagogiques, `a des plates-formes de travail collaboratif, ou sera d´eclin´e sur des th`emes plus concrets que celui des cartes pour cr´eer d’autres jeux s´erieux.

Imagin´e afin de reproduire certains processus de la d´ecouverte scientifique, tels que la g´en´eration et la validation d’hypoth`eses, l’exploration de l’espace de recherche par la mise au point d’exp´eriences, la formulation de th´eories ainsi que leur publication ou leur r´efutation, ´Eleusis+Nobel est la fusion naturelle des deux jeux ´Eleusis [Gardner, 1959] et Nobel [Chavalarias, 1997] que je vais pr´esenter en sections 5.1 et 5.2.

En section 5.3, je pr´esenterai le jeu en lui-mˆeme, en faisant le lien avec le formalisme pr´esent´e au Chapitre 4. Je fournirai ´egalement quelques pistes concernant l’´etude des syst`emes complexes. En effet, cette conceptualisation des ´etapes n´ecessaires `a la cr´eation et `a l’´evolution de th´eories scientifiques int`egre certaines des probl´ematiques majeures des syst`emes complexes :

– l’interaction entre plusieurs agents,

– la construction d’un langage partag´e et adapt´e `a la description des ph´e- nom`enes observ´es ainsi qu’aux diff´erents niveaux de repr´esentation n´e- cessaires `a leur explication,

– les probl`emes de bifurcations et de concurrence li´es aux diff´erents com- portements possibles du syst`eme dans chacun de ses ´etats.

5.1

Eleusis

Le texte ci-dessous est inspir´e de l’article de Martin Gardner [Gardner, 1959] dont la version fran¸caise est parue dans « La math´ematique des jeux« , Biblio- th`eque pour la science, et de la pages web personnelle de Thomas Kauffmann [Kauffmann, 1999].