• Aucun résultat trouvé

Les jeux “intermédiaires”

Dans le document Td corrigé Remerciements - Td corrigé pdf (Page 192-200)

Turing a inventé plusieurs sortes de jeux qui ont servi à la constitution du jeu de l’imitation. Deux semblent particulièrement importants pour notre propos.

216 Cf. Cf. D. Michie, On Machine Intelligence, op. cit., p. 39-42. D. Michie concluait encore en 1974 que, même pour les jeux les plus simples, il n’y avait pas d’algorithme d’apprentissage qui garantirait un apprentissage optimal.

231. Le jeu de “Presents”

A. Hodges, dans sa biographie de Turing, fait allusion à un jeu inventé par Turing vers 1949 qui s’appelle “Presents” et dont il décrit brièvement les règles.

Celles-ci introduisent pour la première fois un jeu à trois personnes qui ressemble au jeu de l’imitation 217:

«L’idée en était qu’une personne sortait de la pièce et que les autres dressaient une liste de cadeaux imaginaires qu’ils pensaient qu’il souhaiterait recevoir. Ensuite, il revenait et pouvait poser des questions au sujet des cadeaux avant de les choisir et c’est là que le jeu de bluff et de double bluff commençait, car l’un des cadeaux était secrètement appelé

“Tommy” et une fois que Tommy était choisi, la partie était terminée».

Remarquons que dans ce jeu, les deux joueurs qui restent dans la pièce et qui dressent la liste des cadeaux comprenant le cadeau caché ne sont pas en situation de concurrence mais de connivence. Il s’agit d’une différence capitale par rapport au jeu de l’imitation. Le jeu ne se situe donc pas entre ces deux joueurs mais entre l’interrogateur et eux. Or, du point de vue de ce dernier, le jeu se ramène en fait à un puzzle, dans la mesure où il doit réussir à énumérer une liste de cadeaux conformes à ses désirs : l’énumération d’une liste peut être opérée par un algorithme, si tant est qu’une liste dressée à partir d’un désir puisse être l’objet d’une mise en algorithme. C’est d’ailleurs le rôle attribué au cadeau dénommé “Tommy” que de déjouer la pure et simple application d’un algorithme et d’exiger de la part de l’interrogateur la mise au jour de ses désirs. De ce point de vue, le “Tommy” représente ce que les deux autres joueurs croient être un désir caché de l’interrogateur et il fait office de “point mort” dans la mesure où, si l’interrogateur ne peut ou ne veut pas l’avouer, il lui est bien inaccessible objectivement ou stratégiquement218.

Un autre jeu semble avoir servi à la constitution du jeu de l’imitation : il s’agit du jeu de “Psychology”.

217 Cf. A. Hodges, Alan Turing, The Enigma of Intelligence, op. cit., p. 397. Turing jouait à ce jeu en compagnie de Nick Furbank et Robin Gandy.

218 Le choix du mot “Tommy” vient peut-être de l’expression anglaise [Peeping Tom] qui désigne le voyeur : du point de vue des deux jouerus qui dressent la liste, c’est finalement à une attitude de “voyeur” que revient la constitution du cadeau “inavouable”.

232. Le jeu de “Psychology”

Il y a en effet un autre “ancêtre” au jeu de l’imitation, plus ancien que le jeu de “Presents” inventé juste avant le jeu de l’imitation, et dont Turing a étudié les issues par le biais du calcul des probabilités. Turing l’avait inventé aux États-Unis quand il faisait son PhD de logique à Princeton en 1937. Par la suite, Turing a continué à jouer à ce jeu et à en examiner les issues.

232. 1. Traduction de la première section du manuscrit de “Psychology”

Voici comment il se présente dans les manuscrits de Turing 219 :

« Joueurs A et B.

A chaque partie, on choisit tout d’abord un nombre entre 0 et 1.

Fréquence uniforme. Chaque joueur choisit un nombre entre 0 et 1.

Si A choisit  et B choisit , alors B paye A

1

2X sgn(α - β)

Quoiqu’il en soit, les joueurs sont obligés en moyenne de jouer des nombres 0 à 1 avec une fréquence uniforme.

Si A joue un nombre (, d) avec une fréquence  (, X) d

et B joue un nombre (+ d) avec une fréquence Xd alors le gain moyen pour A est

et les fonctions X, X sont sujettes aux conditions suivantes :

φ(α,X) dX =1

Nous faisons la conjecture euristique que ce jeu est équivalent à la variation suivante :

Les restrictions

219 Cf. A. Hodges, Alan Turing, The Enigma of Intelligence, op. cit., p. 128 et 373. Andrew Hodges parle du jeu de “Pyschologie” mais n’en mentionne pas les règles. Ayant eu l’occasion de lui demander personnellement à quoi celui-ci ressemblait, il m’a conseillé de m’adresser à Robin Gandy qui a joué à ce jeu avec Turing. Ce dernier ne se rappelait plus précisément des règles mais il m’a fait parvenir des photocopies tirées des archives Turing décrivant le jeu. Sans être parfaitement explicites, elles m’ont permis de reconstituer au moins son allure générale.

φ (α,X) dX =1

0 1

ψ (β,X) dX =1

0 1

sont relaxées, mais le gain est

1

2X sgn (α −β) −f(α) +f(β)

pour une fonction f. On déterminera ultérieurement cette fonction de sorte que la meilleure stratégie pour la fonction f aura pour résultat la restriction mentionnée.

Nous montrerons ensuite que la solution obtenue ainsi donne la meilleure stratégie pour le jeu originel.»

232. 2. Remarques sur le jeu de “Psychology”

Il s’agit d’un jeu binaire de somme nulle, c’est-à-dire d’un jeu joué par deux joueurs A et B faisant des choix à partir d’un ensemble d’options, indexées sur l’intervalle réel [0, 1]. Les choix définissent une fonction de probabilités. Le choix de  par A et de  par B donne lieu à un paiement K au joueur A et -K

au joueur B : il s’agit d’un jeu à somme nulle puisque la quantité | K | gagnée par un joueur est perdue par l’autre. Le gain est alors défini par une formule du type : K = 1/2 sgn (). Si K > 0, B paye A et si K < 0, A paye B. On peut faire deux remarques sur le déroulement du jeu.

Premièrement, pour toutes les parties, A doit jouer  avec une probabilité de gain d. La condition  (, X) est la probabilité pour que A joue  dans le jeu X. La condition φ(α,X) dX =1

0 1

veut dire que, sur toutes les parties, A doit jouer

 avec une probabilité d dans n’importe quel intervalle [,  + d]. Sans cette condition, A jouerait toujours  = 1 et maximiserait ainsi ses gains : il y aurait là un “algorithme” évident pour gagner la partie et dans ce cas, le jeu se transformerait immédiatement en puzzle. Comme le fait remarquer R. Gandy 220:

«Mais cela fait que le “jeu” n’en est plus un au sens habituel du terme - comment B pourrait-il dire que A n’était pas un en train de tricher en jouant toujours 1. Pour

“jouer”, A choisit une fonction f (a, X), B choisit y (b, X) et ils calculent ensuite le gain à l’avance (ce que Turing appelle le “gain moyen”)».

220 Correspondance personnelle du 10 juin 1993.

Le jeu n’est donc pas un jeu véritable dans la mesure où il n’impose pas de règles concernant le bluff : c’est cette absence de règles touchant le bluff qui transforme le jeu en puzzle.

Deuxièmement, on calcule les gains à l’avance en définissant une fonction représentant un optimum de gain. Comment définir cet optimum ? Pour étudier celui-ci, Turing émet ce qu’il appelle une “conjecture euristique” qui consiste à déplacer le cas étudié vers un cas qu’il juge plus simple et qui peut servir d’optimum dans le cas du jeu originel. Cette hypothèse consiste à modifier la fonction de distribution de X, ce qui renforce l’un des deux joueurs en favorisant la croissance de f en . C’est ce qui permet ensuite de définir un optimum dans la conjecture euristique221 puis dans la version originelle du jeu222. Le jeu de Psychologie se dédouble donc comme le jeu de l’imitation : la conjecture euristique émise par Turing consiste à inventer comme un “jeu n°2” dans lequel la recherche d’un optimum soit plus facile à définir que dans le cas premier. Mais, dans le jeu de l’imitation, le problème n’est pas, comme dans le jeu de Psychologie, de rapporter le cas n°2 au cas n°1 mais l’inverse : en effet, selon la thèse de Turing qui décrit le passage de l’informel au formel, c’est le passage de la première à la deuxième formule du jeu qui est problématique. Bref, on ne peut pas constituer le jeu n°2 en conjecture euristique ayant le même statut que dans le jeu de Psychologie tant que l’on n’a pas la preuve que le jeu n°2 remplace sans pertes le jeu n°1. Or cette preuve doit précisément être apportée par le déroulement d’une partie. Il y aurait donc un cercle vicieux à vouloir présupposer a priori la réussite

221 Turing définit une solution de type continu. Il aboutit à la conclusion - conjecturale, comme il le précise lui-même - que la meilleure stratégie pour A est :

φ (α, X) = 1

R. Gandy envisage un type discret de solution en faisant usage de programmation linéaire et fait remarquer qu’il n’a aucune idée de la façon dont Turing est parvenu à définir sa stratégie propre. Il ajoute cependant que Turing a peut-être constitué sa solution en l’adaptant à partir du cas continu.

222 Le retour au jeu originel et la définition d’un optimum dans ce cas m’a paru incompréhensible. R. Gandy qui s’est essayé à la reconstituer avoue lui-même ne pas comprendre comment Turing est parvenu à cette solution.

du passage de la première à la deuxième formule du jeu et à accorder à sa deuxième formule un statut de conjecture euristique semblable à celui du jeu de Psychologie. C'est ce qui distingue profondément les deux jeux.

Le jeu de Psychologie apparaît donc bien comme un “ancêtre” du jeu de l’imitation, de par sa structure et ses conditions de jeu223. Néanmoins, le jeu de l’imitation, dans la mesure même où il repose sur la clarification de la différence ente le physique et l’intellectuel se distingue du jeu de Psychologie qui porte sur la détermination du choix d’un nombre réel dont la détermination est tout abstraite.

En déplaçant son point de vue et en le faisant porter sur la différence entre le physique et l’intellectuel, Turing change de perspective et transforme du même coup la portée de l’argumentation probabiliste du jeu de l’imitation.

233. Retour au jeu de l’imitation

Comme on sait, c’est un jeu qui se joue à trois, un interrogateur et deux joueurs dont Turing suppose qu’ils sont en situation de concurrence (on pourrait en effet imaginer qu’ils se liguent contre l’interrogateur pour que celui-ci n’opère pas les bonnes identifications). Le jeu de l’imitation oscille entre la structure de jeu et la structure de puzzle selon que l’on se place du point de vue des joueurs ou de l’interrogateur d’une part et selon que l’on accorde une issue positive ou négative au jeu d’autre part. Étudions ces différents points de vue.

Les deux joueurs, homme et femme, sont en situation de concurrence sans véritablement jouer entre eux : leurs réponses peuvent gêner l’autre joueur mais elles ne visent pas à le vaincre puisqu’elles font essentiellement partie du jeu qu’ils jouent avec l’interrogateur.

L’interrogateur se trouve au départ confronté à deux adversaires dans ce qu’il croit être un jeu : il lui faut, comme les joueurs, appliquer une stratégie, se souvenir des réponses qui lui ont été faites et qui peuvent l’aiguiller vers des questions embarrassantes pour les joueurs. On voit que les positions de l’interrogateur et des joueurs sont inversées par rapport au jeu de “Presents” :

223 Pourquoi porte-t-il ce nom ? Selon notre interprétation, c’est son aspect intermédiaire entre la notion de puzzle et celle de jeu qui lui accorde une importance du point de vue de la modélisation de la psychologie. c’est peut-être pour cette raison qu’il s’appelle ainsi.

alors que dans “Presents”, c’est l’interrogateur qui peut avoir du mal à avouer l’objet d’un désir que les joueurs ont imaginé pour lui, dans le jeu de l’imitation au contraire le but - et non le désir - de l’interrogateur est clair (c’est l’établissement de la différence des sexes) mais les joueurs font tout ce qui est verbalement possible pour qu’il ne puisse pas y avoir accès. Bref, dans le jeu de l’imitation, l’interrogateur n’a pas à effectuer personnellement un travail sur ce qu’il peut chercher à ignorer de lui-même : il n’a pas de désir inconscient. Mais, du point de vue de l’observateur extérieur, on pourrait dire que les joueurs représentent le travail en question puisque les joueurs tentent autant que faire se peut de le maintenir dans l’illusion. Plusieurs cas de figure peuvent se présenter alors, selon que l’interrogateur parvient ou croit parvenir à opérer les bonnes identifications. Les deux premiers cas sont ceux pour lesquels l’interrogateur parvient à identifier les joueurs; le dernier est celui pour lesquels il n’y parvient pas.

Premièrement, dans le cas où l’interrogateur parvient à identifier un joueur dans le jeu n°1, c’est-à-dire dans le cas où l’identification se fait suffisamment vite pour que l’observateur extérieur n’ait pas le temps de remplacer l’homme par un ordinateur, la différence des sexes est déterminée et la liste des questions que l’interrogateur a posée lui paraît comme autant d’étapes dans le déroulement d’un algorithme. Le jeu de l’imitation se réduit alors à un puzzle pour tous les participants au jeu, y compris l’observateur extérieur.

Deuxièmement, si une partie dure suffisamment pour que l’observateur extérieur ait le temps de remplacer l’homme par un ordinateur et que l’interrogateur parvient à identifier un joueur dans le jeu n°2, deux cas sont possibles : soit il a identifié la femme, soit la machine.

Dans le cas où l’interrogateur a identifié la femme, la différence des sexes lui paraît être déterminée et il lui semble que le déroulement d’une partie est identique au déroulement des étapes d’un algorithme. Il croit donc que le fait d’avoir découvert qui était la femme lui permet de déterminer son complémentaire, l’homme, mais il se trompe. Dans la mesure où l’on se trouve dans un cas où l’interrogateur croit avoir réduit le jeu à un puzzle, on peut, par

analogie avec la situation qui existe pour les algorithmes dans les systèmes formels, dire qu’il se trouve dans le cas de la détermination d’un ensemble récursivement énumérable non récursif : la liste des questions qu’il a posées ne permet pas la détermination indirecte du complémentaire de l’ensemble à déterminer. Mais cette analogie formaliste ne vaut que parce que l’interrogateur est dans l’erreur et même dans l’illusion quant à la nature de la différence des sexes. En fait, du point de vue de l’observateur extérieur, l’interrogateur croit pour de mauvaises raisons qu’il a réduit le jeu de l’imitation à un puzzle, même si le jeu se réduit effectivement à un puzzle.

Dans le cas où l’interrogateur a identifié la machine, il a réussi à s’apercevoir que l’observateur extérieur a changé les règles du jeu sans l’avertir.

La différence des sexes est déterminée et joue le rôle d’un critère de jeu comme un autre, que l’algorithme mis en place par l’interrogateur est susceptible de dépasser. Le jeu se réduit à un puzzle pour l’interrogateur comme pour l’observateur extérieur.

Troisièmement, dans le cas où le jeu dure et que l’interrogateur ne parvient à identifier un joueur ni au jeu n°1 ni au jeu n°2, la différence des sexes reste pour lui indéterminée et sa liste de questions entre dans le cadre d’une stratégie de jeu.

Qu’en est-il pour l’observateur extérieur ? S’agit-il d’un jeu ou d’un puzzle ? Il s’agit en fait d’une question de point de vue. L’observateur extérieur doit en effet reconnaître qu’il s’agit d’un jeu à l’intérieur pour l’interrogateur et d’un puzzle à l’extérieur pour lui. Il doit en effet prendre en compte le fait que l’interrogateur est dans l’illusion et le fait que lui ne l’est pas : la différence des sexes existe et n’existe pas selon que l’on se place à l’intérieur ou à l’extérieur du jeu.

C’est l’observateur extérieur qui est censé réduire le jeu à un puzzle : si c’est bien le cas, le jeu n°2 jouerait le même rôle que celui d’un puzzle de substitution. Cette réduction est-elle possible ? Si l’on reprend les propres termes de l’analyse des jeux par Turing, il faudrait réussir à affecter des poids d’évidence aux réponses dans le jeu n°1 et montrer qu’en maintenant un aspect ambigu dans celles-ci, il est possible d’évoluer du jeu n°1 au jeu n°2 sans solution de continuité. Peut-on affecter des poids d’évidence tels que la différence entre le

physique et l’intellectuel ne soit jamais assignable par l’interrogateur ? Comment réussir à affecter d’une valeur numérique sur une échelle d’évaluation les réponses des joueurs sans préjuger à l’avance de l’issue générale d’une partie ou même de ses issues partielles ? Cette tâche serait pourtant indispensable à qui voudrait constituer une évaluation en termes de minimax. En particulier, on ne voit pas où constituer des “points morts” au-delà desquels il n’y aurait pas intérêt à explorer les solutions pour établir une différence radicale entre le physique et l’intellectuel : comme le nombre de réponses possibles pour une question donnée est énorme, une évaluation en termes de minimax n’est plus praticable.

Cependant, si l’on abandonne, faute de moyens, la poursuite de la justification de ce troisième cas de figure et si l’on fait l’hypothèse que la solution de Turing est la bonne, on peut réussir à interpréter la solution adoptée par Turing et saisir ses intentions profondes.

Dans le document Td corrigé Remerciements - Td corrigé pdf (Page 192-200)