• Aucun résultat trouvé

Les définitions préliminaires et le découpage ensembliste.

Ramsey, von Neumann/Morgenstern, Savage.

C- Décision et incertitude : la théorie de Savage.

1) Les définitions préliminaires et le découpage ensembliste.

La théorie de N/M bien qu’étant très achevée, nous laisse avec un problème de taille : comment analyser une situation décisionnelle lorsque les probabilités ne sont pas objectives1 ? Comment formaliser la prise de décision en contexte d’incertitude, c’est-à-dire lorsque les probabilités ne sont pas données objectivement, mais construites par le sujet à partir de ses croyances2 ? C’est la question à laquelle, dans la lignée de Ramsey (1931), va répondre de façon magistrale le mathématicien L. J. Savage en rédigeant son maître ouvrage : The foundations of statistics3. L’axiomatique de Savage représente une avancée majeure, probablement même l’aboutissement majeur en théorie statistique de la décision, et le dépassement des travaux fondateurs de Neyman, Pearson et Fisher. Nous pouvons même dire que c’est la théorie bayésienne de la décision qui reste à ce jour la plus achevée4. Avant Savage, la théorie bayésienne du choix rationnel était presque totalement ignorée5, après lui,                                                                                                                

1 Voir, Gilboa (2009), p 40-46 ; et l’article de R. Sugden, in Barberà/Hammond/Seidl (2006), p 726. Sur la dualité

« probabilités subjectives et probabilités objectives » en théorie de la décision on peut se reporter à Saint-Sernin (1973), p 38- 60. L’auteur recense les efforts de ceux qui depuis de Finetti (1937) et Carnap (1945) ont tenté d’unifier les deux points de vue, que ce soit sous l’égide du subjectivisme ou d’une approche plus logiciste. Savage (1954) ira, comme nous le verrons, dans le sens de de Finetti. Il faut toutefois noter que d’autres auteurs ont tenté d’unifier les deux points de vue en les incorporant dans une seule théorie de l’utilité, c’est le cas par exemple de Anscombe/Aumann (1963), et de Raiffa (1968).

2 Comme le fait remarquer Picavet (1996), p 207, une des originalités de la théorie de Savage, c’est le rôle opératoire qu’elle

attribue au concept de croyance.

3 L’ouvrage a été publié en 1954, et a connu une deuxième édition en 1972, avec certaines corrections et ajouts

bibliographiques dont certains sont majeurs en théorie de la décision par exemple : Edwards/Savage/Lindman (1963), Ellsberg (1961) ou Hacking (1967). Selon les mots de l’auteur, p 5, il se divise en deux parties : chapitre 2 à 7 pour l’aspect fondationnel proprement dit, et chapitres 8 à 17 pour l’élaboration complète de la théorie avec la reprise de la théorie du minimax au chapitre 9, et l’hypothèse du « minimax regret ». C’est un livre très difficile qui a pourtant donné lieu à une abondante littérature secondaire dans le domaine des mathématiques de la décision, de l’économie et du bayésianisme. Cependant il faut prendre garde que la complexité de l’ouvrage a donné lieu à deux types d’approches : scientifiques et vulgarisatrices. Dans le premier cas nous avons par exemple des ouvrages de références comme Fishburn (1970), Kreps (1988), Barbera/Hammond/Seidl (2006). Concernant le point de vue économique, ou plutôt microéconomique, car il est impossible d’appliquer la théorie de Savage à un ensemble aussi vaste que l’économie à grande échelle, on peut se reporter à Fienberg/Zellner (1975). Du côté français, la théorie de Savage a été étudiée par Saint-Sernin (1973), qui consacre la majeure partie de son analyse au problème de la normativité des probabilités ; Granger (1988) consacre une brève mais très pertinente partie à Savage dans le cadre d’une enquête sur le « style » des interprétations subjectivistes en probabilités ; Picavet (1996) propose l’analyse la plus exhaustive et la plus précise disponible en langue française. En ce qui concerne les ouvrages de vulgarisation (presque tous excellents) nous avons le classique de Luce/Raiffa (1957) ; Baron (1988) ; Peterson (2009) ; Binmore (2009) ; et enfin Gilboa (2009), le livre de Gilboa se situe en fait à mi-chemin entre l’approche scientifique et l’approche plus « populaire ». Le livre de Savage a donné lieu à bon nombre d’articles que nous mentionnerons à l’occasion.

4 Kreps (1988) va jusqu’à qualifier l’entreprise de Savage de « The crowning glory of choice theory », p 120. Voir aussi

Picavet (1996), p 190-191.

5 Voir à ce propos le court mais intéressant article de Savage : « The shifting foundations of statistics » dans R. G. Glodny

elle occupera une place de premier plan dans les débats scientifiques concernant les probabilités personnelles1 et certaines parties de l’épistémologie contemporaine2.

Nous allons ici étudier les cinq premiers3 chapitres de l’ouvrage et suivre d’aussi près que possible le déploiement de la théorie avec l’introduction des 7 axiomes4 qui vont permettre d’établir du même coup l’existence d’une probabilité qualitative sur les événements et l’existence d’une fonction d’utilité obéissant au principe bernoullien de l’espérance mathématique5, fonction d’utilité qui sera construite à l’aide du concept de « pari »6. Le livre

de Savage, en ce sens qu’il propose une théorie de l’utilité fondée sur des probabilités subjectives, peut être considéré comme la synthèse des travaux de Ramsey (1926), de Finetti (1937)7 et von Neumann/Morgenstern (1947).

Après quelques remarques d’ordre philosophiques sur les fondations dans les sciences dures8, Savage présente immédiatement l’interprétation des probabilités9 qu’il entend soutenir et développer au long de son ouvrage :

« Probability measures the confidence that a particular individual has in the truth of a particular proposition, (…). These views postulate that the individual concerned is in some way ‘reasonnable’ »10.

Deux remarques s’imposent. Tout d’abord l’auteur relie de façon immédiate la rationalité de l’agent à l’application et au respect des axiomes du calcul des probabilités11,                                                                                                                

1 Voir, Savage (1961), (1967) et (1968) ; ainsi que Kyburg/Smokler (1980). 2 Voir, Bovens/Hartmann (2003), et Oaksford/Chater (2007).

3 Ils se situent aux pages 1-104, nous citons : Savage (1954).

4 Savage utilise le terme « postulate ». Certains théorèmes sont très importants aussi. 5 Voir, Savage (1954), p 74-76.

6 La filiation entre Savage et Ramsey est très nette, et parfaitement assumée par notre auteur, voir, Savage (1954), p 7 ; et

Picavet (1996), p 191.

7 Savage se réfère beaucoup aux résultats de l’article de 1937, surtout dans les chapitres 3 et 4 sur les probabilités

personnelles, en particulier p 40 à 56 où Savage explore à sa façon le concept « d’échangeabilité ».

8 Du point de vue épistémologique, Savage semble être assez en accord avec les idées de Quine (1951) ; par ailleurs

l’inspiration générale de l’ouvrage, et notamment le rôle attribué à la croyance, pourrait laisser supposer une ascendance humienne assez forte, nous verrons, que si l’inspiration est certes humienne, la théorie de Savage ne peut en aucun cas être considérée comme la mise en forme mathématique de l’ensemble des idées de Hume sur les croyances. Voir, Picavet (1996), p 207.

9 L’auteur discute aussi brièvement, trop brièvement peut-être, les autres interprétations. Pour un point de vue plus complet de

Savage lui-même, on peut se référer à l’article cité en note 5.

10 Savage (1954), p 3.

11 Il faut insister brièvement sur l’aspect normatif des probabilités, conçues par Savage comme « un code de cohérence » pour

le sujet. Nous sommes ici très proches des intuitions de Ramsey (1926), qui faisait des probabilités les « principes de la raison humaine », d’autre part, toujours dans la lignée du philosophe britannique il s’agit d’une croyance en la vérité d’une

probabilités conçues comme une mesure des degrés de croyance. Il s’agit ici, comme chez Ramsey (1926) et de Finetti (1937) de construire une structure théorique qui puisse relier les probabilités au comportement observable des sujets en contexte décisionnel.

Deuxième remarque : nous assistons à un écart avec la théorie de N/M. En effet deux agents « rationnels » dans la même situation, avec les mêmes informations peuvent développer des degrés de croyance différents et des préférences différentes. Le postulat implicite de Savage est le suivant : nos croyances arrivent par degrés et elles ont une structure probabiliste qui permet d’en formaliser les modifications1. La théorie de Savage est, comme celle de

Ramsey, à connecter avec la théorie humienne de la croyance comme disposition à l’action2, c’est ce que viendra formaliser, entre autres l’axiome 43.

Pour Savage, les décisions en contexte d’incertitude (« in the face of uncertainty ») sont le lot quotidien des sujets humains, des organisations et même des animaux4. En effet, il y a un nombre extrêmement élevé de variables que nous ne contrôlons pas dans notre environnement décisionnel. La question qui se pose ici est de savoir dans quelle mesure la logique – ici une logique inductive du type de celle que propose Ramsey5 – peut pallier cet inconvénient : « It must be admitted that logic itself does lead some criteria for decisions »6.

Si la logique de la décision peut être conçue comme un guide pour le choix rationnel et par là même pour l’action, nous pouvons nous demander quel type de « décideur » Savage a à l’esprit lorsqu’il élabore sa théorie : « I am about to build up a highly idealized theory of the behavior of a ‘rational’ person with respect to decision »7. L’agent rationnel auquel s’adresse                                                                                                                                                                                                                                                                                                                                                             proposition. Une de nos analyses dans notre troisième chapitre insistera justement sur la pertinence de ce « code de cohérence » dans le cadre du fonctionnement du système de référence décisionnel. Concernant l’aspect normatif des probabilités, voir Savage, op. cit., p 59 ; et aussi l’excellente analyse de Saint-Sernin (1973), p 45 ; et Picavet (1996), p 191. Pour un point de vue plus récent sur cette problématique, voir T. Martin (Ed.) (2003).

1 C’est un des réquisits centraux du bayésianisme ; voir, Gärdenfors (1988), p 4-10 ; Baron (1988), p 121-134 ; Gilboa et Al.

(2004), p 3-4 ; Griffith/Yulle in Chater/Oaksford (2008), p 33-57. Peterson (2009), p 125-130 ; Binmore (2009), p 116-134. On peut aussi se reporter à Bradley (2006), p 5-6 qui récapitule et unifie les vues de Ramsey et Savage.

2 Voir à ce sujet Engel (1997) et Picavet (1996), p 53-95.

3 L’étude de cet axiome nous révélera que les choses sont plus nuancées et plus complexes. 4 Savage associe plusieurs fois les animaux aux problèmes décisionnels.

5 Voir Ramsey (1926), p 187.

6 Savage (1954), p 6. Il est intéressant de comparer cette phrase avec ce que dit Savage sur le rôle « régulateur » de la logique

à la page 59 : qu’elle ne saurait être le seul critère normatif pour l’existence. Il y a une sous-détermination radicale de la vie par la logique, et ce dans de multiples dimensions qui dépassent largement le cadre de la théorie de la décision. C’est ce que nous tenterons de montrer dans notre troisième chapitre : la philosophie de la volonté doit remplacer la logique de la décision. Concernant l’aspect de la logique conçue comme un ensemble de règles à caractère normatif et les problèmes qui y sont reliés, on peut se reporter aux travaux séminaux de Wason (1960), (1966) ; ainsi qu’à Baron (1988), p 50 et p 77-97. Une partie de l’entreprise de Kahneman et Tversky, dans leur théorie des heuristiques et des biais, sera de montrer que la logique inductive, non plus n’est pas normative ; voir, Tversky/Kahneman (1974) ; Andler (2004), p 315-405.

Savage est une personne hautement idéalisée, c’est-à-dire capable de faire des choix totalement logiques et cohérents1. En outre, l’agent en question, comme c’était déjà le cas chez Ramsey et N/M, doit être capable d’ordonner et de hiérarchiser toutes les options qui se présentent à lui. La personne idéale à laquelle se réfère Savage est celle qui respecterait ses axiomes dans toutes les situations possibles, pourvu qu’elles soient assez circonscrites et précises2.

La première étape de cette reconstruction du choix rationnel consiste en un découpage aussi fin que possible de la réalité décisionnelle en termes d’ensembles, de sous-ensembles, d’éléments et d’algèbres de sous-ensembles3. Savage introduit deux ensembles fondamentaux – que viendront relier des fonctions : les actes – avec leurs éléments :

• S : le monde. Mais il faut être attentif au fait que le monde en question est l’ensemble de tous les éléments pertinents pour une décision donnée, c’est-à-dire les états du monde possibles dans un contexte précis. Il ne s’agit donc pas ici de l’ensemble de tous les objets de l’univers4. La taille du monde à considérer est tributaire du type de décision que nous avons à prendre. Donc : « In application of the theory, the question will arise as to which world to use in a given context »5.

Par exemple, si le sujet a en face de lui une douzaine d’œufs et qu’il se demande si l’un d’eux ou plusieurs sont avariés, le monde pertinent dans ce contexte-là sera l’ensemble de tous les sous-ensembles de descriptions possibles attachées à la douzaine d’œufs, soit                                                                                                                

1 Remarquons que Savage soulève ici un problème important, qui va être dirimant en théorie de la décision : dans quelle

mesure la théorie peut-elle avoir une portée pratique, ou plutôt, dans quelle mesure la théorie est-elle applicable en contexte décisionnel par les sujets que nous sommes ? À ce sujet, et pour une approche originale de cette question, voir Weirich (2004). L’ouvrage de cet auteur, dont le sous-titre est : « Rules for non-ideal agents in non-ideal circumstances » semble être une réponse partielle au problème soulevé ici par Savage. Une large partie des travaux séminaux de Gigerenzer, sur lesquels nous reviendrons, seront consacrés à la critique des postulats de rationalité dans le cadre d’une analyse de la rationalité limitée.

2 Pour Savage il y a une adéquation stricte entre l’axiomatique et la rationalité, nous pourrions même dire que la rationalité de

l’agent passe par le respect de l’axiomatique. Toutefois, nous pouvons d’ores et déjà noter que le « code de cohérence » pour un sujet idéal que constitue la théorie de Savage sera la cible de nombreuses critiques, dont celle d’Allais (1953). Pour un point de vue plus contemporain sur la normativité des axiomes de Savage, voir Gilboa et Al. (2009) ; ainsi que Picavet (1996), p 222-228 qui s’appuie sur les critiques importantes formulées contre la théorie de Savage par R. Sugden (1991).

3 Pour une introduction à ces notions, voir Fishburn (1973), p 130-134 ; Kreps (1988), p 115-126.

4 Savage envisage cette possibilité page 9, mais il la rejette immédiatement, car il la trouve trop vague et peu réaliste : les

mondes dans lesquels nos décisions prennent place doivent être le plus circonscrits possible, et se situer dans ce que Savage nomme un « petit monde », l’auteur analyse ce concept aux pages 82-90 ; voir aussi Picavet (1996), p 196 et suivantes ; Shafer (1986), p 466-467.

5 Savage (1954), p 9. Comme nous le remarquions dans la note précédente, cela nous indique que la théorie de Savage est

d’emblée limitative, elle ne pourra être appliquée qu’à des décisions inscrites dans un « petit monde ».

descriptions possibles. Le concept de monde introduit par Savage est un ensemble d’états du monde qui sont ses éléments et qui sont notés s. Parmi ces états du monde possibles, un seul est vrai, un seul va se réaliser à l’exclusion1 de tous les autres : « The state in fact obtain (…) is the true description of the world »2.

Concernant ce premier découpage ensembliste nous avons donc trois niveaux de

description : a) le monde S3 comme ensemble de tous, b) les états du monde : , et

c), l’état du monde qui est le cas et qui met fin à l’ignorance lorsqu’il advient. L’état du monde qui se réalise représente le passage du possible au réel4.

À partir du concept d’état du monde Savage construit le concept d’événement, les événements sont notés A, B, C, etc. : « An event is a set of states »5. Un événement sera donc un sous-ensemble A – sur lequel pourra être construite une algèbre booléenne – de S ( ) ayant un nombre n de s comme éléments ( )6. Par exemple dans le cas de notre boîte d’œufs, le sujet peut se demander si exactement un seul est pourri, ici il s’agit d’un événement qui a l’ensemble de 12 états du monde comme éléments. Si par contre, il se demande si au moins un œuf est pourri, l’événement de référence aura cette fois états du monde comme éléments7.

Afin de pouvoir appliquer les opérateurs de l’algèbre de Boole, Savage introduit deux événements d’un genre particulier : l’événement universel (S) et l’événement vide (noté O)8. Ces deux concepts ont une fonction importante tant au niveau opératoire que conceptuel, en particulier lorsqu’il va s’agir de conditionaliser sur les événements : le fait que l’événement                                                                                                                

1 Le concept d’exclusion est ici central, les états du monde, tout comme les événements sont disjoints. 2 Savage (1972), ibid.

3 La question de savoir si S est fini ou infini est importante dans le cadre de la théorie de la mesure qui sera élaborée après le

quatrième axiome, nous reviendrons sur ce problème à ce moment-là.

4 Sur le concept d’« états du monde », voir Fishburn 1970, p 163-174. Son approche est plus générale que celle de Savage

mais néanmoins très éclairante.

5 Savage (1972), p 10.

6 Voir Fishburn (1970), p 130-131, et Kreps (1988), p 116-117 ; voir aussi pour plus de détail, l’article essentiel et fondateur

de Kraft/Pratt/Seidenberg (1959), ainsi que Fishburn (1986), p 336 ; et Suppes (1994). Toutes ces considérations sont essentielles dans le cadre de la définition d’une probabilité qualitative telle que définie par de Finetti (1931) et (1937).

7 Cet exemple simple est particulièrement pertinent pour comprendre comment Savage découpe, de façon aussi précise que

possible, la réalité. En fait le découpage doit être opéré en fonction de la décision à prendre. Nous pourrions dire qu’il faut que le sujet soir capable d’ajuster le contexte aux décisions qu’il va prendre, et donc par là même d’évacuer les éléments non pertinents. À ce sujet voir Picavet (1996), p 197. Nous reviendrons sur ces problèmes d’ajustement du contexte décisionnel en fonction du système de référence des sujets dans notre troisième chapitre, nous resterons assez proches des vues de Savage.

8 Dans le calcul ils vont jouer le rôle du 0 et du 1 en algèbre de Boole ; voir Savage, p 10. L’événement universel a comme

éléments tous les états du monde possibles pour une décision donnée, l’événement vide lui n’a aucun état du monde comme élément, il correspond à l’ensemble vide. Sur le rôle opératoire de ces concepts en logique et en théorie des ensembles, voir Halmos (1965) ; Suppes (1972) ; Lepage (2010).

s1, s2, s3,..., sn

A⊂ S s∈A

considéré soit non nul est une condition sine qua non de la conditionalisation1, puisque la

probabilité p|A = p si A est nul.

• Le deuxième ensemble que Savage introduit est l’ensemble F des conséquences, notées f, g, h, etc.2 : « A consequence is anything that may happen to the person »3.

Ce deuxième ensemble est nécessaire pour formaliser les objets ultimes des préférences que sont les conséquences, mais aussi pour construire de façon originale le concept d’acte. La conséquence est le résultat commun de l’acte et de l’inscription dans la réalité d’un état du monde donné, état du monde qui voit son statut se modifier alors en « état de la personne » : « Consequences might appropriatly be called states of the person, as opposed to states of the world »4.

Afin de rendre plus clair ce qu’il veut démontrer, Savage utilise un exemple bien connu5 visant à montrer comment dans un contexte élémentaire et assez épuré se découpe la

réalité selon les concepts de monde, états du monde et conséquences, et comment dans cette structure théorique doit être modélisé le concept central d’acte6.

L’exemple, que nous allons présenter ici, est le suivant : voulant aider sa compagne – qui a déjà cassé cinq œufs dans un saladier afin de préparer une omelette – un homme s’apprête à casser le sixième œuf qui est posé sur le comptoir de la cuisine. Le protagoniste ne                                                                                                                

1 Voir, Skyrms (1986), p 138-148 ; Baird (1992) p 201-233 ; Hacking (2004) p 57-66.

2 Cet ensemble peut être fini ou infini. L’axiome 7 viendra formaliser la finitude de cet ensemble pour les actes. Savage

envisage cependant le cas d’actes ayant des conséquences infinies en analysant le pari de Pascal par exemple ; voir Savage (1954) p 77.

3 Savage (1954), p 13. Il y a un certain conséquentialisme de la théorie de Savage ainsi que dans l’axiomatique N/M, qui doit

être connecté avec son pragmatisme : les actes sont en vue des conséquences, et la délibération qui précède est en vue de l’acte. Nous retrouvons ici un schéma proche de celui proposé par Aristote dans l’Éthique à Nicomaque, voir par exemple, la première partie du livre III. Il y aurait des parallèles à mener entre le rôle du syllogisme pratique chez Aristote et la théorie de la décision chez Savage.

4 Savage (1954), p 14.

5 L’exemple de « l’omelette de Savage » est un exemple archétypique en théorie de la décision, il est systématiquement repris.

Mentionnons ici les approches de Luce/Raiffa (1957), p 276-277, avec une matrice parfaitement adéquate pour décrire les décisions en contexte d’incertitude ; et l’excellente analyse de Jeffrey (1976), p 361-371.

6 Ici, nous observons encore un léger écart avec les théories de Ramsey (1926) et N/M (1947). Savage est en effet le seul des

auteurs que nous étudions à considérer le concept d’acte et de préférences sur les actes comme premiers dans sa théorie. Les théories précédemment étudiées parlaient avant tout de préférences sur des différences de valeurs entre des mondes possibles (Ramsey) ou de préférences sur les événements construits comme des loteries, ces deux notions bien qu’étant très proches ne