• Aucun résultat trouvé

L’axiomatique de von Neumann et Morgenstern.

Les fondements du modèle de Davidson (1957)

2.1. Le modèle canonique de la théorie de la décision : de l’héritage ancien aux débats modernes

2.1.4. L’axiomatique de von Neumann et Morgenstern.

La particularité de l’axiomatique de vNM est qu’elle est largement imprégnée de l’analogie avec la physique mentionnée plus haut comme cela se voit dans la formulation première de leur axiomatique par vNM (voir encadré). Toutefois les notations mathématiques à l’époque choisies par vNM pour formuler leurs axiomes sont pour le lecteur d’aujourd’hui peu claires. Nous présenterons donc dans un premier temps la formulation moderne des axiomes de manière à disposer d’une présentation suffisamment conventionnelle pour nous permettre de comparer la théorie de vNM à celle de Savage par exemple.

Le point de départ de l’axiomatisation de vNM est la théorie ordinale des préférences.

Comme on l’a signalé plus haut, leur présentation des postulats et axiomes de la théorie peut sembler archaïque au théoricien de la décision moderne tant les objets et

55

les opérations de la théorie manquent de raffinement. Là où les partisans d’une conception ordinale des préférences utilisaient comme éléments de base des préférences sur des objets, vNM – du fait de l’analogie mentionnée plus haut, entre théorie physique et théorie économique – considèrent que la relation de préférence portent sur des utilités et c’est précisément ce que va remettre en cause la théorie moderne, lorsqu’elle reformulera la relation de préférence de vNM en la faisant porter non pas sur des utilités mais sur des loteries.

Pour exposer cette présentation moderne, nous avons choisi de reprendre celle de Luce et Raiffa [1957, 1985]54 particulièrement claire et précise55.

Selon Luce et Raiffa, on peut partir de l’idée qu’un individu dispose d’un certain classement de préférences entre des issues (que ce soient des gains monétaires, ou des récompenses d’un jeu) A, B, et C tel que A est préféré à B, B à C et A à C. Un pari risqué consisterait à proposer à l’individu de choisir entre l’option 1 ayant pour résultat d’obtenir B pour sûr et l’option 2 revenant à un pari dont les deux issues sont A et C pondérée respectivement par les probabilités p et 1-p. On demande donc au sujet de comparer et de décrire ses préférences entre une option certaine et une loterie (c'est-à-dire une option revenant à deux issues mutuellement incompatibles pondérées par des probabilités relatives à leur obtention). Comme le soulignent Luce et Raiffa [1957, p. 21], il semble clair que plus p se rapprochera de la valeur 1, c'est- à-dire de la chance maximale, plus l’individu sera tenté de choisir l’option 2, et symétriquement, plus p se rapprochera de 0, plus l’individu sera tenté de choisir l’option 1.

Le pari est généralement considéré comme le point de départ des problèmes de prise de décision en situation de risque (Luce et Raiffa [1957, 1985], p. 19). Le pari permet, en effet, non seulement d’avoir accès à l’évaluation des issues par l’individu mais aussi à la manière dont il les évalue dans une situation particulière (Luce et Raiffa [1957, 1985], p.21)56.

54 Nous nous appuierons sur la seconde édition de 1985.

55 Bien qu’il existe évidemment d’autres reformulations modernes comme celles de Herstein et Milnor [1953], celle de Jensen [1967] ou encore celle de Tversky [1975].

56

Comme le souligne Emmanuel Picavet [1996], cette référence au pari remonte au moins à Kant qui dans la

Critique de la raison pure avançait l’idée que la « pierre de touche communément employée pour déterminer

si quelque chose que quelqu’un affirme est une simple persuasion, ou du moins une conviction subjective, c'est-à-dire une croyance solide, est le pari » (Kant [1781, 2001], pp.669-670).

56

Cette représentation des préférences sur des issues dont certaines sont des loteries constitue le point de départ et la condition nécessaire pour attribuer, dans un second temps, des utilités, et donc des nombres à ces issues.

L’objectif de la théorie de la prise de décision (decision making) en situation risquée est de présenter un certain nombre d’hypothèses (sous formes d’axiomes)57 permettant non seulement de représenter un modèle « idéalisé » des préférences – et donc de présenter les conditions de cohérence et de rationalité - mais aussi de préciser les modalités de la représentation des préférences par des utilités numériques.

La première hypothèse (axiome) H1 est relative aux choix d’un individu entre des paires de tickets de loteries58 notés L = (p1A1, p2A2,…, prAr) et L’ = (p1’A1, p2’A2,…, pr’Ar) où {p1, …, pr} représentent l’ensemble des probabilités et {A1, ..., Ar} l’ensemble des lots.

Comme le soulignent Luce et Raiffa, si L est préférée à L’, alors l’individu préfère « l’expérience associée » à la loterie L à celle de la loterie L’.

Le symbole ≳ est utilisé pour représenter la préférence faible (c'est-à-dire la situation ou soit l’individu préfère Ai à Aj soit la situation où l’individu est indifférent entre les deux) d’un individu.

H1 (hypothèse d’ordre). Pour tout Ai à Aj dans l’ensemble des lots, l’une de ces relations est valable : soit Ai ≳ Aj, soit Aj ≳ Ai. Cette relation de préférence est transitive : si soit Ai ≳ Aj et soit Aj ≳ Ak alors soit Ai ≳ Ak.

Cette hypothèse d’ordre permet de relier les débats relatifs à la décision en situation risquée à la conception ordinale dominante avant la publication de l’ouvrage de vNM en 1944. Toutefois, vNM n’évoquent ni un ensemble de résultats ni la question de l’indifférence comme on le verra dans l’encadré 1.

57 Luce et Raiffa [1957, 1985], p. 24.

58 « Un ticket de loterie est un mécanisme de probabilité (chance mechanism) produisant des lots représentés par des résultats ayant une certaine probabilité » (Luce et Raiffa [1957, 1985], p. 24). Autrement dit, un ticket de loterie offre la possibilité de participer à un pari offrant des résultats conditionnés à des probabilités connus à l’avance (dans le cas présent) – ou perspectives aléatoires ; ce pourquoi on qualifie ces résultats de risqués dans la mesure où nul ne peut avoir l’assurance que tel résultat va se produire.

57

Si l’on considère les loteries L(1), L(2),…, L(s) composées les lots A1, A2, ..., Ar ainsi que des nombres réels non négatifs q1, q2, …, qs dont la somme égale 1, alors (q1 L(1), q2 L(2),…, qs L(s)) représentent une loterie composée dont les lots sont eux-mêmes représentées par des loteries.

H2. Axiome de loteries composées

Toute loterie composée est indifférente à une loterie simple dont les lots sont A1, A2, ..., Ar dont les probabilités sont calculées selon le calcul ordinaire des probabilités. En particulier, si

L(i) = (p1(i) A1, p2(i) A2, …, pr(i) Ar) pour i = 1, 2, …., s,

Alors (q1 L(1), q2 L(2),…, qs L(s)) ∼ (p1A1, p2A2, …, prAr), avec pi = q1pi(1)+ q2pi(2)+…+ qspi(s).

Autrement dit, cette hypothèse rend possible la réduction de loteries composées à des loteries simples. Cet axiome est explicitement présent chez vNM (axiome (Cb) voir encadré). Même si certains auteurs comme Samuelson [1952] considèrent que c’est un axiome purement technique qui relèverait uniquement de l’algèbre et non du comportement humain (Samuelson [1952], p. 671), les implications de cet axiome pour la théorie sont pourtant significatives.

En effet, comme le soulignent Luce et Raiffa, cet axiome permet de faire abstraction de tout « plaisir dans le jeu » (joy in gambling), d’ « atmosphère de jeu » (atmosphere of the game) et de « plaisir du suspense » (pleasure in suspense) puisque cette réduction des loteries composées à des loteries simples signifie que l’individu est indifférent au fait de jouer une fois ou plusieurs fois (Luce et Raiffa [1957, 1985], p. 26).

Cette hypothèse est donc essentielle si l’on se place dans une perspective expérimentale de la théorie puisque les choix proposés aux sujets sont généralement des choix répétés comme dans les expériences de Davidson et Suppes [1957].

H3. Axiome de continuité

Chaque lot Ai est indifférent à un ticket de loterie impliquant A1 et Ar c'est-à-dire qu’il existe un nombre ui tel que Ai ∼ [uiA1, (1-ui) Ar].

58

H4. Axiome d’indépendance

Pour toute loterie L, si A1∼ Ar alors, [αA1, (1-α) A2] ∼ [αAr, (1-α) A2].

Autrement dit, si une loterie est jugée indifférente à une autre, le fait de combiner chacune d’elle par une même tierce loterie ne changera pas la relation initiale d’indifférence.

Cet axiome n’est pas explicitement présent dans l’axiomatique de vNM (voir encadré). La présentation moderne de cet axiome semble être initialement apparue dans l’article de Marschak [1950]. L’axiome existe aussi dans l’article de Friedman et Savage [1952] sous le nom de troisième postulat (p.358) bien que les auteurs ne lui donnent pas le nom d’axiome d’indépendance. La présentation de cet axiome sous l’expression « axiome d’indépendance » se trouve toutefois dans l’article de 1952 de Samuelson qui évoque lorsqu’il présente son deuxième axiome, l’ « indépendance forte ». Malinvaud [1952] montrera le caractère implicite de cet axiome dans l’axiomatique de vNM.

A partir de ces quatre hypothèses, il est possible de montrer qu’il existe une fonction

u( .) à valeurs réelles sur l’ensemble des loteries.

En effet, si un individu dispose d’une relation de préférences ≳ transitive sur l’ensemble des loteries et si pour chaque loterie on peut assigner un nombre u(L) tel que :

(a) u(L) ≥ u(L’) si et seulement si L >~ L’

Alors, nous pouvons dire qu’il existe une fonction d’utilité u(.) sur l’ensemble des loteries et que cette fonction d’utilité a la propriété suivante :

(b) u (L , L’ ; p , 1 – p) = pu(L) + (1 – p) u(L’)

Autrement dit, elle est linéaire en probabilités.

La classe des fonctions d’utilité qui respecte ces conditions est définie à une transformation affine positive près telle que v(x) = au(x) + b avec a > 0.

59

La présentation de l’utilité espérée de vNM avec les notations originales des auteurs(1947)

Les objets de la théorie, c'est-à-dire ceux sur quoi vont porter les différentes opérations issues de la théorie physique, sont donc les utilités elles-mêmes c'est-à- dire des objets physiques tout comme les poids.

vNM considèrent que la relation d’ordre59, définie sur l’ensemble des utilités, est une relation binaire « naturelle », notée « > » au même titre que l’opération naturelle mentionnée plus haut – est complète et totale. La complétude est assurée par les deux opérations strictes « > » et « < »60. Cette relation est complète si l’on peut écrire : (A) u > v ou v < u.

vNM n’intègrent pas véritablement l’égalité qu’ils considèrent comme une vraie identité (vNM [1947], p. 617).

vNM considèrent que pour tous u, v une seule de ces trois relations est valable : (A1) u = v, u > v, u < v.

Les auteurs insistent aussi sur l’hypothèse de transitivité : (A2) u > v, v > w implique u > w.

La deuxième étape consiste à décrire les axiomes d’ordre et de combinaison (B) (vNM [1947], p.26) :

(Ba) u < v implique que u < αu + (1-α)v61 ;

(Bb) u > v implique que u > αu + (1-α)v ;

(Bc) u < w < v implique l’existence d’un α tel que αu + (1-α) v < w ; (Bd) u > w > v implique l’existence d’un α tel que αu + (1-α) v > w. L’interprétation de ces axiomes est la suivante :

(Ba) : si v est préférée à u, alors la combinaison de u et de v pondérées respectivement par α et 1 – α est préférée à u ;

(Bb) cela correspond à l’axiome (Ba) avec la relation « moins préférée à » à la place de « préférée à » ;

(Bc) si w est préférée à u et que v est préférée aux deux autres, alors la combinaison de u avec la probabilité α et v avec la probabilité 1-α ne va pas affecter la relation de préférence par rapport à w à condition que la probabilité soit suffisamment faible ; (Bd) même interprétation que (Bc) en remplaçant « moins préférée » par « préférée à ».

La littérature de la théorie de la décision qualifie (Bc) et (Bd) de « principe de la chose sûre ».

59 vNM utilisent le terme « ordering » et non « preordering ». En effet, vNM postulent une relation de préférence stricte – en référence aux sciences physiques – ce qui explique pourquoi ils notent la relation de préférence avec les signes <,> et =. Par ailleurs, l’ordre des préférences portent sur les « utilités » - comprises comme des entités physiques comme la chaleur ou le poids.

60

vNM [1947], p.26. 61

60

Troisième étape, les axiomes de combinaison (C) : (Ca) αu + (1-α) v = (1-α) v + αu.

(Cb) α (βu (1-β) v) + (1-α) v = γu + (1-γ) v, où γ = αβ.

Ces axiomes, et tout particulièrement le dernier, rendent possible la réduction de combinaisons d’utilités pondérées par des probabilités (selon l’expression moderne des « loteries composées ») à de simples combinaisons d’utilités conditionnées à des probabilités (des loteries simples). Cette assimilation préserve le l’ordre complet valable pour les simples combinaisons d’utilités pondérées par α et (1-α).

Grâce à ces axiomes, les auteurs ont défini l’utilité numérique à laquelle on peut appliquer le calcul des espérances mathématiques.

L’objectif ultime est de montrer que les axiomes sur le comportement permettent d’élaborer un théorème de représentation des choix comme résultant de la maximisation de l’espérance mathématique des utilités.

La première étape consiste à trouver une correspondance entre les utilités et les nombres qui vérifie la double relation : on a pour les utilités u et v la relation « naturelle » u > v (c'est-à-dire u est préféré à v) et l’opération « naturelle » α u + (1- α) v, (0 < α < 1) (lire : la combinaison de u, v avec les probabilités α, 1-α). On doit trouver une correspondance entre les utilités et les nombres qui supporte la relation u > v et l’opération α u + (1-α) v.

La correspondance peut s’écrire :

u → ρ = v(u) ; u étant l’utilité et v(u) le nombre qui lui est rattaché.

Les exigences sont les suivantes : • u > v implique que v (u) > v (v)

v (αu + (1-α) v = α v (u) + (1-α) v (v)

Ceci, si les deux correspondances suivantes existent : • u → ρ = v (u),

u → ρ’ = v’(u).

Dès lors, on a une correspondance entre les nombres qui peut s’écrire ρ’= Ф (ρ). Si les deux correspondances fonctionnent, il s’ensuit que les deux exigences évoquées sont satisfaites. En outre, si ρ’= Ф (ρ), cela conduit à la relation ρ > σ qui permet l’opération αρ + (1-α) σ, c'est-à-dire que les opérations sur les nombres suivent les opérations sur les utilités. D’où :

• ρ > σ implique que Ф (ρ) > Ф (σ)

• Ф (αρ + (1-α) σ = αФ (ρ) + (1-α) Ф (σ), où Ф (ρ) est une fonction linéaire. Si une évaluation numérique des utilités existe, alors elle est déterminée à une transformation monotone linéaire près.

(D) la fonction d’utilité

Von Neumann et Morgenstern définissent deux utilités certaines (non pondérées par des probabilités) u0 et v0. A partir de la relation u0 < v0, et pour tout w défini sur l’intervalle u0 < w < v0, on définit la fonction numérique f (w) = f u0, v0 (w) comme suit :

f (u0) = 0 f (v0) = 1

61

f (w), pour w ≠ u0, v0 c'est-à-dire avec u0 < w < v0, est un nombre α dans l’intervalle 0 < α < 1 dans le sens où l’on a les deux opérations mentionnées plus haut : u > v et αu + (1-α) v ainsi que la relation α → w = (1-α) u0 + α v0.

On a, dès lors, la carte62 w → f (w) qui a les propriétés suivantes : • elle est monotone

pour O < β < 1 et w ≠ u0, on a f ((1-β) u0 + βw = β f (w)

pour O < β < 1 et w ≠ v0, on a f ((1-β) v0 + βw) = 1- β + βf (w).

On trouve ici l’expression de la théorie de l’utilité espérée. Ce dernier met en relief l’existence d’une fonction f représentant la satisfaction de l’agent, aussi bien dans le cas certain que dans le cas risqué. Dans ce dernier cas, elle prend la forme d’une espérance mathématique d’utilité sur les gains possibles. Le fait d’utiliser une même fonction d’utilité témoigne d’une volonté de vNM d’intégrer l’analyse par les courbes d’indifférence au sein de leur propre schème. Cette idée sera reprise dans l’article de Friedman et Savage (1948) et fera même l’objet d’une tentative d’expérimentation par ces deux auteurs.

2.1.5 Friedman et Savage, une refonte du modèle de von Neumann et