• Aucun résultat trouvé

Enrichissement de la théorie de l’utilité actualisée, introduction de la structure par

Les travaux récents sur la théorie de l’utilité actualisée (DU) ont cherché à mieux rendre compte des déterminants des choix individuels dans une situation ou les conséquences de ces choix s’étendent dans le temps. Trois axes peuvent être identifiés dans l’ensemble de ces travaux :

la modification de la structure de la fonction d’utilité instantannée dans le modèle de base ;

l’introduction de la structure par terme du taux d’escompte psychologique dans le modèle de base ;

la remise en cause de la théorie de l’utilité actualisée.

Ces développements fournissent des cadres d’hypothèses et des explications différentes des préférences temporelles. Le présent chapitre ambitionne de présenter une synthèse de ces travaux.

I. Utilité actualisée avec fonction d’utilité instantanée modifiée

L’un des enrichissements apportés à la version de base de la théorie de l’utilité actualisée a été de modifier la structure de la fonction d’utilité instantanée proposée par Samuelson (1937) dans la construction de la fonction d’utilité inter-temporelle.

Ces travaux se sont développés autour de six modèles :

modèle de l’utilité actualisée avec formation des habitudes ; modèle de l’utilité actualisée avec biais de projection ; modèle de l’utilité actualisée avec point de référence ;

modèle de l’utilité actualisée avec fonction d’utilité de Veblen ; modèle incorporant une utilité des anticipations ;

modèle inter-temporel avec incertitude ;

1. Modèle avec formation des habitudes

Le modèle avec formation des habitudes formalisé par Pollak (1970)16 et Ryder Jr and Heal (1973) à la suite des travaux de Duesenberry (1952); il stipule que dans la fonction d’utilité inter-temporelle de Samuelson (1937), la fonction d’utilité instantanée ne dépend plus seulement de la quantité de bien attendue à la date courante mais devrait dépendre aussi d’une

variable d’état notée zt. Ainsi, le choix du décideur est obtenu par la maximisation de la fonction d’utilité inter-temporelle qui s’écrit comme suit :

( )

(

)

= − = 1 1 , t t t t z c u C U ρ avec 0 < ρ < 1 et ² >0 ∂ ∂ ∂ t t z c u

La variable d’Etat zt est une variable spécifique à l’individu. Ainsi, la fonction d’utilité

instantanée admet la forme suivante : u(ct, zt).

Les auteurs imposent la contrainte ² >0

∂ ∂ ∂ t t z c u

qui signifie que la dérivée croisée entre la consommation courante et la variable d’état est positive. De cette hypothèse, on tire que la variable d’état bonifie l’impact sur le bien-être de la consommation de chaque instant. Elle exerce un effet positif sur l’utilité de la consommation de chaque instant.

Les travaux qui ont emprunté ce chemin ont donné des significations différentes à la variable d’état.

Pollak (1970)17 et Ryder Jr and Heal (1973) postulent que la variable d’état est la moyenne

pondérée des consommations passées :

+∞

= − = 1 i i t i t c

z γ et 0 < γ < 1. Cette formulation revient à

intégrer un effet d’inertie des consommations passées. Dans ce cas, la variable z est l’effet agrégé des consommations passées. Elle mesure la mémoire des consommations (revenus) passées qui s’estompe lorsque le temps passe puisque les coefficients de pondération sont sous la forme exponentielle. Plus une consommation est lointaine, moins elle a de l’effet sur le bien être à une date donnée.

Ryder Jr and Heal (1973, p. 2) s’appuient sur cette formalisation pour construire un modèle de croissance économique optimale avec variable d’état inter-temporelle. On retrouve cette formulation chez Detemple and Zapatero (1991) dans le modèle d’analyse de la dynamique du prix des actifs.

L’absence de la prise en compte de cette hypothèse pourrait justifier les taux d’escompte relativement élevés obtenus dans les travaux empiriques de la première génération. En effet, dans l’hypothèse de l’impact des consommations passées sur le bien être présent, la consommation à une date donnée joue un double rôle. Elle procure un bien être instantanée et bonifie le bien être tiré des consommations sur les périodes suivantes. Ainsi, l’individu à

tendance à plus consommer aujourd’hui. Pour le décideur, le choix du niveau de consommation à une date donnée dépend de ce double effet.

L’ignorance de l’effet d’inertie de la consommation dans l’estimation du taux d’escompte psychologique a pour effet d’attribuer le poids relatif de la consommation courante par rapport aux consommations ultérieures au taux d’escompte psychologique. Il s’en suit alors une surévaluation du taux d’escompte psychologique qui serait alors exagérément élevé. D’autres travaux tels que ceux de Constantinides (1990), Wachter (2002), Verdelhan (2010), Dubin et al. (2011) assimilent la variable d’état à un niveau de consommation ou de revenu attendu par l’individu du fait de ses habitudes de consommation. La fonction d’utilité instantanée s’écrit en fonction de la différence entre le niveau de la consommation de la période et la variable d’état qui joue alors le rôle de point de référence, de niveau de consommation attendue ou imposée par l’environnement économique ou les exigences de l’individu. La formulation de la fonction d’utilité inter-temporelle devient alors

( )

(

)

= − − = 1 1 t t t t u c z C U ρ

Par exemple, Wachter (2002) propose un modèle de formation des habitudes pour expliquer la dynamique du rendement des obligations et des actions. Verdelhan (2010) s’appuie sur un cadre identique pour étudier la dynamique de la prime de risque du taux de change.

Un autre modèle ayant pris en compte les habitudes dans la théorie de l’utilité actualisée est proposée par Gomes and Michaelides (2003) qui ont développé un modèle inter-temporel de choix de portefeuille avec formation des habitudes dans lequelle la variable d’état intervient comme un quotient de la consommation avec un facteur de contrôle dans la fonction d’utilité instantanée. La fonction d’utilité inter-temporelle s’écrit comme suit :

( )

∞ = −       = 1 1 t t t t z c u C U ρ γ

Le terme γ est un paramètre de sensibilité aux habitudes qui permet de donner de la flexibilité

au modèle. Lorsqu’il est égal à 0, l’on retrouve la version de base de la théorie de l’utilité actualisée.

En outre, il postule une dynamique d’ajustement adaptative de la variable d’état (niveau d’habitude) comme suit :

zt = (1- λ) zt-1 + λ Ct-1

Plus récemment, Yoon (2011) a développé un modèle de formation des habitudes quasi- myope (quasi-myopic habit formation) dans lequel l’individu n’anticipe pas totalement le changement d’habitudes de consommation. Ce modèle permet d’étudier les problèmes de self control en postulant que l’individu peut se tromper sur ses goûts futurs.

Cette théorie a largement été utilisée pour expliquer des choix économiques et financiers. Nous avons donné plusieurs exemples dans les lignes précédentes. Il s’agit, entre autres de Detemple and Zapatero (1991) qui utilise un modèle inter-temporel de formation des habitudes pour étudier la dynamique du cours des actifs dans le cadre d’un Consumption Capital Asset Pricing Model (CCAPM).

Par ailleurs, Wathieu (1997) montre que le modèle d’utilité actualisée avec formation des habitudes permet de corriger certaines anomalies du modèle de base ; notamment le phénomène de décroissance de l’impatience et la propension des individus à préférer, à somme actualisée des utilités constante, l’option composée de séquences croissantes à l’option composée de séquences décroissantes.

Toutefois, le modèle d’utilité actualisée avec formation des habitudes est un modèle normatif. Rien n’assure que l’individu a une juste évaluation de ses habitudes pour constamment prendre en conséquence sa décision.

2. Modèle avec biais de projection

L’ensemble des travaux que nous avons présentés font l’hypothèse implicite que l’individu à une entière connaissance de sa fonction de bien être (utilité ou felicity) instantannée à toutes les périodes. Mieux, il est supposé que la fonction d’utilité ne variera pas.

La contribution de Loewenstein et al. (2003) a été de remettre en cause cette hypothèse et de développer un modèle qui intègre un bais sur l’estimation de l’utilité des consommations futures. En effet, les goûts de l’individu dépendent de ses habitudes, de son humeur, des influences sociales, … Dans sa prise de décision, soit l’individu n’intègre pas ce changement, soit l’intègre mais de façon imparfaite. Il est alors victime de biais de projection (changing taste). Pour les auteurs, ce changement de goût pourrait expliquer l’incohérence temporelle de l’individu.

Formellement, Loewenstein et al. (2003) postule que l’individu prend sa décision en optimisant la fonction d’utilité inter-temporelle ci-après.

( )

(

)

= − = 1 1~ , t t t t s c u C U ρ avec 0 < ρ < 1

Avec st : un indice de mesure du goût de l’individu qui varie dans le temps

Les auteurs postulent que l’individu se trompe sur ses goûts futurs. En effet, ils notent u(ct,

s’t) la véritable fonction d’utilité de l’individu à l’instant t mais qui n’est qu’imparfaitement

connue par l’individu. Ce dernier considère que son utilité pour le niveau de consommation ct à la date t est u~

(

ct,st

)

=

λ

u

(

ct,s't

) (

+ 1−

λ) (

u ct,st

)

. Le paramètre λ mesure la sophistication

de l’individu. S’il est égal à 1 alors l’individu ne commet pas d’erreur sur son utilité future. A l’opposé, s’il vaut 0, l’individu se trompe carrément sur son utilité en supposant que son goût ne change pas et qu’il est égal à son goût actuel.

Les auteurs développent un modèle dans lequel ils combinent le biais de projection et la formation des habitudes. Dans ce modèle, la fonction d’utilité inter-temporelle de l’individu s’écrit :

( )

(

)

= − − = 1 1 t t t t vc s C U

ρ

avec 0 < ρ < 1, v’ >0 et v’’ < 0

Où st est le stock d’habitudes de l’individu qui s’ajuste dans temps comme suit :

st = (1- γ) st-1 + γ ct-1 avec 0 < γ < 1. Le paramètre γ donne une mesure de la vitesse

d’ajustement du goût de l’individu. En effet, l’ajustement du goût à un effet d’inertie et un effet d’adaptation en fonction de la consommation de la période précédente. Les conditions sur v (v’ > 0 et v’’ < 0) implique que la fonction de valorisation est croissante en ses arguments mais avec utilité marginale décroissante.

Cette formulation permet d’établir deux conclusions.

lorsqu’un individu ne se trompe pas sur l’utilité des consommations futures, si à un

moment donné sa consommation (ct) est supérieure à ses habitudes de consommation

(st) alors sa consommation a un profile croissant ct < ct+1 < … < cT.

lorsque l’individu est sujet à une contrainte budgétaire avec un revenu fixe, la formation des habitudes combinée avec le biais de projection fait que l’individu consomme plus en début de période et est condamné à réduire sa consommation en fin de période. Ce résultat pourrait expliquer le profil de consommation des salariés dans un mois lorsqu’ils sont soumis à une contrainte de liquidité (pas accès au découvert

bancaire ou découvert bancaire limité) ; ils ont une consommation élevée en début de mois et sont contraints de réduire drastiquement leur train de vie dans la deuxième moitié du mois.

Toutefois, si l’individu est conscient du fait que toute consommation excessive en début de période doit être payée en fin de période par une contrainte à réduire la consommation en fin de période, il réalise l’arbitrage inverse en baissant sa consommation en début de période pour l’augmenter en fin de période.

Somme toute, la contribution de Loewenstein et al. (2003) permet d’intégrer dans le programme de choix un univers incertain dû aux erreurs qu’il pourrait commettre sur son utilité future. Il permet de lier ses erreurs à l’incohérence temporelle observée dans les études empiriques. Cette contribution apporte de la flexibilité dans l’explication des choix individuels dans la mesure où ce cadre comprend le cadre de base de Samuelson (1937). Toutefois, certaines questions méritent d’être approfondies notamment la dynamique du goût de l’individu qui est exogène dans le modèle proposé ; le processus de correction du biais par exemple par l’introduction d’un mécanisme d’apprentissage de l’individu n’est pas encore intégré ; le processus d’accommodation ou de prise de conscience de ce biais n’est pas non plus pris en compte. Cette contribution ouvre des pistes de recherches pour l’amélioration du pouvoir explicatif de la théorie de l’utilité actualisée.

3. Modèle du point de référence

Le modèle du point de référence est inspiré des travaux de Kahneman and Tversky (1979) et Tversky and Kahneman (1992). Il a été développé par Loewenstein and Prelec (1992) qui proposent une fonction d’utilité inter-temporelle qui aurait la forme suivante :

( )

( ) ( )

= = 1 t t x u t D C U

Avec D(.)18 la fonction d’escompte psychologique et u(.) la fonction de valorisation

Les auteurs abandonnent la fonction d’utilité pour la remplacer par une fonction de valorisation des quantités de bien attendues ou à verser à chaque instant.

Les auteurs ne donnent pas une forme explicite à la fonction de valorisation mais suggèrent que cette fonction dépend d’un point de référence qui est spécifique à l’individu et qui tient compte de l’environnement avec ses incertitudes et ses opportunités, des capacités cognitives

18 Les auteurs ont proposé une modification de la fonction d’escompte en proposant une fonction d’escompte hyperbolique que nous présenterons plus loin dans le document.

et des ambitions de l’individu, etc. En outre, la fonction de valorisation devrait vérifier un certains nombres de propriété notamment :

elle doit comporter deux portions qui se connectent au point de référence, une pour les pertes (consommation ou revenu négatif) et l’autre pour les gains (consommation ou revenu positif) ;

la pente de la portion des pertes est plus élevé que celle de la portion des gains ; la fonction de valorisation est plus élastique pour les pertes que pour les gains ; la fonction de valorisation a une élasticité plus élevé pour les revenus élevés.

La propriété 1 fait dépendre l’utilité de l’individu d’un niveau de consommation (ou revenu) de référence et attendu. Une consommation supérieure à ce seuil est considérée comme un gain. Une consommation en deçà de ce seuil est considérée comme une perte. En outre, les auteurs postulent que la fonction u(.) est concave pour les valeurs positives et convexe pour les valeurs négatives.

La propriété 2 stipule que la fonction d’utilité instantannée obéit à la règle de la décroissance de l’utilité marginale. Ainsi, un individu peut être indifférent entre recevoir 100 € dans 1 mois et 150 € dans quatre mois mais préférer recevoir 1500 € dans 4 mois à 1000 € dans un mois.

Cette propriété permet de corriger le Magnitude effect.

La propriété 3 traduit l’inversion de la préférence entre deux récompenses lorsque le signe de ces récompenses est inversé. En d’autres termes, cette formulation permet de retrouver qu’un individu préfère un gain de 150 € à 100 € mais préfère une perte 100 € à une perte de 150 €.

Cette dernière propriété permet de corriger l’anomalie du sign effect.

Cette construction s’inspire des travaux de Kahneman and Tversky (1979).

Loewenstein and Prelec (1992) établissent que cette formulation permet de prendre en charge

certaines anomalies de la théorie de l’utilité actualisée notamment le ‘’Common difference

effect’’, le ‘’Delay – speed up assymetry’’ et le ‘’Framing effect’’.

Toutefois, les auteurs reconnaissent des insuffisances dans le cadre proposé par les modèles avec point de référence. En effet, le modèle

n’explore pas l’état d’esprit de l’individu qui succombe à la tentation immédiate en ayant conscience que cette action lui est préjudiciable à moyen ou à long terme ; ne rend pas compte du niveau élevé de taux d’escompte psychologique des personnes qui sont sous addiction ou en situation de manque ;

n’intègre pas l’interaction des préférences entre les périodes ; il ne rend donc pas compte de la préférence des individus pour les séquences croissantes ;

convient mieux aux arbitrages à court terme et s’adapte moins bien à des problèmes d’arbitrages à moyen ou long terme.

En dépit de ses insuffisances, le modèle de la théorie de l’utilité actualisée avec point de référence ouvre une voie d’amélioration du modèle de base et permet d’enrichir la compréhension des déterminants des choix d’arbitrages inter-temporels. Il conviendrait d’approfondir les travaux d’analyse visant à enrichir la proposition de Loewenstein and Prelec (1992).

4. Modèle de l’utilité actualisée avec fonction de Veblen

Veblen (1899)19 ‘’ … soutient qu’une part considérable de la consommation est motivée par

le désire d’afficher sa classe sociale … ’’. Une partie de la consommation n’est pas faite pour la jouissance intrinsèque qu’elle procure mais en raison du statut qu’elle confère à l’individu. Les dépenses ostentatoires pourraient être classées dans cette catégorie.

Eswaran and Oxoby (2008) ont développé un modèle d’utilité actualisée avec effet de Veblen. Il s’agit d’un modèle à deux périodes mais nous présentons une version à plusieurs périodes pour conserver la cohérence de la présentation de ce document.

( )

(

)

[

]

+ − = − T t t t t c c v c u C U 0 ) (

ρ

Avec ρ le taux d’escompte psychologique, c le niveau de consommation moyen

Les auteurs établissent que l’introduction de l’effet de Veblen entraine l’individu à privilégier la consommation des périodes récentes sans que ce soit l’effet de sa préférence pour le présent. Ce résultat permet de comprendre la surévaluation systématique que l’on trouve dans les travaux de recherche qui ne prennent pas en compte cet effet puisque le report de consommation sur le présent est interprété comme une préférence élevé pour aujourd’hui sans que ce ne soit forcément le cas.

En outre, l’utilité marginale et la productivité du travail amplifie la tendance à privilégier les consommations des premières périodes par rapport aux périodes lointaines. Ce dernier résultat suggère que les sociétés huppées ont tendance à pénaliser le futur par rapport au présent. Si l’on intègre le fait que la production des biens de luxe (ostentatoire) entraine une surutilisation

des ressources naturelles, l’effet de Veblen a pour conséquence d’accélérer l’exploitation abusive de ces ressources et entrainer leur épuisement rapide.

Le modèle a l’avantage de fournir une explication à la valeur relativement élevée des facteurs d’escompte psychologique estimés dans les travaux empiriques traditionnelles de validation de la théorie de l’utilité actualisée (Frederick et al., 2002, p. 380). Toutefois, l’accent est mis sur la préférence pour le présent des biens ostentatoires. Rien ne présage que l’explication est valable pour les biens d’utilisation courante qui sont consommés pour le bien être qu’ils procurent.

5. Modèle d’utilité actualisée avec utilité des anticipations

Ce modèle présenté par Jevons (1905)1, stipule que la fonction d’utilité instantanée ne dépend

dépend pas seulement de la consommation courante mais aussi des consommations futures anticipées.

Cette catégorie de modèle considère que le décideur anticipe son niveau de consommation et développe un bien-être aujourd’hui des consommations à venir. En effet, dans certaines situations, on constate que le décideur préfère reporter la décision de consommation ou de réception de la récompense alors qu’il a la possibilité de l’exécuter le jour même. C’est l’exemple de quelqu’un qui garderait son ticket gagnant de loterie sans encaisser son gain juste avant la date d’expiration. C’est aussi le cas de celui qui conserve sur une longue période un vin de qualité qui lui a été offert lors de son anniversaire ou lors d’un départ à la retraite. L’ensemble de ces préférences qui ne sont pas cohérent avec la théorie de l’utilité actualisée sont pris en charge par le modèle d’utilité actualisée avec utilité des anticipations.

Soit un individu à la date t0 qui anticipe une consommation ou un revenu de niveau x à la date

T > t0 qui lui procurera une utilité instantanée u(x) qui durera L périodes. L’utilité tirée de

cette anticipation à l’instant t est de Loewenstein (1987, p. 669) :

(

)

( )

(T t)

(

L

)

t x T L u xe e U δ δ δ α − − − − = 1 , , Avec

T : la date prévue de consommation ;

L : La durée de la période sur laquelle le bien-être sera ressenti ;

δ : taux d’escompte psychologique de l’individu ;

α : mesure la capacité de l’individu à imaginer et à garder à l’esprit la consommation

attendue ;

A partir de cette formulation, l’auteur parvient à évaluer l’effet sur son bien être d’une quantité de bien attendue. Cet effet est décomposé en deux parties. L’utilité associée à la consommation et l’utilité associée à l’anticipation de la consommation. Il effectue une analyse de l’influence du report de la consommation du bien en question à travers les graphiques de la figure 2.1 ci-après.

Figure 2.1 : Représentation de l’évolution de la valeur actuelle nette d’une consommation future

Pour une gain attendu Pour une perte attendue

Source : Loewenstein, 1987, p. 671, 672

Ce modèle permet d’expliquer le ‘’savouring ou dread effect’’. En effet, les consommations ne procurent pas seulement un bien être à la période dans laquelle elles interviennent mais ont un effet d’amplification du bien être des consommations des périodes précédentes. C’est donc