• Aucun résultat trouvé

L’exemple du Yield Management

A t = 0+, on a bien p0

t = pt = ∆p, mais le trend-following amplifie graduellement la perturbation initiale pour finalement la multiplier par un facteur 1−µ1 . Lorsque le trend-following est trop fort (i.e.µ > 1), cette quantité diverge, et le marché est instable (on voit aussi que l’équation8.12n’est plus définie en général). Les équations ci-dessus décrivent également l’amplification de l’impact d’un métaordre, et montrent que si celui-ci décroît à zéro sans trend-following, il décroitra également à zéro en sa présence. En revanche, si un impact permanent existe, il sera amplifié par un facteur 11

−µ. Tout cela est finalement assez peu intéressant car cela aurait très bien pu être trouvé en-dehors du cadre des agents hétérogènes : les aspects prix et liquidité y sont quasiment découplés. La seuls chose qu’on retiendra, c’est que la liquidité garde toutes les propriétés qu’elle avait en l’absence de trend-following – en particulier, le carnet d’ordres en V. Les variantes plus intéressantes où l’aspect hétérogène pourra se manifester et affecter le processus de prix de manière non triviale, seront par exemple des situations où les paramètres µ et τ varieront d’agent en agent, avec possiblement des µ négatifs (comportements de mean-reversion). L’apport d’arbitrageurs pourrait également être un élément clé, car en leur absence le prix est facilement prévisible. Au-delà de ces embryons d’idées, il y en a certainement de nombreuses auxquelles je ne pense pas, et auxquelles le cadre des agents hétérogènes pourrait donner du sens. Ce sont des questions pour des temps futurs.

8.5

L’exemple du Yield Management

Le cadre exposé dans cette thèse, bien qu’initialement motivé par la compréhension de la mi- crostructure des marchés financiers et par la résolution de problèmes pratiques comme le trading optimal, se trouve avoir une portée bien plus large. En effet, rien ne l’oblige à se restreindre au cas des double-enchères continues (comprendre : des marchés financiers modernes) qui a initialement justifié son étude. En fait, bien plus que dans les prédictions sur la structure de l’offre et la demande dans ce cas particulier, la réelle avancée se trouve dans la compréhension de leur dynamique. Nous pouvons donc nous attaquer à une classe bien plus large de problèmes, quel que soit le mécanisme de marché ou les propriétés micro- et macroscopiques du système. Une première étape dans cette direction a été effectuée an Chapitre 7, en tentant de comprendre comment la fréquence du market clearing affecte le marché, et comment l’on passe de l’équilibre Walrasien classique aux marchés financiers modernes en permettant des transactions en continu. La seconde étape est maintenant de sortir du cadre habituel des marchés financiers : c’est ce que l’on va tenter d’ébaucher dans cette section.

Nous allons pour cela nous intéresser au cas où un côté de l’enchère est contrôlé par un mono- pole et où l’autre côté (la demande) est constituée de nombreux clients. La firme en monopole doit alors déterminer dynamiquement des prix optimaux de manière à maximiser une fonction d’utilité donnée (qui peut dépendre par exemple de ses revenus attendus, de leur variance, de contraintes sur l’expérience utilisateur, etc.). Ce problème est bien connu dans l’industrie sous le nom de reve-

154 CHAPITRE 8. CADRE D’ÉTUDES POUR LES MODÈLES MULTI-AGENTS

nue management (ou yield management ) et est adressé par de nombreuses entreprises (companies aériennes, hôtels, etc.).

L’idée de cette courte section est d’utiliser la compréhension des systèmes à agents que nous avons obtenue dans le cadre des marchés financiers pour donner une dynamique aux clients, que nous allons modéliser par un ensemble d’agents hétérogènes. Nous proposons ainsi une sorte de couche additionnelle qui pourra se superposer aux modèles macroscopiques habituellement utilisés (données de tendances sur la demande, inventaire restant, temps avant l’échéance, etc.) pour produire des courbes de demande dynamiques – et optimiser les prix en fonction de celles-ci.

8.5.1 Formulation générale du problème

Soitϕ(x, t) la densité d’acheteurs potentiels au prix x et au temps t. Cette densité est supposée suivre une dynamique d’agents hétérogènes, représentée par l’équation suivante :

     ∂ϕ ∂t =Lxϕ ∀x ≥ p(t), ϕ(x, t) = 0 (8.14)

Lx est un opérateur différentiel approprié qui capture la dynamique des clients, et p(t) est le prix de vente proposé par la firme au temps t. La signification exacte de ϕ est laissée vague intentionnellement, une possibilité est d’y inclure tous les clients en recherche active du bien ou du service, mais on peut imaginer y inclure des intentions latentes comme pour le cas des marchés financiers. En toute généralité, le problème à résoudre pour la firme est donc le suivant :

max p

Z

t

e−r(s−t)dUs (8.15)

où p est la politique de pricing, dUs est son utilité incrémentale et r est un taux d’actualisation.

8.5.2 Un exemple

Supposons pour faire simple que la firme souhaite maximiser ses revenu futurs sans aucune autre contrainte, et sans taux d’actualisation. Le problème devient alors18 :

max p Z t −p(s) ∂ϕp ∂x (0, s)ds (8.16)

Supposons également que la demande suit la dynamique évoquée au Chapitre 6, avec (i) des nou- veaux entrants par unité de temps représentés par une densité λ(x, t), (ii) des intentions annulées représentés par un taux d’annulationνt, et (iii) des changements d’avis globaux (Vt) et idiosyncra-

18. Sous cette forme l’intégrale diverge, il faut donc voir l’intégrale comme la limite de l’intégrale jusqu’à T pondérée par 1/T pour que le problème de maximisation ait un sens. Cela revient à résoudre le problème8.15pour r → 0.

8.5. L’EXEMPLE DU YIELD MANAGEMENT 155

tiques (Dt). Ces hypothèses sont représentées par l’opérateur suivant :

Lxϕ = Dt ∂2ϕ ∂x2 + Vt

∂ϕ

∂x + λ(x, t)− νtϕ. (8.17)

Les évolutions temporelles des paramètres Dt,Vt,λ(x, t) et νt pourront typiquement être données en amont par un modèle macroscopique plus « classique ». Pour illustrer ces propos par un exemple, considérons la dynamique suivante19 :

Dt= D; Vt= V sin(µt); λ(x, t) = λ1x<¯p; νt= ν, (8.18) c’est-à-dire une situation où l’agressivité des clients (ou leur impatience) est périodique et où tous les autres paramètres sont constants. Cette périodicité peut par exemple provenir d’effets journa- liers, hebdomadaires, mensuels, annuels, etc. La fonction de pricing la plus simple pour la firme est simplement de garder un prix constant pconst : cela constituera notre benchmark (le profit obtenu pour la meilleure valeur possible de pconst est Πconst et est normalisé à Πconst = 100). Une esti- mation numérique de la stratégie optimale, obtenue par recuit simulé, est présentée sur la figure

8.5. Naturellement, celle-ci a également un aspect périodique, et permet de réaliser un revenu de Πrs = 116, soit 16% de plus que la meilleurs stratégie de prix constant. La meilleure stratégie sinu- soïdale, en comparaison, réalise un profit deΠsin= 108.7, soit une amélioration de 8.7% par rapport au benchmark. Il est intéressant de noter que les politiques de pricing optimales sont décalées par rapport à la courbe d’agressivité des clients. Il semble en effet qu’il soit optimal de monter les prix avant que les clients ne deviennent plus agressifs, probablement pour permettre à un plus grand réservoir de se constituer en prévision du moment où les prix seront hauts. Cet effet est d’ailleurs quasi-parfaitement synchronisé entre la politique en sinus et celle déterminée par recuit simulé. Le pattern du volume associé à la politique optimale est également intéressant : lors de chaque période, il augmente progressivement jusqu’à un pic, puis redescend immédiatement aux alentours de zéro : une fois le pic d’agressivité passé, il est plus intéressant de permettre au réservoir de clients de se reconstituer en vue du pic suivant, plutôt que de réaliser les transactions. Cela se manifeste sur les courbes de profits, moins lisses que dans le cas constant.

Il ne s’agit bien sûr là que d’un exemple, dont rien n’assure la pertinence dans le monde réel. Les questions de savoir si la modélisation choisie ici est réaliste, ou si son apport par rapport à des modèles plus simples à optimiser est suffisamment conséquent pour justifier de leur utilisation en pratique, ne relèvent pas de cette thèse. Quoi qu’il en soit, ce type de modèles peut a minima permettre de comprendre certains aspects qualitatifs dont il faut être conscient – comme ceux décrits à la fin du paragraphe précédent – ou encore de benchmark pour tester la pertinence des modèles

19. ...qui n’a pas été choisie pour son réalisme, mais qui permet de développer certaines intuitions. Les valeurs des paramètres choisis sont : D = 10; V = 10; µ =10∗πT ; T = 10; λ = 1; ν = 1 (unités arbitraires).

156 CHAPITRE 8. CADRE D’ÉTUDES POUR LES MODÈLES MULTI-AGENTS P ri ce Time customer impatience constant refill sin P ro fi ts Time constant refill sin V ol u m e Time constant refill sin

Figure 8.5 – (gauche) En noir, l’agressivité des clients. En couleur, les politiques de pricing optimales (à erreurs numériques près) dans le cas d’un pricing constant (bleu), sinus (vert) et une solution numérique obtenue par recuit simulé (rouge). (milieu) Profits cumulés associés à chacune de ces politiques. La politique en sinus améliore le benchmark constant de8.7%, et le recuit simulé de 16%. (droite) Volumes de transactions correspondants.

plus simples que l’efficacité de la production exige.