Approximation de la réserve d'une compagnie
d'assurance par un processus de diffusion et étude de
quelques indicateurs de risque
Mémoire
Marwa Essid
Maîtrise en statistique - avec mémoire
Maître ès sciences (M. Sc.)
Approximation de la réserve d’une compagnie
d’assurance par un processus de diffusion et étude
de quelques indicateurs de risque
Mémoire
Marwa Essid
Sous la direction de: Khader Khadraoui
Résumé
La gestion de risque est un domaine qui ne cesse d’évoluer chaque année. En effet, plusieurs modèles ont été construits pour modéliser la richesse d’une compagnie d’assurance et suivre son comportement dans le temps. Un des objectifs de cette modélisation est de fournir des indicateurs de risque qui donnent une visibilité sur la situation de la compagnie et aident ses gestionnaires à prendre les décisions nécessaires. La majorité des modèles reposent sur le processus de Poisson et tiennent compte du nombre et du moment de sinistre.
Dans ce mémoire, on propose un nouveau modèle stochastique différent de ce qui était réalisé jusqu’à présent pour la gestion de risque. Il s’agit d’un modèle d’approximation de réserve par un processus de diffusion, basé sur une équation différentielle stochastique. Dans ce modèle on ne tient pas compte du nombre ni des instants de sinistres, on ne tient compte que de la valeur totale des dépenses et celle des revenus. On introduit aussi le taux de croissance de la compagnie car il a une grande influence sur l’augmentation des réserves dans le temps. On définit aussi quelques indicateurs de risque et on les ajuste selon notre modèle.
Donc, on considère un processus de risque multidimensionnel dont chaque composante du vecteur représente le processus de réserve pour une des lignes d’activité de la compagnie. On suppose dans la construction du modèle l’indépendance entre les lignes afin de faciliter les calculs. Enfin, on supporte la construction du modèle par une validation numérique dans laquelle on utilise des schémas de discrétisation et de simulation numérique comme Euler-Maruyama et la méthode de Monte-Carlo pour expliquer le fonctionnement de chaque ligne d’activité et obtenir l’approximation de quelques indicateurs de risque.
Suite à l’étude numérique on valide que notre approche est fonctionnelle et fournie une modé-lisation réaliste. On constate alors que le capital initial a un grand rôle et peut dans certains cas sauver la situation de la compagnie. Le niveau du seuil de l’arrêt de la ligne (en cas de ruine sévère) qu’on a introduit dans le modèle agit aussi beaucoup sur la santé de l’entreprise.
Abstract
Risk management is an area that continues to evolve each year. Indeed, several models are built to model the wealth of an insurance company and follow its behavior over time.
One of the targets of this modeling is to provide risk indicators that give visibility about the company’s situation and help the company’s managers make the necessary decisions. The majority of models rely on the composed Poisson processes and consider the number and time of sinisters.
We propose in this thesis a new stochastic model based on stochastic differential equation for risk management. It is a reserve approximation model obtained by a diffusion process. In this model we do not take into account the number or the instants of sinisters, we only take into account the total of losses and of incomes together with the growth of each business line. Some risk indicators are also defined and adjusted according to our model.
We consider then a multidimensional risk process, where each component of the vector is the reserve process for one line of business for the company. We assume the independence between the different lines to facilitate the modelling.
Finally, we propose a simulation study using an Euler-Maruyama scheme coupled to a Monte-Carlo method. Then, we explain the behavior of each line and we compute the approximation of some risk indicators.
The findings of the numerical study support the conclusion that our method works and provide good results. With regard to the numerical results, it can be concluded that the initial capital has a great role and can in some cases save the company’s situation. Moreover, the threshold level that has been introduced into the model is also very important for the insurance company’s health.
Table des matières
Résumé iii
Abstract iv
Table des matières v
Liste des tableaux vii
Liste des figures viii
Remerciements xii
Introduction 1
1 Sur quelques concepts stochastiques 3
1.1 Les processus stochastiques . . . 3
1.1.1 La marche aléatoire discrète . . . 5
1.1.2 Le processus gaussien . . . 6
1.1.3 Le mouvement brownien . . . 7
1.1.4 Le bruit blanc . . . 16
1.2 Les équations différentielles stochastiques . . . 18
1.2.1 Le problème du bruit blanc . . . 19
1.2.2 Intégrale d’Itô . . . 20
1.2.3 Existence et unicité de la solution . . . 21
1.2.4 Le schéma d’Euler-Maruyama . . . 25
1.2.5 Le schéma de Milstein . . . 27
2 Application : Le modèle Black-Scholes 29 2.1 Quelques définitions des éléments du marché financier . . . 29
2.2 L’équation de Black-Scholes . . . 31
2.3 Résolution de l’équation de Black-Scholes . . . 32
3 Un nouveau processus de diffusion pour la gestion de risque 37 3.1 Introduction. . . 37
3.2 Construction du nouveau modèle . . . 38
3.3 Existence et unicité de la solution du modèle . . . 42
3.4 Application numérique : La solution du modèle . . . 46
3.4.1 Schéma du calcul des réserves . . . 46
3.4.3 L’influence du capital initial uj sur le comportement du processus de
réserve . . . 58
3.4.4 L’influence du seuil vj sur le comportement du processus de réserve . 60 3.4.5 L’évolution du nombre de trajectoires qui font faillite dans le temps 63 4 Dérivation des indicateurs de ruine 64 4.1 Quelques indicateurs de risque. . . 64
4.1.1 L’instant de ruine . . . 65
4.1.2 La probabilité de ruine. . . 65
4.1.3 Le temps passé dans le rouge . . . 66
4.1.4 Le temps de rétablissement . . . 66
4.1.5 La sévérité agrégée de la ruine jusqu’au rétablissement . . . 67
4.1.6 La probabilité de non ruine . . . 67
4.2 Analyse théorique de la ruine . . . 68
4.2.1 La ruine d’une branche d’activité . . . 68
4.2.2 La ruine de toute la compagnie . . . 70
4.3 Étude numérique de la ruine. . . 71
4.3.1 Scénario 1 : λj = µj . . . 71
4.3.2 Scénario 2 : λj > µj . . . 73
4.3.3 Scénario 3 : λj < µj . . . 74
4.4 Coût de ruine et allocation optimale du capital . . . 77
Conclusion 79
Liste des tableaux
2.1 Tableau de définitions des termes techniques de la finance. . . 30
2.2 Tableau multiplicatif de calcul stochastique. . . 33
3.1 Tableau représentant le taux de présence de chaque type de trajectoires selon
la valeur du capital initial uj. . . 59 3.2 Tableau représentant le taux de présence de chaque type de trajectoires selon
la valeur du seuil. . . 61
4.1 Tableau récapitulatif des indicateurs de risque pour le processus présenté dans
la Figure 4.4. . . 72
4.2 Tableau récapitulatif des indicateurs de risque pour le processus présenté dans
la Figure 4.5. . . 73
4.3 Tableau récapitulatif des indicateurs de risque pour le processus présenté dans
la Figure 4.6. . . 74
4.4 Tableau récapitulatif des indicateurs de risque pour le processus présenté dans
la Figure 4.7. . . 74
4.5 Tableau récapitulatif des indicateurs de risque pour le processus présenté dans
la Figure 4.8. . . 76
4.6 Tableau récapitulatif des indicateurs de risque pour le processus présenté dans
Liste des figures
1.1 Simulation de n = 20 pas de la marche aléatoire discrète X et interpolation des
points aléatoires (o) par une courbe linéaire par morceaux (−−). . . 6
1.2 Exemple de mouvement brownien standard calculé sur l’intervalle [0, 100]
moyen-nant une grille uniforme de temps 4t = 0.01. . . 8
1.3 Plusieurs mouvements browniens simulés sur l’intervalle [0, 100] moyennant une
grille uniforme de temps 4t = 0.01.. . . 9
1.4 Exemple de pont brownien calculé sur l’intervalle [0, 1] moyennant une grille
uniforme de temps 4t = 0.001. . . 12
1.5 Plusieurs pont browniens calculés sur l’intervalle [0, 1] moyennant une grille
uniforme de temps 4t = 0.001. . . 12
1.6 Deux exemples de browniens fractionnaires calculés sur l’intervalle [0, 1] moyen-nant une grille uniforme de temps 4t = 0.005. La Figure 1.6a est calculée avec un cœfficient de Hurst H = 1/4 et la Figure 1.6b est calculée avec un cœfficient
de Hurst H = 3/4. . . 17
1.7 Deux exemples de bruits blancs calculés pour J = 100 et J = 1000. . . 18
2.1 (cas 1) Calcul des deux solutions (numérique et théorique) de l’EDS de Black-Scholes pour les paramètres : µ = 0.05, σ = 0.3, S0= 100 sur un intervalle d’un
an [0, 1]. . . 35
2.2 La différence relative des deux solutions du (cas 1) présentée sur l’intervalle
[0.65, 0.7]. . . 35
2.3 (cas 2) Calcul des deux solutions (numérique et théorique) de l’EDS de Black-Scholes pour les paramètres : µ = 0.09, σ = 0.5, S0= 100 sur un intervalle d’un
an [0, 1]. . . 36
2.4 La différence relative des deux solutions du (cas 2) présentée sur l’intervalle
[0.4, 0.5].. . . 36
3.1 Simulation du processus de réserve pour les paramètres : λj = 0.975, µj = 0.975,
αj = 0.001, uj = 2.550, vj = −8.550, ρj = 0.050, ¯sj = 1 et sj = 1. . . 49 3.2 Simulation du processus de réserve pour les paramètres : λj = 1, µj = 1, αj =
0.002, uj = 0.250, vj = −2.250, ρj = 0.050, ¯sj = 1 et sj = 1. . . 50 3.3 Simulation du processus de réserve pour les paramètres : λj = 0.975, µj = 0.975,
αj = 0.001, uj = 0.100, vj = −3.550, ρj = 0.050, ¯sj = 1 et sj = 1. . . 51 3.4 Simulation du processus de réserve pour les paramètres : λj = 0.610, µj = 0.580,
αj = 0.001, uj = 0.250, vj = −3.550, ρj = 0.050, ¯sj = 1 et sj = 1. . . 53 3.5 Simulation du processus de réserve pour les paramètres : λj = 0.318, µj = 0.299,
3.6 Simulation du processus de réserve pour les paramètres : λj = 0.318, µj = 0.299,
αj = 0.08, uj = 0.650, vj = −2.650, ρj = 0.050, ¯sj = 1 et sj = 1. . . 55
3.7 Simulation du processus de réserve pour les paramètres : λj = 0.892, µj = 0.900, αj = 0.001, uj = 1.500, vj = −2.500, ρj = 0.050, ¯sj = 1 et sj = 1. . . 56
3.8 Simulation du processus de réserve pour les paramètres : λj = 0.528, µj = 0.531, αj = 0.001, uj = 0.950, vj = −5.950, ρj = 0.050, ¯sj = 1 et sj = 1. . . 57
3.9 Simulation du processus de réserve pour les paramètres : λj = 0.528, µj = 0.531, αj = 0.001, uj = 0.950, vj = −2.950, ρj = 0.050, ¯sj = 1 et sj = 1. . . 57
3.10 L’étude de l’influence du capital initial uj sur les trajectoires de réserve d’une branche d’activité pour les paramètres : λj = 0.450, µj = 0.457, αj = 0.001, vj = −2, ρj = 0.050, ¯sj = 1 et sj = 1.. . . 59
3.11 L’étude de l’influence du capital initial ujsur la solution numérique du processus de réserve d’une branche d’activité pour les paramètres : λj = 0.450, µj = 0.457, αj = 0.001, vj+ uj = −2, ρj = 0.050, ¯sj = 1 et sj = 1. . . 60
3.12 L’étude de l’influence du seuil vj sur les trajectoires de réserve d’une branche d’activité pour les paramètres : λj = 0.450, µj = 0.457, αj = 0.001, uj = 0.550, ρj = 0.050, ¯sj = 1 et sj = 1. . . 61
3.13 L’étude de l’influence du seuil vj sur la solution numérique du processus de réserve d’une branche d’activité pour les paramètres : λj = 0.450, µj = 0.457, αj = 0.001, uj = 0.550, ρj = 0.050, ¯sj = 1 et sj = 1. . . 62
3.14 L’évolution de probabilité de faillite Pf au cours du temps. . . 63
4.1 L’instant de ruine pour le processus de réserve. . . 66
4.2 Le temps passé dans le rouge par le processus de réserve.. . . 67
4.3 Le temps de rétablissement du processus de réserve. . . 68
4.4 Calcul du processus de réserve pour les paramètres : λj = 0.569, µj = 0.569, αj = 0.002, uj = 0.250, vj = −2.250, ρj = 0.050, ¯sj = 1 et sj = 1. . . 72
4.5 Calcul du processus de réserve pour les paramètres : λj = µj = 0.943, αj = 0.002, uj = 0.150, vj = −5.150, ρj = 0.050, ¯sj = 1 et sj = 1. . . 73
4.6 Calcul du processus de réserves pour les paramètres : λj = 0.153, µj = 0.150, αj = 0.002, uj = 0.150, vj = −2.250, ρj = 0.050, ¯sj = 1 et sj = 1. . . 74
4.7 Calcul du processus de réserves pour les paramètres : λj = 0.212, µj = 0.150, αj = 0.002, uj = 0.150, vj = −2.250, ρj = 0.050, ¯sj = 1 et sj = 1. . . 75
4.8 Calcul du processus de réserves pour les paramètres : λj = 0.9395, µj = 0.9412, αj = 0.002, uj = 1, vj = −5.458, ρj = 0.050, ¯sj = 1 et sj = 1. . . 75
4.9 Calcul du processus de réserves pour les paramètres : λj = 0.938, µj = 0.941, αj = 0.002, uj = 0.958, vj = −4.458, ρj = 0.050, ¯sj = 1 et sj = 1. . . 76
A mon cher mari et ma famille pour leur amour, leur support et leur patience
"Be wise enough not to be reckless, but brave enough to take great risks"
Remerciements
J’apprécie bien cette partie de la rédaction de mon mémoire car elle me donne l’occasion de remercier toutes les personnes qui ont contribué de loin ou de près à la réussite de mon travail. Je tiens tout d’abord à remercier mon directeur de recherche Khader Khadraoui pour son soutien, son aide et sa compréhension tout au long de la maîtrise. Ses remarques et ses conseils étaient d’une grande importance pour ma propre formation et surtout dans l’amélioration de la qualité de mon travail. Merci pour votre précieuse collaboration, votre disponibilité, votre rigueur et votre générosité. Je suis très reconnaissante pour votre appui depuis le début et tout au long de ma maîtrise. Je suis aussi très contente qu’il m’a fait confiance pour travailler sur un sujet qui était nouveau pour moi.
Je compte aussi adresser mes remerciements aux membres de jury qui ont accepté d’évaluer mon travail. Je remercie particulièrement les professeurs Damir Kinzebulatov et Jean Deteix. Mes remerciements vont aussi à Michel Lapointe qui m’a aidé dans l’installation des logiciels, ce qui m’a permis de me mettre sur le bon chemin pour préparer mon mémoire.
Je ne peux pas passer sans avoir exprimer tout mon amour, ma joie et ma gratitude pour mon mari Amine qui m’a toujours entouré et soutenu dans les moments les plus difficiles. Tu étais d’un appui indéfectible et tu m’as toujours encouragé pour avancer et aller au delà de mes rêves. Ton support était indispensable pour moi afin de réussir dans mes projets et surtout bien travailler sur mon mémoire. Je me considère très chanceuse de t’avoir dans ma vie, sans toi, je n’aurais jamais pu mener à bien ce travail auquel je tenais et je t’en suis profondément reconnaissante.
Un grand merci à mes parents qui me suivent de loin et qui ne cessent jamais d’être fiers de moi et de me souhaiter la réussite et le bonheur. C’est grâce à votre confiance que je me défis à chaque fois de bien réussir, votre bonheur compte beaucoup pour moi. Un merci aussi pour ma sœur Amani qui, à sa façon assez spéciale, m’a bien encouragé depuis le début de ma maîtrise et merci mimi pour ses prières. Enfin, merci à mes beaux parents pour leurs encouragements et leur confiance, à mes amis et à mes collègues qui m’ont toujours encouragé et n’ont cessé de croire à la réussite de mon projet.
Introduction
L’assurance est une opération de gestion de risque qui engage la compagnie d’assurance vis-à-vis ses assurés à supporter les coûts des sinistres et cela contre une prime qui se verse mensuellement tout au long de la période de couverture. En effet, les assureurs et réassureurs font face à plusieurs types de risque durant la période du contrat d’assurance. C’est pourquoi, la gestion de tous ces risques est une opération primordiale pour la compagnie d’assurance afin de se protéger contre ces dangers probables et de respecter ses engagements. La gestion de risque repose sur la modélisation mathématique de la situation financière de la compagnie d’assurance, ses réserves financières, ses dépenses, le coût des sinistres, le taux de croissance, etc.
Lier tous ces paramètres n’est pas une opération facile surtout quand on essaye de s’approcher de la réalité des choses. Les modèles de la gestion des risques sont divers, ils ont tous le même principe qui est de modéliser la réserve d’une ou de plusieurs branches d’activité d’une compagnie d’assurance et d’observer son comportement au cours du temps. Par contre, chaque modèle a ses hypothèses et ses conditions qui lui sont propres et c’est ce qui crée sa particularité par rapport aux autres modèles.
Certes, grâce à l’avancement de l’informatique, on remarque une évolution rapide dans le domaine de la théorie de ruine mais personne ne peut nier que la complexité mathématique limite les chercheurs. Malgré toutes ces limites, plusieurs modèles ont été élaborés dans ce domaine, la plus part d’entre eux reposent sur le modèle classique de Cramér-Landberg (on réfère le lecteur à la revue bibliographique sur les modèles stochastiques en assurance dans le livre Rolski et al.[1999]). En particulier, il s’agit souvent de quelques raffinements du modèle de base afin de mieux modéliser la richesse de la compagnie et d’éviter au maximum le fait que la compagnie se trouve dans une situation de panique où ses réserves deviennent largement inférieures à ses dépenses, c’est ce qu’on appelle "la ruine".
Dans ce mémoire, on présente une nouvelle vision de gestion de risque basée principalement sur les équations différentielles stochastiques. Ainsi, on propose un nouveau modèle basé sur un processus de diffusion. Ce mémoire est composé de quatre chapitres.
passe ensuite à une introduction générale des équations différentielles stochastiques. Enfin, on conclut le chapitre par une définition de deux schémas de résolution numérique, celui d’Euler-Maruyama et celui de Milstein.
Le chapitre 2 est divisé en deux axes. Premièrement, on fait un survol rapide sur quelques éléments du marché financier pour mieux introduire le deuxième axe qui présente un exemple d’équation différentielle stochastique, très connu sur le marché financier, qui est le modèle de Black-Scholes. Deuxièmement, on présente les hypothèses du modèle puis finalement on pro-pose deux résolutions de cette équation, la première est théorique et la deuxième est numérique en utilisant l’un des schémas présentés dans le chapitre précédent.
Le chapitre3représente le cœur de ce mémoire, notre modèle sera défini dans cette partie. On commence le chapitre par une présentation du modèle de base dans la gestion de risque, celui de Cramér-Landberg. Ensuite, on définit notre modèle dans un cadre multidimensionnel et, afin d’alléger l’écriture mathématique, on présente les étapes de sa construction sur une seule branche d’activité (cadre unidimensionnel). Puisque notre modèle repose sur une équation différentielle stochastique, alors nous consacrons une partie du chapitre à la démonstration de l’existence et l’unicité de la solution du modèle. Enfin, la dernière partie présente l’étude numérique du modèle.
Le chapitre 4aborde le sujet de la théorie de ruine, on commence par définir quelques indica-teurs de risque comme le temps de ruine, le temps passé dans le rouge, la probabilité de ruine, etc. Une attention particulière sera donnée au calcul de la probabilité de ruine pour une seule branche d’activité puis pour toute la compagnie. Dans une étude numérique, on propose une estimation de certains indicateurs de risque y compris la probabilité de ruine puis on illustre les résultats des simulations avec des graphiques. L’étude de ses indicateurs de risque est adaptée au modèle proposé dans le chapitre3. On conclut enfin le chapitre par une ouverture d’horizon qui aborde le concept de coût de la ruine et le problème d’allocation de réserve (capital).
Chapitre 1
Sur quelques concepts stochastiques
Ce chapitre sera principalement consacré à une brève synthèse bibliographique . En effet, nous introduisons et définissons les outils stochastiques que nous utiliserons tout au long du travail. De ce fait, le chapitre sera divisé en trois parties. Dans un premier temps, nous présentons les différents types de processus stochastiques où on propose principalement de les définir et les illustrer par quelques exemples. Dans la deuxième partie, nous décrivons les équations différentielles stochastiques (EDS). Enfin, on conclut le chapitre par une présentation des schémas de discrétisation d’Euler-Maruyama et celui de Milstein. Évidemment, nous ne pouvons pas donner des exemples de processus stochastique sans définir ce concept. Pour avoir plus de détails sur les processus stochastiques généraux nous invitons le lecteur intéressé à consulter Karlin and Taylor[2014].
1.1
Les processus stochastiques
Pour bien définir les processus stochastiques, on utilise un espace de probabilité (Ω, F , P) appelé espace mesuré. On fait d’abord une petite revue sur le concept d’espace échantillonnal Ω, du σ-algèbre F et de la mesure de probabilité P. En effet, Ω est souvent appelé l’univers et il représente l’ensemble de tous les résultats possibles d’une expérience. Faisant par exemple l’expérience du lancé d’une pièce de monnaie, il n’y a que deux résultats possibles (soit Pile (P) soit Face (F)), donc Ω = {P, F }. Plus généralement, l’espace échantionnal Ω est un ensemble suffisamment grand pour paramétrer tous les résultats possibles de l’expérience.
Tout ensemble mesurable F ∈ F est appelé événement et chaque événement correspond à un ensemble de résultat de l’expérience. On définit ensuite le σ-algèbre F ,
Définition 1 (σ-algèbre). Un ensemble F de sous-ensemble d’un ensemble E est dit une σ-algèbre si :
(i) L’ensemble vide appartient à F ({} ∈ F ).
(iii) Si Fj ∈ F alors, l’union S
j∈N
Fj ∈ F .
Le σ-algèbre F est un sous-ensemble de Ω. Il englobe les sous-ensembles de Ω auxquels nous pouvons effectuer des probabilités. Prenant le même exemple que précédemment, les résultats {F } et {P } sont deux éléments du σ-algèbre F = {{} , {P } , {F } , {P, F }}. Le couple (Ω, F ) est connu comme un espace mesurable.
Pour compléter la présentation de tous les éléments de l’espace de probabilité, on définit la notion de mesure puis la mesure de probabilité.
Définition 2 (Mesure). Dans un espace mesurable (X, F ), l’application µ : F 7−→ R+∪ {∞}
est dite une mesure si elle vérifie les propriétés suivantes : (i) µ(∅) = 0 : la mesure de l’ensemble vide est nulle.
(ii) Si les Fj ∈ F sont deux à deux disjoints (i.e. Fk∩Fj = {} pour k 6= j ) alors µ ∞ S j=1 Fj ! = ∞ P j=1 µ(Fj).
Définition 3 (Mesure de probabilité). Pour un espace de probabilité (Ω, F ), une mesure P est dite une mesure de probabilité si elle vérifie les conditions suivantes :
(i) Pour un événement F ∈ F , sa probabilité P(F) ∈ [0, 1]. C’est-à-dire, la probabilité d’un événement est un nombre réel compris entre 0 et 1.
(ii) P(Ω) = 1 : la probabilité de l’événement certain.
Une fois l’espace de probabilité (Ω, F , P) est bien défini, on peut maintenant définir rigou-reusement les processus stochastiques. En effet, un processus stochastique est une famille de variables aléatoires définie sur un même espace de probabilité (Ω, F , P) et indicée par un pa-ramètre t appartenant à un ensemble T . L’indice t est souvent interprété comme le temps. Le processus est en temps continu si T = [0, ∞) ou [0, T ] pour T > 0. Dans ce mémoire, nous ne considérerons que des processus en temps continu à l’exception de la marche aléatoire discrète étudiée dans la suite. Les variables aléatoires Xt prennent leurs valeurs dans un espace E dit espace d’état. Cet espace peut être dénombrable, e.g. E = N ou continu e.g. E = Rd. Dans la première partie de ce chapitre, nous considérons le cas E = N, par la suite le cas E = Rd (même si d = 1 dans une grande partie du mémoire).
Un processus aléatoire est markovien si, conditionnellement à sa valeur au temps présent t, son évolution future est indépendante de son passé.
Les trajectoires d’un processus stochastique (Xt)t≥0 sont les fonctions ω 7→ Xt(ω) définies
pour presque toute valeur de ω.
(i) Ce processus est dit à accroissements indépendants lorsque pour tout n et pour tous 0 ≤ t0 < t1 ≤ . . . ≤ tn < ∞, les variables Xt1 − Xt0, Xt2 − Xt1,. . ., Xtn− Xtn−1 sont
mutuellement indépendants.
(ii) Ce processus est dit à accroissements stationnaires lorsque pour tous s et t ≥ 0, la loi de l’accroissement Xt+s− Xt ne dépend pas de t.
Pour fixer les idées, il semble pertinent de commencer la présentation des processus stochas-tiques par l’exemple le plus basique qui est la marche aléatoire discrète.
1.1.1 La marche aléatoire discrète
La marche aléatoire discrète est un processus à temps discret et à valeurs discrètes. Elle se définit comme suit :
Définition 4 (Marche aléatoire discrète). Une marche aléatoire discrète est le processus sto-chastique de base et le plus simple. C’est un processus (Xn)n∈N défini par :
X0= 0, Xn+1 = Xn+ ξn, pour n = 0, 1, 2, . . . ,
où ξn sont des variables aléatoires indépendantes et identiquement distribuées (iid) satisfaisant
la probabilité P(ξn= ±1) = 12.
Puisque X0 = 0 et Xnprend des valeurs paires quand n est paire et des valeurs impaires quand
n est impair, alors X0, X1, X2, . . . est une séquence de variables aléatoires à valeurs entières.
Propriétés 1. L’espérance et la variance de la marche aléatoire discrète se calculent de la manière suivante :
(i) Étant donné que E[ξn] = 0, alors l’espérance E[Xn] = 0 pour chaque entier n.
(ii) Puisque l’espérance E[ξkξl] = 0 pour tout k 6= l et E[ξk2] = 1 alors la covariance de Xn
et Xm se calcule comme suit :
Cov (Xn, Xm) = E [XnXm] = E " n X k=1 ξk−1 m X l=1 ξl−1 # = min(n, m).
Pour mieux comprendre la dynamique de la marche aléatoire présentée à la Définition 4, on construit maintenant un algorithme permettant de simuler un exemple de trajectoire sur un intervalle de temps fini.
Un exemple de trajectoire de marche aléatoire discrète simulé moyennant l’algorithme 1 est présenté dans la Figure1.1. Il s’agit d’une courbe linéaire par morceaux qui interpole les points aléatoires X0, X1, . . . , Xn.
Algorithme 1 Algorithme pour générer n pas de marche aléatoire discrète. Initialiser X0 = 0 et fixer n pour i = 1, 2, . . . , n faire Tirer ξi de probabilité P(ξi= ±1) = 12 Calculer Xi= Xi−1+ ξi fin pour
Figure 1.1 – Simulation de n = 20 pas de la marche aléatoire discrète X et interpolation des points aléatoires (o) par une courbe linéaire par morceaux (−−).
1.1.2 Le processus gaussien
Avant de présenter une définition rigoureuse pour le processus gaussien, on introduit la dé-finition du processus de second ordre dont l’utilité s’avère importante pour la rigueur de la présentation. Dans la suite, on se place sur un espace de probabilité (Ω, F , P). Pour tout réel p ≥ 1, Lp(Ω, F , P) ou simplement Lp, s’il n’y a pas d’ambiguïté, désigne l’espace des v.a réelles de puissance p-ème intégrable, muni de la norme usuelle.
Définition 5 (Processus de second ordre). Un processus à valeurs réelles (Xt)t∈T est dit de second ordre si Xt ∈ L2(Ω) pour chaque temps t ∈ T . Son espérance est µt := E[Xt] et sa
fonction de covariance est C(s, t) := Cov(Xs, Xt) pour tout s,t ∈ T .
Il est clair que l’espérance et la fonction de covariance d’un processus de second ordre sont bel et bien définis. On est maintenant en mesure de donner une définition au processus gaussien. Définition 6 (Processus gaussien). Un processus stochastique à valeurs réelles de second ordre (Xt)t∈T est dit gaussien si la distribution fini-dimensionnelle de X = (Xt1, . . . , Xtn)
distribution normale multivariée pour tous les instants t1, . . . , tn∈ T et pour tout n ∈ N.
Parmi les exemples les plus connus du processus gaussien, nous présentons le mouvement brownien avec ses différentes variantes ainsi que ses propriétés. Une fois qu’on s’est assuré que les deux premiers moments sont finis (processus de second ordre), alors on peut à ce niveau définir le mouvement brownien en se reposant sur l’espérance et la fonction de covariance.
1.1.3 Le mouvement brownien
Dans cette partie nous étudions le mouvement brownien standard, le pont brownien et le mouvement brownien fractionnaire. Nous introduisons leurs définitions et leurs principales propriétés. À travers des algorithmes de simulations nous illustrons ces trois processus et nous observons leurs comportements sur un intervalle de temps [0, T ]. À titre d’exemple, nous pouvons suggérer au lecteur intéressé de consulter le livre de Le Gall [2013] pour un exposé détaillé concernant le mouvement brownien.
Le mouvement brownien standard
Le mouvement brownien a vu la lumière grâce au botaniste Robert Brown qui l’a découvert suite à ses travaux de recherche sur les grains de pollen. C’est de là que vient le nom brownien. Il est aussi appelé le processus de Wiener car le mathématicien Norbert Wiener a bien contribué dans l’élaboration de la théorie mathématique de ce processus, d’où vient la notation Wt. Voici maintenant une définition.
Définition 7 (Mouvement brownien). On dit que le processus stochastique à temps continu (Xt)t∈R+ est un mouvement brownien s’il est un processus gaussien d’espérance µt= 0 et de
fonction de covariance C(s, t) = min(s, t).
Même si la définition paraît très claire, nous introduisons quelques propriétés du mouvement brownien afin de s’assurer de la bonne compréhension de ce concept.
Propriétés 2. Les principales propriétés du mouvement brownien standard sont :
(i) W0 = 0 presque sûrement (p.s.) car la loi de W0 est une loi normale N (0, 0) = δ0, on
dit que la loi est dégénérée en 0. On note ici par δx la masse de Dirac en x.
(ii) Wtest un processus à accroissements indépendants. En effet, pour les instants t1, t2, t3, t4 ≥ 0 on a :
E [(Wt2− Wt1)(Wt4− Wt3)] = Cov (Wt2, Wt4) − Cov (Wt2, Wt3)
− Cov (Wt1, Wt4) + Cov (Wt1, Wt3)
en utilisant s ∧ t = min (s, t). Ce qui fait que pour t1 6 t2 6 t3 6 t4 on a la fonc-tion de covariance Cov(Wt2 − Wt1, Wt4 − Wt3) = 0. Alors, les variables (Wt2 − Wt1)
et (Wt4− Wt3) sont donc non corrélées. Elles sont aussi indépendantes car elles sont
gaussiennes par définition.
(iii) E [Wt] = 0, V [Wt] = C(t, t) = t et donc Wt' N (0, t) (il suffit de voir que Wt− W0 ∼
N (0, t − 0) ⇒ Wt∼ N (W0= 0, t)).
iv) Quand s ≤ t, on a Wt− Ws' Wt−s. Par conséquence :
V [Wt− Ws] = Cov (Wt− Ws, Wt− Ws)
= Cov (Wt, Wt) − 2Cov (Wt, Ws) + Cov (Ws, Ws)
= |t − 2s + s| = |t − s|.
Donc on aura Wt− Ws' Wt−s' N (0, |t − s|).
(v) Les accroissements Wt−Wssont de lois normales et les accroissements sur des intervalles disjoints sont indépendants.
(vi) Wt est une fonction continue en temps, mais pas dérivable nulle part.
Pour illustrer et observer le comportement du mouvement brownien standard, nous présentons l’algorithme2de simulation de ce processus sur un intervalle de temps fini. La Figure1.2décrit le comportement aléatoire d’un mouvement brownien standard simulé sur [0, 100].
Figure 1.2 – Exemple de mouvement brownien standard calculé sur l’intervalle [0, 100] moyen-nant une grille uniforme de temps 4t = 0.01.
Le mouvement brownien est un processus stochastique par construction, donc deux mouve-ments browniens simulés sur le même intervalle de temps n’ont pas nécessairement le même comportement aléatoire. La Figure 1.3 décrit trois exemples de comportement aléatoire pour des mouvements browniens simulés sur le même intervalle de temps [0, 100].
Figure 1.3 – Plusieurs mouvements browniens simulés sur l’intervalle [0, 100] moyennant une grille uniforme de temps 4t = 0.01.
Algorithme 2 Algorithme pour simuler le mouvement brownien standard sur l’intervalle du temps [0, T ]. Initialiser W0 = 0 pour i = 1, . . . , n faire Calculer 4ti= ti− ti−1 Tirer zi ∼ N (0, 1) Calculer Wti = Wti−1+ √ 4ti× zi fin pour Le pont brownien
En simulant le mouvement brownien Wt, les valeurs sur l’intervalle ]0, T [ sont inconnues et
il est intéressant de connaître leur distribution. En s’intéressant à spécifier les valeurs du mouvement brownien à des instants spécifiques, disons à t = 0 et t = T , cela nous ramène à considérer un cas particulier de processus qui s’appelle le pont brownien Bt sur [0, T ]. La
distribution de ce pont s’obtient en conditionnant la distribution de Wtpar des conditions de
bords, c’est-à-dire à t = 0 et t = T . Bien entendu, le mouvement brownien standard part à l’origine, W0 = 0 p.s., et on rajoute une autre condition WT = b pour un certain b ∈ R. Pour
0 ≤ t0 < t1 < . . . < tn ≤ T , la distribution multivariée du pont brownien Bt se calcule de la manière suivante : P Bt1 .. . Btn ∈ F = E 1F Wt1 .. . Wtn WT = b , F ∈ B(Rn).
Alors, pour toute fonction mesurable φ : Rn−→ R,
E [φ(Bt1, . . . , Btn)] = E [φ(Wt1, . . . , Wtn)|WT = b] . (1.1)
Pour T > 0, la variance de Wtest positive et la distribution multivariée du pont brownien est
gaussienne. Donc, le pont brownien est un processus gaussien d’espérance µt= E[Wt|WT = b]
en appliquant (1.1) avec φ(x) = x et de fonction de covariance donnée par : C(s, t) = E[(Bs− µs)(Bt− µt)],
= E[(Ws− µs)(Wt− µt)|WT = b],
en appliquant (1.1) avec φ(x, y) = (x − µs)(y − µt). Visiblement, les expressions explicites
de l’espérance et de la covariance sont plus difficile à calculer dans ce cas que pour le cas du mouvement brownien. Nous proposons sans perte de généralité, de faire les calculs dans le cas particulier T = 1 et b = 0.
Proposition 1. Le pont brownien (Bt)t∈[0,1] avec les conditions de bords B0 = B1= 0 est un
processus gaussien d’espérance µt= 0 et de fonction de covariance C(s, t) = min(s, t) − st.
Preuve. Pour 0 ≤ t ≤ 1, la covariance se calcule par :
Cov(Wt− tW1, W1) = E[(Wt− tW1)(W1)]
= min(t, 1) − t = 0.
Comme leur covariance est nulle et leur distribution jointe est normale, alors on a Wt− tW1
et W1 sont indépendants. Cela implique que
E[Wt− tW1|W1] = E[Wt− tW1] = 0 p.s.
De plus, en utilisant la linéarité de l’espérance, on peut écrire : E[Wt|W1] = E[tW1|W1] = tW1 p.s.
En se donnant W1, l’espérance de Wt augmente linéairement à partir de 0 à la valeur de W1.
Ainsi, l’espérance de Bt est µt= E[Wt|W1 = 0] = 1 × 0 = 0. La fonction de covariance de Bt
est donnée par :
avec µt= 0, ∀t ∈ [0, 1]. Alors,
C(s, t) = E[(WsWt|W1 = 0]
= E[(Ws− sW1)(Wt− tW1)|W1= 0].
La variable aléatoire (Ws− sW1)(Wt− tW1) est indépendante de W1 ce qui nous ramène au
calcul suivant :
C(s, t) = E[(Ws− sW1)(Wt− tW1)]
= E[WtWs] − tE[W1Ws] − sE[W1Wt] + stE[W12]
= min(s, t) − ts − st + ts = min(s, t) − st.
Ce qui termine la preuve.
Pour construire un algorithme de simulation dédié au pont brownien dans le cas où T = 1 et b = 0, on va exploiter le fait que Wt− tW1 a la même distribution que le pont brownien Bt.
Partant de l’algorithme 2 qui simule une trajectoire de Wt à des valeurs fixes du temps, cela nous offre une stratégie facile pour déduire une trajectoire de Bt à travers l’algorithme 3.
Algorithme 3 Algorithme de simulation du pont brownien sur l’intervalle du temps [0, T ]. Initialiser B0 = 0 pour i = 1, . . . , n faire Calculer 4ti= ti− ti−1 Tirer zi ∼ N (0, 1) Calculer Wti = Wti−1+ √ 4ti× zi Calculer Bti = Wti− Wtn× (ti− t1) (tn− t1) fin pour
On va présenter quelques propriétés du pont brownien afin d’avoir une compréhension plus claire sur ce concept. On va de même présenter une simulation d’une trajectoire.
Propriétés 3. Pour t ∈ [0, 1], on remarque ces propriétés intéressantes : (i) B1−t est aussi un pont brownien.
(ii) Bt est un mouvement brownien conditionné par la valeur 0 quand t = 1.
Les Figures1.4et1.5sont produites moyennant l’algorithme3. Au niveau de la première Figure
1.4on voit plus clairement le comportement du pont brownien ainsi que les conditions imposées aux bords de l’intervalle [0, 1]. Au niveau de la Figure1.5on observe le comportement de trois ponts browniens. En effet, on constate que les trois trajectoires partent de 0 et se terminent tous au 0 et entre le point de départ et le point d’arrivé elles oscillent aléatoirement.
Figure 1.4 – Exemple de pont brownien calculé sur l’intervalle [0, 1] moyennant une grille uniforme de temps 4t = 0.001.
Figure 1.5 – Plusieurs pont browniens calculés sur l’intervalle [0, 1] moyennant une grille uniforme de temps 4t = 0.001.
Le brownien fractionnaire
Le mouvement brownien fractionnaire (mBf) a été introduit par le mathématicien Andreï Kolmogorov en 1940. Ensuite, il a été reproduit et introduit dans les modèles financiers par
Mandelbrot and Ness [1968]. Le champ d’application des mBf est très large. Nous définis-sons et détaillons par la suite son fonctionnement par des exemples. En effet, en ajoutant
deux nouvelles propriétés additionnelles aux précédentes propriétés du mouvement brownien standard nous obtenons la famille du mouvement brownien fractionnaire. Ces deux propriétés additionnelles sont les suivantes :
(i) L’auto-similarité : étant donné un mouvement brownien (Wt)t∈R+ et un indice d’échelle
α > 0, on définit le processus gaussien suivant fWt:= α
1 2Wt
α
. Il s’agit d’un processus de distribution continue, d’espérance µt= 0 et de fonction de covariance donnée par :
C(s, t) = E h f WsWft i = α × min s α, t α = min(s, t).
En se basant sur la Définition 7 on peut conclure que fWt est aussi un mouvement
brownien. Suite à ce constat on dit que le mouvement brownien est auto-similaire. (ii) Stationnarité des accroissements : Si on se place sur l’intervalle [s, t], l’accroissement
d’un mouvement brownien Wt− Ws a une distribution gaussienne N (0, |t − s|). Donc,
la distribution de Wt− Wsest identique à celle de Wt+h− Ws+h pour tout h > 0. C’est-à-dire, la distribution des accroissements reste invariante même par une translation, on dit alors que le mouvement brownien est un processus à accroissements stationnaires. Le mBf noté par BtH appartient à une famille de processus gaussiens (d’espérance nulle µt= 0)
et paramétré par un cœfficient H ∈ ]0, 1[ souvent appelé le paramètre de Hurst. Il s’agit d’un processus auto-similaire avec des accroissements stationnaires. La propriété d’auto-similarité signifie que pour tout α > 0,
e
BtH := αHBHt α
,
est un mouvement fractionnaire paramétré par le même cœfficient de Hurst que celui du mouvement brownien fractionnaire de départ BtH. Si on normalise ce processus en exigeant que E[BtH] = 0 et E[(B1H)2] = 1 alors on arrive à bien définir le mouvement brownien fractionnaire.
Autrement dit, ces conditions caractérisent l’espérance et la fonction de covariance de BtH. En utilisant le fait que la distribution d’un processus gaussien est déterminée complètement par son espérance et sa fonction de covariance, on peut déterminer la distribution de BHt simplement à partir de ces conditions. Pour dériver la fonction de covariance, on suppose que E[(BHt )2] = qt, pour l’auto-similarité on a besoin que qt = E[( eBtH)2] et ainsi qt = α2Hqt
α.
Ceci signifie que quand α = t, qt est proportionnel à t2H. Si on se réfère à la première
condition telle que E[(B1H)2] = 1, alors on doit avoir qt = t2H et à partir de la propriété
d’accroissements stationnaires, on en déduit que E[(BtH − BHs )2] = qt−s. Finalement, par
l’utilisation de x2+ y2− (x − y)2 = 2xy, on établit :
E[BtHBsH] = 1 2 E[(B H t )2] + E[(BsH)2] − E[(BtH − BsH)2], = 1 2 t 2H+ s2H− |t − s|2H.
Définition 8 (Le brownien fractionnaire). Un processus stochastique BH t
t≥0est dit un
mou-vement brownien fractionnaire de cœfficient de Hurst H ∈ ]0, 1[ s’il est un processus gaussien d’espérance µt= 0 et de fonction de covariance donnée par :
EBsHBtH =
1 2 |t|
2H+ |s|2H− |t − s|2H .
Pour donner plus d’allure à la fonction de covariance du mouvement brownien fractionnaire, on définit par MBH la matrice (n × n) de variance-covariance de ce processus de la manière
suivante : (MBH)i,j = 1 2 t2H1 · · · |ti|2H+ |tj|2H− |ti− tj|2H .. . . .. ... |ti|2H + |tj|2H − |ti− tj|2H · · · t2Hn 1 ≤ i, j ≤ n. (1.2) Il n’est pas surprenant que la fonction de covariance du mBf dépend de la valeur du cœfficient de Hurst. En effet, quand le paramètre de Hurst H = 12 la fonction de covariance vaut
E B 1 2 t B 1 2 s = |t| + |s| − |t − s| 2 = min(s, t),
ce qui est clairement la fonction de covariance du mouvement brownien. Donc, pour synthétiser, un mouvement brownien fractionnaire avec un paramètre H = 12 n’est autre qu’un mouvement brownien standard. Comme on a vu, le mouvement brownien standard est facile à simuler par l’algorithme 2 en exploitant le fait que ses accroissements sont indépendants. Par contre, les accroissements de BHt sont corrélés donc il est plus difficile de simuler ce processus sur un ordinateur. Afin de voir cela, on considère les accroissements sur les intervalles [0, 1] et [1, 2] tels qu’on a, E(B2H − B1H)(B1H − B0H) = E B2HB1H − E B2HB0H − E (B1H)2 + E B1HB0H , = 1 2 2 2H+ 1 − 1 − 0 −1 2(2) + 0, = 1 2 4 H − 2 . C’est-à-dire Cov(B2H−BH1 , B1H−B0H) = 4H − 2 2 et les accroissements B H 2 − BH1 et B1H− B0H sont corrélés positivement si H > 12 et ils sont corrélés négativement si H < 12. D’une façon générale, la corrélation entre les accroissements du mouvement brownien fractionnaire dépend de la valeur de H, si H > 12 la corrélation est positive ce qui signifie que les tendances se pour-suivront probablement sur de longues périodes et si H < 12 la corrélation est donc négative et nous nous attendons à des fortes variations dans le processus.
Afin de visualiser ces variations sur des exemples concrets, on commence par rappeler au lecteur le concept de la décomposition spectrale qui joue un rôle très important dans la simulation des
trajectoires du mBf. En effet, soit (Xt)t∈T un processus gaussien à valeurs réelles d’espérance
µt et de fonction de covariance C(s, t). Pour t1, t2, . . . , tn∈ T , on définit
X = (Xt1, Xt2, . . . , Xtn)
T
∼ N (µ, Cn), (1.3)
avec µ = (µt1, µt2, . . . , µtn)
T et C
n ∈ Rn×n avec des composantes cij = C(ti, tj). On sait que
si la matrice de covariance s’écrit sous cette forme :
Cn= VTV, (1.4)
alors les échantillons de X ∼ N (µ, Cn) peuvent être générés par :
X = µ + VTZ, (1.5)
avec Z = [z1, z2, . . . , zn]T où les composantes zi iid
∼ N (0, 1).
Quand la matrice Cn est définie positive on peut utiliser la décomposition spectrale pour trouver la matrice V satisfaisant (1.4).
Définition 9 (Décomposition spectrale). Chaque matrice n × n symétrique à valeurs réelles A peut être écrite comme A = U ΣUT, où U est une matrice orthogonale dont les colonnes u
j sont
des vecteurs propres de A et Σ est une matrice n × n diagonale dont les composantes υj sont les valeurs propres réelles de A. La forme U ΣUT est connue sous le nom de la décomposition spectrale de A.
Passant du générale au particulier, on sait que le mouvement brownien fractionnaire BH ∼ N (µ = 0, MBH) et la matrice de covariance MBH définie dans (1.2) est une matrice carrée, bel
et bien symétrique et à valeurs réelles. Donc, d’après la Définition9la matrice MBH peut être
décomposée comme suit MBH = U ΣUT. De plus, comme MBH est définie positive, on peut
ordonner ses valeurs propres de sorte que υ1 ≥ υ2 ≥ . . . ≥ υn ≥ 0. On définit VT := U Σ1/2,
où Σ1/2 est une matrice diagonale dont les composantes sont √υj avec j = 1, . . . , n. On voit
que MBH = VTV , d’après l’équation (1.5) BH = µ + VTZ = µ + U Σ1/2Z et BH s’écrit de la
manière suivante : BH = µ + n X j=1 √ υjujzj, (1.6)
et nous pouvons générer des échantillons à partir de N (0, MBH) après avoir calculé les vecteurs
propres et les valeurs propres du MBH. Notons que (1.6) est bien définie même si l’une des
valeurs propres est nulle et la décomposition spectrale est définie même lorsque MBH est
singulière, contrairement à la factorisation de Cholesky.
Considérons un fBm BHt sur l’intervalle [0, T ] avec une grille uniforme de temps 4t = n−1T , tj = (j − 1)4t et i, j = 1, . . . , n. Ici, la matrice de covariance MBH associée à C(ti, tj) =
1 2
h
t2Hi + t2Hj − |ti− tj|2Hiest singulière car C(t
L’algorithme 4montre comment échantillonner un fBm avec un paramètre H ∈]0, 1[ sur l’in-tervalle [0, T ] en utilisant la décomposition spectrale.
Algorithme 4 Algorithme pour générer des mouvements browniens fractionnaires sur l’in-tervalle du temps [0, T ].
Fixer une valeur de H ∈]0, 1[ pour i = 1, 2, . . . , n faire pour j = 1, 2, . . . , n faire Calculer MBH(i, j) = 12 h t2Hi + t2Hj − |ti− tj|2H i , fin pour Tirer zi ∼ N (0, 1), fin pour On pose Z = (z1, . . . , zn),
Calculer U = la matrice des vecteurs propres de MBH,
Calculer V = la matrice diagonale contenant les valeurs propres(υ1, . . . , υn) de MBH,
Calculer BH = U × V1/2× Z.
La Figure1.6présente des simulations de trajectoires de BHt pour H = 14 et H =34, produites moyennant l’algorithme4. On remarque que quand H = 14 la trajectoire fait plus d’oscillations que celle calculée avec H = 34. Ce qui met en relief l’effet du cœfficient de Hurst H sur le comportement du processus.
1.1.4 Le bruit blanc
Le bruit blanc dérive son nom de la lumière qui consiste en une combinaison linéaire d’ondes de différentes langueurs d’ondes. Ainsi, un mélange homogène d’onde produit de la lumière blanche. De même, les processus stochastiques sont classés en fonction de leurs représentations dans une base de fonctions orthogonale (les fonctions de base correspondent aux ondes élé-mentaires des couleurs de la lumière). En effet, le bruit blanc contient un mélange homogène de toutes les fonctions de base. Pour mieux fixer les idées, On se place dans l’intervalle de temps T = [0, 1] et on définit le bruit blanc de la manière suivante.
Définition 10 (Bruit blanc). Le bruit blanc est un processus stochastique constitué de quan-tités aléatoires égales de chaque fonction de base. En effet, soit φ = {φ1, φ2, . . .} une base
orthogonale de L2(0, 1) (Si par exemple les fonctions de base φi(t) =
√
2 sin(iπt) alors chaque φi représente une onde et i est l’indice d’onde correspondant). On définit
εt= ∞ X i=1 ziφi(t), zi iid v N (0, 1) . (1.7)
(a) H = 1/4
(b) H = 3/4
Figure 1.6 – Deux exemples de browniens fractionnaires calculés sur l’intervalle [0, 1] moyen-nant une grille uniforme de temps 4t = 0.005. La Figure 1.6a est calculée avec un cœfficient de Hurst H = 1/4 et la Figure 1.6best calculée avec un cœfficient de Hurst H = 3/4.
covariance définie par :
Cov(εs, εt) = E[εsεt] − E[εs]E[εt]
= E *∞ X i=1 ziφi(s), ∞ X j=1 zjφj(t) + = ∞ X i=1 E[z2i]φi(s)φi(t) or E[zi2] = 1, = ∞ X i=1 φi(s)φi(t).
Afin de compléter la définition, il semble pertinent de citer quelques propriétés simples du bruit blanc. Ces propriétés vont aider à bien comprendre le fonctionnement de ce processus. Propriétés 4. Soit εt un bruit blanc, alors il vérifie les propriétés suivantes :
i) V ar(εt) = δ0= 0.
ii) E[(εt)2] = ∞. Il n’y a pas de variance finie ce qui prouve que le bruit blanc n’est pas bien
définit sur L2(Ω).
iii) ∀t 6= s, Cov(εs, εt) = E[εtεs] = 0. C’est-à-dire l’auto-covariance est nulle.
v) Le processus est stationnaire par définition, la loi conjointe de {εt1+t, . . . , εtk+t} ne
dé-pend pas de t.
(a) J = 100
(b) J = 1000
Figure 1.7 – Deux exemples de bruits blancs calculés pour J = 100 et J = 1000. La divergence de la somme introduite dans (1.7) est illustrée par la Figure1.7, où on trace un exemple de trajectoire calculé par troncature de la somme telle que :
εt= J
X
i=1
ziφi(t).
La première Figure 1.7a est calculée pour J = 100, on voit bien sur cette figure que le bruit blanc varie entre −20 et 20 par contre si on se concentre sur la deuxième Figure1.7b, comme elle est calculée pour J = 1000 on remarque que le bruit blanc varie entre −100 et 100 ce qui explique clairement que εJ devient de plus en plus large quand on augmente la valeur de J .
1.2
Les équations différentielles stochastiques
Les équations différentielles stochastiques (EDS) sont une reformulation stochastique des équa-tions différentielles ordinaires (EDO) par l’ajout d’un terme stochastique afin de tenir compte
de l’aléa. On commence cette partie par expliquer le problème du bruit blanc dans la construc-tion des EDS. Ensuite, on étudiera l’existence et l’unicité de la soluconstruc-tion de l’EDS d’un point de vue théorique. Enfin, on détaillera deux schémas de base dans la résolution numérique des EDS (Euler-Maruyama et Milstein).
1.2.1 Le problème du bruit blanc
Considérons sans perte de généralité, l’équation différentielle stochastique unidimensionnelle suivante :
dXt
dt = rXt+ αXt
ε
t, (1.8)avec r > 0, α > 0 et (
ε
t)t∈R+ est souvent choisi comme un bruit blanc qui satisfait les propriétés présentées précédemment dans Propriétés 4. Dans la plupart des cas on utilise le bruit blanc afin de fournir des données bruités, et ce dans le but de modéliser des phénomènes aléatoires. Par contre dans certaines situations, comme dans la finance si Xt représente la valeur d’un capital à l’instant t, nous voulons résoudre l’équation (1.8) afin de pouvoir suivre l’évolution de Xtd’une façon continue et nous nous trouvons face à un problème de discontinuité du bruitblanc. Donc, la trajectoire Xt aura des discontinuités et des fluctuations incontrôlables. De ce fait, le choix du bruit blanc n’est pas bien adapté pour ces situations. Compte tenu de la discontinuité du bruit blanc, nous ne pouvons pas résoudre l’équation (1.8). Dans le but de remédier à ce problème, on peut remplacer
ε
t par un terme continu.On commence tout d’abord par discrétiser le temps [0, T ]. Cette étape nous permet de mieux expliquer les termes de l’EDS et bien repérer le terme discret. En effet, on prend N sous-intervalles de [0, T ] tels que 0 = t0, t1, . . . , tN = T , alors pour tout tk ∈ [0, T ] suivant la
formule d’Euler on a :
4Xtk = Xtk+1− Xtk = rXtk4tk+ αXtk
ε
tk4tk, (1.9)avec 4tk= tk+1− tk.
Par construction le terme
ε
tk4tk n’est autre que le mouvement brownien donné par la Défi-nition7, dans sa version discrétisée 4Wk avec 4Wk= Wtk+1− Wtk.On précise que le mouvement brownien (Wt)t∈R+ est le seul processus stochastique continu et
qui vérifie toutes les propriétés du bruit blanc. En effet, quand on remplace
ε
tk4tk par 4Wk,on peut écrire la version discrète de l’EDS comme suit :
∀tk ∈ [0, T ], Xtk+1− Xtk = rXtk4tk+ αXtk4Wk.
Alors, on a
Avec un pas de temps très petit c’est-à-dire quand 4tk → 0 et pour 0 < n ≤ N , l’équation (1.10) prend la forme : Xtn = X0+ r n−1 X j=0 Xtj4tj+ α n−1 X j=0 Xtj4Wj,
et on peut aussi la présenter sous sa forme intégrale. Xt= X0+ r Z t 0 Xtdt + α Z t 0 XtdWt,
où le dernier terme de l’équation Rt
0XtdWt est appelé l’intégrale d’Itô qui sera défini par la
suite. Mais afin d’alléger la notation, on considère l’EDS sous sa forme différentielle suivante :
dXt= rXtdt + αXtdWt. (1.11)
A ce stade, on est en mesure de résoudre l’EDS (1.11). Ainsi le mouvement brownien a remplacé le terme de bruit blanc pour modéliser les phénomènes aléatoires et le problème de continuité de l’équation 1.8 est réglé en considérant le mouvement brownien. Se pose maintenant la question des questions assurant l’existence d’une solution et si elle existe, est-t-elle unique ? Dans la suite, on présente une réponse détaillée à ces questions.
1.2.2 Intégrale d’Itô
On propose à ce niveau d’analyser l’intégrale d’Itô. Pour une classe de processus Xt, on définit l’intégrale d’Itô par :
It=
Z t
0
XsdWs.
Soit (Ω, Fs, P) un espace de probabilité. Pour gérer les notions du passé et du futur, on utilisera
la sous σ-algèbre Ft pour chaque temps t. L’espérance E [Wt| Fs] = Wt∧s. On va clarifier cela
à travers la notion de filtration.
Définition 11. (i) Une filtration (Ft)t≥0 est une famille croissante de sous σ-algèbre de F .
Chaque (Ω, Ft, P) est un espace mesuré et on suppose qu’il est complet (voir la Définition
16).
(ii) Un espace de probabilité filtré c’est le quadruplet (Ω, F , Ft, P) où (Ω, F, P) est l’espace
de probabilité et Ft est la filtration de F .
Intuitivement, les événements dans Ft sont ceux observables avant t et naturellement les σ-algèbres Ftcontiennent plus d’événements quand t croit de plus en plus.
Définition 12 (Adaptation). Soit (Ω, F , Ft, P) un espace de probabilité filtré. Un processus stochastique (Xt)t≥0 est Ft-adapté si la variable aléatoire Xtest Ft-mesurable pour tout t ≥ 0.
Définition 13 (Filtration naturelle). Si (Xt)t≥0 est un processus stochastique, soit Ft la plus
petite σ-algèbre telle que Xs est mesurable pour tout s ≤ t. (Ft)t≥0 est appelée la filtration
naturelle de Xt.
Il existe des conditions techniques qui assurent que l’intégrale d’Itô est bien définie. On se limite ici à une brève description de cette intégrale.
On se tourne maintenant vers l’intégrale d’Itô d’un processus Xt qui est Ft-adapté où Ft
est la filtration naturelle du mouvement brownien (Wt)t≥0. On suppose que (Xt)t≥0 est un
processus continu à droite. L’idée est d’introduire une grille pour discrétiser le temps, par exemple : sj = j4t pour j = 0, 1, 2, . . . et 4t = 2−N, N ∈ N. On approxime Xs pour
s ∈ [sj, sj+1[ par Xsj et dWs par l’accroissement (Wsj+1 − Wsj). Alors, on peut écrire :
Z t 0 XsdWs := lim N →∞ X sj<t Xsj Wsj+1∧t− Wsj = lim N →∞S N Xt. (1.12)
Un fait surprenant est que la limite en (1.12) dépend du choix de Xsj pour approximer Xtsur
t ∈ [sj, sj+1]. En effet, Xsj est Fsj-mesurable et indépendant de l’incrément Wsj+1∧t− Wsj
ce qui permet de conclure que l’espérance E
h Rt
0 XsdWs
i
= 0. Par contre, cela n’est pas vrai si on remplace Xsj par Xrj où rj > sj.
Un résultat bien connu stipule que la limite dans (1.12) existe, c’est par définition l’intégrale d’Itô, qui est bien définie dans L2(Ω) (SXNt possède une limite dans L2(Ω) si N → ∞).
1.2.3 Existence et unicité de la solution
Pour étudier l’existence et l’unicité de solution d’une EDS, on prend le cas multivarié général avec b : Rd → Rd une fonction vectorielle appelée la dérive et σ : Rd → Rd×m une fonction
matricielle connue sous le nom de diffusion. Puis, on définit la forme générale d’une EDS par : dXt= b(Xt)dt + σ(Xt)dWt, X0 ∈ Rd, (1.13)
avec Wt = (Wt1, . . . , Wtm)
T
. Sa solution Xt, si elle existe, est un processus stochastique tel
que : Xt= X0+ Z t 0 b(Xs)ds + Z t 0 σ(Xs)dWs. (1.14)
On a besoin de revoir quelques outils mathématiques nécessaires pour une étude rigoureuse de l’existence et l’unicité de la solution de l’EDS (1.13).
Définition 14 (Norme). Une norme k.k est une fonction d’un espace vectoriel réel (ou com-plexe) V dans R+ tel que pour tout v ∈ V
(i) kvk = 0 si et seulement si v = 0. (ii) kλk = |λ|kvk avec λ ∈ R (ou C).
(iii) kv + yk ≤ kvk + kyk pour v, y ∈ V (inégalité triangulaire).
Un espace vectoriel normé (V, k.k) est un espace vectoriel V muni de la norme k.k.
Si seul les propriétés (i) et (ii) sont satisfaites, on dit que k.k est une semi-norme notée souvent par |.|V.
Exemple 1. (Rd, k.k2) est un espace normé, sa norme est définie par
kvk2 := |v1|2+ . . . + |vd|2
1/2 ,
avec v = (v1, . . . , vd) ∈ Rd et |.| pour noter la valeur absolue. Plus généralement, kvk∞ :=
max (|v1|, . . . , |vd|) et kvkp := (|v1|p+ . . . + |vd|p)1/p pour p ≥ 1 est une norme et (Rd, k.kp)
est un espace vectoriel normé. Si d = 1, ces normes se réduisent tout simplement à la valeur absolue.
Définition 15 (Suite de Cauchy). Considérons un espace vectoriel normé (V, k.k). Une suite (vn)n∈N∈ V est dite une suite de Cauchy si, pour tout ε > 0, il existe un ordre N ∈ N tel que
kvn− vmk < ε, pour tous n, m ≥ N.
Définition 16 (Espace complet). L’espace (V, k.k) est dit complet si toute suite de Cauchy vn ∈ V converge vers une limite v ∈ V . En d’autres termes, il existe v ∈ V tel que kvn−
vk −→
n→+∞0.
Définition 17 (Espace de Banach). Un espace de Banach est un espace vectoriel normé et complet.
Exemple 2. (R, |.|) et Rd, k.kp pour 1 ≤ p ≤ ∞ sont deux espaces de Banach.
Nous introduisons maintenant le théorème de point fixe de Banach qui est un ingrédient essentiel pour prouver l’existence et l’unicité de l’EDS (1.13).
Définition 18. Une fonction ϕ de (V, k.k) dans lui même est dite k-contractante si 0 ≤ k ≤ 1 et si pour v, y ∈ V on a :
kϕ(v) − ϕ(y)k ≤ kkv − yk.
Théorème 1 (Point fixe). Soit (V, k.k) un espace normé et complet (non vide) et ϕ une application k-contractante de V dans V . Il existe un point fixe unique v∗ de ϕ tel que ϕ(v∗) = v∗.
Définition 19 (Inégalité de Jensen). Si φ : Rd−→ Rd est une fonction convexe et X une v.a
telle que E[X] < ∞ alors,
φ (E[X]) ≤ E[φ(X)], En particulier, si p > 1 alors (E[|X|])p ≤ E[|X|p] .
Le corollaire suivant présente quelques conséquences de l’inégalité de Jensen.
Corollaire 1. Soit φ : R −→ R une fonction mesurable et convexe et f ∈ L1(0, 1) alors, φ Z 1 0 f (s)ds ≤ Z 1 0 φ(f (s))ds. (1.15) En particulier si p ≥ 1 , Z 1 0 f (s)ds p ≤ tp−1 Z 1 0 |f (s)|pds. (1.16) Pour ai∈ R et p ≥ 1, n X i=1 ai p ≤ np−1 n X i=1 |ai|p. (1.17) En particulier, (a1+ a2+ . . . + an)2 ≤ n(a21+ a22+ . . . + a2n).
Notre stratégie pour développer l’existence et l’unicité de la solution de l’EDS est de baser les arguments sur la théorie du point fixe dans l’espace de Banach suivant :
Définition 20. Soit le quadruplet (Ω, F , Ft, P) un espace de probabilité filtré. On pose H2,T
l’espace de Banach donné par l’ensemble de processus à valeurs dans Rd, (Xt)t≥0est Ft-adapté
et continu à droite telle que : kXkH 2,T := sup t∈[0,T ] kXtkL2(Ω,Rd)= sup t∈[0,T ] EkXtk22 1/2 < ∞. Il s’agit d’un espace de Banach muni de la norme kXkH2,T.
On a besoin de l’hypothèse suivante sur la régularité des cœfficients de dérive et de diffusion. Hypothèse 1 (Croissance linéaire et conditions de Lipschitz). Il existe une constante L > 0 telles que les conditions de croissance linéaire sont satisfaites :
kb(Xt)k22 ≤ L 1 + kXtk22
kσ(Xt)k22≤ L 1 + kXtk22 , et les conditions de Lipschitz sont vérifiées :
kb(Xt) − b(Yt)k2≤ LkXt− Ytk2
kσ(Xt) − σ(Yt)k2 ≤ LkXt− Ytk2,
Théorème 2 (Existence et unicité). On suppose que l’hypothèse 1 est vérifiée et Wt est un mouvement brownien de filtration Ft dans (Ω, F , Ft, P). Pour tout T > 0 et X0 ∈ Rd, il existe une solution unique de (1.13), notée Xt∈ H2,T telle que pour tout t ∈ [0, T ] on a :
Xt= X0+ Z t 0 b(Xs)ds + Z t 0 σ(Xs)dWs. (1.18)
Preuve. Soit X0 ∈ L2(Ω, Rd) une variable aléatoire indépendante de la filtration F
0 et donc
du processus Wt. Pour Xt∈ H2,T on définit :
ϕ(Xt) = X0+ Z t 0 b(Xs)ds + Z t 0 σ(Xs)dWs, t ∈ [0, T ].
Si Xt ∈ H2,T est un point fixe de ϕ alors il satisfait l’équation (1.18). On montre l’existence
d’un point fixe unique en appliquant le théorème1de point fixe qu’on a présenté précédemment sur l’espace de Banach H2,T. Nous devons donc vérifier les deux hypothèses du théorème1. Pour étendre le résultat à n’importe quel intervalle de temps, on peut ré-appliquer les mêmes arguments avec une condition initiale XkT sur l’intervalle [kT, kT + T ] avec k = 1, 2, . . ..
On montre d’abord que la fonction ϕ varie dans H2,T. Le processus ϕ(Xt) est prévisible car
pour X0 ∈ LT
2(Rd×m), {
Rt
0 XsdWs} est un processus prévisible avec t ∈ [0, 1].
Il reste à montrer que la norme de H2,T de ϕ(Xt) est finie. À l’aide de l’inégalité de Jensen (1.16) on obtient : E " Z t 0 b(Xs)ds 2 2 # ≤ E t Z t 0 kb(Xs)k22ds , (1.19)
et en appliquant l’isométrie d’Itô, on obtient l’inégalité suivante :
E " Z t 0 σ(Xs)dWs 2 2 # ≤ Z t 0 E h kσ(Xs)k2F i ds, (1.20)
avec k.kF la norme de Frobenius. En utilisant les deux inégalités (1.17), (1.19) et l’équation
(1.20) on trouve : E h kϕ(Xt)k22 i ≤ 3EhkX0k22 i + 3E " Z t 0 b(Xs)ds 2 2 # + 3E " Z t 0 σ(Xs)dWsds 2 2 # ≤ 3EhkX0k22i+ 3E t Z t 0 kb(Xs)k22ds + 3 Z t 0 E h kσ(Xs)k2Fids. Grâce à l’équation suivante (Isométrie d’Itô)
Z t 0 XsdWs 2 L2(Ω) = E " Z t 0 XsdWs 2# = Z t 0 E|Xs|2ds,
en utilisant les conditions de croissance des hypothèses 1, on peut écrire cette inégalité : E h kϕ(Xt)k22 i ≤ 3EhkX0k22 i + 3t Z t 0 L2E1 + kXsk22ds + 3 Z t 0 L2E1 + kXsk22ds. (1.21)
Finalement, on prend la borne supérieure sur t ∈ [0, T ] dans les deux derniers termes de l’inégalité (1.21). En effet, E h kϕ(Xt)k22 i ≤ 3EhkX0k22 i + 3L2(t + 1)t 1 + sup t∈[0,T ] EkXtk22 ! .
Par conséquent, kϕ(X)kH2,T < ∞ et ϕ varie de H2,T dans lui même.
Pour prouver que ϕ est une contraction, on procède de la même manière en utilisant les conditions de Lipschitz au lieu des conditions de croissance linéaire. En effet,
E h kϕ(Xt) − ϕ(Yt)k22 i ≤ 2tE Z t 0 kb(Xs) − b(Ys)k22ds + 2E k Z t 0 σ(Xs) − σ(Ys)dWsk22 ≤ 2L2t Z t 0 Ekxs− ysk22 ds + 2L2 Z t 0 Ekxs− ysk22 ds ≤ 2L2t(t + 1) sup t∈[0,T ] EkXt− Ytk22 .
Si on choisit T = min 1,8L12, alors
sup t∈[0,T ] E h kϕ(Xt) − ϕ(Yt)k22 i ≤ 1 2t∈[0,T ]sup E h kXt− Ytk22 i , et kϕ(Xt) − ϕ(Yt)kH2,T ≤ 1 2kXt− YtkH2,T pour X, Y ∈ H2,T.
On voit que ϕ est belle et bien une fonction contractante dans H2,T, ainsi le théorème
d’exis-tence et unicité (1.18) est bien appliqué. De ce fait, on peut dire qu’il existe un unique point fixe de ϕ et une solution unique à (1.13).
L’existence et l’unicité de solution de l’EDS (1.13) étant établies, il est justifié d’aborder la résolution de cette équation. À ce stade, on s’intéresse à la résolution numérique d’une EDS quand la résolution théorique n’est pas possible explicitement. Donc, dans la partie qui suit on va présenter les deux schémas de discrétisation les plus usuels dans la résolution numérique d’une EDS.
1.2.4 Le schéma d’Euler-Maruyama
Certes, l’équation (1.11) est un cas particulier d’EDS où les fonctions de dérive et de diffusion sont linéaires ce qui fait que la solution explicite existe et unique. En générale pour les fonctions de dérive et de diffusion non linéaires, la solution explicite de l’équation (1.13) n’existe pas d’où la nécessité des techniques numériques. Dans cette section, sur un intervalle de temps [0, T ]
on examine l’approximation numérique de Xtn par des variables aléatoires Xnavec tn= n4t, 4t = T
N et n = 0, 1, 2, . . .. Une simple méthode est celle d’Euler-Maruyama qu’on tire à partir
de l’équation (1.14) Xtn+1 = X0+ Z tn+1 0 b(Xs)ds + Z tn+1 0 σ(Xs)dWs, (1.22) et Xtn = X0+ Z tn 0 b(Xs)ds + Z tn 0 σ(Xs)dWs, (1.23)
en substituant les deux equations (1.22) et (1.23) on obtient : Xtn+1 = Xtn+ Z tn+1 tn b(Xs)ds + Z tn+1 tn σ(Xs)dWs.
Prenons les deux fonctions b et σ constantes sur l’intervalle [tn, tn+1[ alors on obtient la
méthode d’Euler-Maruyama définie comme suit.
Définition 21 (Schéma d’Euler-Maruyama). Pour un pas de temps 4t > 0 et la condition initiale X0 ∈ Rd l’approximation d’Euler-Maruyama Xn de la solution exacte de (1.8) est
définie par
Xn+1= Xn+ b(Xn)4t + σ(Xn)4Wn, (1.24)
avec 4t = tn+1− tn, W étant défini comme un mouvement brownien tel que Wn=
Rtn+1
tn dWs
et 4Wn= Wtn+1− Wtn.
Pour un pas de temps donné 4t, la méthode d’Euler–Maruyama génère des variables aléatoires Xn qui se rapprochent des variables aléatoires Xtn données par la solution exacte de l’EDS à
l’instant tn= n4t. On explique maintenant comment Xn converge vers Xtn quand 4t → 0.
Cette convergence engendre la notion de marge d’erreur. On définit l’erreur générale comme une mesure de divergence entre le processus et son approximation au dernier instant T . Il existe de nombreuses notions de convergence pour les variables aléatoires et les méthodes numériques (voir Comets and Meyre[2006]). On se limite ici à la notion de convergence forte et pour la définir on utilise l’erreur quadratique moyenne ou l’erreur L2(Ω).
Définition 22. Pour tout pas de discrétisation 4t > 0, on dit qu’un schéma de discrétisation Xn est fortement convergent (le mot fort vient de la norme choisie) d’ordre γ > 0 si pour
0 ≤ tn≤ T , il existe une constante c < ∞ telle que
eT := kXtn− XnkL2(Ω)≤ c4tγ, ∀4t ∈]0, 1].
En générale, plus l’ordre de convergence est grand, plus le schéma de résolution est performant. Supposons ici que Xtest la solution unique de l’équation (1.8) alors on peut définir le théorème