UNIVERSITE DE BRETAGNE OCCIDENTALE
Année 2017-2018Master EURIA 1ère ANNEE
Théorie des valeurs extrêmes
Exercice 1
1. Simuler une réalisation d’un échantillon(X1, ..., Xn)de taillen= 5000d’un loi de Student à df= 3 degrés de liberté à l’aide de la fonctionR rt et réaliser un QQ-plot gaussien (fonctions R qqnorm etqqline). La loi de Student a-t’elle une queue plus “lourde” ou plus
“légère” que la loi normale ?
2. Comparer les quantiles des lois de Student df= 3degrés de liberté etdf = 100degrés de liberté : quelle loi a les queues les plus lourdes ?
3. On admet que le théorème de Fisher-Tippet s’applique à la loi de Student et on cherche à estimer le paramètre de formeκde la loi GEV limite. Mettre en place un procédure pour cela dansR. On pourra utiliser la fonctionfgev du packageevd. Quelles valeurs approchées obtenez-vous pour κlorsquedf = 2,df = 3etdf = 1000? Proposer une formule empirique qui lie df àκ.
4. On cherche à estimer le quantile d’ordreα= 99.5%de la loi de l’échantillon simulé dans la première question. Calculer les estimations obtenus avec les trois méthodes ci-dessous.
(a) Calcul du quantile empirique sur l’échantillon simulé (fonctionR quantile).
(b) Ajustement d’une loi normale à l’échantillon simulé et calcul du quantile d’ordreαde la loi ajustée.
(c) Utilisation de la méthode des maxima par bloc.
(d) Utilisation de la méthode POT.
Quelle méthode donne le meilleur résultat ? On pourra répéter plusieurs fois la simulation et ainsi estimer le biais et la variance des trois estimateurs.
Exercice 2On considère dans cet exercice des données d’intensité du vent (enms−1) à Ouessant (source :http ://www.ecmwf.int/research/era/do/get/index).
1. Importez les données après les avoir récupérées sur la page web du cours. Le fichier contient 44colonnes (chaque colonne correspondant à une année, de 1958 à 2001) et1460 lignes (les observations sont disponibles toutes les6 heures soit un total de environ 365∗4 = 1460observations par an).
2. Ajuster une loi Gamma aux données de vent. On pourra utiliser la fonctionfitdistr du packageMASS. Discuter les résultats obtenus, notamment en ce qui concerne la partie supérieure de la distribution.
3. Calculer la série temporelle des maxima annuels.
(a) Représenter la série obtenue : peut-on identifier une tendance ? Quels arguments peuvent être utilisés pour modéliser cette série comme une réalisation i.i.d. d’une loi GEV?
(b) Ajuster une loiGEV à la série temporelle des maxima annuels. Discuter les résultats obtenus. Le modèle ajusté est-il réaliste ? Peut-on affirmer que la distribution est à queue lourde ?
4. Période de retour. On notemi la valeur maximum observée la ième année etMi la variable aléatoire associée. On suppose que(M1, ..., Mn, ...)est une suite de variables aléatoires i.i.d. On noteF(s) =P[Mi≤s]la fonction de réparation associée et
N b(n, s) =card{i∈ {1, ..., n}|Mi> s}le nombre (aléatoire) de dépassement du niveaus ennannées.
1
(a) Montrer queN b(n, s)suit une loi binomiale dont on précisera les paramètres. En déduire les quantités suivantes :
— Quelle est la probabilité de dépasser exactement une fois le niveausennannées ?
— Quelle est la probabilité de dépasser au moins une fois le niveausennannées ?
— Combien de fois en moyenne le niveausest-il dépassé ennannées ?
(b) On définit généralement la tempête centenale comme l’intensité du vent qui est observé en moyenne une fois tous les cent ans. Exprimer l’intensité de la tempête centenale en fonction de la fonction quantile associée àF.
5. Estimer l’intensité du vent dans une tempête centenale à Ouessant (on donnera le résultat sous la forme d’un intervalle de confiance à 95%).
6. Analyser la série temporelle de vent avec la méthode POT et comparer avec les résultats obtenus avec ceux des questions précédentes.
Exercice 3On considère la série temporelle des log-ratio correspondant au cours du S&P 500 depuis 1950 (cours de clôture journaliers). Les données sont disponibles au format .csv à l’adresse http ://fr.finance.yahoo.com
1. Importer la série temporelle sousR et la représenter graphiquement.
2. Dans le modèle de Black and Scholes, on suppose que la série temporelle de l’actif
sous-jacent est une réalisation d’un mouvement Brownien géométrique. Si c’est le cas alors la série temporelle des log-ratio
xt=log(yt)−log(yt−1) =log(yt/yt−1)
est une réalisation d’une suite de variables aléatoires i.i.d gaussienne.
— Mettre en évidence, à l’aide d’un graphique simple, que la loi des log-ratio observés a une queue plus lourde que la loi normale.
— Estimer le quantile à99,9%en utilisant une approximation par la loi normale et comparer au quantile empirique. Discuter.
3. On considère la série temporelle obtenue en prenant l’opposé de la série des minima annuels associés à{xt}. Ajuster une loi GEV à cette série temporelle puis discuter les résultats obtenus :
— Donner des estimations des paramètres ainsi que des intervalles de confiance. Est-ce que ces résultats sont en accord avec l’hypothèse de normalité du modèle de Black et Sholes ?
— Comparer les fonctions de répartition et les fonctions quantiles empirique avec celles correspondant à la loi GEV ajustée. Le modèle est-il réaliste ?
— Donner un quantile à0.01%pour la série temporelle intiale en utilisant la loi GEV ajustée. Comment s’interprète cette quantité en terme de valeur de retour ?
— Quelle est la période de retour du krach de 1987 ?
4. Analyser la série avec la méthode POT et comparer avec les résultats obtenus avec ceux de la question précédente.
2