Université Félix-Houphouët-Boigny

(1)

Université Félix-Houphouët-Boigny

Année 2019-2020

Master 1ère ANNEE

Théorie des valeurs extrêmes

Exercice 1

1. Tracer sur un même figure les densités de la loiGEV(0,1, κ)pour

κ∈ {−1,−0.9, ....,0, ...,1}. On pourra utiliser la fonctiondgev du packageevd.

2. Simuler une réalisation d’un échantillon(X1, ..., Xn)de taillen= 5000d’un loi de Student à df= 3degrés de liberté à l’aide de la fonctionR rt et un échantillon (Y1, ..., Yn)de taille n= 5000d’un loi normale centré-réduite. Réaliser un QQ-plot pour comparer les quantiles empiriques des deux échantillons simulés (fonctionR qqplot). La loi de Student a-t’elle une queue plus “lourde” ou plus “légère” que la loi normale ?

3. Réaliser un QQ-plot gaussien (fonctionsR qqnorm) des échantillons simulés dans la question précédente puis un QQ-plot gaussien d’un échantillon simulé selon une loi normale de moyenne µ= 2et varianceσ²= 4. Discuter les résultats obtenus.

4. Comparer les quantiles empiriques d’un échantillon simulé selon la loi de Student àdf = 3 degrés de liberté et d’un échantillon simulé selon la loi de Student àdf = 100degrés de liberté : quelle loi a les queues les plus lourdes ?

5. Vérifier, en utilisant des simulations, que le théorème central-limite, s’applique à la loi de Student.

6. Vérifier, en utilisant des simulations, que le théorème de Fisher-Tippet s’applique à la loi de Student. On pourra utiliser la fonctionfgev du packageevd. Quelles valeurs approchées obtenez-vous pour le paramètre de forme κde la loi GEV limite lorsquedf = 2,df= 3 et df = 1000?

7. On cherche à estimer le quantile d’ordreα= 99.99%de la loi de l’échantillon(X₁, ..., X_n) simulé dans la première question. Calculer les estimations obtenus avec les méthodes ci-dessous.

(a) Calcul du quantile empirique sur l’échantillon simulé (fonctionR quantile).

(b) Ajustement d’une loi normale à l’échantillon simulé et calcul du quantile d’ordreαde la loi ajustée.

(c) Utilisation de la méthode des maxima par bloc.

(d) Utilisation de la méthode POT (dépassements de seuil).

Quelle méthode donne le meilleur résultat ? On pourra répéter plusieurs fois la simulation et ainsi estimer le biais et la variance des estimateurs.

1

(2)

Exercice 2On considère dans cet exercice les données météorologiques en Côte d’Ivoire disponibles sur le site

https://www.ncdc.noaa.gov/data-access/land-based-station-data/land-based-datasets/global-historical-climatology-network-ghcn On considérera en particulier les variablesTmax (maxima journaliers de température en degré

Celcius),Tmin (minimas journaliers de température en degré Celcius) etP rcp(cumuls journaliers de précipitation de mm). Les données sont disponibles pour diﬀérentes stations de mesure en Côte d’Ivoire. Afin de télécharger les données et les transformer en un format exploitable, on pourra s’aider du script R disponible sur la page du cours

http://pagesperso.univ-brest.fr/~ailliot/doc_cours/M1UFHB

Après avoir importé les données pour la ville de votre choix, répondez aux questions suivantes.

1. Pourquoi un actuaire pourrait être amené à analyser ces données et les extrêmes en particulier ?

2. Tracer les séries temporelles des moyennes annuelles pour les diﬀérentes variables

météorologiques. Peut-on identifier des tendances (réchauﬀement climatique, évolution de la pluviométrie,...) ?

3. Calculer la proportion de valeurs manquantes chaque année et représenter avec un graphique. Discuter.

4. Tracer un boxplot des diﬀérentes variables météorologiques avec un boxplot diﬀérent pour chaque mois. Quel est le mois le plus chaud ? le plus froid ? le plus humide ?

5. On utilise généralement une loi normale pour modéliser les températures. Est-ce que cette hypothèse vous parait justifiée ?

6. Ajuster une loi Gamma aux précipitations positives (c’est à dire après avoir enlevé les 0 et les valeurs manquantes). On pourra utiliser la fonctionfitdistr du packageMASS. Discuter les résultats obtenus, notamment en ce qui concerne la partie supérieure de la distribution.

7. Dans la suite de l’exercice, on s’intéresse à la variable P rcp. Calculer la série temporelle des maxima annuels (ou mensuels).

(a) Représenter la série obtenue : peut-on identifier une tendance ? Quels arguments peuvent être utilisés pour modéliser cette série comme une réalisation i.i.d. d’une loi GEV?

(b) Ajuster une loiGEV à la série temporelle des maxima annuels. Discuter les résultats obtenus. Le modèle ajusté est-il réaliste ? Peut-on aﬃrmer que la distribution est à queue lourde ?

8. Période de retour. On notemi la valeur maximum observée la ième année etMi la variable aléatoire associée. On suppose que(M1, ..., Mn, ...)est une suite de variables aléatoires i.i.d. On noteF(s) =P[Mi≤s]la fonction de réparation associée et

N b(n, s) =card{i∈ {1, ..., n}|Mi> s}le nombre (aléatoire) de dépassement du niveaus ennannées.

(a) Montrer queN b(n, s)suit une loi binomiale dont on précisera les paramètres. En déduire les quantités suivantes :

— Quelle est la probabilité de dépasser exactement une fois le niveausennannées ?

— Quelle est la probabilité de dépasser au moins une fois le niveausennannées ?

— Combien de fois en moyenne le niveausest-il dépassé ennannées ?

(b) On définit généralement l’événement centennal comme l’événement qui est observé en moyenne une fois tous les cent ans. Exprimer l’intensité de la précipitation centenale en fonction de la fonction quantile associée àF.

9. Estimer l’intensité de la précipitation centennale pour la ville que vous avez choisie (on donnera le résultat sous la forme d’un intervalle de confiance à 95%).

10. Analyser la série temporelle avec la méthode POT et comparer avec les résultats obtenus avec ceux des questions précédentes.

2

(3)

11. Reprendre les questions précédentes en considérant la variableTmax.

3

(4)

Exercice 3On considère la série temporelle des log-ratio correspondant au cours du S&P 500 depuis 1950 (cours de clôture journaliers). Les données sont disponibles au format .csv à l’adresse http ://fr.finance.yahoo.com

1. Importer la série temporelle sousR et la représenter graphiquement.

2. Dans le modèle de Black and Scholes, on suppose que la série temporelle de l’actif

sous-jacent est une réalisation d’un mouvement Brownien géométrique. Si c’est le cas alors la série temporelle des log-ratio

xt=log(yt)−log(yt−1) =log(yt/yt−1)

est une réalisation d’une suite de variables aléatoires i.i.d gaussienne.

— Mettre en évidence, à l’aide d’un graphique simple, que la loi des log-ratio observés a une queue plus lourde que la loi normale.

— Estimer le quantile à99,9%en utilisant une approximation par la loi normale et comparer au quantile empirique. Discuter.

3. On considère la série temporelle obtenue en prenant l’opposé de la série des minima annuels associés à{x_t}. Ajuster une loi GEV à cette série temporelle puis discuter les résultats obtenus :

— Donner des estimations des paramètres ainsi que des intervalles de confiance. Est-ce que ces résultats sont en accord avec l’hypothèse de normalité du modèle de Black et Sholes ?

— Comparer les fonctions de répartition et les fonctions quantiles empirique avec celles correspondant à la loi GEV ajustée. Le modèle est-il réaliste ?

— Donner un quantile à0.01%pour la série temporelle intiale en utilisant la loi GEV ajustée. Comment s’interprète cette quantité en terme de valeur de retour ?

— Quelle est la période de retour du krach de 1987 ?

4. Analyser la série avec la méthode POT et comparer avec les résultats obtenus avec ceux de la question précédente.

4