Cas d'une copule triangle

In document en fr (Page 71-76)

Gumbel exp

(−lnu)θ+ (−lnv)θ1/θ

non explicite Clayton u−1/θ+v−1/θ −1−θ

1−u−θ+ (eu.u1+θ)1+θθ −1/θ

Tab. 3.3 Copules archimédiennes et l'inverse de leurs distributions conditionnelles.

3.3 Cas d'une copule triangle

Dans la suite, les couples (Xi, Yi) sur lesquels on va travailler vérieront par construction Xi > Yi, i= 1, .., n. Cette particularité doit être prise en compte dans la modélisation de la dépendance par les copules. Dans la suite, on appelera une telle copule une copule triangle.

3.3.1 Estimation du paramètre d'une copule triangle

Au départ on a un n-échantillon de vecteurs Zi = (Xi, Yi) vériant ∀i ∈1, .., n, Xi > Yicomme illustré sur la Figure 3.8(a). Les approches classiques de modélisation par copules supposent une répartition des couples sur [0,1]2, ne se limitant pas au seul triangle sous la bissectrice. Pour contourner ce problème, deux approches sont proposées : la permutation (voir Fig. 3.8(c)) et la symétrisation (3.8(b)) de l'échantillon de départ.

Permutation de l'échantillon de départ

Le but de la permutation de l'échantillon de départ est de construire un nouvel échantillon de couples se répartissant sur [0,1]2. On procède de la façon suivante

CemOA : archive ouverte d'Irstea / Cemagref

3.3 Cas d'une copule triangle 59

échantillon du type f1>f2

f1

f2

(a) Échantillon de départ

● ●

échantillon dit ''symétrisé''

f1

pts de départ pts symetrisés

(b) Échantillon symétrisé

échantillon dit ''permuté''

f1

pts non permutés pts permutés

(c) Un échantillon permuté

Fig. 3.8 Deux transformations de l'échantillon de départ.

pour un n-échantillon de vecteursZi = (Xi, Yi)vériant ∀i∈ {1..n}, Xi > Yi : Pourj ∈1. . . Npermut :

1. On choisit bn/2c valeurs comprises entre 1 et n sans remise formant alors l'ensembleIˆ. (a) On choisit n valeurs comprises entre 1 et n avec remise formant alors

l'ensemble U.

(b) On forme un nouvel n-échantillon Ee =

{Zi}i∈{1..n} \I∩Uˆ {Zi0}i∈I∩Uˆ

(c) On estime le paramètre θcjk de la copule choisie Cθ sur l'échantillon E àe l'aide des méthodes usuelles (ici on utilisera celle de l'inversion du tau de Kendall).

5. On recommence Npermut fois.

CemOA : archive ouverte d'Irstea / Cemagref

On a un ensemble de N = Npermut ×Nboot estimations {θbj}j=1..N du paramètre θ. On estime alors le paramètre par la médiane des estimations. On peut également proposer une estimation par intervalle au risque p en prenant les quantiles 1−p/2 et p/2 de l'échantillon des θbj.

Symétrie de l'échantillon de départ

Comme pour la méthode de permutation, le but est de construire un échantillon où les points sont répartis sur [0,1]2. On procède de la façon suivante pour un n -échantillon de vecteurs Zi = (Xi, Yi) vériant ∀i∈ {1..n}, Xi > Yi :

1. On considère un 2n-échantillon ZZ des couples Zi = (Xi, Yi) pour i∈ {1..n}

et Zi0 = (Yi, Xi) pour i∈ {1..n}; ZZ =

{Zi}i∈{1..n}

{Zi0}i∈{1..n}

.

2. L'idée est d'utiliser la procédure bootstrap sur ZZ={ZZi}i=1..2n avecZZi = (Xi, Yi)pouri∈ {1..n}etZZi = (Yi, Xi)pouri∈ {n+1..2n}: pourj ∈1. . . N avec N assez grand :

(a) On choisit 2n valeurs comprises entre 1 et 2n avec remise formant alors l'ensembleIe.

(b) On forme un nouvel2n-échantillonZZf ={ZZi}i∈Ie.

(c) On estime le paramètre θbj de la copule choisie Cθ sur l'échantillon gZZ à l'aide des méthodes usuelles (ici on utilisera celle de l'inversion du tau de Kendall).

3. On a un ensemble deN estimations{θbj}j=1..N du paramètreθ. On estime alors le paramètre par la médiane des estimations. On peut également proposer une estimation par intervalle au risquepen prenant les quantiles 1−p/2etp/2de l'échantillon des θbj.

Permutation ou Symétrie ?

An de valider les 2 méthodes, permutation et symétrie, on procède par simu-lations et on utilise une approche Monte-Carlo. On choisit une copule Cθ (ici on utilise la copule de Gumbel) en xant θ puis on applique un grand nombre de fois la procédure suivante :

1. On simule unn-échantillon Z de couplesZi = (Xi, Yi) pouri∈ {1..n}selon la copule Cθ. On estime le paramètre θZ de la copule à partir de l'échantillon Z.

CemOA : archive ouverte d'Irstea / Cemagref

3.3 Cas d'une copule triangle 61

2. On cherche les indices i de l'échantillon Z tel que Xi < Yi pour i ∈ 1. . . n formant l'ensemble Isup. Plutôt que de supprimer les couples (Xi, Yi) pour i∈ Isup, ce qui impliquerait une perte d'information pour l'estimation, on les permute an de former un n-échantillon Z' = {Zi0}i=1..n avec Zi0 = (Xi, Yi) pouri∈ {1..n}\Isup etZi = (Yi, Xi)pour i∈Isup.

3. On applique les procédures de permutation et de symétrie précédemment citées sur l'échantillon Z'.

4. On stocke, pour la procédure permutation (resp. la procédure symétrie) , le pa-ramètre estimé, notéθc1Z0 (resp.θc2Z0) ainsi que l'intervalle de conance empirique à95%, notéICZ01 (resp. ICZ02 ).

Nous avons eectué la procédure de validation dans le cas d'une copule de Gum-bel pour diérents paramètres θ = 1.2, 1.5 et2.5 et diérentes tailles d'échantillon n= 50, 100 et250.

Dans un premier temps, on regarde si les estimations θc1Z0 et θc2Z0 dièrent des esti-mations θcZ en regardant le critère de Nash (voir Annexe G). Puis on regarde le pourcentage PθZ0 d'intervalles de conance ICZ01 ou ICZ02 qui contiennent la vraie valeur du paramètreθ de la copule.

Le récapitulatif des résultats est fourni dans le Tableau 3.4 pour N = 500.

Quelque soit la valeur de θ, les deux méthodes d'estimation d'une copule trian-gle, celle de la permutation et celle de la symétrie, montrent de bons résultats.

En eet, au vu des critères de Nash, les estimations sur l'échantillon entier Z et celles sur l'échantillon en triangle sont quasiment identiques. Il n'y a quasiment pas de diérences entre estimer le paramètre sur l'échantillon entier et l'estimer sur un échantillon en triangle. On remarque que l'estimation est tout de même plus précise pour la méthode de la permutation. Les intervalles de conance empiriques de ces méthodes contiennent la vraie valeur du paramètre dans la plupart des cas respectant assez bien le pourcentage théorique. La méthode de la permutation est alors choisie pour estimer le paramètre de la copule et son intervalle de conance empirique.

Remarque 3.3.1 L'utilisation du bootstrap dans la méthode de permutation a été motivée par le fait que les intervalles de conance empiriques estimés qu'à partir de la permutation étaient trop étroits et ne contenaient que très rarement la vraie valeur du paramètre θ. La permutation ne faisait pas assez bouger l'information.

Remarque 3.3.2 On utilise l'inversion du tau de Kendall pour l'estimation du pa-ramètre de la copule. Ce choix a été motivé par le fait que l'on a, dans les données à étudier, des fréquences qui ne suivent pas une loi uniforme (voir Fig. 3.9). Avec le tau de Kendall, ceci n'est pas un problème car il est estimé seulement à partir des

CemOA : archive ouverte d'Irstea / Cemagref

Permutation Symétrie θ taille de Z Nash(θZ01Z) Pθ1

Z0 de l'I.C. 95% Nash(θZ02Z) Pθ2

Z0 de l'I.C. 95%

θ= 1.2

n= 50 0.97 88% 0.93 92%

n= 100 0.99 90% 0.96 92%

n= 250 0.99 90% 0.97 93%

θ= 1.5

n= 50 0.98 88% 0.94 91%

n= 100 0.985 88% 0.96 91%

n= 250 0.995 87% 0.97 92%

θ= 2.5

n= 50 0.96 89% 0.88 91%

n= 100 0.98 90% 0.95 88%

n= 250 0.99 89% 0.97 91%

Tab. 3.4 Résultats de la procédure de validation pour estimer le paramètre d'une copule trian-gle. On calcule les Nash entre les paramètres estimés à partir de l'échantillon triangle Z' et à partir de l'échantillon de départ Z ainsi que le pourcentage d'intervalles de conance contenant la vraie valeurθ de la copule simulée.

rangs des valeurs alors qu'avec la méthode de pseudo-vraisemblance cela biaise for-tement l'estimation. Par contre si on avait eu un échantillon uniforme, la méthode de la pseudo-vraisemblance serait utilisable directement sur l'échantillon triangle : on pourrait alors éviter de passer par les méthodes de permutation ou de symétrie.

Remarque 3.3.3 Les méthodes de symétrie et de permutation ne sont valables que pour des copules symétriques, -ie- Cθ(x, y) = Cθ(y, x), qui est le cas des copules archimédiennes mais également de beaucoup d'autres copules. La procédure de va-lidation des méthodes a également été appliquée pour les copules de Clayton et de Frank et les résultats ont été similaires.

CemOA : archive ouverte d'Irstea / Cemagref

In document en fr (Page 71-76)