Dépendance des volumes ordonnés

In document en fr (Page 84-90)

3.4 Mise en évidence de la persistance

3.4.3 Dépendance des volumes ordonnés

Soit f](j,nP

i) la fréquence empirique de dépassement du volume de la jième averse la plus forte de l'événementicomportantni ≥2averses principales pour le posteP avecj ∈ {1, .., ni}.

On regarde alors la dépendance entre f](j,N)P et f^(j+1,N)P avec j ∈ {1, N −1} pour N ∈ {2,max(N AV PiP)}. On regroupe les postes pour formerf](j,N) = (f](j,N)P1 , . . . ,f](j,N)PM ) etf^(j+1,N) = (f^(j+1,N)P1 , . . . ,f^(j+1,N)PM )où P1, . . . , PM sont les M postes étudiés. En re-groupant tous les événements à notre disposition, on obtient alors le scatterplot présenté sur la Figure 3.12(e). On remarque que l'on n'a pas une loi uniforme pour les fréquences et qu'il y a une certaine dépendance entre 2 averses principales de volumes successifs (appartenant au même événement). Par dénition, on obtient un scatterplot qui n'a des points qu'en dessous la bissectrice y = x. On utilise alors les méthodes présentées à la Section 3.3 pour estimer les paramètres des copules considérées.

Avant d'utiliser tels quels les outils de détection de dépendance usuels (le tau de Kendall et les chi-plots), il faut évaluer la conséquence de l'ordonnancement des valeurs sur ces outils, c'est à dire, dénir de nouveaux intervalles de conance du tau de Kendall et de nouvelles bornes de contrôles pour les chi-plots.

Conséquence de l'ordonnancement des valeurs sur des données indépen-dantes

L'idée est de reproduire des données semblables aux données observées mais en se plaçant sous l'hypothèse d'indépendance des volumes an d'évaluer la conséquence de l'ordonnancement sur l'estimation du tau de Kendall et sur les bornes de contrôles des chi-plots.

On se xe un N compris entre 2 et 8. Nous générons un nombre d'événements N E ayant N averses principales de fréquences indépendantes et identiquement distri-bués : f ∼ U[0,1]. N E est pris en respectant le nombre de couples que l'on a dans nos événements observés ayant N averses principales3. Par une procédure de tri au sein de chaque événement simulé, on peut alors créer nos deux vecteurs f](j,N) et f^(j+1,N) pour en estimer leur dépendance via le tau de Kendall sous l'hypothèse d'indépendance.

3Dans les Tableaux 3.6 et 3.7, nous avons le nombre de couples pour chaque type d'événement.

SoitN c le nombre de couples pour les événements ayantN averses principales. Il y a alorsN E=

N c

N−1 événements avecN averses principales

CemOA : archive ouverte d'Irstea / Cemagref

En eectuant un grand nombre de fois cette simulation de données et l'estimation du tau de Kendall sous indépendance, on obtient alors un nouvel intervalle de conance du tau de Kendall pour savoir si la dépendance des données triées est seulement la conséquence de l'ordonnancement ou est liée à une réelle dépendance entre les valeurs triées (voir Tableau 3.10). On a remarqué que ces estimations dépendent du nombre N xé mais pas du nombreN E, c'est à dire, le nombre de couples à partir desquels elles sont estimées.

On eectue la même procédure pour estimer les nouvelles bornes de contrôle des chi-plots dans le cas de données triées. Ces estimations sont diérentes selon le N que l'on xe et selon le N E choisi mais à moindre mesure. L'ordonnancement im-pliquant une dépendance positive, la borne de contrôle se transforme en une valeur limite cp. L'hypothèse d'indépendance est alors rejetée s'il y a plus de 100(1−p)%

paires (χi, λi) au dessus de la valeur limite cp. Le Tableau 3.8 illustre les cp des chi-plots pour la saison hiver et été pour diérentes probabilités p.

Les intervalles de conance du tau de Kendall et les bornes de conance des chi-plots ont été estimés à partir de 10000 chroniques simulées indépendamment.

saison Valeur dep N = 2 N = 3 N = 4 N = 5 N = 6 N 7 N = 8

cp pour hiver

p= 0.9 0.06 0.25 0.41 0.52 0.60 0.66 0.70

p= 0.95 0.08 0.26 0.42 0.53 0.61 0.67 0.71

p= 0.99 0.11 0.27 0.43 0.54 0.61 0.67 0.72

cp pour été

p= 0.9 0.06 0.25 0.41 0.49 0.60

p= 0.95 0.08 0.26 0.42 0.51 0.61

p= 0.99 0.11 0.27 0.43 0.52 0.61

Tab. 3.8 Bornes de contrôle cp des chi-plots pour l'étude de la dépendance entre valeurs ordonnées en fonction du nombre de valeurs à trierN.

Estimation de la dépendance des volumes ordonnés à partir des obser-vations

On veut savoir si, d'après les observations, il y a une dépendance entre les vo-lumes ordonnés au sein des événements. Pour cela on utilise les chi-plots avec les nouvelles bornes de contrôle (Tab. 3.7) et le test du tau de Kendall en prenant les intervalles de conance estimés à partir des données triées.

On regroupe les événements en fonction de leur nombre d'averses principales. On

CemOA : archive ouverte d'Irstea / Cemagref

3.4 Mise en évidence de la persistance 73

a également séparé les événements tropicaux des événements issus de la métropole et de la Corse. Pour la métrople, les Chi-plots entre les variables f^(j+1,N) et f](j,N) sont illustrés sur la Figure 3.12 pour les événements ayant 3 et 5 averses principales pour les deux saisons. Pour le tropical, les Chi-plots sont sur la Fig. 3.13 pour les événements ayant 3, 5 et 7 averses principales pour les deux saisons. Les valeurs du tau de Kendall entre les variables f^(j+1,N) et f](j,N) sont illustrées sur les Tableaux 3.9 pour les postes métropole+Corse et 3.10 pour les postes tropicaux.

saison N AV P = 2 N AV P = 3 N AV P = 4 N AV P ≥ 5 IC 95% ind. deτ [−0.07,0.07] [0.18,0.27] [0.33,0.43] [0.44,0.53]

τ pour Hiver 0.10 0.375 0.48 0.55

τ pour Été 0.03 0.33 0.47 0.51

Tab. 3.9 Estimation du tau de Kendall (et IC à 95%) entre f^(j+1,N) et f](j,N) pour la saison hiver et été sur les postes de la métropole + Corse ainsi que le nombre de couples sur lequel il a été estimé et son intervalle de conance à95%sous indépendance.

saison N AV P = 2 N AV P = 3 N AV P = 4 N AV P = 5 N AV P = 6 N AV P = 7 N AV P 8 IC95%ind. [−0.07,0.07] [0.18,0.27] [0.33,0.43] [0.44,0.53] [0.51,0.61] [0.58,0.68] [0.64,0.70]

τ pour Hiver 0.17 0.38 0.50 0.54 0.63 0.74 0.8

τ pour Été 0 0.28 0.42 0.57 0.62

Tab. 3.10 Estimation du tau de Kendall entre f^(j+1,N) etf](j,N) pour la saison hiver et été sur les postes tropicaux ainsi que le nombre de couples sur lequel il a été estimé et son intervalle de conance à 95% sous indépendance.

Selon les graphiques, on peut rejeter sans ambiguité l'hypothèse d'indépendance des deux variables tout comme pour le test du tau de Kendall. On a une dépendance aussi marquée dans les deux saisons pour la métropole+Corse. De plus, la dépen-dance augmente avec le nombre d'averses principales d'un événement. Le choix de séparer les postes tropicaux et les postes de la métropole + Corse a été dicté par le fait que les événements tropicaux hivernaux peuvent avoir jusqu'à 8 averses princi-pales alors que pour les postes de métrople ce nombre n'excède pas 5. De plus on

CemOA : archive ouverte d'Irstea / Cemagref

remarque que pour ce type d'événements la dépendance est beaucoup plus grande que pour ceux issus de la métropole+Corse.

Remarque 3.4.2 Le choix de la formule d'Hazen par rapport à d'autres du type fj = n+1−2αrj−α avecα ∈[0,1]dans la transformation des volumes en fréquence n'inue pas sur les résultats de dépendance puisque la détection de dépendance par les Chi-plots ou le tau de Kendall se fait à travers les rangs et non à travers les valeurs.

CemOA : archive ouverte d'Irstea / Cemagref

3.4 Mise en évidence de la persistance 75

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 81 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 30 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 89 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 31 %

(e) scatterplot de f(j+1,N)^ en fonction de f^(j,N)

Fig. 3.12 Les Chi-plots pour détecter la dépendance entre les variables f^(j+1,N) et f](j,N) pour les événements (métropole+Corse) ayant N = 3 ou N = 5 averses principales en distinguant les saisons hiver et été. De plus, le scatterplot entref^(j+1,N) etf^(j+1,N) sur tous les événements à notre disposition

CemOA : archive ouverte d'Irstea / Cemagref

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 53 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 63 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 87 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 41 %

Bande de controle avec p = 0.9 avec p = 0.95 avec p = 0.99

% de couples en dehors des bandes contrôles

IC 90%: 50 % IC 95%: 50 % IC 99%: 50 %

(e) événements hivernaux oùN AV P = 7

Fig. 3.13 Les Chi-plots pour détecter la dépendance entre les variables f^(j+1,N) et f](j,N) pour les événements tropicaux ayant N = 3 ou N = 5 averses principales en distinguant les saisons hiver et été.

CemOA : archive ouverte d'Irstea / Cemagref

3.5 Modélisation de la persistance dans SHYPRE 77

In document en fr (Page 84-90)