• Aucun résultat trouvé

Application des tests à notre problème

Dans le document en fr (Page 139-143)

4.4 Validation des quantiles de SHYPRE et SHYREG

5.1.4 Application des tests à notre problème

on a alors sousH0 et pourN assez grand,D H0 χ2d

1−d0. On rejette donc l'hypothèse H0, avec un risque α, si D > uα avecP(χ2d1−d0 > uα) = α.

5.1.4 Application des tests à notre problème

Mise en place du test du rapport des vraisemblances maximales

Nous adoptons la méthodologie Peak-Over-Threshold pour la recherche d'insta-tionnarité.

Soit n le nombre d'événements entre l'année A1 et l'année A1+A

Soit (X1, . . . , Xn), la pluie journalière maximale en millimètre de ces.n événements.

Soit (D1, . . . , Dn), la durée en jours de ces n événements.

Soit (t1, . . . , tn)la série représentant les dates des (X1, . . . , Xn) en jour.

L'instant t = 1 correspond au premier janvier de A1, puis ti correspond au nombre de jours séparant l'instant t = 0 de la date de la pluie maximale journalière de l'événement i.

Soit N[d1,d2]la variable occurrence des événements entre le début du jour d1 et la n du jour d2 de la chronique. Par exemple N[1,365] compte le nombre d'événements au cours de la première année de la série.

Modélisation de l'occurence des événements :

Dans le cadre de l'échantillonnage par valeurs supérieures à un seuil, il est fréquent de supposer que le nombre d'événement par unité de temps (en général l'année) suit une loi de Poisson [81, 62]. Un événement, par dénition, doit comporter au moins une pluie journalière dépassant 20 mm. On peut donc dire que N[t,t]def=N[t] suit une loi de Poisson non homogène de paramètre λ(t). λ(t) correspond alors au nombre moyen d'événements par jour à l'instant t. On a donc N[1,t] suit une loi de Poisson de paramètre tλ(t).

Soit L le nombre total de jours de la chronique (L≈365.25A).

La log-vraisemblance d'un processus de Poisson d'intensitéλ(t)dépendant du temps

CemOA : archive ouverte d'Irstea / Cemagref

5.1 Les diérents tests de détection de tendance 127

t∈[0, L]s'écrit :

LPn1 = − Z L

0

λ(t)dt +

n

X

i=1

log(λ(ti)) (5.1) On peut alors tester l'hypothèse H0 : (M0) λ(t)1 = λ0 contre l'hypothèseH1 : (M1)

1

λ(t) = λ01t à l'aide du test RVM (voir Section 5.1.3) avecd1−d0 = 2 − 1 = 1. On peut également regarder l'évolution du temps d'attente d'un événement au cours du temps. En eet dans un processus de Poisson d'intensité λ(t), le temps d'attente suit une loi exponentielle de paramètre λ(t) [61]. On peut donc construire une nouvelle log-vraisemblance :

LPn2 =

n

X

i=1

log(λ(ti))

n

X

i=1

λ(ti)(ti−ti−1)

avec t0 = 1 (5.2)

Nous avons donc proposé deux modèles appliquables au test RVM pour évaluer l'évo-lution du paramètre N E au cours du temps.

Modélisation de l'intensité des événements :

Les événements sont considérés indépendants, les variables (Xi)i=1..n sont donc in-dépendantes et distribuées selon la même famille de loi. Selon la dénition d'un événement, nous avons ∀i = 1..n, Xi > 20mm. Les dépassements (Xi)i=1..n > u peuvent être modélisés de deux façons.

Premier cas : Les dépassements(Xi)i=1..n > usont modélisés par une loi exponen-tielle de paramètres σ(t)et u xé à 20mm. La log-vraisemblance s'écrit donc

LEn =

n

X

i=1

log(σ(ti))−

n

X

i=1

σ(ti) (xi−u) (5.3) On peut alors tester l'hypothèse H0 : (M0) σ(t)1 = σ0 : µP J max est stationnaire contre l'hypothèse H1 : (M1) σ(t)1 = σ0 + σ1.t : µP J max croit linéairement en fonction du temps à l'aide du test RVM (voir Section 5.1.3) avecd1−d0 = 2−1 = 1. Deuxième cas : Les dépassements (Xi)i=1..n > u (ici le seuil u = 20mm) sont modélisés par une loi de Pareto généralisée [69]. La distribution d'une GPD est

CemOA : archive ouverte d'Irstea / Cemagref

caractérisée par 2 paramètres : σ le paramètre d'échelle et ξ le paramètre de forme.

La fonction de répartition P(X < x|X > u) =F(u,σ,ξ)(x) s'écrit

F(ξ,u,σ)(x) =





1−(1 + ξ(x−u)σ )−1/ξ avec x−uσ <−1ξ pour ξ <0, 1−(1 + ξ(x−u)σ )−1/ξ avec x−uσ >−1ξ pour ξ >0, exp(−(x−u)σ ) pour ξ= 0.

De plus si X ∼GP D(u, σ, ξ) alorsE(X−u|X > u) = 1−ξσ [28]. Nous pouvons donc estimer notre paramètre µP J max par 1−ξσ +u.

Pour caractériser le changement climatique, on suppose alors que le paramètre d'échelle σ(t) varie dans le temps alors que l'on suppose la stationnarité du pa-ramètre de forme ξ, notamment en raison des incertitudes d'échantillonage [82]. La log-vraisemblance s'écrit alors (dans notre cas u = 20mm pour tous les postes) :

LGP Dn = −

n

X

i=1

log(σ(ti))

− 1 + 1 ξ

n

X

i=1

log 1 + ξ(xi−u) σ(ti)

(5.4)

On peut alors tester l'hypothèse H0 : (M0) σ(t) = σ0 : µP J max = 1σ0ξ + u est stationnaire contre l'hypothèse H1 : (M1) σ(t) = σ0 + σ1.t : µP J max(t) =

σ0+σ1.t

1ξ +u:µP J maxcroit linéairement en fonction du temps à l'aide du test RVM (voir Section 5.1.3) avec d1−d0 = 3 − 2 = 1.

Modélisation de la durée des événements :

La durée d'un événement (en jour) est par dénition supérieure ou égale à un.

Soit D0 = (D1 −1, . . . , Dn−1). Nous avons alors ∀i, Di0 ≥ 0. Nous considérons alors que D0 suit une loi de Poisson de paramètre λD(t) où λD(t) + 1 correspond à la durée moyenne d'un événement à l'instant t. La log-vraisemblance s'écrit alors :

LDn =

n

X

i=1

log(λD(ti)) −

n

X

i=1

d0i log(λD(ti)) +

n

X

i=1

log(d0i!) (5.5) On peut alors tester l'hypothèse H0 : (M0) λD(t) = λD0 : contre l'hypothèse H1 : (M1) λD(t) = λD0D1 t à l'aide du test RVM (voir Section 5.1.3) avec d1 −d0 = 2 − 1 = 1.

Les paramètres λ0 et λD0 sont estimés analytiquement sous l'hypothèse H0 de stationnarité. Les autres paramètres λi, λDi (sous H1), σi et ξ sont estimés à l'aide

CemOA : archive ouverte d'Irstea / Cemagref

5.1 Les diérents tests de détection de tendance 129

de la méthode de Broyden-Fletcher-Goldfarb-Shanno (BFGS) [13, 33, 43, 87] de la fonction optim du langage R (http://www.r-project.org/). On a privilégié l'utilisation de cette méthode d'optimisation car elle converge plus souvent que les autres, comme par exemple celle du gradient conjugué.

Remarque 5.1.1 Les deux processus (Poisson et GPD) étant indépendants, nous pouvons donc analyser les deux processus séparément [81]. De plus nous considérons que la durée d'un événement est indépendante de la pluie journalière maximale. Nous pouvons donc analyser les trois processus séparément.

Remarque 5.1.2 Le modèle POT est généralement utilisé dans la tendance des extrêmes [77, 19]. Ici nous l'appliquons pour évaluer la moyenne à un instant donné à partir des paramètres. L'estimation de celle-ci est beaucoup moins soumise aux paramètre de forme ξ que celle d'un quantile dans la queue de distribution. De plus l'hypothèse sur la stationnarité de ξ devient une faible hypothèse contrairement à une estimation des valeurs extrêmes.

Remarque 5.1.3 Nous avons mise en évidence la tendance linéaire mais nous pou-vons appliquer cette méthode à toute forme de tendance comme par exemple une exponentielle du type σ(t) = exp (σ01t).

Mise en place du test de Mann-Kendall et du test de régression linéaire Nous pouvons utiliser les tests de Mann Kendall et de la régression linéaire de deux façons diérentes :

1. On peut directement travailler sur les données (X1, . . . , Xn) et (t1, . . . , tn). PourN E on peut faire les tests RL et MK sur les temps d'attente en regardant (t1−1, t2−t1, . . . , tn−tn−1)en fonction de(t1, . . . , tn). Pour µP J max, on peut faire les tests RL et MK en regardant(X1, . . . , Xn)en fonction de(t1, . . . , tn), de même sur (D1, . . . , Dn) pour µDT OT. On appelera alors ces tests RLbrut

etM Kbrut

2. On peut également ne travailler que sur les moyennes annuelles. En eet siN Ei est le nombre d'événements au cours de l'annéeAi,µP J maxi la moyenne des pluies journalières maximales etµDT OTi la moyenne des durées desN Ei évé-nements, on peut alors eectuer les tests MK et RL sur les variablesµDT OTi, µP J maxi et N Ei en fonction des Ai. On appelera alors ces tests RLmoy et M Kmoy.

CemOA : archive ouverte d'Irstea / Cemagref

Dans le document en fr (Page 139-143)