• Aucun résultat trouvé

Evaluation du biais par simulation

Estimation du quantile

5.3 Tests de la méthode pour des variables aléatoires indépendantes

5.3.2 Evaluation du biais par simulation

La connaissance du biais par un calcul théorique permettrait de la corriger, mais l’expression des moments des statistiques d’ordre est rarement explicite et surtout la loi des mesures est inconnue en pratique. Pour évaluer le biais du quantile empirique, nous procédons donc par simulations. Afin de valider cette démarche, nous allons dans un premier temps construire des exemples pour des simulations de lois statistiques usuelles (normale, lognormale, gamma, exponentielle et uniforme) pour lesquelles le quantile 90 est connu. Par exemple le quantile 90 de la loi normale N(0,1) est de 1.27.

Pour examiner les moyennes des écarts, un millier de simulations est en général suffisant. La fréquence des mesures variant différemment selon les stations, nous estimerons le quantile 90 pour des échantillons de taille allant de 4 à 36 mesures. Comme nous travaillons ici sur des mesures indépendantes, la notion de date de prélèvement, et donc par exemple de régularité de l’échantillonnage, n’intervient pas.

5 . 3. 2. 1 V al i d a t i o n d e l a d i s t r i b u ti o n sim u l é e

Les fonctions de simulations du logiciel Splus ont été retenues pour la programmation après comparaison avec nos propres simulations (Box & Jenkins pour la loi normale et méthode congruentielle pour la loi uniforme). Les simulations ont été validées par comparaison de la fonction de répartition empirique sur 1000 mesures avec la courbe théorique (FIG. 5-2). Bien qu’imparfaites pour la loi uniforme et la loi gamma notamment, les courbes ont été jugées suffisamment satisfaisantes avec 1000 simulations. Pour plus de détails sur les méthodes de simulation, se reporter à (Lantuejoul, 2001).

-3 -2 -1 0 1 2 3

x

0.00.20.40.60.81.0F(x)

Loi normale N(0,1)

0.0 0.2 0.4 0.6 0.8 1.0

x

0.00.20.40.60.81.0F(x)

Loi Uniforme (0,1)

0 2 4 6

x

0.00.20.40.60.81.0F(x)

Loi Exponentielle (1)

0 5 10 15 20

x

0.00.20.40.60.81.0F(x)

Loi lognormale (0,1)

0.0 0.5 1.0 1.5 2.0

x

0.00.20.40.60.81.0F(x)

Loi Gamma (1,3)

FIG. 5-2: Fonctions de répartition théoriques et expérimentales sur 1000 simulations pour différentes lois : de gauche à droite, normale (0,1), uniforme(0,1), exponentielle(1), lognormale(0,1) et gamma(1,3). En

abscisse,

5 . 3 . 2 . 2 C o m p a r a i s o n d u b i a i s t h é o r i q u e a u b i a i s e x p é r i m e n t al p o u r l a l o i u n i f o r m e

Nous avons simulé N=1000 fois n mesures d’une même loi uniforme entre 0 et 1 pour des échantillons de taille n variant de 4 à 36 mesures. Le quantile 90 de la loi est noté qth. On note x x1j, 2j,...xnj le jème échantillon de taille n. :

- Sur l’échantillon j,qth est estimé par qˆj par interpolation linéaire du quantile empirique - Les erreurs d’estimations sur l’ensemble des échantillons sont alors qˆj qth avec j ‰{1,..n}. Alors l’espérance de l’estimateur du quantile est approchée par Q

1

1 ˆ

N j j

Q q

N =

=

œ

et la variance de cet estimateur par ( )2

1

1 ˆ

N j j

q Q

N

œ

= .

Ces résumés statistiques sont comparés aux calculs théoriques du paragraphe 5.3.1 sur la figure FIG.

5-3 pour l’estimation par le quantile empirique, et sur la figure FIG. 5-4 pour le quantile linéarisé.

La démarche est cohérente avec la théorie, malgré quelques écarts non négligeables (pour n=10, 11, 20 et 21) entre l’écart-type expérimental et l’écart-type « théorique » approché. Nous n’avons pas cherché à vérifier si cet écart provenait d’un nombre trop réduit de simulations, jugeant les résultats suffisants pour évaluer le biais d’une méthode.

0 10 20 30

Nombre de prélèvements par an

0.800.820.840.860.880.90Esperance du quantile 90

théorique par simulation

5 10 15 20 25 30 35

0.060.080.100.120.140.160.180.20Ecart type du quantile 90

par simulation théorie

Nombre de prélèvements par an

FIG. 5-3 : Courbes théoriques et simulées de l’espérance et de l’écart-type d’un quantile 90 en fonction du nombre de prélèvements. Loi uniforme.

Tests de la méthode pour des variables aléatoires indépendantes - 66 -

Esperance du quantile 90

Nombre de prélèvements par an

Esperance du quantile 90

Nombre de prélèvements par an

Ecart type du quantile 90

Nombre de prélèvements par an

Ecart type du quantile 90

Nombre de prélèvements par an

FIG. 5-4 : Courbes théoriques et simulées de l’espérance et de l’écart-type d’un quantile 90 interpolé linéairement, en fonction du nombre de prélèvements, pour une loi uniforme

Les calculs sont relativement simples pour une loi uniforme, mais ils s’avèrent plus compliqués pour les autres lois. L’évaluation du biais par simulation étant cohérente avec la théorie, nous procédons désormais par simulation pour évaluer le biais et la variance des estimateurs des quantiles.

5 . 3 . 2 . 3 C a l c u l e x p é r i m e n t a l d u b i a i s p o u r d ’ a u t r e s l o i s Quatre types de distribution ont été examinés :

- Loi normale réduite (moyenne nulle, écart type 1)

- Loi lognormale, de transformée logarithmique réduite (moyenne et variance de la loi lognormale :

1

2, (2 2 1)

M =e T =M e , avec e=2.718, soit M =1.65 et T2 =4.67) - Loi exponentielle de moyenne 1 et de variance 1

- Loi gamma de moyenne 1/3 et de variance 1/9 Les résultats sont présentés FIG. 5-5.

Pour la loi normale, le biais est très faible à partir de 10 prélèvements par an. Pour les autres lois, il reste important mais plus faible et plus « régulier » que celui induit par la règle des 90%. Aucune de ces lois n’est vraiment représentative de la loi suivie par les concentrations car non seulement elle est généralement bimodale mais de plus les concentrations sont toujours positives. Le calcul théorique de la variance d’estimation n’est pas présentée car difficilement calculable. Il peut cependant être évalué à l’aide du carré moyen résiduel.

5 10 15 20 25 30 35 Taille de l'échantillon

1.11.21.31.41.5

quantile moyen sur 1000 simulations

LOI NORMALE (0,1) : évolution de l'espérance du quantile

5 10 15 20 25 30 35

Taille de l'échantillon

0.30.40.50.60.7

Ecart type des quantiles

LOI NORMALE (0,1) : évolution de l'écart type des quantiles

5 10 15 20 25 30 35

Taille de l'échantillon

3.54.04.55.05.5

quantile moyen sur 1000 simulations

LOI LOGNORMALE (0,1) : évolution de l'espérance du quantile

5 10 15 20 25 30 35

Taille de l'échantillon

1.01.52.02.53.03.54.0

Ecart type des quantiles

LOI LOGNORMALE (0,1) : évolution de l'écart type des quantiles

5 10 15 20 25 30 35

Taille de l'échantillon

2.02.22.42.62.8

quantilemoyen sur 1000 simulations

LOI EXPONENTIELLE (1,1) : évolution de l'espérance du quantile

5 10 15 20 25 30 35

Taille de l'échantillon

0.60.81.01.2

Ecart type des quantiles

LOI EXPONENTIELLE (1,1) : évolution de l'écart type des quantiles

5 10 15 20 25 30 35

Taille de l'échantillon

0.700.750.800.850.900.95

quantilemoyen sur 1000 simulations LOI GAMMA (1,3) : évolution de l'espérance du quantile

5 10 15 20 25 30 35

Taille de l'échantillonnage : nombre de mesures

0.200.250.300.350.40

Ecart type des quantiles

LOI GAMMA (1,3) : évolution de l'écart type des quantiles

FIG. 5-5 : Evolution de l’espérance et de l’écart type du quantile 90 en fonction de la taille de l’échantillonnage et de la méthode d’estimation (quantile empirique escalier en noir ou linéarisé en rouge)

pour différentes lois (normale, uniforme, lognormale, exponentielle, gamma)

Tests de la méthode pour des variables aléatoires indépendantes - 68 -