• Aucun résultat trouvé

Les donn´ees d´ecrites ci-dessus ont permis de comparer la performance de techniques de r´egression locale et de krigeage pour produire l’intrant des pr´ecipitations observ´ees pour un mod`ele hydrologique. Dans ce projet, la qualit´e des donn´ees interpol´ees par les diff´erentes m´ethodes a ´et´e test´ee par validation crois´ee de type « leave-on-out » (Isaaks et Srivastava, 1989, p.351-368). Cette technique consiste `a enlever une `a une les obser- vations des stations pour ensuite les pr´evoir `a partir des autres donn´ees. Des erreurs de validation crois´ee sont ensuite obtenues en soustrayant les valeurs pr´edites aux valeurs observ´ees. Cette proc´edure est fr´equemment utilis´ee dans le domaine de l’hydrologie pour tester la performance pr´edictive de m´ethodes d’interpolation (Goovaerts, 2000;

Chapitre 6. Interpolation statistique multivariable de donn´ees de pr´ecipitations 82

krigeage ont ´et´e appliqu´ees aux donn´ees. La moiti´e de ces techniques sont univariables, elles n’utilisent donc que les donn´ees des stations. Les autres sont multivariables ; elles int`egrent les donn´ees du mod`ele atmosph´erique GEM `a l’interpolation. L’utilisation de ces deux groupes de techniques a permis d’´evaluer l’apport de l’int´egration des donn´ees GEM `a l’interpolation. Le tableau suivant d´ecrit les m´ethodes employ´ees :

Param`etre

Identifiant M´ethode Type (krigeage : mod`ele variographique,

r´egression locale : fraction voisinage)

R´egression locale par

RLxy rapport aux coordonn´ees univariable S´election par validation crois´ee spatiales x et y

R´egression locale par

RLxyw rapport `a x et y, ainsi multivariable S´election par validation crois´ee qu’`a la variable auxiliaire

KO Krigeage ordinaire univariable S´election par validation crois´ee KU Krigeage universel univariable S´election par validation crois´ee

KDE Krigeage multivariable S´election par validation crois´ee

avec d´erive externe

CKO Cokrigeage ordinaire multivariable Lin´eaire sans palier

Tab. 6.1 – Description des m´ethodes d’interpolation employ´ees

Dans ce projet, la s´election des param`etres de l’interpolation s’est toujours effectu´ee sans intervention humaine. Ainsi, une utilisation en temps r´eel des m´ethodes propos´ees pour produire les intrants `a un mod`ele hydrologique serait envisageable. La solution adopt´ee pour le cokrigeage (CKO) ´etait de toujours ajuster le mˆeme mod`ele aux semi- variogrammes exp´erimentaux. Le mod`ele lin´eaire sans palier a ´et´e choisi car il est le plus simple `a ajuster. Pour toutes les autres m´ethodes, la validation crois´ee ´etait utilis´ee afin d’automatiser l’´etape de la s´election du mod`ele variographique ou de la fraction de voisinage. En krigeage, les mod`eles variographiques p´epitique, sph´erique, exponen- tiel, gaussien, lin´eaire avec et sans palier et puissance ´etaient en comp´etition. Pour la r´egression locale, les fractions de voisinage possibles ´etaient 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 et 1. `A chaque temps, le mod`ele ou la fraction choisi ´etait celui qui minimisait la moyenne des erreurs de validation crois´ee au carr´e (Erreur Quadratique Moyenne). L’indice plus robuste de la m´ediane des valeurs absolues des erreurs a aussi ´et´e test´e, mais il donnait de moins bons r´esultats. Notons que l’utilisation de la validation crois´ee pour choisir la fraction de voisinage en r´egression locale est r´epandue et approuv´ee (Cleveland et Loader,1996). Cependant, on ne peut en dire autant concernant l’utilisation de la vali- dation croi´ee en g´eostatistique. Notamment,Isaaks et Srivastava(1989, p.514) ainsi que

Chapitre 6. Interpolation statistique multivariable de donn´ees de pr´ecipitations 83

mod´elisation du semi-variogramme et ils d´econseillent l’emploi de la validation crois´ee `a cette ´etape. Pour sa part, Davis (1987) ne rejette pas l’approche. Il rappelle toute- fois que le mod`ele variographique choisi par validation crois´ee n’est pas optimal, il est simplement le meilleur parmi les mod`eles envisag´es selon le crit`ere utilis´e.

Les six m´ethodes du tableau 6.1 ont ´et´e employ´ees pour interpoler les donn´ees `a chaque p´eriode de temps pour laquelle il a plu. En aoˆut 2003, cela repr´esente 92 p´eriodes de 6 heures sur 124. En fait, le krigeage avec d´erive externe (KDE) et la r´egression locale multivariable (RLxyw) n’ont pu ˆetre appliqu´es lorsque les donn´ees GEM ´etaient trop peu variables. Ainsi, ces m´ethodes n’ont ´et´e utilis´ees que pour 63 des 92 p´eriodes de pluie du mois. En outre, les techniques de r´egression locale et de krigeage examin´ees dans ce projet peuvent produire des pr´evisions inf´erieures `a z´ero, ce qui est inappropri´e pour une variable non n´egative telle qu’une quantit´e de pr´ecipitations. Les pr´evisions n´egatives ont donc toujours ´et´e ramen´ees `a z´ero.

Plutˆot que d’utiliser la mˆeme m´ethode d’interpolation `a toutes les p´eriodes de temps, l’option de s´electionner la m´ethode la plus appropri´ee `a chaque temps a ´et´e examin´ee. Une septi`eme approche a donc ´et´e test´ee. Celle-ci consiste `a effectuer les pr´evisions `a un temps donn´e par la m´ethode parmi les six du tableau 1 qui minimise la moyenne des erreurs de validation crois´ee au carr´e. Cette proc´edure d’interpolation sera ici nomm´ee « S´election » . Haberlandt et Kite (1998) ont aussi exploit´e, dans un contexte de mod´elisation hydrologique, l’id´ee d’appliquer `a chaque p´eriode de temps la m´ethode la plus appropri´ee selon un certain crit`ere. Ils ont effectu´e un krigeage avec d´erive externe conditionnellement `a une corr´elation entre les donn´ees de stations et la variable auxiliaire d´epassant un certain seuil. Pour une corr´elation inf´erieure au seuil, le krigeage ordinaire ´etait employ´e. Cette proc´edure est tr`es logique, mais elle permet seulement de choisir entre deux m´ethodes : une univariable et une multivariable. L’ap- proche propos´ee ici est plus souple, permettant de choisir entre autant de m´ethodes que le d´esire l’utilisateur. D’ailleurs, aucune proc´edure de ce genre ne semble avoir ´et´e sugg´er´ee dans la litt´erature.

Le mod`ele hydrologique HYDROTEL (INRS-ETE, 1998) a ´et´e employ´e pour tes- ter l’approche propos´ee. Ce mod`ele comporte un module d’interpolation de donn´ees par la m´ethode de l’inverse de la distance. Cette m´ethode d’interpolation a donc ´et´e choisie comme base de comparaison. Une pr´evision effectu´ee par cette m´ethode en un point de l’espace est donn´ee par la moyenne des observations des trois stations les plus proches avec une pond´eration inversement proportionnelle `a la distance entre le point d’observation et le point de pr´evision.

Chapitre 6. Interpolation statistique multivariable de donn´ees de pr´ecipitations 84

Gstat (Pebesma, 2004a) ont permis d’ex´ecuter tous les types de krigeage.