• Aucun résultat trouvé

2.6 Résultats et discussions

2.6.1 Ajout de variables explicatives

Comme décrit dans les paragraphes précédents, notre modèle d’interpolation des pré-cipitations moyennes journalières par types de temps ne fait intervenir qu’une seule va-riable explicative : l’altitude. On peut donc légitimement se demander si d’autres vava-riables ne pourraient pas compléter l’altitude dans l’explication des précipitations. Nous pensons bien évidemment ici aux variables classiquement utilisées pour l’explication des variables météorologiques au sol comme la pente, l’orientation, la distance à la mer ou à l’océan (Laborde, 1984), mais également aux variables plus complexes comme les variables is-sues d’une ACP7du relief utilisées par exemple dans la méthode AURELHY8(Benichou et Le Breton, 1987). L’objectif est alors de chercher une relation multi-linéaire locale liant la précipitationPà l’altitudeZainsi qu’à un certain nombre d’autres variablesVicomme suit : P=a0·Z+ nv

i=1 ai·Vi

Les coefficients ai étant estimés par régression linéaire multiple (en prenant garde aux variables auto-corrélées, et donc en utilisant une régression multiple de type "pas à pas" par exemple). Cependant, augmenter le nombre de variables explicatives nécessite implicitement d’augmenter la taille de l’échantillon sur lequel on souhaite réaliser cette régression, afin de garantir la robustesse de la relation. Ainsi si on suit les recommanda-tions de Burnham et Anderson (2002)9 , il est nécessaire de considérer un nombre assez important de stations pour chaque pixel, et finalement on réalise au pixel une régression certes multi-linéaire mais surtout régionale, qui perd en tout cas une part de son caractère très local. La question est donc de savoir laquelle des solutions est la plus appropriée à notre interpolation de précipitation par type de temps sur la période 1957-1973 :

– une régression linéaire très locale appuyée sur une dizaine de points et utilisant uniquement l’altitude,

– une régression multi-linéaire régionale appuyée sur plusieurs dizaines de points et utilisant l’altitude ainsi que d’autres variables explicatives comme le relief par exemple.

Nous avons donc développé une version plus élaborée du modèle, dans lequel la pré-cipitation est expliquée avec l’altitudeZ, mais également à l’aide de formes du relief. La démarche AURELHY nous semblant particulièrement pertinente, les formes de relief que nous avons retenues sont construites de la même manière que dans cette méthode. Elles sont ainsi issues d’une ACP réalisée sur les voisinages de chaque pixel. Chaque voisinage est une matrice carrée de onze pixels de coté, issue d’un MNT de maille 5kmet centrée sur le pixel (le voisinage est relatif, on ôte à la matrice l’altitude du pixel central). Il dé-crit ainsi correctement le relief environnant du pixel considéré. Le traitement par ACP du relief permet alors de condenser au maximum l’information pour disposer d’un système réduit de paramètres descriptifs du relief, en perdant un minimum d’observations.

7Analyse en Composantes Principale

8Analyse Utilisant le RELief et l’HYdrométéorologie

2.6. RÉSULTATS ET DISCUSSIONS 69

(a) Première (b) Seconde (c) Troisième (d) Quatrième

(e) Légende

FIG. 2.19 – Cartographie des quatre premières composantes principales de l’ACP du relief sur le massif des Alpes

On dispose alors d’un jeu de coefficients du relief utilisables comme variables ex-plicatrices de la précipitation, au même titre que l’altitude. La figure 2.19 présente les cartographies des quatre premières composantes principales pour le massif des Alpes. On retrouve sans surprise sur ces cartes comme première composante l’orientation Est/Ouest des versants, puis en deuxième composante l’orientation Nord/Sud.

En pratique, après différents tests, seules les premières composantes principales du relief semblent avoir un pouvoir explicatif sur les précipitations. De ce fait, on n’excédera jamais la dizaine de variables explicatives, et souvent on se contentera de deux ou trois variables de relief en plus de l’altitude.

Les résultats de validation croisée obtenus à l’aide de ce nouveau modèle sur le mas-sif des Alpes et pour la moyenne annuelle de précipitation sur la période 1957-1973, sont présentés dans la figure 2.20. Ils sont tout à fait représentatifs de ce que l’on obtient pour tous les types de temps (nous rappelons que la moyenne annuelle est obtenue par agré-gation de chaque type de temps), et sur le Massif Central et les Pyrénées. On présente dans cette figure 2.20 les scores de NASH de validation croisée pour différents jeux de variables explicatives. Tout d’abord la courbe rouge présente les scores du modèle "clas-sique" (utilisation de l’altitude et de la pondération en distance de franchissement). On trouve ensuite en noir pour mémoire les scores du modèle n’utilisant que l’altitude (pas de pondération). Et enfin dans les dégradés de bleu, on présente les scores obtenus avec l’altitude et les variables de relief (notées Cp1, Cp2, Cp3 pour les trois premières compo-santes principales).

"Et soudain, c’est le but !"10En effet, pour des grandes sélections de stations explica-tives (Ns >20 stations), c’est à dire lorsqu’on réalise des régressions linéaires à l’échelle

70 CHAPITRE 2. STRUCTURES SPATIALES DES PRÉCIPITATIONS 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 10 20 30 40 50 60 70 80 90 100 Ns NASH Z,Cp1,Cp2,Cp3 Z, Cp1, Cp2 Z,Cp1 Altitude Seule Altitude + Pondération

FIG. 2.20 – Score de NASH de validation croisée en fonction de Ns sur le massif des Alpes, pour différents jeux de variables explicatives

régionales, les variables de relief apportent indéniablement de l’information, et les scores de validation croisée sont bien supérieurs à ceux n’utilisant que l’altitude. Cependant, lorsque le nombre de stations de proximité diminue, les scores augmentent pour tous les différents jeux de variables, et les écarts entre scores s’amenuisent, pour s’annuler aux alentours de 8 ou 10 stations explicatives. De ce fait, on reconstitue aussi bien les précipi-tations à l’aide de l’altitude seule, qu’en rajoutant les variables du relief, qui perdent toute signification localement. En fait, elles se trouvent déjà à cette échelle dans les données locales de précipitation.

En conclusion, le modèle local retenu avecNs=8 stations explicatives et seulement l’altitude, arrive aux mêmes performances qu’un modèle plus régional utilisant plus de stations et de variables explicatives. C’est donc le modèle le plus simple (le modèle présenté précédemment) que nous avons retenu pour l’identification des gradients alti-métriques et des précipitations journalières moyennes par type de temps sur la période 1957-1973.

Bien sûr, nous ne cesserons pas de rappeler la bonne densité du réseau de mesures des années 1957 à 1973, pour lequel nous affirmons les conclusions suivantes : l’ajout de variables de relief n’est pas significatif dans l’amélioration des critères de validation croisée de notre jeu de données sur la période 1957-1973, cela s’explique sans doute par la bonne densité spatiale de ce réseau de mesure à cette époque qui semble être telle que l’utilisation des pluviomètres de proximité avec une seule variable, l’altitude, permet la meilleure explication possible de la précipitation.

Cette affirmation a été vérifiée au travers de divers essais en utilisant un réseau réduit de densité plus faible. En effet, la réalisation d’une interpolation sur la période 1957-1973, avec uniquement les stations opérationnelles du réseau actuel de DTG, montre que des variables supplémentaires ont leur place dans l’explication des précipitations, et que

2.6. RÉSULTATS ET DISCUSSIONS 71 les variables de relief sont de très bonnes candidates.

Enfin, on note dans cette figure 2.20 l’apport indéniable de la pondération en distance de franchissement pour un nombre de stations explicatives inférieur à 15. La courbe rouge se détache en effet de manière significative de la courbe noire. Le gain en terme de score de NASH obtenu à l’aide de la pondération en distance de franchissement est ici clairement mis en évidence.