• Aucun résultat trouvé

Sensibilité à l’échantillon de bassins donneurs

II. D’où partons-nous ? 39

4. Méthodes de référence en contexte non-jaugé 71

4.4. Sensibilité à l’échantillon de bassins donneurs

Le transfert du jeu de paramètres obtenu par la fonction objectif FO4 et la structure M2b obtient les meilleures performances pour l’ensemble des critères étudiés. Le test de Wilcoxon montre que FO4 -M2b est différent des autres distributions pour tous les critères, sauf pour N* où les performances sont équivalentes à FO4 -M1. À la différence du calage où les performances sont toujours meilleures sur la gamme de débit sur laquelle le modèle est calé, le couple

M2b-FO4 obtient aussi les meilleures performances pour les critères sur les débits moyens et les basses-eaux. Ce résultat est peut-être dû au fait que la variabilité des basses eaux est expliquée en majorité par les caractéristiques physiques du bassin alors que les hautes-eaux sont plutôt expliquées par la variabilité des forçages entre les bassins. Dans ce cadre, le jeu de paramètres obtenu en calant le modèle sur les hautes-eaux dépendrait moins du bassin et serait donc plus facilement transférable vers des bassins non jaugés. Les résultats ont été présentés pour le transfert basé sur la similarité physique (parameter averaging) mais les résultats sont similaires pour les autres méthodes de transfert.

4.3.3. Conclusion

En contexte jaugé, la fonction objectif la plus performante semblait être FO3 et la structure à privilégier M1. En revanche en contexte non jaugé, il semble que la fonction objectif FO4 et la structure de modèle M2b soient à utiliser. De même, si les performances de M2b sont systé-matiquement plus faibles en contexte jaugé, cette structure offre globalement des performances plus élevées en contexte non jaugé. Si une étude du modèle en contexte jaugé est un préalable indispensable à la modélisation des bassins non jaugés, les résultats entre les deux contextes ne sont donc pas équivalents.

Les fonctions objectif qui donnent plus de poids aux hautes-eaux semblent donner des jeux de paramètres plus facilement transférables entre les bassins. Pour la suite de l’étude qui se déroule en contexte non jaugé, nous opterons donc pour la structure de modèle M2b (à 5 paramètres) et le jeu de paramètres défini par la fonction objectif FO4.

4.4. Sensibilité à l’échantillon de bassins donneurs

Il est utile d’étudier la sensibilité de la régionalisation à l’échantillon de bassins versants don-neurs car cela donne une idée de la sensibilité des calculs à la densité du réseau hydrométrique. Dans la mesure où tous les bassins de l’échantillon ne sont pas utilisés pour construire les rela-tions de régionalisation, étudier la sensibilité à l’échantillon de bassins donneurs permet aussi de savoir si les résultats sont facilement généralisables à d’autres échantillons de bassins versants.

4.4.1. Méthode

Nous avons testé quatre définitions pour l’échantillon de bassins versants donneurs : 1. D1 : Tous les bassins sont donneurs (580 donneurs) ;

2. D2 : 465 bassins où FO4 >0.89 en calage (valeur pour laquelle 465 bassins sont don-neurs) ;

3. D3 : 465 bassins versants pour lesquels le coefficient de variation temporel est inférieur à 0.8 pour tous les paramètres et

4. D4 : 290 bassins versants où FO4 >0.93 en calage (50% des bassins versants sont don-neurs)

Nous avons envisagé d’enlever les bassins versants mal modélisés en calage (D2 et D4 ) car c’est une pratique courante dans les études de régionalisation, voir par exemple Oudin et al.

(2008b);Boldetti et al. (2010). La motivation pour ce type de tri est que si le modèle échoue à

représenter correctement le fonctionnement du bassin, son jeu de paramètres ne sera pas infor-matif sur les caractéristiques du bassin. Par ailleurs, l’incertitude sur les valeurs de paramètres est souvent avancées comme un facteur explicatif de la performance des régionalisations. Un moyen d’estimer cette incertitude est d’étudier la stabilité des paramètres dans le temps, voir par exempleMerz & Blöschl (2004). L’hypothèse sous-jacente est que si les jeux de paramètres ne sont pas stables, ceux-ci sont incertains et donc peu fiables.

La comparaison entre D1 et les autres expériences mesure l’impact d’une sélection des bassins sur la performance de la régionalisation. La comparaison entre D2 et D3 nous permet de discuter des critères de sélection de l’échantillon de bassins donneurs. La comparaison entre D2 et D4 nous permet de discuter l’impact de la densité du réseau de jaugeage. Pour chacune des définitions, la performance sera calculée sur l’ensemble de l’échantillon. Nous utiliserons le test de Wilcoxon pour savoir si la performance de la régionalisation varie significativement entre les différentes définitions.

4.4.2. Résultats pour la fonction objectif

La figure 4.3 présente l’impact de la définition de l’échantillon de donneurs sur la performance des méthodes de transfert, mesurée par la fonction objectif utilisée en calage (FO4*).

4.4. Sensibilité à l’échantillon de bassins donneurs 79 D1 D2 D3 D4 0.3 0.4 0.5 0.6 0.7 0.8 ProxGeo−OutAv FO4* 0.64 0.63 0.64 0.61 0.64 0.63 a b ab c D1 D2 D3 D4 0.4 0.5 0.6 0.7 0.8 ProxGeo−ParAv FO4* 0.63 0.62 0.62 0.61 a a a b D1 D2 D3 D4 0.4 0.5 0.6 0.7 0.8 SimPhy−OutAv FO4* 0.65 0.64 0.65 0.61 0.65 0.64 a b ab c D1 D2 D3 D4 0.3 0.4 0.5 0.6 0.7 0.8 SimPhy−ParAv FO4* 0.64 0.63 0.64 0.61 a b ab c

Figure 4.3. – Impact de la définition de l’échantillon de donneurs sur la performance de la régionalisation. La lecture du graphique en ligne permet de comparer les dif-férences entre output averaging (OutAv) et parameter averaging (ParAv). La lecture en colonne permet de comparer les différences entre proximité géogra-phique (ProxGeo) et similarité physique (SimPhy). Les boxplots sont définis par le premier, le deuxième et le troisième quartile, les moustaches s’étendent du 10ème au 90ème quantile. Les moyennes sont matérialisées par les croix. Les lettres en haut des graphiques présentent les résultats du test de Wilcoxon : deux distributions sont différentes si leurs lettres sont différentes.

La figure 4.3 montre que les performances de la régionalisation sont comparables entre les différentes définitions de l’échantillon de bassins donneurs, à l’exception de D4, qui obtient sytématiquement de moins bonnes performances.

En comparant D4 avec les autres expériences, on voit que les performances diminuent si l’on divise le nombre de bassins versants donneurs de moitié. Cet effet est probablement lié au fait que la variabilité dans les jeux de paramètres transférés est moindre lorsque le nombre de bassins donneurs est réduit. En effet dans ce cas, les chances pour le bassin receveur de trouver un bassin donneur ayant un comportement hydrologique similaire sont diminuées. Si le nombre de bassins dans l’échantillon de donneurs est proche de celui dans l’échantillon total (D2 et

D3), le nombre de bassins versants donneurs n’a que peu d’impact.

Pour les méthodes basées sur la proximité géographique, l’impact du nombre de donneurs est légèrement amplifié lorsque l’on utilise la technique de l’output averaging, alors que l’échantillon de donneurs n’a pas d’impact sur les méthodes utilisant le parameter averaging. Dans le cas de l’output averaging, les jeux de paramètres calés sur les voisins sont directement valorisés. La diminution de la variabilité parmi les jeux de paramètres au voisinage des receveurs est alors directement répercutée sur la simulation du débit. Dans le cas du parameter averaging,

les jeux de paramètres transférés sont par définition moins variables car ce sont des moyennes. La variabilité des jeux de paramètres transférés est donc moins diminuée lorsque le nombre de bassins donneurs est plus faible. Pour les méthodes basées sur la similarité physique, cet effet est atténué : les différences étant les mêmes pour les méthodes basées sur l’output averaging que pour le parameter averaging. Il est possible que la distance physique utilisée identifie un plus grand nombre de voisins “pertinents”, c’est-à-dire des voisins pour lesquels le transfert de paramètres vers le bassin non jaugé est efficace. Dans ce cas, la variabilité des jeux de paramètres n’est pas impactée par la sélection des bassins versants donneurs et on n’augmente pas le nombre de bassins versants atypiques.

La comparaison entre D2 et D3 nous renseigne sur la manière de définir de “bons” bassins versants donneurs. D’après la figure 4.3, sélectionner les bassins sur la base de la stabilité temporelle de leur jeu de paramètres semble être l’option à privilégier. Il est possible qu’en sélectionnant les bassins sur la base de la performance en calage, on augmente le nombre de bassins atypiques, pour lesquels il est difficile de trouver un jeu de paramètres à transférer.

4.4.3. Certaines gammes de débits sont-elles plus impactées ?

Dans la mesure où l’impact de la définition de l’échantillon de bassins donneurs est supérieur à celui des modalités du transfert, nous étudierons l’impact de la définition de l’échantillon de calage toutes méthodes de régionalisation confondues. Les boxplots de la figure 4.4 sont donc tous constitués de 2320 valeurs (580 bassins et 4 méthodes de régionalisation).

4.4. Sensibilité à l’échantillon de bassins donneurs 81 D1 D2 D3 D4 −0.4 −0.2 0.0 0.2 E99 −0.03 −0.03 −0.02 −0.05 −0.03 −0.03 a ab b c D1 D2 D3 D4 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 N* 0.51 0.51 0.51 0.48 a a b c D1 D2 D3 D4 −0.2 0.0 0.2 0.4 0.6 Kl* 0.29 0.28 0.29 0.26 0.29 0.28 a b a c D1 D2 D3 D4 0.0 0.2 0.4 0.6 Ki* 0.26 0.25 0.26 0.22 a b a c D1 D2 D3 D4 −6 −4 −2 0 E1 −1.96 −2.14 −2.03 −2.20 −1.96 −2.14 a b a c D1 D2 D3 D4 0.8 0.9 1.0 1.1 1.2 1.3 1.4 Bm 1.06 1.08 1.03 1.09 a b a c

Figure 4.4. – Impact de la définition de l’échantillon de bassins versants donneurs sur la ré-gionalisation du débit. Les boxplots sont définis par le premier, le deuxième et le troisième quartile, les moustaches s’étendent du 10ème au 90ème quantile. Les moyennes sont matérialisées par les croix. Les lettres en haut des graphiques présentent les résultats du test de Wilcoxon : deux distributions sont différentes si leurs lettres sont différentes.

La figure 4.4 montre que l’utilisation de l’ensemble des bassins versants comme donneurs (D1 ) obtient globalement de meilleures performances alors qu’une diminution de 50% du nombre de bassins donneurs (D4 ) obtient systématiquement les performances les plus faibles. De manière générale sur les critères étudiés, le modèle obtient de meilleures performances lorsqu’un grand nombre de bassins versants donneurs sont utilisés (D1, D2 ou D3 ), ce qui confirme les résultats précédents. Cela est dû à deux effets : (i) la densité des voisins autour de chaque bassin receveur est plus forte et (ii) la variabilité des jeux de paramètres est plus élevée parmi les donneurs ce qui limite le nombre de bassins versants atypiques.

Les gammes de débits sont donc pareillement impactées par la définition de l’échantillon de donneurs. Pour la suite de l’étude, nous choisissons de garder l’ensemble des bassins versants comme donneurs (D1 ).