• Aucun résultat trouvé

hasmanyfacets"

5.3 Combinaison decentres

 

5.3 Combinaisondecentres

Jusqu'ici nous avons traité chaque centre séparément et nous avons réalisé que même si certains centres obtiennent de meilleurs scores que d'autres, ils apportent tous une information supplémentaire sur l'échantillon de 74 bassins versants examinés. Il devient alors intéressant d'examiner si la combinaison des prévisions provenant des différents centresarriveàaméliorerlaqualitédesprévisionsémises.

Nousavosrecenséunnombrelimitéd’étudesrécentessurl'utilisationd'ungrandensemble composédedifférentscentresdelabaseTIGGE(Pappenbergeretal.,2008;Heetal.,2009; Bao et al., 2011 ; Keller et al., 2011 ; Hagedorn et al., 2012 ; Hamill, 2012 ; Yamaguchi et al., 2012). Cependant peu d'études se concentrent sur une combinaison pondérée des différents centres (Johnson et Swinbank, 2009 ; Yang et al., 2012 ; Zhietal.,2012).Deplus,pratiquementtoutescesétudesjusqu'àpresentseconcentrent surlesprévisionsdepluieou/etdetempératuredelabaseTIGGE.Anotreconnaissancela combinaisondedifférentesprévisionsdedebitsn'estpasencoreabordée.Danscettepartie delathèsenousessayonsd'abordercesujet.   5.3.1 Approchesétudiées

Avant de décrire en détails les approches de combinaison de centres que nous avons appliquées, nous présentons brièvement lesméthodes de combinaison de centres déjà utiliséesdanslalittératurepourlesprévisionsdepluie.

ƒ lapondérationbayésiennedemodèles(enanglais"bayesianmodelaveraging")ou BMA.

Yangetal.,(2012)ontappliquécetteapprochesurlesprévisionsdesprécipitationsdumois de juillet 2007 dans le bassin versant de Yishusi en Chine. Selon les auteurs, le grand ensemble pondéré a démontré de meilleures performances Ͳ en termes de scores de performance Ͳ que les différents centres individuels, ainsi que le grand ensemble équiprobable.Cetteaméliorationestégalementévidentesurlesprécipitationsextrêmes. Dans l’approche de BMA, nous notons que la probabilité a priori attribuée p(x) à un événementxestestiméeparlasommepondéréedelaprobabilitéprédictiveconditionnelle delavaleurfinaledel'événementx.Lepoidswkattribuéàchaquecentrekestégalàla probabilitéaposteriorip( yx ),unefoislavaleurréeleydel’événementestconnue,calculée en période de calage. Quand le poids wk correspondant au centre k est petit, cela nous permet(danslecasoùletempsdecalculestlimité)d'identifierlescentresquiapportent

 

peu à l'ensemble et les éliminer. L'estimation de poids wk est faite en utilisant un algorithme d'espéranceͲmaximisation [EM], qui permet de trouver le maximum de vraisemblancedesparamètres(icipoidswk)enutilisantdesdonnéesdecalagedisponibles.

ƒ la régression linéaire multiple (Krishnamurti et al., 1999 ; Kharin et Zwiers, 2002 ; DoblasͲReyesetal.,2005).

Ils'agitd'unegénéralisationàplusieursvariablesdelarégressionlinéairesimple.Encequi concerne la combinaison de différents modèles, cette approche permet le calcul d'une moyenne pondérée des valeurs des différents modèles. Plusieurs auteurs trouvent néanmoins que l'extension de cette approche à la pondération de probabilités – comme c'est le cas pour les prévisions probabilistes Ͳ n'est pas toujours évidente (Stefanovaet Krishnamurti, 2002 ; Pena et van den Dool, 2008 ; Johnson et Swinbank, 2009).

Cetypedeméthodeestsouventappliquéelorsdelacombinaisondesdifférentesprévisions, issues de divers modèles. Dans ce cas de prévisions multiͲmodèles, la méthode peut être assimiléeàuneapproched'habillageempiriquedechaquecentreindividuellement,àpartir de la distribution de probabilité de l'erreur préalablement calée. En considérant chaque centrecommeindépendantnouspouvonsluiassignerunpoids,quiestcalculéàpartird'une régressionlinéaire.

Lathéoriederégressionproposelaconstructiondesprobabilitésprédictivesetdesdensités de probabilité prédictives à partir d'une loi de distribution gaussienne (GlahnetLowry,1992;StefanovaetKrishnamurti,2002).L'estimationdesdeuxmoments decettedistribution(moyenneetvariance)danslecasd'unerégression(multiͲ)linéaireest faite en utilisant soit la méthode des moments, soit la méthode de maximum de vraisemblance.

Commepourl’approcheBMA,unelonguesériededonnéesestrequisepourlecalagedes paramètres de la méthode de combinaison (Wilson et Vallée, 2002). Sans les données nécessaires pour le bon calage des paramètres, les performances de ces approches ne diffèrent pas considérablement de celles d'une méthode plus simple de pondération (JohnsonetSwinbank,2009).

ƒ lapondérationdecentresselonleurperformancepouruncritèred'evaluationdonné (WoodcocketEngel,2005).

Cetteapprochecalculelespoidsattribuésàchaquecentreenfonctiondesaperformance selonuncritèred'évaluation.Lesétudesexistantesontutilisél'erreurquadratiquemoyenne



 

Deplus,JohnsonetSwinbank(2009)ontmontrédansleurscasquelesvaleursdepoids obtenués sont similaires à celles calculées par la régression linéaire multiple ou la pondération bayésienne de modèles. Parmi les avantages de cette approche se trouve sa simplicité,ainsiquelefaitqu'elles'adapteàn'importequellelongueurdedonnées.

DansleurétudeJohnsonetSwinbank(2009)ontappliquécetteapprochesurdesprévisions detempératurestiréesdescentreseuropéen,britanniqueetaméricainsurlapériodedu23 août2007au29avril2008.Ilsontmontréquelegrandensembleestplusperformantque chaque centre individuel. Ils ont obtenu des résultats similaires en considerant des prévisions débiaisées de chaque centre individuel. De plus, les auteurs ont conclu que le grandensembleoffreuneprévisibilitéamélioréepour2jours–c’estͲàͲdire,lesprévisions sontplusfiablesjusqu'àunhorizonde2jourssupplémentaires.

Dans notre étude nous avons essayé de combiner les prévisions de différents centres de façonàélargirladistributionprédictiveenprenantencomptelesmembresdesensembles individuels.Lapondérationdesdifferentscentresestbaséesurleurperformanceentermes descoredeprobabilitéordonnéeRPS.Afinquelacomparaisonsoitfaitedanslesmêmes termes pour tous les centres, la période d’évaluation examinée est limitée aux 242 jours disponiblespourtouslescentres.



 5.3.2 Approchesappliquées

Nous étudions plus en détails la construction d'un "grand ensemble" constitué des prévisionsdel’ensembledescentresdisponiblesdanslabaseTIGGE.Deuxapprochessont considérées: 1. legrandensemblebasésurl'équiprobabilitédescentresetdesmembresdechaque centre.Seloncetteapproche,legrandensembleestforméenregroupant,àchaque jourdeprévision,touslesmembresdetouslescentresdisponibles.Autotal,nous avonsainsiuneprévisiond’ensembleavec232membres,

2. le grand ensemble basé sur la combinaison des différents centres, pondérés selon leurperformanceentermesdescoredeprobabilitéordonnéeRPS.Noussupposons iciqu’aucuncentreaunscoreparfait(RPS=0,aucasoùilneseraitpasquestionde pondérer les centres mais d’adopter directement le "centre parfait"). Les poids wk attribuésàchaquecentreks’exprimecomme: k k k

RPS

RPS

w 1min(

1:

)

Eq.49

 

Pour la construction du grand ensemble, chaque wk est considéré en tant que facteur multiplicatifdunombredemembresNkaveclequelchaquecentreparticipedanslegrand ensemble.Nousavonsexaminédeuxoptionspossibles:

(A) l'applicationdespoidswkàlamoyenned'ensembledechaquecentre:legrand ensemble est ainsi constitué de wk fois la moyenne d’ensemble de chaque centrek,

(B) l'application des poids wk en tant que facteurs multiplicatifs du nombre de membresNkaveclesquelschaquecentreparticipedanslegrandensemble. Lecalagedespoidsasuivileprincipe"splitͲsample"(Klemeš,1986):lapériodede242jours disponibles a été divisée en deux sousͲpériodes de calageͲvalidation et inversément. Les résultatsenvalidationontétéensuitecombinésetsontprésentésciͲaprès.

Notons enfin que les deux approches par pondération selon le RPS nous permettent de construireladistributionprédictivedugrandensemblesimilairementàlaconstructiondu grand ensemble basé sur l'équiprobabilité. Ces trois approches de combinaison seront comparées entre elles, mais également comparées aux performances de deux centres individuels, à savoir le centre européen (ECMF) et le centre brésilien (SBSJ), les deux calculéessurlapériodede242joursutiliséspourlaconstructiondestroisgrandsensembles. 

 5.3.3 Évaluationdesprévisionsd'ensembledepluiesduGrandEnsemble

Afin de procéder à l’évaluation de la qualité du grand ensemble, nous nous appuyons à nouveausurlesdifférentsattributsquiqualifientuneprévisiond’ensemble:lafiabilité,la dispersiondesmembres,ladiscriminationetlaqualitéglobale. Nousexaminonsd’abordlesprévisionsdeprécipitation:lafiabilitédesprévisionsexprimée parl’histogrammedePIT(Figure55etFigure56),lescourbesROC(Figure57etFigure58), l’évolutiondeladispersiondesmembresenfonctiondel’échéancedeprévision(Figure59) etlesperformancessurl’ensemblede74bassinsversantsselonlescritèresRPSetRDS. Pour les critères graphiques, nous retenons les mêmes bassins versants utilisés à titre illustratif: la Drôme à Saillant et l’Oise à Sempigny. Ces graphiques illustrent les performancesàuneéchéanedeprévisionde7joursdesgrandsensemblesconstruits:(a)à partirdel’equiprobabilitédemembres,(b)aveclapondérationdesmoyennesd’ensemble dedifférentscentresenfonctionduscoreRPSet(c)aveclapondérationdesprévisionsde différentscentresenfonctionduscoreRPS.

   L’analyseamontréque: ƒ lesperformancesdugrandensembledepluiebrut(construitsanspondération,surle principed’équiprobabilité)etdugrandensemblepondérémontrentunefiabilitédes prévisions de pluie significativement améliorée par rapport à celle des prévisions tirées des centres individuels(Figure 55 et Figure 56). Cette conclusion est valable surtout pour les prévisions du grand ensemble basé sur l’équiprobabilité (a) ou pondéréenfonctionduscoreRPSsurl’ensembledesmembresdechaquecentre(c). ƒ entermesdediscrimination(Figure57etFigure58),lescourbesROCpourunseuil dedépassementégalauquantile70%,etpourl’échéancede7jours,montrentquele dépassement de ce quantile avec une probabilité de bonne détection POD supérieure à 60% est prévu par la majorité de membres (plus de 60% du nombre total de membres) des trois grands ensembles examinés. Nous remarquons égalementquelesperformancesdecestroisgrandsensemblessontsimilairesàcelle ducentreeuropéen,avecuneairesouslacourbeapproximativementéquivalente. Cependant, les performances des grands ensembles sont considérablement amélioréesparrapportauxperformancesdesautrescentresindividuels,commepar exemplelecentreaméricainoulecentrebrésilien.

ƒ toutefois,enexaminanttousleshorizonsdeprévision,nousconstatonsaussiquele comportemententermesdediscriminationestfortementinfluencéparl'horizonde prévision. Les courbes ROC des prévisions des trois approches de combinaison du grand ensemble ici testées montrent que le nombre de membres qui prévoient le dépassement du quantile 70% avec une probabilité de détection POD de 60% diminue considérablement avec l’échéance. De plus, auxhorizons plus lointains de prévision (supérieurs à 10Ͳ13 jours), l’aire sous la courbe ROC approche la valeur minimale de 0,5. En ce qui concerne les autres seuils de dépassement, nous constatons que le nombre de membres qui prévoient les dépassements avec une probabilité de bonne détection POD de 60% diminue considérablement quand le seuil varie de 10%  à 90%. Ce fait devient plus apparent dans le cas du grand ensembleconstruitàpartirdesmoyennesd’ensemblepondérées(b).

ƒ Legrandensembleconstruitàlabasedelapondérationdesmoyennesd’ensemble (b) produit des prévisions peu dispersées. Une explication possible est liée à la dispersiondemembresquiestmoinsfortedanscecas,étantdonnéquel’onréduit lavariabilitédesmembresenprenantseulementleurmoyennepourlaconstruction du grand ensemble avec cette approche. Ceci est confirmé par la Figure 59, qui montreenparallèlel’évolutiondeladispersiondesmembresdel’ensembledepluie en fonction de l’horizon de prévision pour le grand ensemble constitué par la pondérationdesmoyennesetcelleducentreeuropéenprisindividuellement.

   (a)    (b)    (c)  (d)    (e)    

Figure55:HistogrammesdePITpourlesprévisionsdepluiepourlebassindelaDrômeàSaillantàun horizon de 7 jours tiréesd'un grand ensemble basé sur : (a) l'équiprobabilité de membres, (b) la pondération de la moyenne d'ensemble des différents centres en fonction du score RPS, (c) la pondérationenfonctiondeleurperformanceselonleRPS.Lesprévisionsd’ensembledepluietirées descentreseuropéenetbrésilienévaluéessurles242jourssontprésentéesdanslafigure(d)&(e).   (a)    (b)    (c)   (d)    (e)    

Figure56:HistogrammesdePITpourlesprévisionsdepluiepourlebassindel'OiseàSempignyàun horizon de 7 jours tiréesd'un grand ensemble basé sur : (a) l'équiprobabilité de membres, (b) la pondération de la moyenne d'ensemble des différents centres en fonction du score RPS, (c) la pondérationenfonctiondeleurperformanceselonleRPS.Lesprévisionsd’ensembledepluietirées descentreseuropéenetbrésilienévaluéessurles242jourssontprésentéesdanslafigure(d)&(e).

      (a)    (b)    (c)   (e)    (d) Figure57:CourbesROCpourlesprévisionsdepluiepourlebassindelaDrômeàSaillantàunhorizon de7jourstiréesdugrandensemblebasésur:(a)l'équiprobabilitédemembres,(b)lapondérationde lamoyenned'ensembledesdifférentscentresselonlescoreRPS,(c)lapondérationenfonctionde leurperformanceenfonctionduRPS.Lesprévisionsd’ensembledepluietiréesducentreeuropéenet brésilien(d)&(e).    (a)    (b)    (c)   (d)    (e)     Figure58:CourbesROCpourlesprévisionsdepluiepourlebassindel’OiseàSempignyàunhorizon de7jours.

         (a)        (b) Figure59:Boîtesàmoustachesreprésentantl’évolutiondeladispersiondesmembresdel’ensemble depluieenfonctiondel’échéancedeprévisionpourlebassindelaDrômeàSaillant.Lesprévisions sonttirées: (a) du grand ensemble utilisant une pondération de la moyenne d'ensembles des différentscentresenfonctionduscoreRPSet(b)ducentreeuropéen.



Par la suite nous examinerons la performance de la qualité globale des prévisions météorologiques d'ensemble. Sur l'échantillon de 74 bassins versants examinés, nous présentonsdesboîtesàmoustachescorrespondantàladistributiondevaleursduscorede probabilitéordonnéeRPSetduscorededivergence(Figure60etFigure61).Lalignerouge correspond à la médiane des valeurs du score de probabilité ordonnée RPS pour les prévisionstiréesducentreeuropéenECMF.Lesgraphiquesenhautetenbasprésententles échéancesdeprévisions3et7joursrespectivement.Nousconstatonsque:

ƒ en termes de score RPS (Figure 60), la performance de la qualité globale des prévisions des grands ensembles montre que lors des premières échéances de prévision les différentes approches de construction du grand ensemble – avec l’exceptiondu grand ensemble construiten pondérant les membresde l’ensemble (4) – se montrent plus performantes par rapport aux prévisions tirées d'un centre individuel(danslafigurenouslescomparonsaucentreeuropéenͲ1).Pourlaplupart des bassins versants, le grand ensemble construit avec les moyennes d’ensemble pondéréesenfonctionduscoreRPS(3)obtientdesscorescomparablesàceuxdu grandensemblebasésurl’équiprobabilité(2).

   ƒ cependant,auxhorizonspluslointainsdeprévision,laperformancedesdifférentes combinaisonsdugrandensembleproposéessedégradeconsidérablement.Legrand ensemblebasésurl’équiprobabilité(2)semontreconsidérablementplusperformant parrapportauxautrescombinaisonsproposéesetlégèrementmeilleurparrapport auxprévisionsducentreeuropéen(1)prisindividuellement.Uneexplicationpossible est liée à la dispersion importante que les deux combinaisons par pondération proposées apportent. D’un côté, la pondération des moyennes d’ensemble (3) améliore la fiabilité des prévisions,mais produit des ensembles sous dispersés aux horizons plus lointains. D’un autre côté, la pondération  qui considère tous les membresdesprévisionsdesdifférentscentres(4)introduitplusdedispersionquele nécessaireet,parconséquent,lesensemblessontfiablesmaistropdispersés.         (a)        (b) Figure60:Boîtesàmoustachesreprésentantlaperformancedesprévisionsdepluieentermesde scoresdeprobabilitéordonnéeRPSpourl’échantillonde74bassinsversantssurlapériodeentière d'évaluationetàunhorizonde3(a)et7(b)jourstiréessurlesprévisionsdu:(1)centreeuropéen,(2) grandensemblebasésurl'équiprobabilitédemembres,(3)legrandensembleconstruitenpondérant la moyenne d'ensemble des différents centres en fonction du score RPS, (4) le grand ensemble en pondérantlesmembresenfonctiondeleurperformanceselonleRPS.Lesprévisionsd’ensemblede pluiesontévaluéessur242jours.

 

ƒ les performances globales des grands ensembles évaluées selon le score de divergence RDS (Figure 61) montrent que, aux horizons courts de prévision, les grands ensembles construits avec les différentes approches de combinaison des centressontcomparablesàcelleducentreeuropéen(1)individuellement.Cescore permetégalementdetireruneautreconclusiongénéraledel’analyse:lesprévisions de précipitation des grands ensembles se caractérisent par une tendance à plutôt surestimerl'observation(valeursRDSinférieuresàzéro).Néanmoins,latendanceàla bonne performance des grands ensemble diminue, voire disparaît, aux horizons lointains de prévision. A ces horizons, il devient évident que, en combinant les différentscentresaveclaméthodedepondérationdesmoyennesd’ensemble,nous obtenonsungrandensemblemoinsperformantetquiaunefortetendanceàsousͲ estimerl’observation(valeursRDSsupérieuresàzéro).SimilairementàlaFigure60, quianalyselaqualitéselonlecritèreRPS,cetteapprochedecombinaisondecentres seprésentecommel'approchelamoinsperformante.        (a)        (b) Figure61:Boîtesàmoustachesreprésentantlaperformancedesprévisionsdepluieentermesde scoresdedivergencepourl’échantillonde74bassinsversantssurlapériodeentièred'évaluationetà unhorizonde3(a)et7(b)jourstiréessurlesprévisionsdu:(1)centreeuropéen,(2)grandensemble basé sur l'équiprobabilité de membres, (3) le grand ensemble construit en pondérant la moyenne d'ensemblesdesdifférentscentresenfonctionduscoreRPS,(4)legrandensembleenpondérantles membres en fonction de leur performance selon le RPS. Les prévisions d’ensemble de pluie sont évaluéessur242jours.



 

 5.3.4 Évaluationdesprévisionsd'ensemblededébitsduGrandEnsemble

Nousévaluonsmaintenantlaperformancedesgrandsensemblesparrapportàlaqualitédes prévisions de débits du modèle GRP. Les mêmes attributs sont examinés: la fiabilité, la dispersiondesmembres,ladiscriminationetlaqualitéglobale.Cesattributssontévaluésà l’aide des mêmes outils graphiques et scores: la fiabilité des prévisions exprimée par l’histogramme de PIT (Figure 62 et Figure 63), les courbes ROC (Figure 65 et Figure 66), l’évolutiondeladispersiondesmembresenfonctiondel’échéancedeprévision(Figure64) etlesperformancessurl’ensemblede74bassinsversantsselonlescritèresRPSetRDS.Pour lescritèresgraphiques,nousretenonsànouveaulesbassinsversantsde:laDrômeàSaillant etl’OiseàSempigny.

Sur la qualité générale des prévisions de débits des grands ensembles, nous remarquons que:

ƒ lesgrandsensemblesarriventàaméliorerlafiabilitédesprévisionsdanslestroiscas, avec l’approche par équiprobabilité et avec les deux approches de pondération. Selonlebassinversant,l’améliorationestplusévidente:c’estlecasdubassindela DrômeàSaillant(Figure62),oùnousremarquonsquelesprévisionshydrologiquesà partirdescentresindividuelssontsoitfortementsousdispersées,soitbiaiséesetles grands ensembles améliorent cette tendance. Sur d’autres bassins cependant, comme pour le bassin de l’Oise à Sempigny (Figure 63), les grands ensembles n’arrivent à améliorer que légèrement la fiabilité des centres individuels en augmentantladispersiondesmembres.

ƒ sur l’ensemble de 74 bassins versants, nous constatons que les approches de combinaisonsbaséessurl’équiprobabilité(a)etsurlapondérationdesmembresdes centresenfonctiondeleurperformanceentermesdescoreRPS(c)sontcellesqui améliorentlepluslafiabilitédesprévisions.Cefaitestvalablepourlamajoritédes bassins versants, avec la combinaison pondérée se montrant légèrement plus performante. Nous remarquons que cette amélioration est combinée avec une dispersionplusfortedesmembresdel’ensemble,surtoutpourleshorizonsjusqu’à 5Ͳ7jours(Figure64).

ƒ En ce qui concerne la performance en termes de discrimination, les courbes ROC pour un seuil de dépassement égal au quantile 70% montrent que les grands ensemblesapportentuneaméliorationentermesdediscriminationparrapportaux prévisions de débits obtenues à partir de chaque centre individuellement: par exemplel’airesouslacourbequiestplusimportante(Figure65etFigure66,pourles bassinsdelaDrômeàSaillantetl’OiseàSempigny,respectivement).Commepourles pluies,lescapacitésdediscriminationvarientd’unbassinàl’autre:parexemple,le bassinversantdel’OiseàSempigny(Figure66)secaractériseparunecapacitéplus

Documents relatifs