• Aucun résultat trouvé

court-terme

2.3. Propositions de modèles de prévision probabilistes

2.3.3. Variables explicatives utilisées

2.3.3.1. Variables initiales

Les prévisions sont faites à partir de variables d’entrée, et il est nécessaire de définir les variables qui seront utilisées pour l’entraînement du modèle. On peut ici reprendre les variables proposées dans [48], le cas d’étude étant le même que le nôtre. Les auteurs considèrent alors, pour une prévision faite à un instant t pour un instant t+h, un total de 34 variables :

• Les valeurs observées aux instant t, t-15mn, t-30mn, t-45mn, t-60 mn et t-24h de RTLR observées sur une station donnée.

• Les valeurs observées aux instants évoqués ci-dessus, pour les 4 paramètres météorologiques (la vitesse du vent (m/s), la direction du vent (rad), l’irradiation solaire globale (W/m²) et la température ambiante (K)).

• Des prévisions météorologiques pour la localisation de la station, et qui sont obtenues à l’aide d’un downscaling statistique et de prévisions fournies par ECMWF (rappel : les quatre paramètres prévus sont les vitesses de vent zonale et méridionale à 10m (m/s), l’irradiation solaire globale (W/m²) et la température ambiante (°C)).

Pour ces 4 dernières variables, les auteurs proposent d’utiliser deux interpolations, une temporelle et une spatiale. L’interpolation temporelle est simple : les prévisions sont générées toutes les 12 heures seulement pour des horizons multiples de 3 heures. Afin de pouvoir travailler sur des horizons ne respectant pas ce critère, des interpolations linéaires sont faites entre les prévisions temporelles obtenues pour deux horizons différents.

Pour l’interpolation spatiale, des données de réanalyse sont utilisées (on considère les prévisions faites à un instant t pour un même instant t), ce pour générer un modèle linéaire liant les observations faites aux stations aux 4 valeurs de réanalyse fournies pour les positions encadrant la station météorologique considérée.

Par la suite, l’ensemble des 4 prévisions météorologiques pour l’instant t+h utilisées sont considérées comme entrées du modèle linéaire de downscaling statistique, et une prévision modifiée est obtenue en sortie du modèle.

Le set de variables que l’on se propose d’utiliser, composé lui de 27 variables, est différent.

Tout d’abord, nous avons souhaité travailler sur des prévisions en se focalisant sur des horizons à court- terme (>6 heures). Pour cette raison, nous avons considéré avoir moins besoin de variables observées, et nous n’en avons considéré que deux, l’observation du RTLR à l’instant où la prévision est faite, et la valeur moyenne de trois observations RTLR, faites sur les trois jours qui précédent le moment de la prévision à la même heure que l’heure pour laquelle la prévision est faite.

Nous avons aussi considéré les prévisions météorologiques, pour 5 paramètres : les 4 mêmes paramètres que ceux utilisés dans [48], et un cinquième correspondant à des prévisions RTLR, obtenues par

2. Prévision du Dynamic Line Rating à court-terme 70

l’utilisation du modèle physique associé au calcul de l’ampacité vu dans le chapitre 1, avec pour entrées les 4 prévisions météorologiques évoquées :

RTLR̂NWPt+h|t= fphysique(Ût+h|tNWP, V̂t+h|tNWP, T̂t+h|tNWP, Ŝt+h|tNWP) (2-26)

Ces prévisions ont été considérées à la fois pour les 4 positions les plus proches de la station météorologique considérée, et pour la position de la station avec le même type de downscaling statistique évoqué. Pour les 4 prévisions encadrant la position de la station, on note les positions des prévisions comme suit :

• La position 1 correspond à la prévision faite au sud-ouest de la position de la station. • La position 2 correspond à la prévision faite au sud-est de la position de la station. • La position 3 correspond à la prévision faite au nord-ouest de la position de la station. • La position 4 correspond à la prévision faite au nord-est de la position de la station.

La corrélation entre ces variables est importante, mais cela n’était pas nécessairement problématique pour l’entraînement des modèles : soit une part importante de ces variables étaient supprimée, en raison des réductions du nombre de variables faites pour plusieurs modèles, soit celles-ci n’avaient pas d’influence pour certains modèles peu sensibles au surapprentissage comme le QRF.

Sur le Tableau 2-5, on reprend les 27 variables évoquées ainsi que la nomenclature utilisée pour les décrire.

Tableau 2-5. Récapitulatif des 27 variables initialement choisies pour entraîner les modèles de prévision.

RTLR_0_ob Observation RTLR à une station donnée au moment où la prévision est faite. (A)

RTLR_m_ob Observation RTLR moyenne à une station donnée, pour les trois jours précédents à la même heure que celle pour laquelle la prévision est faite. (A)

U_t+h_1 Prévision de la composante est-ouest du vent à 10m pour la position 1, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

U_t+h_2 Prévision de la composante est-ouest du vent à 10m pour la position 2, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

U_t+h_3 Prévision de la composante est-ouest du vent à 10m pour la position 3, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

U_t+h_4 Prévision de la composante est-ouest du vent à 10m pour la position 4, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

V_t+h_1 Prévision de la composante sud-nord du vent à 10m pour la position 1, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

V_t+h_2 Prévision de la composante sud-nord du vent à 10m pour la position 2, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

V_t+h_3 Prévision de la composante sud-nord du vent à 10m pour la position 3, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

V_t+h_4 Prévision de la composante sud-nord du vent à 10m pour la position 4, fournie à l’instant de la prévision pour l’horizon de la prévision. (m.s-1)

T_t+h_1 Prévision de la température ambiante pour la position 1, fournie à l’instant de la prévision pour l’horizon de la prévision. (K) T_t+h_2 Prévision de la température ambiante pour la position 2, fournie à l’instant de la prévision pour l’horizon de la prévision. (K) T_t+h_3 Prévision de la température ambiante pour la position 3, fournie à l’instant de la prévision pour l’horizon de la prévision. (K) T_t+h_4 Prévision de la température ambiante pour la position 4, fournie à l’instant de la prévision pour l’horizon de la prévision. (K) S_t+h_1 Prévision de l’irradiation solaire globale pour la position 1, fournie à l’instant de la prévision pour l’horizon de la prévision. (W.m-2) S_t+h_2 Prévision de l’irradiation solaire globale pour la position 2, fournie à l’instant de la prévision pour l’horizon de la prévision. (W.m-2) S_t+h_3 Prévision de l’irradiation solaire globale pour la position 3, fournie à l’instant de la prévision pour l’horizon de la prévision. (W.m-2) S_t+h_4 Prévision de l’irradiation solaire globale pour la position 4, fournie à l’instant de la prévision pour l’horizon de la prévision. (W.m-2) RTLR_t+h_1 Prévision de la valeur de la RTLR pour la position 1, fournie à l’instant de la prévision pour l’horizon de la prévision. La RTLR est

calculée comme fphysique (U_t+h_1, V_t+h_1, T_t+h_1, S_t+h_1) (A)

RTLR_t+h_2 Prévision de la valeur de la RTLR pour la position 2, fournie à l’instant de la prévision pour l’horizon de la prévision. La RTLR est calculée comme fphysique (U_t+h_2, V_t+h_2, T_t+h_2, S_t+h_2) (A)

RTLR_t+h_3 Prévision de la valeur de la RTLR pour la position 3, fournie à l’instant de la prévision pour l’horizon de la prévision. La RTLR est calculée comme fphysique (U_t+h_3, V_t+h_3, T_t+h_3, S_t+h_3) (A)

RTLR_t+h_4 Prévision de la valeur de la RTLR pour la position 4, fournie à l’instant de la prévision pour l’horizon de la prévision. La RTLR est calculée comme fphysique (U_t+h_4, V_t+h_4, T_t+h_4, S_t+h_4) (A)

U_t+h_SD

Prévision de la composante est-ouest du vent pour la position de la station météorologique, fournie à l’instant de la prévision pour l’horizon de la prévision. La variable est calculée à partir d’une opération de statistical downscaling et de (U_t+h_1, U_t+h_2, U_t+h_3, U_t+h_4) (m.s-1)

V_t+h_SD

Prévision de la composante sud-nord du vent pour la position de la station météorologique, fournie à l’instant de la prévision pour l’horizon de la prévision. La variable est calculée à partir d’une opération de statistical downscaling et de (V_t+h_1, V_t+h_2, V_t+h_3, V_t+h_4) (m.s-1)

T_t+h_SD

Prévision de la température ambiante pour la position de la station météorologique, fournie à l’instant de la prévision pour l’horizon de la prévision. La variable est calculée à partir d’une opération de statistical downscaling et de (T_t+h_1, T_t+h_2, T_t+h_3, T_t+h_4) (K)

S_t+h_SD

Prévision de l’irradiation solaire globale pour la position de la station météorologique, fournie à l’instant de la prévision pour l’horizon de la prévision. La variable est calculée à partir d’une opération de statistical downscaling et de (S_t+h_1, S_t+h_2, S_t+h_3, S_t+h_4) (W.m-2)

RTLR_t+h_SD Prévision de la valeur de la RTLR pour la position de la station météorologique, fournie à l’instant de la prévision pour l’horizon de la prévision. La RTLR est calculée avec (U_t+h_SD, V_t+h_SD, T_t+h_SD, S_t+h_SD) (A)

2. Prévision du Dynamic Line Rating à court-terme 72

2.3.3.2. Discussion sur l’ajout de variables liées aux risques d’erreurs de prévisions Plusieurs approches associées aux prévisions du DLR tiennent d’une certaine manière compte des risques d’erreur de prévision, associées aux prévisions météorologiques considérées. On peut ici considérer par exemple :

• L’étude [73], dans laquelle des prévisions météorologiques ensemblistes sont considérées pour générer les prévisions probabilistes des paramètres météorologiques.

• L’étude [89], où ce sont les erreurs historiques des prévisions qui sont utilisées pour obtenir une information sur les écarts-types associés à des prévisions probabilistes de paramètres météorologiques.

Nous avons investigué l’intérêt d’intégrer dans notre modèle des variables tenant compte de tels paramètres. Pour ce faire, nous avons considéré un ajout de variables spatiales. Une première approche aurait pu être d’utiliser des observations météorologiques de stations à proximité, comme proposé dans [81] pour le cas du DLR.

Or, en raison des horizons de prévision considérés, nous avons préféré travailler avec des données générées à partir de prévisions météorologiques. Nous avons alors repris une approche proposée dans [120]. Dans cet article, les auteurs proposent de considérer l’information qui peut être tirée d’une grille de prévisions météorologiques (Figure 2-5).

Figure 2-5. Représentation d’une maille de prévisions météorologiques encadrant une station météorologique (croix bleue).

Cela est fait au moyen de la génération de deux catégories de variables :

• Des variables issues d’une analyse par composante principale faite sur 169 variables d’une grille ayant 13 éléments par côté, telle que 90% de la variance soit expliquée.

• L’écart-type et la valeur moyenne des prévisions sur la grille de Np prévisions considérées.

σ ̂t+h|tspat,NWP = √∑ (xt+h|t NWP,i− x̅ t+h|t NWP)2 Np i=1 Np− 1 (2-27)

Ensuite, une évaluation de différents modèles est faite, et les auteurs observent les améliorations possibles d’indices d’évaluation (CRPS, MAPE) selon que de nouvelles variables sont introduites ou

non. Nous avons utilisé une approche similaire à celle de [120], considérant des modèles QRF initiaux, entraînés pour des horizons allant de 24 heures à 48 heures, avec des fenêtres glissantes d’un mois et pour les 8 stations météorologiques considérées.

Pour l’ensemble de ces prévisions, la Figure 2-6 montre l’amélioration relative des prévisions en fonction de la variable ajoutée, sans considérer l’irradiation solaire nulle pendant la nuit. Contrairement aux résultats présentés dans [120] où des améliorations relatives du CRPS et du MAPE de l’ordre de 10% étaient obtenues, les résultats observés ont été relativement médiocres, ce avec des variables ajoutées individuellement, ou pour l’ensemble des combinaisons possibles de ces 4 variables.

Figure 2-6. Amélioration relative des prévisions faites à midi, en fonction de la variable ajoutée, moyennée sur les 8 stations étudiées pour des horizons de prévision allant de 24 heures à 48 heures.

Par la suite, nous avons fait une étude similaire (Figure 2-7), mais en ne considérant que les prévisions faites pour des horaires entre 7h00 et 17h00, afin de pouvoir ajouter l’effet d’une variable issue des prévisions d’irradiation solaire. On peut alors noter que la variable issue de la prévision de l’irradiation solaire permet une amélioration supérieure à ce qui était observé pour les autres variables, pour les prévisions à très bas quantile.

Cependant, les améliorations relatives observées étant faibles, nous n’avons pas plus poussé l’investigation relative à l’intérêt de ce type de variable, que ce soit des variables spatiales, temporelles ou encore associées aux prévisions ensemblistes, et nous n’avons pas ajouté ces catégories de variables aux entrées de nos modèles.

2. Prévision du Dynamic Line Rating à court-terme 74

Figure 2-7. Amélioration relative des prévisions faites à midi, en fonction de la variable ajoutée, moyennée sur les 8 stations étudiées pour des horizons de prévision allant de 24 heures à 31 heures, et de 41 heures à 48 heures (seules les prévisions en journée, de 7h00 à 17h00, sont considérées).