• Aucun résultat trouvé

Bilan : Prédictions de type ARIMA

N/A
N/A
Protected

Academic year: 2022

Partager "Bilan : Prédictions de type ARIMA"

Copied!
38
0
0

Texte intégral

(1)

Sujet de thèse:

Prédiction de séries temporelles et applications aux énergies

renouvelables

CHD Castelluccio, Unité Radiophysique Service Radiothérapie, 20176 Ajaccio -

Laboratoire SPE, Université de Corse, CNRS-UMR 6134, 20250 Corte Cyril Voyant

cyrilvoyant@hotmail.com

(2)

2/38

synthèse de la dernière réunion

Prédiction ARMA non optimisée car saisonnalité de la série chronologique très importante

Nécessite de bien caractériser la ressource énergétique afin de lui appliquer la désaisonnalisation adéquate. Avec ces processus statistiques il faut rendre la série apériodique et stationnaire pour une prédiction optimale (désaisonnalisation, centrée, réduite,…)

Passage aux estimateurs ANN, une fois la technique ARMA dite de référence bien appropriée

Dans un premier temps ne pas se disperser avec certains estimateurs étudiés jusqu’alors : Inférence bayesienne, inférence floue, lissage exponentiel, clustering, k-neighbourg...

Essayer la méthode de désaisonnalisation par apprentissage mensuel

Trouver de bons ouvrages qui vont servir de base à nos futures

études

(3)

3/38

Sommaire

Echelle journalière, désaisonnalisation physique et résultats de prédiction

Echelle horaire, désaisonnalisation et résultats de prédiction

Bilan des modes de prédiction statistique de type ARMA

Perspective et méthodologie d’utilisation des ANN

(4)

4/38

Sommaire

Echelle journalière, désaisonnalisation physique et résultats de prédiction

Echelle horaire, désaisonnalisation et résultats de prédiction

Bilan des modes de prédiction statistique de type ARMA

Perspective et méthodologie d’utilisation des ANN

(5)

5/38

Echelle journalière : la série chronologique

1-janv.

26-janv.

20-févr.

17-mars 11-avr.

6-mai 31-mai

25-juin 20-juil.

14-août 8-sept.

3-oct.

28-oct.

22-nov.

17-déc.

2000 3000 4000 5000 6000 7000 8000 9000

moyenne d'irradiation journamiere en Wh/m² 1971-1989

Les mesures journalières sont

régulées par une composante

périodique de période ~365 jours

(6)

6/38

Echelle journalière : Méthodologie et prétraitement de la série 1-3

Contrairement aux données temporelles économiques où il n’existe pas de

modélisation physique

les données d’irradiation solaire ont une composante modélisable physiquement, elles ne dépendent que de la distance entre

le lieu de l’observation et le centre du

soleil

(7)

7/38

Echelle journalière : Méthodologie et pré-traitement de la série 2-3

janvier premier

le représente

= n

n)) + ( ( π ,

=

=δ n declinaiso

1

365 284 . 45.sin 2.

23 horaire

angle l' est A

+ A

= T

= vrai solaire temps

h

h

sv 12 15

δ) L

A +

A L δ

n ( + π

π G

= terrestre extra

irrad H

e (h) H

= IDir

h h

o

f(t)) ( o

.sin .sin 360.

2π .sin

.cos cos

. 365 )

. (2.

0,0334.cos 1

. 24. .

.sin





SV o

SV f(t))

(

o

(h) e dT + H g(t) ( (h)) dT

H

=

IG . ∫ sin .

. . ∫ . sin

0,4

.

données objectives et calculables

Les données modélisables

l’aspect périodique de l’irradiation solaire est en partie lié à l’irradiation à

l’entrée de l’atmosphère

Diviser la série chronologique par cette donnée déterministe va tendre à

stationnariser le phénomène

(8)

8/38

Echelle journalière : Méthodologie et prétraitement de la série 3-3

Méthodes pour s’affranchir de la périodicité :

•9 processus ARMA ou ARIMA, chacun sur une base d’apprentissage mensuel

•Processus SARIMA

•Méthode suivante :

(9)

9/38

Echelle journalière : Les tests statistiques à disposition

Suivant le résultat du test, il faut lever la périodicité, effectuer une régression sur

le temps (MCO si TS), passer aux différences (DS)

Possibilité de remplacer le test de Fisher simple par des tests de racine unitaire, ou

de Dickey Fuller

Les autres tests utilisés sont

•Test de Student sur les coefficients ARMA

•Tests sur les résidus (normalité, autocorrelation … =>iid

•Tests AIC, BIC, R²… pour estimation des meilleurs modèles

(10)

10/38

Echelle journalière : désaisonnalisation “physique”

On s’aperçoit que le critère périodique est régulé par l’irradiation extraterrestre

Résultats de la série

stationnarisée « physiquement »

(11)

11/38

Echelle journalière : désaisonalisation “mathématiques”

Nécessité de corriger une deuxième fois la périodicité car

la désaisonnalisation physique n’annihile pas complètement le

phénomène

on s'aperçoit qu'il y a encore une périodicité (Fc=1,64) mais pas

de tendance (fc=0,01)

Une idée séduisante serait de s'affranchir complètement de la composante saisonnière

méthode empruntée à l'économétrie Les facteurs périodiques

La série devient non périodique (Fc=0,0002) mais on induit une tendance (Fc=99), cette

dernière n'est ni rigide ni souple

pour une prédiction à h31, elle ne semble pas dommageable

METHODOLOGIE DE

DESAISONNALISATION RIGIDE PAR COEFFICIENT SAISONNIER

SCHEMAT MULTIPLICATIF

Sj (j=0..365) les coefficients saisonniers représentant la moyenne

du jour j sur les 20 années d’apprentissage (le coeff est normalisé afin que la moyenne

générale soit égale à l’unité) Xijcorrigé=Xt/Sj

(12)

12/38

Echelle journalière : stationnarité et saisonnalité 1/2

Données relatives à la série désaisonnalisée par le rapport de

l'irradiation extraterrestre

(13)

13/38

Echelle journalière : stationnarité et saisonnalité 2/2

Données relatives à la série désaisonnalisée par le rapport de

l'irradiation extraterrestre et les coefficients périodiques

La deuxième

désaisonnalisation modifie complétement l’allure des coefficients d’autocorrélation

Il faut donc faire attention

aux prétraitements utilisés

(14)

14/38

Echelle journalière : estimation des modèles

Quel que soit le prétraitement effectué, il faut établir une méthodologie pour l’estimation

des modèles ARMA

Jusqu’à présent, l’estimation ne reposait que sur l’analyse de critères

(AIC, R², vraisemblance…) Par la suite de nouveaux outils

seront pris en compte

•test d’autocorrélation (Résidu=bruit blanc)

normalité des résidus

•les coeff du modèle sont significativement différents de zéro

(test student)

•Analyse du spectre (saisonnalité,spectre rouge…)

(15)

15/38

Echelle journalière : analyse des spectres

L’analyse des spectres est très délicate, Le spectre de la série étudiée et celui de l’arma choisi, ne correspondent pas Le modèle ARMA(2,2) est pourtant celui

qui minimise l’erreur de prédiction

spectre de l'arma (2,2) choisi vzariance residu 0,9

ar1 -1,48

ar2 0,49

ma1 -1,21

ma2 0,24

(16)

16/38

Echelle journalière : résultats de prédiction, sans desais

Ces résultats sont ceux exposés lors de la dernière

réunion

(17)

17/38

Echelle journalière : résultats de prédiction, une seule desais (physique)

(18)

18/38

Echelle journalière : résultats de prédiction avec double desais

(19)

19/38

Echelle journalière : synthèse des prédictions

37,00%

non ARIMA(2,1,6)_mens non

37,00%

non ARMA(2,6)_mens non

35,00%

non VAR(8)_log_diff non

34,30%

non VAR(8)_log non

31,00%

non ARIMA(1,1,1)_mens oui

30,70%

non VAR(8) non

25,60%

non ARIMA(2,1,6) non

25,00%

non SARIMA(8,1,0)(1,0,0) oui

24,10%

non ARIMAX(6,2,X) non

23,00%

non ARIMA(1,1,1) oui

22,70%

non ARMA(6,2) oui

21,00%

oui ARMA(2,2) oui

29,00%

Moyenne

nRMSE désais math

désais phy

(20)

20/38

Sommaire

Echelle journalière, désaisonnalisation physique et résultats de prédiction

Echelle horaire, désaisonnalisation et résultats de prédiction

Bilan des modes de prédiction statistique de type ARMA

Perspective et méthodologie d’utilisation des ANN

(21)

21/38

Echelle horaire : Méthodologie utilisée dans le cas horaire

Les premiers résultats en considérant une série temporelle horaire ne sont pas satisfaisants ni exploitables. D’où l’idée

d’utiliser 16 prédicteurs indépendants pour chaque créneau horaire

d’ensoleillement.

Cela permet aussi de s’affranchir de la Cela permet aussi de s’affranchir de la Cela permet aussi de s’affranchir de la Cela permet aussi de s’affranchir de la

période période période

période intraintraintraintra----journalièrejournalièrejournalièrejournalière

On effectue une transformation d’une série horaire en 9 séries j On effectue une transformation d’une série horaire en 9 séries j On effectue une transformation d’une série horaire en 9 séries j

On effectue une transformation d’une série horaire en 9 séries journalièresournalièresournalièresournalières Cette transformation nous permet d’exploiter les résultats obten

Cette transformation nous permet d’exploiter les résultats obten Cette transformation nous permet d’exploiter les résultats obten

Cette transformation nous permet d’exploiter les résultats obtenus dans le us dans le us dans le us dans le chapitre précèdent

chapitre précèdentchapitre précèdent chapitre précèdent

(22)

22/38

Echelle horaire: pré-traitement physique de la série 1/3

) A L δ

+ L δ

(

= h

= soleil du

hauteur arcsin sin .sin cos .cos .cos h

sin

0,4

. . .

.sin (h) e + H g(t) ( (h)) H

=

IG

o (f(t)) o

Dans le cas horaire il existe aussi une modélisation physique du phénomène, pour cela il est important

d’introduire la notion de hauteur solaire

Hauteur=f(heure) Energie

rayonnée=f(heure)

(23)

23/38

Echelle horaire : prétraitement physique de la série 2/3

L'énergie déposée sur une surface horizontale est

directement proportionnelle à la hauteur solaire (course

solaire)

L'énergie déposée dans la cellule est directement proportionnelle au nombre de

photon l'atteignant, c’est pourquoi, la connaissance de

l'angle solaire permet de quantifier le rayonnement

direct sur le détecteur:

(24)

24/38

Echelle horaire: pré-traitement physique de la série 3/3

(25)

25/38

Echelle horaire : spectre des séries horaires (desais physique)

Là encore on s’apercoit que la périodicité subsiste même après le traitement physique des différentes

séries

(26)

26/38

Echelle horaire : désaisonnalisation “mathématiques”

La méthodologie utilisée est

scrupuleusement la même que lors de l’étude journalière, à savoir :

METHODOLOGIE DE

DESAISONNALISATION RIGIDE PAR COEFFICIENT SAISONNIER

SCHEMAT MULTIPLICATIF

Sj (j=0..365) les coefficients saisonniers représentant la moyenne

du jour j sur les 20 années d’apprentissage (le coeff est normalisé afin que la moyenne

générale soit égale à l’unité) Xijcorrigé=Xt/Sj

(27)

27/38

Echelle horaire : spectre des séries horaires (double desais)

La cumul des deux traitements (physique et statistique) permet

d’obtenir des séries purement

apériodiques

(28)

28/38

Echelle horaire : synthèse de la prédiction

CCVS

h).

sin(

1

µ...σ1

CVS jk jk ijk

CVS jk jk j

CVS k j k j

k j i i

ijk

C h x

C C h

h x x

).

sin(

.

).

sin(

). . . sin(

365 . 18

1 365

1 18

1 ' ' '

' '

'

µ

=

= ∑ ∑

=

=

TS1 série corrigée des points atypiques

xijk

TS2 double desais

yijk

TS3 (centrée reduite)

zijk i année

j jour k heure

nRMSE

0,255 0,26 0,265 0,27 0,275 0,28 0,285

8 9 10 11 12 13 14 15 16

Heure

nRMSE

TS3=0 arma

(

ijk

)

jk CVSjk

ijk

CVS k s j k s j

k s j i k

s j i

Q

t

k t j i tk ijk

P

s

k s j i sk ijk

C h z

x

C h

z x

a a

z z

).

sin(

ˆ . ˆ .

. ).

sin(

. ˆ .

) ( ) (

) ( )

(

0

) ( 0

) (

µ σ

σ µ σ +

=

=

Θ

+ Φ

=

=

=

HYPOTHESE SIMPLE (prédiction nulle)

ˆ

ijk

= 0

z

yˆijk = µ xˆijk = µ.sin(hjk).CCVSjk

(29)

29/38

Echelle horaire : résultats de prédiction sans desais

(30)

30/38

Echelle horaire : résultats de prédiction 1/2

ARMAX régression non linéaire de type Marquardt–Levenberg

Désaisonnalisation physique

double

désaisonnalisation

(31)

31/38

Echelle horaire : résultats de prédiction 2/2

(32)

32/38

Echelle horaire : synthèse des prédictions

49 48

50 30

31 46

30 42

43 non

arima(2,1,6) non

29 29

28 28

28 27

28 29

29 non

FIT sin non

29 29

28 27

28 27

28 30 29

non armax(6,2,X) non

29 29

28 28

28 29 28

32 34

non arma(2,2) oui

26 27

26 27

27 26

27 28

28 oui

arma(2,2) oui

29 30

29 29

29 29

29 31

moyenne 30

16 15

14 13

12 11

10 9

8 heures desais math

désais phy

nRMSE

(33)

33/38

Sommaire

Echelle journalière, désaisonnalisation physique et résultats de prédiction

Echelle horaire, désaisonnalisation et résultats de prédiction

Bilan des modes de prédiction statistique de type ARMA

Perspective et méthodologie d’utilisation des ANN

(34)

34/38

Bilan ARMA : Rappel du mode mensuel

on considère une prédiction annuelle par pas mensuel

(horizon 12), 18 années d’apprentissage et deux ans

pour la validation, soit : RAPPEL

ECHELLE MENSUELLE

13,2%

11,5%

nRMSE

naive ARIMA-X12

La prédiction naïve est la répétition des données de l’année précédente

(35)

35/38

Bilan ARMA 1/2

Parcimonie, les processus complexes ne permettent pas de gain considérable en terme de prédiction

Le logiciel Sylab (et la toolbob Grocer) permettent la modélisation de tous les ARIMA(p,d,q), petite difficultés pour les SARIMA

Nécessité de modéliser pour des phénomènes physiques, si le cas le permet

Nécessité de maîtriser les éléments de statistique pour bien utiliser ces processus (Student, fisher, dickey fuller….)

Les résultats obtenus jusqu’ici, sont en accord avec ceux de la littérature Grande sensibilité aux prétraitements de la série (linéarité, stationnarité,

périodicité, tendance). Les prétraitements semblent plus importants que le modèle ARMA choisi (Cf prédiction nulle)

Sur certains des exemples étudiés nRMSE identiques à h1, h10 et h31

Dans le cas horaire on surestime systématiquement l’irradiation solaire (surtout quand la couverture nuageuse est importante)

Il faut en général centrer réduire si le modèle ARMA ne comprend pas de constante (la moyenne de la série doit être égale à zéro)

(36)

36/38

Bilan ARMA 2/2

La méthodologie appliquée lors des prédictions journalières et horaires (doubles désaisonnalisation) semble robuste, peut être applicable à d’autres phénomènes météorologiques

Difficulté de prédiction des premières et dernières heures de la journée (masque solaire)

Facilité de prédiction pour certains mois (été printemps) mais difficulté pour les autres

Il faut de gros échantillons de prédiction pour estimer les meilleurs modèles (spécificité et sensibilité) => apprentissage mensuel

Une fois les prétraitements effectués (double désais) les modèles avec p=1 et q=1 semblent optimum

Les transformations de box-cox et la différentiation d’ordre 1 ne semblent pas avoir un réel intérêt dans notre cas

Le cas mensuel semble très bien fait avec la méthode du census X-12

Elimination des points atypiques par moyenne+-3 σ et remplacement par la moyenne sur 20 ans du jour choisi

(37)

37/38

Sommaire

Echelle journalière, désaisonnalisation physique et résultats de prédiction

Echelle horaire, désaisonnalisation et résultats de prédiction

Bilan des modes de prédiction statistique de type ARMA

Perspective et méthodologie d’utilisation des ANN

(38)

38/38

Percpective et ANN

Benchmark nécessaire pour le choix des prétraitements (dépériodicité ou non...), mais aussi sur le choix des topologies des ANN.

Tous les paramètres doivent être étudiés (alpha nbre de neurone). Utilité de faire une étude exhaustive des paramètres ?

Nécessité d'installer matlab avec sa toolbox

Vers quoi orienter l'étude, mensuelle, journalière horaire, actualisation des données sources (1971-1989), passage en prédiction de vitesse de vent??

Pallier des nRMSE (10% en mensuelle ; 20% en journalière ; 25 % en horaire Continuer l’étude physique du soleil, afin d’affiner la modélisation du

rayonnement?

Passer avec une inclinaison de détecteur (attention, diffusés différents)

Dans la littérature récente, beaucoup d’études essaient d’intégrer l’aspect spatial de la prédiction (prédiction à une localité différente du détecteur qui sert de support à la série chronologique), est-ce une finalité pour nous ?

Dans le cas horaire, continue t’on à utiliser les 9 modèles journaliers, ou passons nous à un seul modèle ARMA véritablement horaire.

Références

Documents relatifs

Sur la feuille réponse et à l’endroit prévu à cet effet, écrire N(p) sous la forme d’un polynôme en p, réduit et ordonné suivant les puissances décroissantes de p. Sur

Dans cette étude nous examinons du point de vue statistique, sur base des tests d'homogénéité, dans quelle mesure ces deux approches sont acceptables pour représenter un ensemble

Cadre du sondage Enseignant·e·s Elèves Verbatim IOGS Une brève analyse?. Annexe :

Méthode pour la transformation d’une série quelconque, ou du rapport entre deux séries, en une fraction continue équivalente.. Annales de Mathématiques pures et appliquées, tome

Leclert a imaginé une seconde transformation, souvent moins commode que la première, mais cependant utile dans certains cas. Voici en quoi

D’après les nombres stoechiométriques de l’équation chimique, la réaction consomme deux fois plus d’oxyde de cuivre que de carbone, or la quantité initiale d’oxyde de

1) Ecrire l’équation de cette réaction et ajuster les nombres stoechiométriques. 2) Préparer le tableau d’avancement de la réaction. 3) Calculer la quantité de matière initiale

Valorisation moyenne du lait chez les fromagers fermiers : 1.75 euro par litre Grandes variations (de 1 à 3) selon : le. circuit de commercialisation, la région, le type de