Précision de l’estimation - Performances de l’estimateur neuronal

4.3 Apprentissage d’un estimateur neuronal des flux de puissance sur un

4.3.6 Performances de l’estimateur neuronal

4.3.6.1 Précision de l’estimation

4.3.6.1.1 Évolution des erreurs d’apprentissage sur la base de validation

Au fil des expérimentations, trois erreurs se sont avérées utiles pour suivre l’évolu- tion de l’erreur d’apprentissage : RMSE, RSE et NLE (figures 4.9 et4.10).

0 500 1 000 1 500 2 000 2 500 3 000 0 1 2 3 Nombre d’itérations Erreur RMSE RSE NLE

Figure 4.9 – Évolution des erreurs d’estimation sur la base de validation (cas 1).

L’erreur MAE a un comportement plus erratique au fil des itérations puisqu’elle représente une moyenne absolue des écarts d’estimation, cependant sa valeur finale à

l’issue de l’apprentissage est une bonne indication de la précision globale de l’estimation sur l’ensemble des points de fonctionnement décrits dans la base de validation.

0 500 1 000 1 500 2 000 2 500 3 000 0 1 2 3 Nombre d’itérations Erreur RMSE RSE NLE

Figure 4.10 – Évolution des erreurs d’estimation sur la base de validation (cas 2).

La décroissance continue des erreurs sur les figures 4.9 et 4.10 est une première indication de la validité de l’architecture neuronale et du paramétrage de l’algorithme de rétropropagation.

De ce point de vue, seules les premières itérations présentent un intérêt puisque à partir d’un certain moment l’évolution des erreurs d’estimation n’est plus perceptible. Ainsi, la première phase de décroissance rapide peut être assimilée à la phase de généralisation tandis que la seconde phase peut être vue comme une phase de spécia- lisation.

En revanche, l’erreur MPE est inadaptée pour suivre l’évolution de l’erreur d’ap- proximation. En effet, pour plusieurs cas d’apprentissage, la sortie attendue est proche d’une valeur nulle ce qui engendre une MPE très élevée. De fait, cette erreur n’est pas considérée dans le reste de l’étude.

4.3.6.1.2 Évolution des coefficients de corrélation et de détermination sur

la base de test

L’évolution du coefficient de corrélation et du coefficient de détermination pour les deux cas d’études sont exprimés par les figures 4.11 et 4.12.

La convergence des coefficients semble plus rapide dans le deuxième cas d’étude. L’une des raisons est que la base d’apprentissage du deuxième cas d’étude est composée de 12 fois plus de données que le premier cas d’étude.

A chaque itération le réseau neuronal ajuste ses poids synaptiques pour adapter son estimation à un plus grand nombre de points de fonctionnement, ce qui entraîne une vitesse initiale de convergence plus élevée.

En revanche, la convergence finale vers une valeur proche de 1 est beaucoup plus longue à obtenir pour les mêmes raisons.

L’allure de ces courbes renseigne également sur l’adéquation de l’architecture du réseau neuronal et des paramètres de l’algorithme de rétropropagation avec le problème à estimer.

— Une évolution plus irrégulière de ces courbes aurait ainsi mis en évidence que le taux d’apprentissage et le momentum ont des valeurs trop élevées ce qui ne permet pas à l’algorithme de rétropropagation de converger dans de bonnes conditions. — Une convergence des coefficients vers une valeur très inférieure à 1 aurait signifié

que l’architecture du RNA n’est pas suffisante pour développer des propriétés de généralisation. De même, une lente convergence peut également signifier que l’architecture du RNA est surdimensionnée.

0 100 200 300 400 500 600 700 800 900 1 000 −1 −0,5 0 0,5 1 Nombre d’itérations Coefficient de corrélation Coefficient de détermination

Figure 4.11 – Évolution de la corrélation entre données estimées et calculées (cas 1).

0 100 200 300 400 500 600 700 800 900 1 000 −1 −0,5 0 0,5 1 Nombre d’itérations Coefficient de corrélation Coefficient de détermination

Figure 4.12 – Évolution de la corrélation entre données estimées et calculées (cas 2).

4.3.6.1.3 Représentativité de la base de test

A l’issue de l’apprentissage, le coefficient de corrélation et le coefficient de détermi- nation issus de l’évaluation de la base de test ont une valeur très proche de 1, ce qui implique que le RNA a développé des capacités de généralisation permettant de donner une bonne estimation sur de nouveaux points de fonctionnement.

Les figures 4.13 et 4.14 représentent une analyse graphique de la corrélation sur l’ensemble de la base de données initiale.

Figure 4.13 – Corrélation entre données estimées et calculées (cas 1).

L’abscisse correspond aux données calculées O et l’ordonnée aux données estimées Y. L’intérêt de ces graphiques est de visualiser les performances d’estimation sur l’ensemble des points de fonctionnement du système.

Dans les deux cas d’étude, l’apprentissage a été effectué jusqu’à ce que le coefficient de corrélation atteigne une valeur de 0,995.

Figure 4.14 – Corrélation entre données estimées et calculées (cas 2).

Sur ces figures, l’enveloppe convexe représente la dispersion entre les données cal- culées et estimées. En théorie, un estimateur parfait verrait l’enveloppe convexe être confondue avec la droite de régression de pente unitaire.

Ainsi, la surface décrite par l’enveloppe convexe est définie comme un critère de dimensionnement supplémentaire pour choisir l’architecture du réseau neuronal la plus adaptée au problème.

Un sous-objectif de la méthodologie pourrait alors être de déterminer l’architecture neuronale et les paramètres de l’algorithme d’apprentissage permettant de minimiser l’aire de l’enveloppe convexe.

4.3.6.1.4 Visualisation de l’erreur d’apprentissage

Les figures 4.15 et4.16 proposent une comparaison entre données calculées et esti- mées pour les 500 premières secondes de fonctionnement de la base de données pour les deux cas d’études. Elles constituent une illustration objective de la précision des estimateurs. 0 50 100 150 200 250 300 350 400 450 500 −0,2 0 0,2 0,4 0,6 0,8 1 1,2 · 104 Temps (s) Puissance globale consommée (k

W) Calcul par heuristique

Estimation par RNA

Figure 4.15 – Comparaison entre les données estimées et calculées (cas 1).

0 50 100 150 200 250 300 350 400 450 500 0 2 000 4 000 6 000 8 000 Temps (s) Puissance globale consommé e (k

W) Calcul par heuristique

Estimation par RNA

Figure 4.16 – Comparaison entre les données estimées et calculées (cas 2).

Ces figures sont obtenues en sommant les puissances électriques aux bornes des trains. Logiquement, la puissance globale résultante devrait être strictement positive quelles que soient les conditions d’exploitation des carrousels, cependant la résolution

itérative permet de calculer les flux de puissance vus par les trains avec une certaine erreur, ainsi la sommation des données calculées et estimées peut être légèrement né- gative du fait de cette marge d’erreur.

En théorie, le critère d’arrêt de la résolution itérative devrait donc être affiné pour réduire l’erreur commise, cependant le gain en précision pour la méthodologie globale serait nul puisque comme il est montré par la suite, une consommation énergétique du carrousel faible voire négative transmet la même information : la synchronisation des trains est optimale.

En effet, l’objectif final de la méthodologie n’est pas de déterminer précisément la consommation énergétique de la ligne, mais de définir dans quelles conditions d’exploitation cette consommation est minimisée. Ainsi, la plage de fonctionnement où l’estimateur neuronal produit la plus grande erreur est paradoxalement celle où cette erreur a le moins d’impact sur la prise de décision.

4.3.6.1.5 Remarques sur la précision de l’estimation

Précédemment, il a été fait mention de l’occurrence de deux phases lors de l’apprentissage : une phase de généralisation et une phase de spécialisation. Dans le cas d’une base de donnée de petite taille, la phase de spécialisation peut se transformer en phase de sur-apprentissage lorsque la phase d’apprentissage est prolongée excessivement pour améliorer l’estimation du réseau neuronal.

Ce problème de sur-apprentissage est surmonté dès lors que la taille de la base de données augmente. En effet, un sur-apprentissage sur une base de données exhaustive de tous les points de fonctionnement du système n’est rien de plus que l’objectif primaire visé lors de la conception de l’estimateur.

Dans le document Optimisation de la consommation énergétique d'une ligne de métro automatique prenant en compte les aléas de trafic à l'aide d'outils d'intelligence artificielle (Page 134-139)