respectivement pour « BIC1 » et « AIC1 ». Pour deux RNA ayant un nombre de neurones ou
d’entrées différents, la différence entre leur nombre de paramètres est au minimum égale à 4
(elle est égale à + dans le cas d’une différence d’un neurone et × dans le cas d’une
différence d’un seul retard). Ce constat explique pourquoi le critère « BIC1 » a sélectionné un
modèle avec seulement 1 neurone et le critère « AIC1 » un RNA à 2 neurones. Les autres
modèles avec plus de neurones ou d’entrées ont été fortement pénalisés à cause de leur
complexité.
Evidemment à partir d’un certain nombre de paramètres, le terme pénalisant la complexité
du modèle devient prépondérant par rapport au terme représentant les erreurs du modèle. Or
ce nombre de paramètre critique est atteint assez rapidement dans le cas étudié. Il est donc
impossible via « AIC1 » et « BIC1 » de sélectionner des réseaux ayant plus de neurones ou
d’entrées. Les performances des réseaux sélectionnés par ces critères ne sont pas bonnes
(« R2nrj » inférieure à 0,92 pour les deux FA). Il est donc primordial de pouvoir choisir des
RNA ayant des complexités plus élevés si nécessaire.
Compte tenu de cette analyse et en gardant seulement les critères ayant sélectionné des
modèles avec de bonnes performances pour les deux FA, les critères les plus pertinents sont :
« BIC2 », « AIC2 », « R2bar », « d », « RMSE » et « R2 ».
Dans le but d’investiguer la possibilité de garder un seul critère pour la sélection des
modèles, une étude statistique de la population des modèles créés en fonction de chaque
critère candidat et du « R2nrj » a été réalisée. Les résultats de cette étude sont représentés
sur les Figure 2- 42, Figure 2- 43, Figure 2- 44 et Figure 2- 45.
Les figures montrent qu’il y a une tendance pour chaque critère à sélectionner un bon
modèle (« R2nrj » proche de 1). En effet, la plupart des RNA susceptibles d’être sélectionnés
(minimisant ou maximisant le critère en question) sont agglomérés au niveau des valeurs les
plus proches de 1 pour « R2nrj ».
Il est intéressant de signaler que plusieurs modèles, de l’ordre de 2%, susceptibles d’être
sélectionnés par « R2 », « RMSE » et « d » (valeur proche de 1, 488 ou 57 en fonction du
critère) ont de très mauvaises performances de généralisation (« R2nrj » proche de 0). Ce
phénomène est beaucoup moins présent chez les critères dépendant du nombre de
paramètres du RNA. La sélection de modèles selon « R2 », « RMSE » ou « d » présente en
conséquence un risque élevé de sélectionner un mauvais modèle. Il est toujours possible de
créer un RNA avec de très faibles erreurs (et donc un très bon « R2 », « RMSE » et « d ») à
condition d’utiliser un nombre suffisamment élevé de neurones dans la couche cachée. Par
contre, ces modèles auront de fortes chances de présenter un problème de sur-apprentissage.
C’est pour cette raison qu’il est primordial de choisir un critère intégrant un terme de
pénalisation pour les modèles complexes (ayant beaucoup de paramètres c.-à-d. de neurones
dans la couche cachée). Les critères « R2 », « RMSE » « d » sont donc à écarter parmi les
- 116 -
Enfin, en l’absence d’une réelle supériorité d’un des trois critères restant (« AIC2 »,
« BIC2 » et « R2bar ») nous allons tous les garder. Les résultats des applications de la
méthodologie pour de nouveaux systèmes permettront d’affiner le choix du critère le plus
pertinent. Les critères retenus, « AIC2 » et « BIC2 » pénalisent la complexité des RNA avec un
terme en racine carrée. La seule différence entre ces deux critères réside dans la pondération
de ce terme. La pénalisation va être légèrement plus faible avec « AIC2 ». Puisque la plage de
variation du terme logarithmique est plus importante (variation entre 12 et 22 pour le SSC
présenté dans ce chapitre) que celle du deuxième terme dépendant des paramètres du RNA
(variation entre 0,03 et 0,16 pour « BIC2 » ; 0,009 et 0,05 pour « AIC2 »), il est fort probable
que ces deux critères sélectionnent les mêmes modèles, comme pour ce premier SSC étudié.
Dans l’application de la méthodologie dans le cas des autres systèmes nous allons pouvoir
apprécier l’influence de ce terme de pénalisation.
- 117 -
Figure 2- 39 : Comparaison entre les prédictions du RNA sélectionné en fonction de chaque critère (indiqués sur chaque figure) et la simulation du test du système sous TRNSYS (à gauche). L’histogramme
des erreurs est donné à droite. Sur chaque figure est indiqué également l’intervalle de normalisation utilisé (±0,2 ; ±0,4 ou ±1,0). Cas de la FA �� . Suite de la Figure 2- 38
- 118 -
Figure 2- 40 : Comparaison entre les prédictions du RNA sélectionné en fonction de chaque critère (indiqués sur chaque figure) et la simulation du test du système sous TRNSYS (à gauche). L’histogramme
des erreurs est donné à droite. Sur chaque figure est indiqué également l’intervalle de normalisation utilisé (±0,2 ; ±0,4 ou ±1,0). Cas de la FA � �é� �
- 119 -
Figure 2- 41 : Comparaison entre les prédictions du RNA sélectionné en fonction de chaque critère (indiqués sur chaque figure) et la simulation du test du système sous TRNSYS (à gauche). L’histogramme
des erreurs est donné à droite. Sur chaque figure est indiqué également l’intervalle de normalisation utilisé (±0,2 ; ±0,4 ou ±1,0). Cas de la FA � �é� � . Suite de la Figure 2- 40.
- 120 -
Figure 2- 42 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA linéaire et des critères AIC2, d, RMSE et BIC2. Tous les critères sont sans dimension sauf RMSE.
- 121 -
Figure 2- 43 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA � �é� � et des critères R2bar et R². Tous les critères sont sans dimension sauf RMSE.
- 122 -
Figure 2- 44 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA tanh et des critères d, AIC2,
- 123 -
Figure 2- 45 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA tanh et des critères R2bar et R². Tous les critères sont sans dimension sauf RMSE.