• Aucun résultat trouvé

respectivement pour « BIC1 » et « AIC1 ». Pour deux RNA ayant un nombre de neurones ou

d’entrées différents, la différence entre leur nombre de paramètres est au minimum égale à 4

(elle est égale à + dans le cas d’une différence d’un neurone et × dans le cas d’une

différence d’un seul retard). Ce constat explique pourquoi le critère « BIC1 » a sélectionné un

modèle avec seulement 1 neurone et le critère « AIC1 » un RNA à 2 neurones. Les autres

modèles avec plus de neurones ou d’entrées ont été fortement pénalisés à cause de leur

complexité.

Evidemment à partir d’un certain nombre de paramètres, le terme pénalisant la complexité

du modèle devient prépondérant par rapport au terme représentant les erreurs du modèle. Or

ce nombre de paramètre critique est atteint assez rapidement dans le cas étudié. Il est donc

impossible via « AIC1 » et « BIC1 » de sélectionner des réseaux ayant plus de neurones ou

d’entrées. Les performances des réseaux sélectionnés par ces critères ne sont pas bonnes

R2nrj » inférieure à 0,92 pour les deux FA). Il est donc primordial de pouvoir choisir des

RNA ayant des complexités plus élevés si nécessaire.

Compte tenu de cette analyse et en gardant seulement les critères ayant sélectionné des

modèles avec de bonnes performances pour les deux FA, les critères les plus pertinents sont :

« BIC2 », « AIC2 », « R2bar », « d », « RMSE » et « R2 ».

Dans le but d’investiguer la possibilité de garder un seul critère pour la sélection des

modèles, une étude statistique de la population des modèles créés en fonction de chaque

critère candidat et du « R2nrj » a été réalisée. Les résultats de cette étude sont représentés

sur les Figure 2- 42, Figure 2- 43, Figure 2- 44 et Figure 2- 45.

Les figures montrent qu’il y a une tendance pour chaque critère à sélectionner un bon

modèle (« R2nrj » proche de 1). En effet, la plupart des RNA susceptibles d’être sélectionnés

(minimisant ou maximisant le critère en question) sont agglomérés au niveau des valeurs les

plus proches de 1 pour « R2nrj ».

Il est intéressant de signaler que plusieurs modèles, de l’ordre de 2%, susceptibles d’être

sélectionnés par « R2 », « RMSE » et « d » (valeur proche de 1, 488 ou 57 en fonction du

critère) ont de très mauvaises performances de généralisation (« R2nrj » proche de 0). Ce

phénomène est beaucoup moins présent chez les critères dépendant du nombre de

paramètres du RNA. La sélection de modèles selon « R2 », « RMSE » ou « d » présente en

conséquence un risque élevé de sélectionner un mauvais modèle. Il est toujours possible de

créer un RNA avec de très faibles erreurs (et donc un très bon « R2 », « RMSE » et « d ») à

condition d’utiliser un nombre suffisamment élevé de neurones dans la couche cachée. Par

contre, ces modèles auront de fortes chances de présenter un problème de sur-apprentissage.

C’est pour cette raison qu’il est primordial de choisir un critère intégrant un terme de

pénalisation pour les modèles complexes (ayant beaucoup de paramètres c.-à-d. de neurones

dans la couche cachée). Les critères « R2 », « RMSE » « d » sont donc à écarter parmi les

- 116 -

Enfin, en l’absence d’une réelle supériorité d’un des trois critères restant (« AIC2 »,

« BIC2 » et « R2bar ») nous allons tous les garder. Les résultats des applications de la

méthodologie pour de nouveaux systèmes permettront d’affiner le choix du critère le plus

pertinent. Les critères retenus, « AIC2 » et « BIC2 » pénalisent la complexité des RNA avec un

terme en racine carrée. La seule différence entre ces deux critères réside dans la pondération

de ce terme. La pénalisation va être légèrement plus faible avec « AIC2 ». Puisque la plage de

variation du terme logarithmique est plus importante (variation entre 12 et 22 pour le SSC

présenté dans ce chapitre) que celle du deuxième terme dépendant des paramètres du RNA

(variation entre 0,03 et 0,16 pour « BIC2 » ; 0,009 et 0,05 pour « AIC2 »), il est fort probable

que ces deux critères sélectionnent les mêmes modèles, comme pour ce premier SSC étudié.

Dans l’application de la méthodologie dans le cas des autres systèmes nous allons pouvoir

apprécier l’influence de ce terme de pénalisation.

- 117 -

Figure 2- 39 : Comparaison entre les prédictions du RNA sélectionné en fonction de chaque critère (indiqués sur chaque figure) et la simulation du test du système sous TRNSYS (à gauche). L’histogramme

des erreurs est donné à droite. Sur chaque figure est indiqué également l’intervalle de normalisation utilisé (±0,2 ; ±0,4 ou ±1,0). Cas de la FA �� . Suite de la Figure 2- 38

- 118 -

Figure 2- 40 : Comparaison entre les prédictions du RNA sélectionné en fonction de chaque critère (indiqués sur chaque figure) et la simulation du test du système sous TRNSYS (à gauche). L’histogramme

des erreurs est donné à droite. Sur chaque figure est indiqué également l’intervalle de normalisation utilisé (±0,2 ; ±0,4 ou ±1,0). Cas de la FA � �é� �

- 119 -

Figure 2- 41 : Comparaison entre les prédictions du RNA sélectionné en fonction de chaque critère (indiqués sur chaque figure) et la simulation du test du système sous TRNSYS (à gauche). L’histogramme

des erreurs est donné à droite. Sur chaque figure est indiqué également l’intervalle de normalisation utilisé (±0,2 ; ±0,4 ou ±1,0). Cas de la FA � �é� � . Suite de la Figure 2- 40.

- 120 -

Figure 2- 42 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA linéaire et des critères AIC2, d, RMSE et BIC2. Tous les critères sont sans dimension sauf RMSE.

- 121 -

Figure 2- 43 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA � �é� � et des critères R2bar et R². Tous les critères sont sans dimension sauf RMSE.

- 122 -

Figure 2- 44 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA tanh et des critères d, AIC2,

- 123 -

Figure 2- 45 : Histogramme illustrant la densité des RNA en fonction de chaque couple de critères. Cas de la FA tanh et des critères R2bar et R². Tous les critères sont sans dimension sauf RMSE.

- 124 -

La Figure 2- 46 permet de résumer les différences entre les deux catégories de modèles en

Documents relatifs