• Aucun résultat trouvé

CHAPITRE 3  APPROCHE MÉTHODOLOGIQUE GLOBALE 41 

3.1  Méthodologie globale 41 

3.1.3  Modélisation du foisonnement à l’aide des réseaux de neurones 47 

La Figure 3.4 décrit les étapes suivies lors de l’utilisation des RN pour la prédiction du foisonnement filamenteux à l’usine de pâtes et papiers étudiée.

La première étape consistait à établir la liste de paramètres disponibles qui sont liés à la décantation des boues activées ou encore à l’état de santé de celles-ci.

CONSTRUCTION DU RÉSEAU DE NEURONES

APPRENTISSAGE ET VALIDATION DONNÉES

y(t) = PRÉDICTION DE LA CIBLE T(t) CHOIX

DES CIBLES ET DES ENTRÉES RAFFINEMENT DES ENTRÉES CHOIX DE L’ARCHITECTURE DU RÉSEAU DE NEURONES

PRÉTRAITEMENT DES DONNÉES

Ces paramètres sont ceux qui seraient potentiellement impliqués dans la constitution d’un signal d’alerte pour le foisonnement filamenteux. Chaque paramètre d’entrée x ou cible T peut être utilisé plusieurs fois, mais à des délais différents par rapport au jour actuel. Le paramètre x1

pourrait donc donner lieu à trois variables, soit x1(t), x1(t-2) et x1(t-5), par exemple. La prédiction

d’une cible T à un temps donné par les RN est ici dénotée par y(t).

Avant de passer à la phase de détermination de l’architecture du RN, un prétraitement des données a dû être effectué :

• Traitement des valeurs manquantes et des valeurs aberrantes : dans les deux cas, elles peuvent être remplacées par des valeurs linéairement interpolées si le nombre de jours entre les deux valeurs manquantes ou éliminées n’est pas équivalent par exemple à plus d’une semaine;

• Lissage des signaux d’entrée et de sortie : le foisonnement est probablement intimement lié aux tendances à court et à long terme de certains paramètres, et donc un lissage permet de focaliser sur les tendances à prédire plutôt que sur les valeurs individuelles;

• Définition de la région d’opération d’intérêt : le début du foisonnement doit être prédit (à l’avance) et donc l’utilisation de données associées à des évènements de chloration ou d’utilisation de polymères pour aider à la décantation viendrait fausser la prédiction du phénomène. Des données de post-chloration devraient également être éliminées pour tenir compte du temps de récupération du système suite au choc de la chloration. La durée de la période de post-chloration peut être égale à un âge de boues du système étudié, par exemple;

• Normalisation des données : les données doivent être normalisées avant d’être alimentées au RN afin de s’assurer que la distribution statistique des valeurs de chaque variable d’entrée et de chaque cible soit approximativement uniforme et afin qu’elles soient distribuées dans la même plage que la fonction d’activation. En ayant les mêmes plages pour chacune des variables utilisées, les biais envers une variable plutôt qu’une autre seront minimisés.

À l’étape de détermination de l’architecture du réseau à utiliser, plusieurs combinaisons de neurones, de couches cachés ainsi que de variables d’entrée ont dû être examinées et comparées les unes aux autres. Le réseau a alors été construit, testé et validé, et sa performance évaluée, en utilisant par exemple, le coefficient de détermination, R2, ou l’erreur quadratique moyenne.

ÉVALUATION DE LA PERFORMANCE

ARCHITECTURE FIXÉE

CONSTRUCTION DU RÉSEAU DE NEURONES AVEC UNE VARIABLE CIBLE

APPRENTISSAGE ET VALIDATION NOMBRE DE VARIABLES D’ENTRÉE NOMBRE DE NEURONES CACHÉS CHOIX DE L’ARCHITECTURE DU RÉSEAU DE NEURONES NOMBRE DE COUCHES CACHÉES

Figure 3.5: Méthodologie utilisée pour la détermination de l’architecture des réseaux des neurones avec une variable cible

Il s’agit de faire un compromis entre un réseau qui est performant et un réseau qui est capable de bien généraliser, sans que le surapprentissage soit observé. Cette procédure est illustrée à la Figure 3.5. Par exemple, supposons que le nombre de variables d’entrée disponibles soit de

trente. Un premier essai serait mené avec cinq variables d’entrée, un neurone et une couche cachés ainsi qu’une variable cible. La performance de ce réseau serait alors enregistrée et comparée à celle du prochain essai avec dix variables d’entrée, et ainsi de suite jusqu’à trente. Les nombres de neurones et de couches cachés seraient à leur tour variés de la même manière de façon à générer un grand nombre de combinaisons.

Figure 3.6: Méthodologie utilisée pour la détermination du signal d’alerte à l’aide des prédictions des réseaux des neurones

L’architecture exprimant le meilleur compromis entre performance et capacité de généralisation serait alors choisie comme l’architecture à utiliser pour le développement du signal d’alerte. Après que l’architecture eut été fixée, les analyses quant aux variables les plus utiles à la prédiction du foisonnement filamenteux ont pu être initiées. Différentes combinaisons d’entrées et de délais sur ces entrées ont successivement été testées afin de prédire les cibles, jusqu’à ce

que l’étape de raffinement permette d’identifier la combinaison de variables d’entrée clés à utiliser pour le développement du signal d’alerte. Le signal d’alerte est lui-même composé de trois valeurs prédites y(t=t1), y(t=t2) et y(t=t3) ainsi que de la vraie valeur du paramètre à prédire

au jour actuel, soit T(t=0). Les trois valeurs prédites avec des RN individuels (i.e. à cible unique) et la vraie valeur actuelle forment une tendance vers un état foisonnant ou non foisonnant à partir du jour actuel. Ceci est illustré à la Figure 3.6.

Cette tendance peut alors être classée comme :

• Non foisonnante ou s’éloignant rapidement d’un état foisonnant (lumière verte ou V); • Représentant un état de transition, incluant les oscillations d’un état à l’autre (lumière

jaune ou J);

• Foisonnant ou entrant rapidement dans un état foisonnant (lumière rouge ou R).

Les détails sur les mesures de performance utilisées pour évaluer les différents modèles testés ainsi que sur le système d’alerte sont donnés dans l’Article 4 à l’Annexe 4. Le code utilisé pour cette étape a été développé dans l’environnement Matlab (version R2008b) et il est présenté à l’Annexe 7.