• Aucun résultat trouvé

CHAPITRE 2  REVUE CRITIQUE DE LA LITTÉRATURE 7 

2.5  Modélisation du procédé de traitement par boues activées 24 

2.5.2  Modélisation empirique du procédé de traitement par boues activées 29 

soucier des connaissances physiques, chimiques et biologiques sur celui-ci. Ils sont donc d’une nature plus descriptive [143]. Différentes approches de modélisation empirique sont adoptées dans la littérature pour étudier le PBA et le foisonnement filamenteux et quelques exemples sont présentés dans cette section. Mais tout d’abord, les bases des RN sont explorées.

2.5.2.1 Réseaux de neurones

L’utilisation des RN est largement répandue à cause de leur comportement dans des situations de modélisation de systèmes non linéaires, comme dans le cas des systèmes de traitement biologiques des eaux usées. Par exemple, les RN ont été utilisés afin de prédire la performance d’usines de traitement des eaux usées ou la qualité de leur effluent final ainsi que pour la création de capteurs logiciels [144-148]. Une autre étude a également utilisé les RN pour développer une procédure semi-automatique d’analyse d’image (AI) pour la reconnaissance de protozoaires et de métazoaires [81]. Par contre, il est difficile d’interpréter les connaissances acquises des RN et il est difficile d’estimer la topologie optimale d’un réseau [149].

Un neurone est une unité de traitement de l’information fondamentale à l’opération d’un RN. Un neurone est constitué de quatre éléments distincts [150] :

• un ensemble de synapses ou de connexions caractérisées par des poids synaptiques, • un poids de sommation qui a comme rôle d’additionner les signaux d’entrée pondérés, • une fonction d’activation qui limite l’amplitude de la sortie d’un neurone, et

• un biais permettant d’augmenter ou de diminuer l’entrée nette de la fonction d’activation.

Un neurone k peut être décrit à l’aide des deux équations suivantes :

∑ (2.2)

(2.3) où :

= potentiel d’activation du neurone k, = signal d’entrée j au neurone k, p = nombre de signaux d’entrée,

= poids synaptiques du neurone k, · = fonction d’activation, et

w

k1

w

k2

w

kp

w

k0

x

1

x

2

x

p

x

0

y

k Sortie Fonction d’activation Poids de sommation Poids synaptiques (incluant biais) Entrées Biais

( )

⋅ φ

Figure 2.2: Modèle non linéaire d’un neurone

La Figure 2.2 présente le modèle non linéaire d’un neurone k. La façon de structurer les neurones dans un RN est intimement liée à l’algorithme d’apprentissage utilisé pour entraîner le RN [150]. Une classe importante de RN, les perceptrons multicouche, possèdent une couche d’entrée, une ou plusieurs couches cachées et une couche de sortie. La Figure 2.3 illustre l’architecture générique d’un perceptron multicouche avec p entrées, une couche cachée avec k neurones (Ne) et une sortie (y1).

Cette classe de RN a été appliquée avec succès dans plusieurs études dans la littérature, plus particulièrement lorsqu’entraînée à l’aide de l’algorithme de rétropropagation. Cet algorithme utilise deux passes de calcul pour l’apprentissage, pendant lequel l’objectif principal est la minimisation d’une fonction d’erreur, comme l’erreur quadratique moyenne. Premièrement, une passe vers l’avant est initiée pendant laquelle les poids synaptiques restent inchangés et les calculs sont effectués neurone par neurone afin d’obtenir une valeur de sortie.

...

...

Figure 2.3: Schéma d’un perceptron multicouche

Ensuite, une passe de retour commence à la couche de sortie et calcule l’erreur entre la sortie qui vient d’être obtenue et la valeur désirée , où n est l’indice représentant le numéro d’itération :

(2.4)

Cette erreur permet alors de calculer l’ajustement des poids Δ entre les nœuds j et i :

Δ · · (2.5)

où :

= taux d’apprentissage,

= gradient local qui est égal au produit de l’erreur et de la dérivée de la fonction d’activation associée.

Il est à noter qu’avec l’architecture présentée à la Figure 2.3, chaque neurone contient un biais représenté par le terme . Des poids sont aussi appliqués aux connexions entre les nœuds de la couche cachée et le nœud de sortie, et donc les équations 2.2 et 2.3 ainsi que le modèle du neurone donné à la Figure 2.2 sont aussi valides pour le nœud de sortie.

Lorsque l’on conçoit un modèle de RN, le nombre de couches et le nombre d’unités dans chaque couche doivent être déterminés. Il n’existe pas de stratégie ou de théorie générales permettant de définir le nombre optimal de couches et de neurones cachés : ceci dépend probablement du problème spécifique étudié et de l’expérience du modélisateur. Ceci est dû au fait que la relation entre la performance d’un réseau et la taille de sa couche cachée n’est pas très bien comprise [147]. Dans plusieurs études des systèmes de boues activées, le nombre optimal de neurones cachés a été trouvé par essai et erreur [151-153].

Lorsque l’algorithme de rétropropagation est utilisé en apprentissage, il est préférable que le RN soit capable de bien généraliser, c’est-à-dire que les relations entre les entrées et les sorties calculées par le réseau soient appropriées pour des données qui n’ont pas été utilisées pour entraîner celui-ci. Le contraire, appelé surapprentissage, peut être relié à des ensembles de données bruitées ou à des données aberrantes ou encore à l’utilisation de petites quantités de données [145].

2.5.2.2 Modélisation empirique du foisonnement filamenteux

Les modèles présentés dans cette section se sont appliqués à fournir de l’information sur les relations entre les processus du PBA et les problèmes de décantation, tels que le foisonnement filamenteux. Les approches utilisées pour modéliser ce problème sont présentées au Tableau 2.6. Celles-ci comprennent les systèmes experts (SE), les RN, l’analyse multivariable et l’AI. À noter que dans le Tableau 2.6, PLS « signifie « partial least squares » ou la méthode d’analyse de régression partielle par les moindres carrés et ARX est utilisée pour représenter un modèle autorégressif avec entrées exogènes (autoregressive model with external inputs).

Toutes les études répertoriées ici utilisaient des données provenant de procédés de boues activées à grande échelle, sauf les études utilisant l’AI qui se sont fiées sur des montages en laboratoire avec ensemencement d’eaux usées provenant d’usines réelles.

Tableau 2.6: Modèles empiriques du foisonnement filamenteux

Approche Description Type

d’effluent

Réf.

PLS Prédiction du début du foisonnement à l’aide de relations entre des paramètres d’opération conventionnels et la qualité de l’effluent et de la décantation

Pâtes et papiers

[71, 154] SE Système basé sur des calculs de charge sur le décanteur secondaire et l’IVBA n/d [155]

SE Évaluation du potentiel de foisonnement Municipal [156]

SE Développement d’un système d’opération « intelligent » pour le foisonnement Municipal [157] SE Développement d’un indice de santé globale et d’un système de diagnostic et d’aide à la

décision

Pâtes et papiers

[76] SE Système de diagnostic et d’analyse des problèmes de foisonnement Industriel [158] RN Modélisation de l’IVB un jour à l’avance en utilisant de l’information retardée sur des

paramètres conventionnels

Municipal [159] RN Détection, à l’aide de paramètres conventionnels, du foisonnement tel que décrit par la

hauteur du voile de boues dans le décanteur secondaire

Chimique [160] RN Détection, à l’aide de paramètres conventionnels, du foisonnement tel que décrit par

une variation en forme d’échelon d’un paramètre de l’équation du taux de décantation

Municipal [161] RN Détection, à l’aide de paramètres conventionnels et d’information qualitative sur la

présence de filamenteuses, du foisonnement tel que décrit par les MES à l’effluent final

Municipal [162] AI Caractérisation de la morphologie des boues activées pour la détection du foisonnement Synthétique [163]

La plupart de ces modèles cherchaient à prédire l’occurrence de problèmes de foisonnement filamenteux ou encore à proposer des systèmes de diagnostic de ces problèmes.

La première des deux études utilisant PLS cherchait à prédire l’IVBD et l’enlèvement de la DCO, du N et du P à partir de paramètres conventionnels mesurés. Le modèle réussit à prédire des dérives de procédés sans pour autant prédire leur importance (amplitude), mais les prédictions s’avèrent être faibles dans certains cas. Selon les auteurs, les pics des évènements de foisonnement sont difficiles à prédire à cause du manque de données et de la faible fréquence d’échantillonnage. De plus, des délais sur les variables indépendantes de plus d’un jour seraient nécessaires pour vraiment capturer la dynamique du procédé [71]. L’autre étude avait comme objectif de prédire l’IVB et l’IVBD à l’aide de données conventionnelles d’une usine de traitement des eaux usées de pâtes et papiers [154]. Le modèle a permis de prédire les évènements de foisonnement deux à quatre jours à l’avance mais les auteurs soulignaient également le manque de données et le fait que des paramètres quantitatifs sur la microbiologie des boues activées pourraient améliorer la performance du modèle.

Un SE tente de simuler le processus de raisonnement de l’être humain en appliquant certaines inférences de connaissances spécifiques et de logique. Les décisions prises par des SE sont basées sur des situations programmées par les opérateurs et donc uniquement déjà rencontrées par ceux- ci. Il se peut donc que le SE doive être désactivé pour permettre aux opérateurs de prendre la relève lorsque survient un évènement de foisonnement déclenché par de nouveaux facteurs ou de nouvelles combinaisons de facteurs. La plupart de ces systèmes constituent également des plans d’action réactifs plutôt que préventifs.

Quelques études se sont penchées sur l’utilisation des RN dans le contexte du foisonnement filamenteux. Belanche et al. (2000) a trouvé que l’information qualitative quant à la présence de filamenteuses et de protozoaires exerçait une influence bénéfique sur la prédiction des MES à l’effluent, quoique cette influence fut très variable. Fuente et Vega (1999) et Miller et al. (1997) ont également cherché à prédire le foisonnement filamenteux, mais uniquement à l’aide de paramètres conventionnels tels que les débits, l’OD, le pH, la DBO et la DCO. Dans deux comptes rendus de l’utilisation des RN, des paramètres conventionnels sont retardés pour prédire le foisonnement. Capodaglio et al. (1991) ont retardé les entrées au RN d’un maximum de cinq

jours afin de prédire l’IVB une journée à l’avance alors que Belanche et al. (2000) ont utilisé un délai de deux jours sur les entrées pour prédire l’IVB à t = 0, soit le jour actuel.

Finalement, afin d’exploiter de façon quantitative l’information donnée par les observations microscopiques, quelques auteurs utilisent l’AI conçue pour réduire la charge de travail dans l’identification des bactéries filamenteuses dans les boues activées. Da Motta et al. (2002) utilisent une procédure automatisée de caractérisation de la morphologie des boues activées afin de surveiller une usine pilote et détecter le foisonnement. Les auteurs réussissent à établir des corrélations entre l’IVB et la vitesse de décantation et la longueur totale des filaments, leur nombre et la taille des flocs. Banadda et al. (2005) et Smets et al. (2006) cherchent quant à eux à établir des corrélations entre l’information donnée par l’AI et l'IVB. Les auteurs concluent que le paramètre décrivant la longueur totale des filaments augmente au même moment que l’IVB et ne permet donc pas de prendre des actions proactives quant au contrôle du foisonnement [164, 165]. Des combinaisons d’outils empiriques s’attardent également à la modélisation d’aspects reliés au PBA, mais la seule étude de ce type répertoriée traitant du foisonnement filamenteux est celle de Miller et al. (1997), qui utilise une combinaison d’analyse en composantes principales, de RN et de relations semi-empiriques pour prédire la hauteur du voile de boues dans un décanteur secondaire. L’analyse en composantes principales a été appliquée à la réduction de la dimensionnalité des données d’entrée au RN, jugées en quantités insuffisantes pour créer une structure de modèle significative et parcimonieuse.

Finalement, les avantages des modèles empiriques et mécanistes peuvent être jumelés dans un modèle hybride, à l’aide de deux stratégies distinctes, soit en série et en parallèle. Dans les stratégies en série, la composante empirique décrit les aspects sous-jacents ou inconnus du procédé étudié alors que la composante mécaniste décrit les aspects fondamentaux qui peuvent être exprimés à l’aide d’équations mathématiques. Dans un exemple de cette stratégie, des RN prédisent les facteurs d’efficacité pour la croissance hétérotrophe à l’aide de variables d’opération conventionnelles. Ces facteurs sont nécessaires au bon fonctionnement d’un modèle mécaniste des limitations de nature diffusionnelle dans un floc de boues activées [166]. La stratégie de jumelage en parallèle utilise la composante empirique pour estimer l’erreur résiduelle entre les prédictions d’un modèle mécaniste et les données mesurées. Quelques études ont utilisé cette approche pour ainsi corriger les prédictions de modèles mécanistes de boues activées [167-169].

Les stratégies hybrides constituent de bons compromis car ils permettent de développer des modèles mathématiques exacts tout en minimisant les efforts expérimentaux. Par contre, aucun modèle hybride du foisonnement filamenteux n’a pu être trouvé dans la littérature.