Utilisation de la logique floue pour l’analyse des données

Chapitre II. Matériels et Méthodes

II.4 Analyse statistique des données de fonctionnement du pilote de filtration membranaire

II.4.4 Utilisation de la logique floue pour l’analyse des données

L’outil utilisé pour la création de systèmes d’inférence floue est le logiciel FisPro (https://www.fispro.org). Différents choix effectués pour la création des systèmes d’inférence floue dans le cadre de l’étude de l’évolution du colmatage sont explicités dans les paragraphes suivants. D’autres options disponibles dans FisPro sont décrites en Annexe 5.

II.4.4.1 Partitionnement des variables

La description succincte des systèmes d’inférence floue (SIF) effectuée au paragraphe I.4.2.4 a mis l’accent sur la notion d’ensemble flou et plus particulièrement sur le partitionnement des variables en sous-ensembles flous (SEF). Plusieurs méthodes de génération de SEF sont implémentées dans le logiciel Fispro et la méthode choisie pour partitionner les variables lors de l’analyse des données issues du pilote est brièvement décrite ci-après.

Une partition doit être interprétable. Les principaux points à respecter sont d’avoir un nombre justifiable de SEF distincts (cohérent avec la plage de variation de la variable considérée), auxquels les valeurs prises par la variable doivent appartenir de façon significative pour au moins l’un d’entre eux (Guillaume & Charnomordic 2012). Les partitions floues générées automatiquement par le logiciel FisPro sont « fortes ». Cela signifie que la somme des degrés d’appartenance de chaque valeur de la variable à l’ensemble des SEF est égale à 1, ce qui vérifie les conditions précédentes. Une illustration de ce principe peut être observée sur la Figure I-30 : la température 16 °C possède des degrés d’appartenance respectifs de 0,8 et 0,2 pour les SEF « froid » et « tiède », leur somme est donc bien égale à 1.

L’algorithme des k-moyennes a été sélectionné pour le partitionnement des variables, à partir de la visualisation des sous-ensembles flous obtenus par rapport à la distribution des données au sein de ces SEF.

L’algorithme génère des partitions qui sont indépendantes selon le nombre de sous- ensembles. Le principe est détaillé ci-après, pour un nombre de SEF égal à N.

- Initialisation : choix aléatoire de N centres

- Association de chaque valeur du jeu de données à un des centres, de façon à minimiser la somme des carrés des distances entre la valeur et le centre associé - Calcul de la moyenne des N ensembles

157 Néanmoins, le partitionnement des variables sous-entend d’avoir au préalable fixé un nombre de SEF par variable. La méthode HFP (Hierarchical Fuzzy Partitioning), disponible sous FisPro, a été utilisée pour sélectionner la combinaison de nombre de SEF la plus appropriée pour la description des évolutions de la sortie étudiée. Celle-ci est décrite dans le paragraphe suivant. La Figure II-15 illustre le principe de la sélection du nombre de SEF.

Figure II-15 : Sélection des partitions – EI : état initial, IP : indice de performance, IC : indice de couverture, SEF : sous ensemble flou, SIF : système d’inférence floue

Au préalable, un nombre maximal de 3 SEF par variable est choisi à partir des coefficients de variations des variables afin de limiter le nombre de règles générées, un trop grand nombre de règles complexifiant les systèmes et leur interprétation. L’algorithme des k-moyennes est utilisé pour réaliser les différentes partitions.

L’objectif est de définir un nombre de SEF pour chaque variable, soit une combinaison de nombres de SEF. A l’étape initiale, toutes les variables sont définies par un seul SEF. A partir de cette combinaison de nombres de SEF, la méthode HFP teste de façon itérative un nombre croissant de SEF, une variable à la fois. Pour chaque combinaison de nombres de SEF, un SIF (cf. I.4.2.4) est construit pour lequel le nombre de règles ainsi que des critères d’évaluation du modèle (indice de performance et indice de couverture) sont calculés. La méthode d’apprentissage des règles utilisée est la méthode FPA, définie dans le paragraphe II.4.4.3 (seules les méthodes FPA et Wang & Mendel sont proposées à cette étape). La sortie inférée est déterminée selon les options détaillées dans le paragraphe II.4.4.2. Les indices de performance (IP) et de couverture (IC) sont définis par les Équation II-17 et Équation II-18 respectivement. L’objectif est d’avoir un indice de couverture proche de 1 pour prendre en

158 compte la majeure partie du jeu de données et d’avoir un indice de performance le plus faible possible, celui-ci étant la racine de l’erreur quadratique moyenne, i.e. la racine de la moyenne arithmétique des carrés des écarts entre les prévisions et les observations. A la fin de la première boucle, une combinaison de nombres de SEF est sélectionnée à partir des indices de performance et de couverture et devient le nouvel état initial. Les nombres de SEF sont ensuite à nouveau augmentés itérativement. Pour la combinaison de nombres de SEF en fin de première boucle, tous les nombres de SEF sont égaux à 1 excepté pour une variable, dont le nombre de SEF est égal à 2.

𝐼𝑃 = √∑ (𝑥𝑖𝑛𝑓,𝑖− 𝑥𝑜𝑏𝑠,𝑖) 2 𝑁 𝑖=1 𝑛 = 𝑅𝑀𝑆𝐸 Équation II-17 𝐼𝐶 =𝐴 𝑛 Équation II-18

avec xobs,i la valeur observée du jeu de données, xinf,i, la valeur inférée par le système, A le nombre d’exemples actifs et n le nombre total d’exemples du jeu de données

Le choix est ensuite laissé à l’utilisateur de sélectionner la combinaison de SEF appropriée d’après les indices de performance et de couverture ainsi que le nombre de règles, pour limiter la complexité du modèle et éviter une sur-paramétrisation de celui-ci.

En sortie de cette étape, les éventuelles variables n’apparaissant pas, c’est-à-dire pour lesquelles le nombre de SEF est resté égal à 1, sont enlevées du jeu de données.

Une fois les variables sélectionnées et une combinaison de nombres de SEF choisie à l’aide de la méthode HFP, un partitionnement de type « k-moyennes » est réalisé.

II.4.4.2 Choix des paramètres d’inférence de la sortie

La sortie correspondant à une ligne de données d’entrée est inférée à partir de l’ensemble de règles et de leurs conclusions. Plusieurs possibilités sont disponibles que ce soit en termes d’opérateurs de conjonction, d’agrégation ou d’expression de la sortie, qui peut être nette ou floue. Les choix effectués pour l’analyse de l’évolution du colmatage ainsi que la description de leurs conséquences sur la définition du modèle sont présentés dans les paragraphes suivants. Le détail des autres possibilités est disponible en Annexe 5.

La Figure II-16 illustre un exemple de SIF fictif possédant deux variables d’entrée partitionnées en trois sous-ensembles flous chacune auxquels sont attribués les variables linguistiques

159 faible, moyen et fort. Quatre règles ont été générées ( Figure II-16a), la première étant : « Si variable 1 est moyen et si variable 2 est faible, alors sortie 1 est égale à 12,23 ». Dans ce cas, la conclusion de la règle est nette. Le calcul de la sortie inférée à partir d’une ligne du jeu de données (variable 1 = 3,65 et variable 2 = 44,35) est détaillé dans les paragraphes suivants, à travers les choix réalisés pour effectuer ce calcul.

a) a ) a

Figure II-16 : Illustrations a) des règles de décision inférées, b) du calcul de la sortie associée à une ligne de données avec opérateur de conjonction : minimum, opérateur d’agrégation : maximum, sortie inférée : Sugeno

Combinaison des entrées : opérateur de conjonction

Cet opérateur intervient lors du calcul du degré de vérité d’une règle. Le degré de vérité déclenche l’activation ou non d’une règle par une ligne de données du jeu d’apprentissage (exemple) s’il est supérieur à un seuil fixé. La conclusion de la règle est ensuite définie à partir de tous les exemples qui l’activent, par la moyenne des valeurs de sortie observées pondérées par les degrés de vérité des exemples associés. Deux opérateurs principaux sont disponibles, le minimum et le produit.

L’opérateur de conjonction choisi est le minimum. Dans ce cas, le degré de vérité d’une règle est égal au minimum des degrés d’appartenance des variables aux SEF associés. En d’autres termes, cela signifie que les degrés d’appartenance aux SEF de la prémisse de la règle sont tous supérieurs ou égaux à ce degré de vérité. Sur la Figure II-16b, l’opérateur de conjonction choisi est le minimum : le degré de vérité de la règle n°1 pour la combinaison de données

160 (variable 1 = 3,65 et variable 2 = 44,35) est 0,316, qui est le degré d’appartenance de la valeur 44,35 au sous ensemble « faible » de la variable 2.

Ce choix du minimum est justifié par la présence d’un nombre d’entrées relativement important dans l’étude de l’évolution du colmatage (cf. présentation du second opérateur de conjonction en Annexe 5).

Calcul de la sortie : opérateur d’agrégation

Cet opérateur est utilisé lors la détermination de la sortie inférée. Les deux opérateurs proposés par le logiciel sont le maximum et la somme. Le maximum est choisi pour éviter la prise en compte de règles aboutissant à la même conclusion. L’impact de cet opérateur d’agrégation sera détaillé dans le prochain paragraphe qui traite du calcul de la sortie inférée.

Le maximum consiste, si plusieurs sorties de règles sont un même SEF dans le cadre d’une sortie floue, ou une même valeur dans le cadre d’une sortie nette, à ne considérer que la règle pour laquelle le degré de vérité est le plus élevé. Dans le cadre de règles aboutissant à une même conclusion, cela permet de ne considérer le résultat qu’une seule fois lors du calcul de la sortie inférée.

Calcul de la sortie inférée

Afin de faciliter l’interprétation des systèmes obtenus, il a été choisi que ceux-ci infèrent des sorties nettes à partir des règles et de leurs conclusions, comme c’est le cas sur la Figure II-16. Deux options sont proposées pour calculer la sortie associée à une ligne de données, « max net » ou « Sugeno ». Pour des raisons d’interprétabilité, FisPro utilise un système de Sugeno d’ordre 0, c’est-à-dire que la sortie d’une règle est une constante et non une combinaison linéaire des entrées comme dans le système de Sugeno général. C’est cette option « Sugeno » qui est choisie. Contrairement à l’option « max net », cette option permet de considérer plusieurs conclusions de règles dans le calcul de la sortie. En effet, la sortie inférée est la somme pondérée des conclusions des règles, le poids étant le degré de vérité de la règle. La Figure II-16a a pour opérateur d’agrégation le maximum. Lors du calcul de la sortie inférée pour la combinaison de données (variable 1 = 3,65 et variable 2 = 44,35), la règle 4 ne sera pas prise en compte puisque la valeur 12,23 est également la conclusion de la règle n°1 mais pour laquelle le degré de vérité est de 0,316 > 0,211. La sortie est alors calculée selon l’Équation II-19.

161 𝑆(3,65; 44,35) =0,316 × 12,23 + 0,684 × 38,833 + 0,211 × 27,162

0,316 + 0,684 + 0,211

Équation II-19

II.4.4.3 Méthodes d’apprentissage

Quatre méthodes d’apprentissage sont implémentées dans le logiciel FisPro pour générer les règles. Celles-ci sont classées en deux catégories : les premières sont basées sur des régions, c’est-à-dire que les prémisses des règles sont choisies en découpant le domaine de définition des variables d’entrée en un certain nombre de régions et en sélectionnant les régions pertinentes d’après un critère donné vis-à-vis du jeu de données. Les secondes sont basées sur les exemples, c’est-à-dire que les prémisses se basent sur les lignes de données pour construire les règles associées. Celles-ci sont ensuite sélectionnées si elles satisfont un critère donné. C’est le cas pour les méthodes Wang & Mendel et Orthogonal Least Square, non développées ici.

Les méthodes utilisées pour l’étude de l’évolution du colmatage sont brièvement décrites dans les paragraphes suivants.

Algorithme de prototypage rapide ( APR)

Des règles sont générées à partir de toutes les combinaisons possibles de SEF. Par exemple si le jeu de données possède 3 variables d’entrée partitionnées en 3 SEF chacune, 27 règles seront générées. Ensuite, celles-ci ne sont conservées que si un nombre suffisant de lignes de données les activent, c’est-à-dire si elles ont un degré d’activation pour cette règle supérieur à un seuil fixé.

Arbre de décision flou (ADF)

Cette méthode est une extension des arbres de décision classiques. Un arbre de décision flou consiste en une racine (point de départ) et des nœuds, qui correspondent à un sous-ensemble de valeurs d’une des variables d’entrée du jeu de données. Les éléments appelés feuilles sont les nœuds terminaux de l’arbre. Les nœuds sont déterminés de façon à ce que l’homogénéité des exemples soit maximale, en maximisant l’entropie. Guillaume & Charnomordic (2011) présentent les arbres de décision flous proposés dans FisPro. Les arbres de décision flous permettent une représentation facile d’interprétation et la hiérarchisation des variables selon leur importance, les plus importantes se situant au niveau du sommet de l’arbre. Cette méthode est utile pour sélectionner les variables les plus pertinentes avant d’utiliser une des méthodes citées précédemment dans le cas d’un grand nombre de variables d’entrée. L’arbre de décision est la seule méthode, parmi les quatre proposées par le logiciel FisPro à générer

162 des règles incomplètes, i.e. des règles dans lesquelles ne figurent pas toutes les variables d’entrée. Afin d’augmenter la possibilité d’interprétation du système, un élagage de l’arbre peut être effectué. Cela revient à transformer un nœud en feuille si la perte de performance résultante est faible.

Le but de l’étude étant de déterminer les facteurs influençant le colmatage et de les hiérarchiser, la méthode sélectionnée est l’arbre de décision flou. C’est également la méthode préconisée d’après Guillaume & Charnomordic (2013) selon les jeux de données disponibles. En effet, le nombre de lignes de données (101 lignes pour la base de données complète) ainsi que le nombre de variables explicatives sont relativement importants.

Dans le document Limitation du colmatage dans les bioréacteurs à membranes à l'échelle industrielle : modélisation et caractérisation de l'hydrodynamique (Page 158-164)