PARTIE 2 : FONCTIONS DE PILOTAGE
9. Commande par règles heuristiques
9.1. Stratégies adaptatives
9.1.1. Principe
Une alternative aux approches réactives de correction d’erreur (à partir d’un plan prévisionnel
optimal) consiste à intervenir entièrement et uniquement en réactif : la stratégie 3 de contrôle
adaptatif, proposé dans le Chapitre 4.4.
La stratégie adaptative correspond à une approche d’automate à états finis ou FSM (Finite State
Machine). Le concept de cette approche est de décomposer le comportement du système en états
discernables et surtout en nombre fini d'états. A partir de chaque état il est alors possible d'effectuer
une transition vers un autre état (ce qui rappelle le fonctionnement des chaînes de Markov). Il est donc
nécessaire de déterminer les conditions de transitions (définissant ainsi les arcs dans un graphe d'états).
Ces conditions de transition d'états peuvent dépendre de paramètres déterministes ou aléatoires,
cependant ils doivent tous être accessibles depuis l'état en cours.
La stratégie de contrôle adaptatif repose ici sur une sélection de modes de régulation simples, qui sont
les états. Les états, de nombre fini et restreint, ne décrivent pas le système mais la commande
appliquée. A chaque pas de temps, le système est soumis à un seul de ces modes. A tout moment peut
survenir un changement d’un mode à un autre (événements). Chaque événement survient sous une
condition correspondante, qui est spécifique au mode de régulation d’origine (il n’y a pas
d’indétermination). Cette stratégie permet de ne pas utiliser de méthodes fines de calcul, de prédiction
ou de modélisation ; elle nécessite, par contre, un choix pertinent des événements de basculement d’un
mode de régulation à un autre : ce choix se justifiera par comparaison avec le plan de production
optimal dans le cas idéal déterministe.
Le problème est ainsi la détermination des événements, c’est-à-dire les règles de basculement.
Une première approche consiste en l’élaboration de règles heuristiques.
Le choix de règles heuristiques, dans le cadre d’un système expert, n’est pas, de notre point de vue,
satisfaisant : elle correspondrait à chaque cas particulier et ne serait pas généralisable à l’ensemble des
problèmes possibles de gestion de systèmes multi-sources listé dans le Chapitre 5.
123/210
En deuxième approche, on cherche à remplacer un opérateur humain expert, appréhendant d’ordinaire
de manière intuitive et empirique le système, et les conditions de transition les plus adaptées.
La démarche suivante est proposée :
1- Poser le problème sous une formulation d’optimisation (dont la fonction objectif est la
minimisation du coût énergétique total) : il s’agit d’un problème d’optimisation discrète où, à
chaque pas de temps, la variable de décision prend une valeur « A », « B », « C » ou « D »
(l’un des modes de commande ou l’arrêt). En raison de l’explosion combinatoire, une
résolution par méthodes métaheuristiques (algorithmes génétiques) est estimée préférable, qui
déterminera, pour chaque scénario, une combinaison optimale convenable ;
2- Pour chaque scénario disposant d’une combinaison optimale, on sait recenser toutes les
occurrences des basculements de même type (de « A » vers « B », par exemple) et les
données, données d’entrée comme du système, à ces instants-là. Par l’emploi de méthodes
statistiques, une règle sera proposée pour chaque « événement » ;
3- Valider les définitions de règles de basculement par comparaison avec les performances du cas
idéal.
L’exploration de cette démarche (pour système avec micro-cogénération) n’a pas donné de résultats
probants ; les difficultés étant, à l’étape 1, une multiplicité des solutions de combinaison, équivalentes
en terme de coût, et à l’étape 2, la nécessité d’une expertise humaine pour relever les occurrences de
basculement significatives des autres.
Sur l’exemple des stratégies de commande pour véhicule hybride, il est apparaît préférable de recourir
à une stratégie basée sur la logique floue.
9.1.2. Extraction de règles et acquisition de connaissance
Les avantages des stratégies basées sur la logique floue sont leur simplicité et la rapidité de mise en
œuvre. Le paramétrage des règles floues repose généralement sur la connaissance de l’expert qui
conçoit la base et les règles ne sont valables que dans le domaine d’expertise.
Comme dit plus haut, ce n’est pas une solution satisfaisante ; on cherche à appréhender de manière
intuitive et empirique le système et les conditions de transition les plus adaptées.par la méthode de
Wang-Mendel :
Pour concevoir un système de contrôle, il faut recenser l’information disponible : l’expérience de
l’opérateur humain, s’il existe, sous forme de règles logiques de type IF-THEN ; les échantillons
sauvegardés d’entrées et de sorties, sous forme de données numériques. Chacune de ces informations
ne suffit pas pour définir un système de control efficace. L’idée maîtresse de l’algorithme de
Wang-Mendel est de générer des règles logiques floues depuis des ensembles de données numériques, de
collecter ces règles floues dans une base commune et finalement, de concevoir un système de contrôle
à partir de cette base.
Etape 1 : division de l’espace des entrées et des sorties en sous-ensembles flous
Posons les domaines d’intervalle des entrées x1, x2 et de la sortie y comme étant bornés : [
− +]
1 1
, x
x
[
− +]
2 2, x
x et [y ,
−y
+] respectivement. On divise chaque domaine en 2N+1 régions (N peut être
différent pour chaque variable, suivant la finesse de discrétisation nécessaire ; les régions peuvent être
également diversement étendues) qui sont repérés comme suit : SN (Small N), …, S1 (Small 1), CE
(Center), B1 (Big 1), …, BN (Big N). A chaque région est assignée une fonction d’appartenance floue,
avec un motif, par exemple triangulaire (mais d’autres types de fonction d’appartenance sont
possibles).
Etape 2 : génération des règles floues à partir des données entrées-sorties
Sur le jeu de données, on détermine les degrés d’appartenance aux régions floues x
1(i), x
2(i), y
( i), ce
qui permet d’assigner chaque donnée à la région au degré maximal.
<exemple de règle>
Les règles ainsi générées sont des règles « ET » : les conditions nécessaires pour l’application du
« IF » doivent se rencontrer simultanément.
124/210
Etape 3 : assignation d’un degré à la règle floue
La génération de règles aboutit à des règles contradictoires, ce qui ne peut rester en l’état. Une
méthode pour résoudre ce conflit est d’assigner un degré à chaque règle floue et de ne conserver en cas
de contradiction que la règle de degré supérieur.
Pour la règle ‘IF x
1est A et x
2est B, THEN y est C’, le degré D de cette règle est définie comme
suit :
)
(
).
(
).
(
)
(Règle m x
1m x
2m y
D =
A B CCette étape permet également de prendre en compte une éventuelle compétence d’un opérateur humain
expert, sous forme de poids favorisant certaines données jugées caractéristiques du système, tandis que
d’autres sont moins fiables.
Posons la paire de données (
() ())
2 ) (
1i
,x
i,y
ix avec un poids m
(i); la définition du degré de la Règle i est
alors :
) ( 2 1). ( ). ( ).
(
)
_
(Règle i m
Ax m
Bx m
Cy m
iD =
Etape 4 : création d’une base de règles
On remplit une grille de synthèse des règles, en ne conservant que la règle de degré supérieur.
Etape 5 : détermination d’un mappage à partir de la base de règles
On utilise la stratégie de défuzzyfication suivante pour déterminer la sortie à partir des entrées
observées (x
1, x
2) : on combine toutes les règles pouvant s’appliquer et leurs degrés respectifs.
La sortie correspondante est alors :
∑
∑
= ==
K i i O K i j i i O j i j im
y
m
y
1 1.
Où y
ijdésigne le centre de la région O
ij(le centre de la région étant défini comme le point qui a la
valeur absolue minimale parmi tous les points de la région O
ijayant un degré d’appartenance égal à
1).
125/210
Dans le document
Pilotage Optimal de Système Multi-sources pour le Bâtiment
(Page 132-135)