Stratégies adaptatives - Commande par règles heuristiques

PARTIE 2 : FONCTIONS DE PILOTAGE

9. Commande par règles heuristiques

9.1. Stratégies adaptatives

9.1.1. Principe

Une alternative aux approches réactives de correction d’erreur (à partir d’un plan prévisionnel

optimal) consiste à intervenir entièrement et uniquement en réactif : la stratégie 3 de contrôle

adaptatif, proposé dans le Chapitre 4.4.

La stratégie adaptative correspond à une approche d’automate à états finis ou FSM (Finite State

Machine). Le concept de cette approche est de décomposer le comportement du système en états

discernables et surtout en nombre fini d'états. A partir de chaque état il est alors possible d'effectuer

une transition vers un autre état (ce qui rappelle le fonctionnement des chaînes de Markov). Il est donc

nécessaire de déterminer les conditions de transitions (définissant ainsi les arcs dans un graphe d'états).

Ces conditions de transition d'états peuvent dépendre de paramètres déterministes ou aléatoires,

cependant ils doivent tous être accessibles depuis l'état en cours.

La stratégie de contrôle adaptatif repose ici sur une sélection de modes de régulation simples, qui sont

les états. Les états, de nombre fini et restreint, ne décrivent pas le système mais la commande

appliquée. A chaque pas de temps, le système est soumis à un seul de ces modes. A tout moment peut

survenir un changement d’un mode à un autre (événements). Chaque événement survient sous une

condition correspondante, qui est spécifique au mode de régulation d’origine (il n’y a pas

d’indétermination). Cette stratégie permet de ne pas utiliser de méthodes fines de calcul, de prédiction

ou de modélisation ; elle nécessite, par contre, un choix pertinent des événements de basculement d’un

mode de régulation à un autre : ce choix se justifiera par comparaison avec le plan de production

optimal dans le cas idéal déterministe.

Le problème est ainsi la détermination des événements, c’est-à-dire les règles de basculement.

Une première approche consiste en l’élaboration de règles heuristiques.

Le choix de règles heuristiques, dans le cadre d’un système expert, n’est pas, de notre point de vue,

satisfaisant : elle correspondrait à chaque cas particulier et ne serait pas généralisable à l’ensemble des

problèmes possibles de gestion de systèmes multi-sources listé dans le Chapitre 5.

123/210

En deuxième approche, on cherche à remplacer un opérateur humain expert, appréhendant d’ordinaire

de manière intuitive et empirique le système, et les conditions de transition les plus adaptées.

La démarche suivante est proposée :

1- Poser le problème sous une formulation d’optimisation (dont la fonction objectif est la

minimisation du coût énergétique total) : il s’agit d’un problème d’optimisation discrète où, à

chaque pas de temps, la variable de décision prend une valeur « A », « B », « C » ou « D »

(l’un des modes de commande ou l’arrêt). En raison de l’explosion combinatoire, une

résolution par méthodes métaheuristiques (algorithmes génétiques) est estimée préférable, qui

déterminera, pour chaque scénario, une combinaison optimale convenable ;

2- Pour chaque scénario disposant d’une combinaison optimale, on sait recenser toutes les

occurrences des basculements de même type (de « A » vers « B », par exemple) et les

données, données d’entrée comme du système, à ces instants-là. Par l’emploi de méthodes

statistiques, une règle sera proposée pour chaque « événement » ;

3- Valider les définitions de règles de basculement par comparaison avec les performances du cas

idéal.

L’exploration de cette démarche (pour système avec micro-cogénération) n’a pas donné de résultats

probants ; les difficultés étant, à l’étape 1, une multiplicité des solutions de combinaison, équivalentes

en terme de coût, et à l’étape 2, la nécessité d’une expertise humaine pour relever les occurrences de

basculement significatives des autres.

Sur l’exemple des stratégies de commande pour véhicule hybride, il est apparaît préférable de recourir

à une stratégie basée sur la logique floue.

9.1.2. Extraction de règles et acquisition de connaissance

Les avantages des stratégies basées sur la logique floue sont leur simplicité et la rapidité de mise en

œuvre. Le paramétrage des règles floues repose généralement sur la connaissance de l’expert qui

conçoit la base et les règles ne sont valables que dans le domaine d’expertise.

Comme dit plus haut, ce n’est pas une solution satisfaisante ; on cherche à appréhender de manière

intuitive et empirique le système et les conditions de transition les plus adaptées.par la méthode de

Wang-Mendel :

Pour concevoir un système de contrôle, il faut recenser l’information disponible : l’expérience de

l’opérateur humain, s’il existe, sous forme de règles logiques de type IF-THEN ; les échantillons

sauvegardés d’entrées et de sorties, sous forme de données numériques. Chacune de ces informations

ne suffit pas pour définir un système de control efficace. L’idée maîtresse de l’algorithme de

Wang-Mendel est de générer des règles logiques floues depuis des ensembles de données numériques, de

collecter ces règles floues dans une base commune et finalement, de concevoir un système de contrôle

à partir de cette base.

Etape 1 : division de l’espace des entrées et des sorties en sous-ensembles flous

Posons les domaines d’intervalle des entrées x1, x2 et de la sortie y comme étant bornés : [

− +

]

1 1

, x

x

[

− +

]

2 2

, x

x et [y ,

−

y

] respectivement. On divise chaque domaine en 2N+1 régions (N peut être

différent pour chaque variable, suivant la finesse de discrétisation nécessaire ; les régions peuvent être

également diversement étendues) qui sont repérés comme suit : SN (Small N), …, S1 (Small 1), CE

(Center), B1 (Big 1), …, BN (Big N). A chaque région est assignée une fonction d’appartenance floue,

avec un motif, par exemple triangulaire (mais d’autres types de fonction d’appartenance sont

possibles).

Etape 2 : génération des règles floues à partir des données entrées-sorties

Sur le jeu de données, on détermine les degrés d’appartenance aux régions floues x

₁⁽ⁱ⁾

, x

₂⁽ⁱ⁾

, y

^{( i}⁾

, ce

qui permet d’assigner chaque donnée à la région au degré maximal.

<exemple de règle>

Les règles ainsi générées sont des règles « ET » : les conditions nécessaires pour l’application du

« IF » doivent se rencontrer simultanément.

124/210

Etape 3 : assignation d’un degré à la règle floue

La génération de règles aboutit à des règles contradictoires, ce qui ne peut rester en l’état. Une

méthode pour résoudre ce conflit est d’assigner un degré à chaque règle floue et de ne conserver en cas

de contradiction que la règle de degré supérieur.

Pour la règle ‘IF x

₁

est A et x

₂

est B, THEN y est C’, le degré D de cette règle est définie comme

suit :

)

(

).

(

).

(

)

(Règle m x

₁

m x

₂

m y

D =

_A _B _C

Cette étape permet également de prendre en compte une éventuelle compétence d’un opérateur humain

expert, sous forme de poids favorisant certaines données jugées caractéristiques du système, tandis que

d’autres sont moins fiables.

Posons la paire de données (

() ()

)

2 ) (

1ⁱ

,x

ⁱ

,y

ⁱ

x avec un poids m

⁽ⁱ⁾

; la définition du degré de la Règle i est

alors :

) ( 2 1

). ( ). ( ).

(

)

_

(Règle i m

x m

y m

ⁱ

D =

Etape 4 : création d’une base de règles

On remplit une grille de synthèse des règles, en ne conservant que la règle de degré supérieur.

Etape 5 : détermination d’un mappage à partir de la base de règles

On utilise la stratégie de défuzzyfication suivante pour déterminer la sortie à partir des entrées

observées (x

, x

) : on combine toutes les règles pouvant s’appliquer et leurs degrés respectifs.

La sortie correspondante est alors :

∑

= =

=

_K i i O K i j i i O j i j i

m

y

m

y

1 1

.

Où y

ⁱj

désigne le centre de la région O

ⁱj

(le centre de la région étant défini comme le point qui a la

valeur absolue minimale parmi tous les points de la région O

ⁱj

ayant un degré d’appartenance égal à

1).

125/210

Dans le document Pilotage Optimal de Système Multi-sources pour le Bâtiment (Page 132-135)