• Aucun résultat trouvé

Chapitre 1 Contexte et notions fondamentales

1.6. Etat de l’art des stratégies de gestion de l’énergie

Un système de gestion d’énergie est un algorithme de contrôle qui permet de superviser d’une part la coordination entre la consommation et la production d’énergie et d’autre part, la répartition de la puissance demandée par la charge entre les différentes sources d’énergie tout en satisfaisant les contraintes de fonctionnement et de fiabilité du système. Ces stratégies peuvent être classées de façon générale en deux groupes ; les stratégies en ligne et les stratégies hors ligne. Les stratégies de gestion en ligne assurent la gestion énergétique sans connaissance préalable du futur état du système alors que les stratégies hors lignes requièrent une connaissance a priori du profil de puissance demandé par la charge. Les stratégies de gestion d’énergie en ligne décident du mode de fonctionnement du système en considérant les informations en temps réel sur le système (tension, courant, état de charge des systèmes de stockage, de la demande énergétique…). Les conditions de fonctionnement d’un système multi sources étant difficilement prévisibles, ces techniques sont généralement basées sur des règles pour effectuer la gestion de l’énergie en temps réel. Les stratégies hors ligne sont basées essentiellement sur l’optimisation des solutions de problèmes non-linéaires avec contraintes, en effet elles permettent de calculer en boucle fermée une loi de commande qui dépend directement de l’état précédent par l’association des équations de Hamilton-Bellman-Jacobi à la théorie des graphes. Ces outils peuvent assurer le choix optimal permettant de garantir la maximisation ou la minimisation d’une fonction d’objectif préalablement définie en fonction des performances attendus du système. Comme inconvénient, elles nécessitent de connaître à l’avance le profil énergétique demandé au système pour la définition de la puissance à produire par chaque élément du système de génération d’énergie. La minimisation d’une fonction coût bien formulée est cependant difficile à mettre en œuvre en particulier en temps réel. Dans le cadre de nos travaux de thèse, en fonction des objectifs que nous souhaitons atteindre nous avons choisi de les ranger en trois groupes ; les stratégies de gestion à base de règles, les stratégies de gestion à base d’optimisation hors ligne et les stratégies de gestion à base d’optimisation instantanée.

1.6.1. Stratégies de gestion à base de règles

Elles proposent des outils bien adaptés à la gestion des systèmes « complexes » dépendant de grandeurs ou d’états difficilement prévisibles et mal connus en temps réel (vent, ensoleillement, fréquence et état du réseau, variation de la consommation…). Par exemple, la logique floue nous permet d’introduire des variables floues pour prendre en compte l’état de certaines parties d’un système (par exemple le niveau de stockage) et les grandeurs d’entrée. La définition des fonctions d’appartenance est basée sur des choix stratégiques ou l’expérience d’experts. Ces stratégies ont un avantage indéniable qui est leur applicabilité en temps réel car généralement avec ces stratégies le problème de temps de calcul ne se pose pratiquement pas. Jusqu’à présent, il n’existe pas de méthode systématique pour le développement de ce type de superviseur. Cependant la minimisation/maximisation des critères de performance, dans la gestion énergétique, n’est pas garantie avec cette méthode.

La commande floue a été adoptée dans différents travaux de recherche, un exemple intéressant est celui de la gestion énergétique d’un bâtiment à énergie renouvelable [35]. Dans [36] Gaoua utilise la logique floue pour la gestion de l’énergie au sein d’un véhicule hybride dans le but d’augmenter son autonomie, diminuer le coût de la consommation d’énergie et réduire les

Institute FEMTO-ST (Département Energie, UMR CNRS 6174) 20

émissions des gaz polluants. Dans [37], il est utilisé pour la gestion énergétique d’un système à énergie renouvelable connecté au réseau.

Les réseaux neuronaux sont souvent employés pour résoudre des problèmes de reconnaissance et de classification. Leur fonctionnement est basé sur des algorithmes d’apprentissage, qui leur fait mémoriser et classer les données. Dans [38], une méthode de gestion de l’énergie dans un habitat résidentiel est développée sur la base des réseaux neuronaux. Dans [39], la gestion d’un système hybride base sur les réseaux de neurones est proposé. Les auteurs de [40] explore l’adéquation du modèle de classification des réseaux de neurone dans le diagnostique et la détection de pannes en ligne. Les résultats obtenus montrent un bon comportement de cette stratégie dans la détection de pannes simple et pour différentes topologies. De plus les réseaux de neurones peuvent être utilisés dans la modélisation des systèmes complexes. Les auteurs de [41] ont utilisé cette stratégie pour la modélisation d’un micro réseau réels. Dans [42-43], ils sont utilisés pour la gestion de l’énergie dans un véhicule hybride.

Dans [44-45] des stratégies de gestion énergétique basées sur le « grid following strategy » et « power dispatching strategy » pour la gestion de systèmes à énergie renouvelable sont utilisées. Ces méthodes consistent à identifier les flux de puissance dont l’inversion permettrait de déterminer les puissances de références. Comme inconvénient, ces approches nécessitent un modèle mathématique détaillé des sources et des systèmes de stockage ainsi qu’une bonne connaissance en temps réel des différents flux énergétiques et des pertes associées.

1.6.2. Stratégies de gestion à base d’optimisation

Ces outils peuvent assurer le choix optimal permettant de garantir la maximisation, par exemple de l’énergie produite d’origine renouvelable. Comme inconvénient, elles nécessitent de connaître les données du profil énergétique du système.

La programmation dynamique a été largement utilisée pour résoudre le problème de gestion des échanges énergétiques au sein de véhicules hybrides. Elle a été appliquée par S. Delprat [46] et A. Brahma [47] à un véhicule hybride parallèle. Le principe d’optimalité de Bellman est à la base de l’équation de Hamilton-Bellman- Jacobi. Akgün [48] s’appuie sur une méthode analogue pour développer un contrôleur causal basé sur la programmation dynamique afin de gérer un système multi-sources alimentant un système résidentiel. Il adopte une approche commune en ingénierie de contrôle qui examine la décision du contrôleur non-causal pour obtenir un algorithme de control causal. Les résultats obtenus sont meilleurs qu’avec les méthodes heuristiques. De plus, ce contrôleur permet de considérer la nature dynamique des composantes du système. Cependant pour un système beaucoup plus complexe, les temps de calcul sont élevés.

Dans [49], la programmation dynamique a été appliquée aux problèmes non-linéaires de grande dimension. L’énoncé de ce principe [50] a été traduit et présenté par J-C. Culioli [51] comme suit : « Dans un processus d’optimisation dynamique, une suite de décisions est optimale si, quels que

soient l’état et l’instant considérés sur la trajectoire qui lui est associée, les décisions ultérieures constituent une suite optimale de décisions pour le sous-problème dynamique ayant cet état et cet instant comme conditions initiales ».

Institute FEMTO-ST (Département Energie, UMR CNRS 6174) 21

L’inconvénient est que cette méthode nécessite un temps de calcul élevé. Aussi ne peut-elle pas être réalisée en temps réel car sa mise en œuvre nécessite, en plus, la connaissance préalable du profil de demande énergétique du système.

La théorie de la commande optimale a été utilisée pour la résolution de problèmes de gestion d’énergie dans les véhicules hybrides [52]. Cette méthode s’applique lorsqu’il est possible d’évaluer la variation du critère en fonction de la variation de la commande. Des hypothèses de continuité voire de dérivabilité du critère optimal en fonction des variables de commande sont donc sous-entendues.

Le principe du minimum est une généralisation du calcul des variations et le théorème de référence est celui de Pontriaguine. Dans [53], D. Ambuhl implante un superviseur causal d’énergie dans un véhicule hybride en se basant sur la commande optimale et en prenant l’état de charge de la batterie comme critère de pénalité il définit son superviseur. Ce contrôleur évalue la valeur appropriée du facteur équivalent et contrôle l’état de charge de l’élément de stockage suivant une valeur de référence définie. Cependant l’état de charge de la batterie étant difficilement mesurable, il est alors estimé en utilisant un filtre de Kalman. Ceci peut cependant limiter la précision du contrôleur ; de plus, pour un système contenant plus de deux sources, les temps de calcul peuvent être prohibitifs.

La commande optimale ou le principe du maximum de Pontryagin est par nature une condition nécessaire d’optimalité tandis que la programmation dynamique fournit une condition suffisante

[54]. La condition de l’optimum global est donc garantie autant avec la programmation dynamique

qu’avec la commande optimale. En outre, la gestion des contraintes est parfaitement assurée par l’algorithme de programmation dynamique contrairement à la commande optimale qui à cause du temps de calcul plus réduit peut en revanche être adaptée à une application en ligne [55].

1.6.3. Stratégies de gestion temps réels

L’« Energy Consumption Minimisation Strategy » (ECMS) est une application en ligne de la commande optimale. Elle a fait l’objet de plusieurs études surtout dans le cadre de l’optimisation énergétique des véhicules hybrides [56-60]. Dans ces approches, une fonction coût instantanée, permettant d’évaluer la quantité réelle de combustible consommé et la consommation équivalente de combustible liée à l’utilisation du moteur électrique (véhicules hybrides), est à minimiser dans le but d’obtenir un fonctionnement qui, tout en réduisant la consommation de carburant minimise l’éjection dans l’atmosphère de gaz nocifs [61-63]. L’ECMS a aussi été utilisée dans un véhicule fonctionnant avec des super-condensateurs et une pile à combustible pour minimiser le débit d’hydrogène fourni à la pile [64]. Cette méthode a permis d’obtenir des résultats très intéressants. Cependant sa mise en œuvre nécessite la convertion de l’énergie électrique stockée ou déstockée par le système de stockage en consommation équivalente de combustible. Mursado et al

proposent dans [65], un ECMS adaptatif. L’idée est d’actualiser périodiquement les paramètres

de contrôle en fonction du profil de la charge (route load). En particulier, l’algorithme proposé identifie la mission (pattern recognition) suivie par le véhicule et détermine les paramètres optimaux correspondant à cette mission. La mission est déterminée en combinant des données du

Institute FEMTO-ST (Département Energie, UMR CNRS 6174) 22

passé à des données estimées par extrapolation. En fonction des lois d’adaptation choisies, un ou plusieurs paramètres de réglage doivent être déterminés. Le contrôle adaptatif proposé réalise de bonnes performances en temps réels. Les paramètres réglables peuvent être ajustés selon l’état de charge du système de stockage au moyen d’un contrôleur PID [46]. Dans [66] une gestion en temps réel est obtenue en combinant à l’ECMS à une méthode à base de règles.

La méthode prédictive présente un moyen relativement simple d’aborder une loi de commande temporelle ; qualifiée pour la régulation des systèmes multi-variables et hybrides [67-69]. Elle utilise un modèle dynamique du processus dans le contrôleur temps réel pour anticiper le comportement futur d’un procédé. Elle fait partie des techniques de contrôle à modèle interne. Cette approche permet de commander un système a plusieurs entrées et plusieurs sorties et elle est particulièrement intéressante lorsque le système présente des retards importants et de nombreuses perturbations. Elle englobe un ensemble de méthodes différentes :

Le GPC (Generalized Predictive Control) [70]. La mise en œuvre de cette approche présente un

intérêt double : assurer des bonnes performances tout en ayant un certain degré de robustesse. L’idée de base de GPC consiste à prendre en compte, à l’instant présent, le comportement futur du processus, en utilisant explicitement un modèle numérique du système afin de prédire la sortie future sur un horizon fini. Le contrôleur calcule une séquence de commandes à appliquer au système pour minimiser une fonction de coût définie sur l’horizon de prédiction. Cette fonction se construit à partir de deux pénalités : une première pénalité reposant sur l’écart entre la sortie prédite du système et les consignes futures et la seconde mesurant l’effort de commande.

Le PFC (Predictive Functionnal control) [71]. Il est formulé dans le contexte de la représentation

en variables d'état. Ceci permet non seulement de faire usage de théorèmes et résultats existant dans la théorie d'espace d'état, mais aussi facilite son application à des cas plus complexes comme ceux des systèmes avec perturbations stochastiques, bruits sur les variables de mesure ou commande multi variable. Cette approche a donc l'avantage de pouvoir être utilisée pour les systèmes multi variables. Son utilisation présuppose la mesure de l’état global ce qui n’est pas toujours possible, dans ce cas un observateur des états doit être envisagé.

MPHC (Model Predictive Heuristic Control) : connue aussi sous le nom de MAC (Model

Algorithmic Control) elle minimise la variance de l’erreur et impose des trajectoires de référence. Développée en 1978 [72], cette approche est basée sur :

– un modèle à réponse impulsionnelle pour le système, linéaire en entrée (ou des variables internes),

– un critère quadratique à horizon de prédiction fini, – et une trajectoire de référence.

DMC (Dynamic Matrix Control) [73]. L’objectif de la commande DMC est d’amener la sortie la

plus proche possible de la consigne au sens des moindres carrés, avec un terme de pénalité sur les variables de commande. Ce qui permet d’avoir de faibles signaux de commande et une réponse moins agressive sur la sortie.

Institute FEMTO-ST (Département Energie, UMR CNRS 6174) 23

EHAC (Extended Horizon Adaptative Control) : cette méthode est une commande adaptative à

horizon étendu. L’idée fondamentale consiste à calculer à chaque instant, la séquence des signaux de commande pour essayer de maintenir la sortie future la plus proche possible de la consigne pour un horizon de temps plus grand que le retard présent sur le système [74-75].

Le MPC (Model Predictive Control) : [76] il utilise le formalisme d’état pour faciliter l’analyse

de la robustesse et de la stabilité. Le principe de la commande prédictive consiste à utiliser un modèle dynamique du processus à l’intérieur du contrôleur, en temps réel, afin d’anticiper le futur comportement du procédé. Dans [77] une commande MPC a été utilisée comme contrôleur local afin de commander une pile à combustible (PAC). Et dans [78] il est utilisé pour contrôler la vitesse d’un moteur à combustion, en trouvant un compromis entre consommation du carburant et les émissions polluantes.

Documents relatifs