• Aucun résultat trouvé

Chapitre I: Gestion d’énergie de véhicules multi-sources, contexte et problématiques 5

I.3.3 Stratégies de gestion d’énergie à base d’optimisation 22

I.3.3.1 Synthèse d’une stratégie à base d’optimisation

La synthèse d’une stratégie à base d’optimisation se réalise en deux étapes :

Formulation du problème de commande optimale : cette étape consiste entre autres à définir les différentes variables qui interviennent dans le problème de commande op- timale (avec les contraintes associées) et les critères de performances à minimiser (ou maximiser). Par exemple, dans le cas d’un VH MCI-batterie, le critère de performance à minimiser sera généralement la consommation de carburant. En ce qui concerne les variables à prendre en compte, l’état de charge de la batterie sera considéré comme une variable d’état. Une variable de commande pourra être le couple de réfé- rence du MCI. Le choix de ces différentes variables n’est pas systématique. L’un des objectifs des travaux réalisés dans le cadre de cette thèse, consiste à aider à la défi- nition des variables de commande du problème de commande optimale de manière structurée. De plus amples détails sur cet aspect seront donnés dans la partie sui- vante (cf. § I.3.3) et dans le prochain chapitre (Chapitre II).

Résolution du problème de command optimale : la résolution du problème consiste à définir la sortie appropriée de la stratégie (variable de commande), afin de minimiser (ou maximiser) le critère de performances. Les stratégies à base d’optimisation sont généralement différenciées en fonction de la méthode de résolution utilisée.

I.3.3.2 Méthodes de résolution hors ligne

Les méthodes de résolution hors ligne nécessitent la connaissance du cycle de conduite a priori. Elles sont dès lors réservées à la simulation. Cependant, elles peuvent servir de référence pour l’évaluation des performances du véhicule, d’aide au dimensionnement [Hung 2012] ou encore, d’aide à la synthèse de stratégies temps réel [Chen 2014], [Song 2015b],

[Berkel 2015], [Horrein 2015b]. Les méthodes de résolution peuvent être classées en deux catégories [Kermani 2009], [Guzzella 2013b] :

Méthodes heuristiques ou méta-heuristiques : ces méthodes sont basées sur un « mo- dèle de comportement » du système. La structure et les paramètres d’un modèle de comportement n’ont pas de rapport avec le système réel. Ce sont des modèles obte- nus expérimentalement en exploitant des mesures entrées-sorties. Le fonctionne- ment interne du système n’est pas considéré [Abdennour 2001]. Les méthodes heu- ristiques ou méta-heuristiques fonctionnent généralement de manière itérative et sto- chastique. Les algorithmes utilisés peuvent s'appuyer sur des processus physiques. Par exemple, la méthode du recuit simulé s’inspire d’un processus métallurgique, qui consiste à imposer un refroidissement contrôlé à une pièce métallique, ayant suivi un cycle de chauffage au préalable. C’est une méthode de résolution qui est appli- quée dans le cadre de plusieurs problèmes de commande optimale, et ce depuis plu- sieurs années [Kirkpatrick 1984]. Cependant, ce type de méthodes de résolution ne garantit pas la convergence vers un optimum global. Un autre inconvénient concerne le temps de calcul souvent prohibitif [Scordia 2004]. La méthode du recuit simulé a été utilisée pour la gestion d’énergie d’un VE batterie-SCs dans [Trovão 2013]. Par ailleurs, d’autres types de méthodes méta-heuristiques comme les algorithmes géné- tiques [Yu 2011], ou encore l’optimisation par essaims particulaires [Trovão 2015c], [Trovão 2015b] ont été utilisées dans les véhicules multi-sources.

Méthodes exactes : les méthodes exactes sont basées sur un « modèle de connais- sance » du système. Les paramètres d’un modèle de connaissance représentent les grandeurs caractéristiques de la structure étudiée. Les modèles de connaissance sont basés sur des lois physico-chimiques. Ce type de modèle, basé sur la physique du système, peut s’avérer complexe à caractériser dans certains cas [Abdennour 2001]. Les méthodes exactes consistent à trouver des solutions explicites au pro- blème de commande optimale. La résolution peut se faire de manière analytique ou numérique. La méthode analytique principalement utilisée dans la gestion d’énergie des véhicules multi-sources, utilise le Principe du minimum de Pontriaguine (PMP) [Pontriaguine 1974], [Culioli 1994], [Kirk 2004], [Becerra 2011], [Bourdin 2013]. La méthode du minimum de Pontriaguine a été appliquée sur des VEs [Vinot 2010] et des VHs [Delprat 2004], [Yuan 2013], [Vinot 2013]. C’est une méthode qui présente l’avantage de nécessiter un temps de calcul relativement limité. La méthode de réso- lution numérique la plus utilisée dans les applications véhicules, est celle de la pro- grammation dynamique. C’est une méthode basée sur le principe d’optimalité de Bellman [Bellman 2003]. Cette méthode est très performante mais nécessite des ef- forts de calcul très importants. La programmation dynamique a été appliquée pour différents véhicules multi-sources, dans sa forme de base [Scordia 2005], [Chen 2014] ou dans une forme plus évoluée [Kim 2007].

Avantages et inconvénients : les méthodes méta-heuristiques ont l’avantage de ne pas nécessité de modèle de connaissance du système (caractérisation). Cependant, la convergence vers l’optimum (qualité de la solution) n’est pas assurée. Les méthodes

de résolution exactes ont l’inconvénient de nécessité un modèle de connaissance du système. Les méthodes exactes numériques permettent de s’assurer d’un optimum global de la solution et du respect des contraintes imposées. L’inconvénient majeur de ce type de méthode est le temps de calcul pouvant être très important. Les mé- thodes exactes de type analytique permettent de réduire le temps de calcul néces- saire en comparaison aux méthodes numériques. Le gros inconvénient est la prise en compte des contraintes inégalités qui n’est pas évidente. Les avantages et inconvé- nients des méthodes de résolution hors ligne sont résumés Tableau I-4.

Tableau I-4 : avantages et inconvénients des méthodes de résolution hors ligne

Catégorie Qualité solution Nécessité modèle

de connaissance contraintes inégalités Prise en compte Temps de calcul Méta-

heuristique Pas assurée

Exacte numérique

Exacte analytique

I.3.3.3 Stratégies temps réel à base d’optimisation

Divers travaux ont été effectués dans le but de réaliser des stratégies à base d’optimisation pouvant être implantables et performantes en temps réels. Les stratégies à base d’optimisation temps réel sont sous-optimales. Par conséquent, l’objectif est de se rapprocher le plus possible de cet optimum global. Les stratégies à base d’optimisation temps réel doivent faire face à deux problématiques, la non connaissance des conditions de conduites a priori (prédiction) et l’implantation en temps réel (temps de calcul limité) qui doit être possible. Les approches présentées par la suite sont orientées autour de ces deux problématiques.

Commande prédictive

La commande prédictive de type MPC (Model-Predictive Control), consiste à estimer les conditions de conduite futures du véhicule, à partir du modèle du système sur un horizon de temps déterminé [Olaru 2005]. Ce type de commande a été utilisé dans plusieurs travaux sur les véhicules multi-sources [Gong 2008], [Hredzak 2014], [Santucci 2014]. Une comparaison de la commande de type MPC avec des stratégies à base de règles (filtrage, logique floue) a été réalisée dans [Song 2014] pour un VE batterie-SCs. Dans cette étude, la commande MPC s’est avérée moins performante que les stratégies à base de règles utilisées.

Adaptation de méthodes d’optimisation hors ligne pour le temps réel

Ce type de stratégie utilise les principes de méthodes de résolution hors ligne. Cependant, certains aspects sont adaptés pour le fonctionnement en temps réel. La méthode de l’Equivalent Consumption Minimisation (ECMS) est dérivée du PMP. Celle-ci consiste à minimiser une somme pondérée de puissances [Paganelli 2001], [Sciarretta 2007], [Guzzella 2013a]. L’ECMS a été utilisé dans plusieurs travaux sur les véhicules

multi-sources [García 2012], [Han 2014]. La méthode du λ-control est également dérivée du PMP. Elle consiste à adapter le paramètre clé de la méthode de résolution (multiplicateur de Lagrange), par l’intermédiaire d’une boucle d’asservissement [Delprat 2002b], [Kessels 2007], [Kessels 2008]. Le gros avantage des méthodes dérivées du PMP est leur applicabilité en temps réel (temps de calcul). La connaissance a priori des conditions de conduite est un aspect qui reste à l’étude, en dépit de certains éléments qui ont été développés pour faire face à cette problématique [Kermani 2009]. Plus de détails seront donnés Chapitre II sur l’ECMS et le λ-control par la suite, car ce sont les méthodes de résolution qui ont été utilisées dans le cadre des travaux relatif à cette thèse.

Synthèse d’une stratégie à base de règles à partir d’optimisation hors ligne

Plus récemment, des travaux ont été réalisés sur la synthèse de stratégies à base de règles, à partir de résultats obtenus hors ligne, avec des stratégies à base d’optimisation. Cela a notamment été réalisé par l’intermédiaire de la programmation dynamique [Chen 2014], [Song 2015b], [Berkel 2015], [Horrein 2015b], [Zhang 2015]. Dans ces travaux, l’idée était de définir des règles à partir des résultats obtenues avec la programmation dynamique. Une autre approche consiste à définir une base de connaissances à partir d’une méthode d’optimisation hors ligne. Cette base de connaissances peut être développée par l’utilisation de réseaux de neurones. Les réseaux de neurones reproduisent les résultats correspondant aux situations proches de celles rencontrées lors de la phase d’apprentissage. Ce principe a été notamment développé dans [Scordia 2004].

Stratégies « hybrides »

Les stratégies « hybrides » consistent à utiliser les deux approches (règles et optimisation) en parallèle. Par exemple, dans [Trovão 2013] et [Trovão 2015c], une stratégie à base de règle a été utilisée afin de réduire l’espace de recherche de solutions d’une méthode de résolution de type méta-heuristique. Cela a permis d’une part de réduire le temps de calcul nécessaire à la stratégie, et d’autre part de prendre en compte les contraintes du problème de manière aisée. Une stratégie à base de règles a donc été utilisée en tant qu’aide à la synthèse d’une stratégie à base d’optimisation. Des travaux sur l’idée de stratégies hybrides ont été réalisés au L2EP. Dans une application véhicule hybride parallèle, certains éléments ont été gérés par l’intermédiaire de la programmation dynamique et d’autres par des règles [Horrein 2015b].