• Aucun résultat trouvé

CHAPITRE 2 LA GESTION ÉNERGÉTIQUE DES VÉHICULES HYBRIDES : UNE

2.4 Contrôle optimal

Le but ultime d’une stratégie de contrôle d’un véhicule hybride étant de minimiser la consommation de carburant, plusieurs auteurs ont préféré faire appel à des méthodes d’optimisation. Qu’il s’agisse d’un outil de conception ou d’une méthode de contrôle directe, le problème d’optimisation consiste principalement à minimiser une fonction d’objectif (cost function) qui définit la consommation de carburant du véhicule. Notamment, ce problème d’optimisation a été abordé selon trois approches distinctes; la Programmation Dynamique Déterministe ou Stochastique (PDD ou PDS) et la minimisation instantanée de la consommation.

2.4.1 Optimisation par Programmation Dynamique Déterministe (PDD)

La PDD est une optimisation globale effectuée sur un horizon fini, c'est-à-dire que le parcours du véhicule (ou profil de vitesse) est connu a priori. Le résultat est un vecteur de commande qui dicte la puissance des éléments pour chaque intervalle de temps selon certaines variables d’état et qui permet de minimiser la consommation de carburant pour le parcours à l’étude. Il est généralement reconnu et il a été démontré par simulation numérique que cette méthode procure les meilleurs économies de carburant pour un problème donné (Brahma, Guezennec et Rizzoni, 2000; Delprat, Guerra et Rimaux, 2002; Jeon, Lee et Park, 2003; Lin, 2004; Lin et al., 2001; Lin et al., 2002; Oh et al., 2007; Wu et al., 2004). Par contre, l’utilisation d’une optimisation globale pour la gestion d’un véhicule hybride en temps réel est une option peu réaliste. En effet, cette méthode est basée sur une hypothèse fondamentale, soit que le parcours futur du véhicule est connu. Pour que l’optimisation globale sur un horizon fini soit possible en temps réel, il faudrait donc faire appel à une méthode exacte de prédiction du parcours futur du véhicule, ce qui est pratiquement impossible. De plus, ces problèmes d’optimisation sont souvent trop lourds pour être résolus en-ligne par un ordinateur de bord. Malgré cela, l’optimisation globale est souvent retenue et ce pour deux utilités. Premièrement, elle sert à établir une consommation minimale de référence pour comparer le potentiel de différentes solutions de contrôle mieux adaptées à l’utilisation en-ligne. Deuxièmement, les résultats de l’optimisation globale peuvent être utilisés comme guide de conception pour élaborer des règles quasi-optimales de contrôle (Kleimaier et Schroder, 2000; Lin, 2004; Lin et al., 2001; Lin et al., 2002; Wu et al., 2004). Comme il est illustré à la Figure 2.2, il s’agit alors d’appliquer la politique de contrôle optimale à un modèle de simulation et d’analyser le comportement du véhicule hybride et le dosage entre les puissances du MCI et d’appoint. L’avantage de cette méthode est que le concepteur peut s’inspirer du comportement idéal pour établir les règles de contrôle.

Trajet standard ou mesuré

Programmation dynamique déterministique

Politique de contrôle optimale

Simulation

Économie de carburant, Réponse du véhicule

Déduction de règles de contrôle

Stratégie de contrôle à base de règles Procédure d’optimisation

Figure 2.2 Élaboration de règles de contrôle basé sur l’optimisation par programmation dynamique déterministe

(Traduite de Lin, 2004)

2.4.2 Optimisation par Programmation Dynamique Stochastique (PDS)

Les limitations de la PDD ont mené d’autres chercheurs à opter pour la Programmation Dynamique Stochastique à horizon infini (PDS) pour le contrôle de véhicules hybrides (Kim, 2007; Kim et al., 2005; Lin, 2004; Lin, Huei et Grizzle, 2004; Lin et al., 2006; Tate, 2007). Au lieu de considérer les demandes en puissance comme étant connues a priori, celles-ci sont modélisées par un processus dynamique stochastique. Une chaîne de Markov se sert de statistiques, ou probabilités de transitions, comme celles de la Figure 2.3 pour estimer la demande de puissance future à partir des états actuels. Ces probabilités de transitions sont normalement produites à partir de cycles d’utilisation standards ou mesurés. Le résultat de la PDS est une politique, ou surface, de contrôle statique (non dépendante du temps) comme celle de la Figure 2.4.

Figure 2.3 Exemple d’un modèle stochastique de conducteur (Tirée de Lin, Huei et Grizzle, 2004)

Figure 2.4 Exemple d’une surface de contrôle résultante de la programmation dynamique stochastique

(Tirée de Lin, Huei et Grizzle, 2004)

2.4.3 Minimisation instantanée de la consommation de carburant

Paganelli et al. (Paganelli et al., 2001) ont formulé un problème d’optimisation qui vise à minimiser une fonction d’objectif instantanée qui est la somme de la consommation de

carburant du MCI et d’une consommation équivalente due à l’utilisation de l’énergie en réserve dans l’accumulateur (Equivalent Consumption Minimisation Strategy ECMS). Ils ont utilisé les spécifications techniques des composants (limites et efficacités) et ont déterminé la distribution optimale de puissance (MCI vs MG) pour toutes les combinaisons possibles de conditions d’utilisation (puissance et vitesse demandées). Ils ont effectué ces calculs hors-ligne et ont pu ainsi obtenir une cartographie trois dimensions, facilement implantable en temps réel. En plus de cette cartographie, ils ont ajouté dans la fonction d’objectif un facteur de correction pénalisant toutes décisions éloignant l’état de charge actuel de l’accumulateur à la valeur cible. Ce facteur de correction étant non-linéaire, la correction devient de plus en plus sévère avec l’augmentation de l’écart entre l’état de charge actuel de l’accumulateur et cette valeur cible.

Similairement, Paganelli et al. (Lin, 2004; Paganelli et al., 2002) ont proposé une fonction d’objectif qui minimise l’utilisation du MCI pour répondre aux demandes instantanées du conducteur. Pour éviter la décision évidente de n’utiliser que la puissance d’appoint jusqu’à épuisement de l’accumulateur, une stratégie de maintient de la charge est également adoptée. Cette stratégie consiste à ajouter une consommation équivalente dans la fonction d’objectif. Ainsi, la décharge de l’accumulateur se traduit par une consommation équivalente positive (l’accumulateur devra éventuellement être rechargé) alors que la recharge de l’accumulateur équivaut à une consommation équivalente négative (l’énergie emmagasinée permettra ultérieurement de diminuer l’utilisation du MCI). Le calcul des consommations équivalentes se fait en temps réel (comparativement à une cartographie pour le cas précédent). Des efficacités moyennes pour le MCI et les composants du système hybride sont utilisées pour fin de simplification.

Documents relatifs