Commande prédictive et instrumentation - De l'instrumentation au contrôle optimal prédictif pou

La plupart des contrôleurs classiques sont des systèmes dynamiques (le plus souvent nu- mériques) conçus pour garantir un asservissement à une consigne et une régulation face aux diverses perturbations. Cependant, ils ne peuvent pas anticiper l’évolution des besoins ni des conditions météorologiques. La commande prédictive est une stratégie de contrôle anticipatif fondée sur la théorie de la commande optimale, qui permet de minimiser un critère de performance à partir d’un modèle dynamique et d’une prédiction de ses entrées. Les premiers

algorithmes de commande prédictive ont été développés en 1978 par [Richalet et al., 1978]

puis généralisés par [Clarke et al., 1987], et intégrés depuis lors sur de nombreuses applica-

tions industrielles. Ces algorithmes se trouvent généralement dans la littérature anglophone sous le nom de MPC (Model Predictive Control algorithms), et se basent sur la réalisation

Model Definition Model Calibration Optimal control Estimation MPC Control Measurements Measurements

Oﬄine Process Online Process

Figure_{1.7 – Principe de la commande prédictive}

Étapes « hors ligne » :

• Construction du modèle : Au préalable, il est nécessaire de concevoir un modèle dynamique du système que l’on cherche à piloter. Ce modèle peut être conçu à partir d’une analyse ﬁne des propriétés physiques du système (équations diﬀérentielles) ou être plus empirique (modèle statistique, réseau de neurones).

• Calibration du modèle : Dès lors que l’on connaît la structure mathématique de notre modèle, il est essentiel de s’assurer que sa réponse est proche de la réalité. Une étape de calibration, reposant sur des mesures in situ, est alors nécessaire pour trouver le bon paramétrage. Cette calibration peut être réitérée plusieurs fois au cours du cycle de vie du bâtiment.

Étapes « en ligne » : Une fois que l’on dispose d’un modèle représentant suﬃsamment

bien le système piloté, ce dernier est utilisé dans des étapes successives de calcul de commande

optimale et d’estimation d’état [Maciejowski, 2002].

• La phase de commande optimale vise à calculer une loi de commande minimisant un critère donné sur un horizon de temps futur (horizon de prédiction). Un problème de

contrôle optimal se formule généralement comme un problème d’optimisation [Trélat,

2008] :                uopt = argmin u ∈ Utf J (tf, u) ˙x (t) = f (t, x (t) , u (t)) , x (t0) = x0 u ∈ Utf, t ∈ [t0, tf] J (tf, u) = ˆ tf t=t0 c (t, xu(t) , u (t)) dt + g (tf, xu(tf)) u ∈ Utf ϕi(u, xu) ≤ 0 u ∈ Utf (1.1)

On cherche à trouver une loi de commande u appartenant à l’espace des commandes

admissibles Utf (c’est-à-dire l’espace des commandes pour lesquelles la trajectoire x (t) est

déﬁnie sur l’horizon de prédiction [t0, tf]), minimisant une fonction de coût J associée, et

respectant les fonctions de contraintes ϕi. Cette fonction de coût dépend du modèle utilisé,

et des objectifs de contrôle. Un cas particulier courant consiste à considérer c comme l’écart entre la trajectoire d’une commande u et une trajectoire de consigne, et g comme l’écart pondéré entre la valeur ﬁnale de la trajectoire et la valeur ﬁnale désirée. Dans le cas d’un bâtiment, c peut être la somme pondérée d’un critère de confort thermique et de la consom- mation énergétique globale. La résolution de ce type de problème d’optimisation a donné

lieu à des développements mathématiques spéciﬁques, tels que le principe du maximum de

Pontryagin [Pontryagin, 1987], la théorie de la programmation dynamique [Bellman, 1963]

ou encore la théorie du contrôle optimal pour des systèmes gouvernés par des équations aux

dérivées partielles [Lions, 1971].

• La phase d’estimation d’état permet d’introduire une boucle de rétroaction dans le processus de contrôle. La commande optimale est en eﬀet une commande de type « boucle ouverte » qui suppose de connaître parfaitement à l’avance le comportement

du système, l’évolution de ses sollicitations, et ses conditions initiales x0. Ceci est

malheureusement impossible en pratique : même en supposant les conditions initiales parfaitement connues, l’accumulation d’erreurs de modèle et de prédiction des sollicitations vont détériorer la pertinence de la commande avec le temps. L’usage d’ob- servateurs d’état (observateur de Luenberger, ﬁltre de Kalman..) permet à l’aide de

mesures d’estimer les conditions initiales du système avant un calcul de commande

optimale. Estimer régulièrement l’état du système permet alors de recalculer réguliè- rement la commande optimale et d’absorber ainsi les perturbations et autres erreurs de prédiction.

L’imbrication de ces phases peut se résumer par le schéma suivant (ﬁgure 1.8) :

Estimation

Optimal control

Figure_{1.8 – Commande prédictive : horizon de prédiction}

A chaque instant tk, on réalise une estimation d’état à partir des mesures précédentes et

de la connaissance des lois de commande précédemment appliquées. En prenant l’état estimé comme condition initiale, on calcule alors une loi de commande optimale sur un horizon de

prédiction [tk, tk+ tf]. Cette commande est appliquée jusqu’à la nouvelle estimation d’état

à l’instant tk+1 < tk+ tf.

L’introduction de la commande prédictive dans le secteur du bâtiment s’avère très pro- metteuse pour générer des économies d’énergie. En formulant le problème de contrôle comme un problème d’optimisation portant sur la maximisation du confort et la minimisation des dépenses, on peut espérer tirer meilleur parti des sources d’énergies passives (gains solaire, énergie dégagée par les occupants) et/ou naturelles (ﬂux d’énergie extraits par les pompes à chaleur, panneaux solaires...) et des systèmes de stockage (batteries, ballons thermiques, matériaux à changement de phase) qu’avec des systèmes de régulation classique (contrôleur

PID). L’étude [Privara et al., 2010] par exemple, annonce des gains énergétiques d’environ 20% par rapport à un contrôleur boucle ouverte compensé par la température extérieure

durant une période hivernale. Les travaux de [Lamoudi, 2012] sur la commande prédictive

distribuée laissent également espérer entre 5% et 20% de gains énergétiques. Ces ordres de

grandeur se retrouvent régulièrement dans la littérature ([Mantovani et Ferrarini, 2015,Ha-

zyuk, 2011]).

Cependant, dans le cadre du bâtiment, le déploiement du contrôle prédictif est rendu diﬃcile par deux principaux obstacles techniques :

• L’obtention d’un modèle dynamique du bâtiment est une tâche complexe. Les logiciels de simulation thermique du bâtiment (EnergyPlus, Comﬁe Pléiades, TRNSYS...) permettent de construire de tels modèles (de type multizone-nodal), mais nécessitent de connaître parfaitement sa géométrie, les propriétés thermiques exactes de ses matériaux et la prédiction des entrées dont la connaissance est souvent entachée d’incertitudes [Spitz, 2012, Macdonald et Clarke, 2007, Macdonald, 2002, Merheb, 2013]. Ceci rend dans de nombreux cas l’estimation de la performance énergétique d’un bâtiment diﬃcile [Norford et al., 1994, Bordass et Associates, 2004].

• Il est également diﬃcile de prédire l’évolution des sollicitations thermiques du bâtiment. Si les services météo permettent de prédire l’évolution des conditions extérieures, leur

ﬁabilité reste limitée [Tracton et Kalnay, 1993, Murphy, 1993, Murphy, 1977]. La pré-

diction des conditions d’usage (impact des occupants, génération de gains internes, ouverture de fenêtres...) est encore plus complexe à obtenir et a un fort impact sur la

thermique [Nguyen et Aiello, 2013].

Face à de telles incertitudes, il devient complexe de garantir la performance réelle d’une stratégie de contrôle prédictif. Les étapes de calibration et d’estimation d’état sont donc cruciales pour obtenir une commande prédictive ﬁable. Comme ces étapes font appel à des données de mesure in situ, concevoir le système d’instrumentation adéquat est une tâche ayant un impact certain sur la performance de la commande prédictive. Utiliser des réseaux de capteurs sans ﬁl disséminés dans le bâtiment ouvre alors des opportunités en matière de calibration de modèle et d’estimation d’état, et peuvent donc être un levier potentiel à la démocratisation de stratégies de contrôle prédictif en contribuant à la réduction des erreurs de calcul de commande optimale.

Dans le document De l'instrumentation au contrôle optimal prédictif pour la performance énergétique du bâtiment (Page 33-36)