La plupart des contrôleurs classiques sont des systèmes dynamiques (le plus souvent nu- mériques) conçus pour garantir un asservissement à une consigne et une régulation face aux diverses perturbations. Cependant, ils ne peuvent pas anticiper l’évolution des besoins ni des conditions météorologiques. La commande prédictive est une stratégie de contrôle anticipatif fondée sur la théorie de la commande optimale, qui permet de minimiser un critère de per- formance à partir d’un modèle dynamique et d’une prédiction de ses entrées. Les premiers
algorithmes de commande prédictive ont été développés en 1978 par [Richalet et al., 1978]
puis généralisés par [Clarke et al., 1987], et intégrés depuis lors sur de nombreuses applica-
tions industrielles. Ces algorithmes se trouvent généralement dans la littérature anglophone sous le nom de MPC (Model Predictive Control algorithms), et se basent sur la réalisation
Model Definition Model Calibration Optimal control Estimation MPC Control Measurements Measurements
Offline Process Online Process
Figure1.7 – Principe de la commande prédictive
Étapes « hors ligne » :
• Construction du modèle : Au préalable, il est nécessaire de concevoir un modèle dynamique du système que l’on cherche à piloter. Ce modèle peut être conçu à partir d’une analyse fine des propriétés physiques du système (équations différentielles) ou être plus empirique (modèle statistique, réseau de neurones).
• Calibration du modèle : Dès lors que l’on connaît la structure mathématique de notre modèle, il est essentiel de s’assurer que sa réponse est proche de la réalité. Une étape de calibration, reposant sur des mesures in situ, est alors nécessaire pour trouver le bon paramétrage. Cette calibration peut être réitérée plusieurs fois au cours du cycle de vie du bâtiment.
Étapes « en ligne » : Une fois que l’on dispose d’un modèle représentant suffisamment
bien le système piloté, ce dernier est utilisé dans des étapes successives de calcul de commande
optimale et d’estimation d’état [Maciejowski, 2002].
• La phase de commande optimale vise à calculer une loi de commande minimisant un critère donné sur un horizon de temps futur (horizon de prédiction). Un problème de
contrôle optimal se formule généralement comme un problème d’optimisation [Trélat,
2008] : uopt = argmin u ∈ Utf J (tf, u) ˙x (t) = f (t, x (t) , u (t)) , x (t0) = x0 u ∈ Utf, t ∈ [t0, tf] J (tf, u) = ˆ tf t=t0 c (t, xu(t) , u (t)) dt + g (tf, xu(tf)) u ∈ Utf ϕi(u, xu) ≤ 0 u ∈ Utf (1.1)
On cherche à trouver une loi de commande u appartenant à l’espace des commandes
admissibles Utf (c’est-à-dire l’espace des commandes pour lesquelles la trajectoire x (t) est
définie sur l’horizon de prédiction [t0, tf]), minimisant une fonction de coût J associée, et
respectant les fonctions de contraintes ϕi. Cette fonction de coût dépend du modèle utilisé,
et des objectifs de contrôle. Un cas particulier courant consiste à considérer c comme l’écart entre la trajectoire d’une commande u et une trajectoire de consigne, et g comme l’écart pondéré entre la valeur finale de la trajectoire et la valeur finale désirée. Dans le cas d’un bâtiment, c peut être la somme pondérée d’un critère de confort thermique et de la consom- mation énergétique globale. La résolution de ce type de problème d’optimisation a donné
lieu à des développements mathématiques spécifiques, tels que le principe du maximum de
Pontryagin [Pontryagin, 1987], la théorie de la programmation dynamique [Bellman, 1963]
ou encore la théorie du contrôle optimal pour des systèmes gouvernés par des équations aux
dérivées partielles [Lions, 1971].
• La phase d’estimation d’état permet d’introduire une boucle de rétroaction dans le processus de contrôle. La commande optimale est en effet une commande de type « boucle ouverte » qui suppose de connaître parfaitement à l’avance le comportement
du système, l’évolution de ses sollicitations, et ses conditions initiales x0. Ceci est
malheureusement impossible en pratique : même en supposant les conditions initiales parfaitement connues, l’accumulation d’erreurs de modèle et de prédiction des solli- citations vont détériorer la pertinence de la commande avec le temps. L’usage d’ob- servateurs d’état (observateur de Luenberger, filtre de Kalman..) permet à l’aide de
mesures d’estimer les conditions initiales du système avant un calcul de commande
optimale. Estimer régulièrement l’état du système permet alors de recalculer réguliè- rement la commande optimale et d’absorber ainsi les perturbations et autres erreurs de prédiction.
L’imbrication de ces phases peut se résumer par le schéma suivant (figure 1.8) :
Estimation
Optimal control
Figure1.8 – Commande prédictive : horizon de prédiction
A chaque instant tk, on réalise une estimation d’état à partir des mesures précédentes et
de la connaissance des lois de commande précédemment appliquées. En prenant l’état estimé comme condition initiale, on calcule alors une loi de commande optimale sur un horizon de
prédiction [tk, tk+ tf]. Cette commande est appliquée jusqu’à la nouvelle estimation d’état
à l’instant tk+1 < tk+ tf.
L’introduction de la commande prédictive dans le secteur du bâtiment s’avère très pro- metteuse pour générer des économies d’énergie. En formulant le problème de contrôle comme un problème d’optimisation portant sur la maximisation du confort et la minimisation des dépenses, on peut espérer tirer meilleur parti des sources d’énergies passives (gains solaire, énergie dégagée par les occupants) et/ou naturelles (flux d’énergie extraits par les pompes à chaleur, panneaux solaires...) et des systèmes de stockage (batteries, ballons thermiques, matériaux à changement de phase) qu’avec des systèmes de régulation classique (contrôleur
PID). L’étude [Privara et al., 2010] par exemple, annonce des gains énergétiques d’environ 20% par rapport à un contrôleur boucle ouverte compensé par la température extérieure
durant une période hivernale. Les travaux de [Lamoudi, 2012] sur la commande prédictive
distribuée laissent également espérer entre 5% et 20% de gains énergétiques. Ces ordres de
grandeur se retrouvent régulièrement dans la littérature ([Mantovani et Ferrarini, 2015,Ha-
zyuk, 2011]).
Cependant, dans le cadre du bâtiment, le déploiement du contrôle prédictif est rendu difficile par deux principaux obstacles techniques :
• L’obtention d’un modèle dynamique du bâtiment est une tâche complexe. Les logiciels de simulation thermique du bâtiment (EnergyPlus, Comfie Pléiades, TRNSYS...) per- mettent de construire de tels modèles (de type multizone-nodal), mais nécessitent de connaître parfaitement sa géométrie, les propriétés thermiques exactes de ses matériaux et la prédiction des entrées dont la connaissance est souvent entachée d’incertitudes [Spitz, 2012, Macdonald et Clarke, 2007, Macdonald, 2002, Merheb, 2013]. Ceci rend dans de nombreux cas l’estimation de la performance énergétique d’un bâtiment difficile [Norford et al., 1994, Bordass et Associates, 2004].
• Il est également difficile de prédire l’évolution des sollicitations thermiques du bâtiment. Si les services météo permettent de prédire l’évolution des conditions extérieures, leur
fiabilité reste limitée [Tracton et Kalnay, 1993, Murphy, 1993, Murphy, 1977]. La pré-
diction des conditions d’usage (impact des occupants, génération de gains internes, ouverture de fenêtres...) est encore plus complexe à obtenir et a un fort impact sur la
thermique [Nguyen et Aiello, 2013].
Face à de telles incertitudes, il devient complexe de garantir la performance réelle d’une stratégie de contrôle prédictif. Les étapes de calibration et d’estimation d’état sont donc cruciales pour obtenir une commande prédictive fiable. Comme ces étapes font appel à des données de mesure in situ, concevoir le système d’instrumentation adéquat est une tâche ayant un impact certain sur la performance de la commande prédictive. Utiliser des réseaux de capteurs sans fil disséminés dans le bâtiment ouvre alors des opportunités en matière de calibration de modèle et d’estimation d’état, et peuvent donc être un levier potentiel à la démocratisation de stratégies de contrôle prédictif en contribuant à la réduction des erreurs de calcul de commande optimale.