Critère régularisé - COMMANDE PRÉDICTIVE - Efficacité énergétique des bâtiments : modélisation

COMMANDE PRÉDICTIVE

3.4.1 Critère régularisé

Il est proposé d’envisager un critère régularisé tel que :

𝐽_𝜆,Ω^(uz,xz,s) = (1 − 𝜆)·𝐽mpc^(uz,xz,s) + 𝜆 ·Ω (uz) (3.9) où 𝐽mpc^(uz,xz,s)est défini par (3.4) et 0 ≤ 𝜆 ≤ 1 est un hyperparamètre de régularisation. Le rôle du terme supplémentaire 𝜆·Ω(uz) est de régulariser la solution. Dans le contexte du problème ci-dessus, 𝜆·Ω (uz)devrait être une pénalité en faveur de la parcimonie de la dérivée première de uz.

La définition proposée pour Ω(uz) est basée sur la méthode de régularisation de Ti-khonov [Gen17]. Elle consiste à inclure un opérateur linéaire R, et à résoudre le problème suivant :

u^∗𝜆,𝑝 =arg min

uz∈R𝑛u

(1 − 𝜆)·𝐽mpc^(uz,xz,s) + 𝜆 · kR·u_zkmin(1,𝑝)

𝑝 (3.10)

où k · k𝑝 est la norme ℓ𝑝 définie par kwk𝑝 := 𝑛w ∑︁ 𝑖=1 |𝑤𝑖|𝑝 1 𝑝

pour tout vecteur w ∈ R𝑛w. La puissance min(1, 𝑝) du terme de régularisation kR·uzkmin(1,𝑝)

𝑝 permet de considérer par continuité la norme ℓ∞de R·uzpour 𝑝 → ∞ :

lim 𝑝→∞kR·uzkmin(1,𝑝) 𝑝 = lim 𝑝→∞ ∑︁ 𝑖 (R·uz)_𝑖 𝑝 1 𝑝×1 = kR·uzk_∞ (3.11) et la norme ℓ₀de R·uzpour 𝑝 → 0 :

lim 𝑝→0^kR·u^z^k min(1,𝑝) 𝑝 = lim 𝑝→0 ∑︁ 𝑖 (R·uz)_𝑖 𝑝 1 𝑝×𝑝 = kR·uzk0 (3.12) L’équation (3.12) est particulièrement intéressante car théoriquement, la parcimonie de R·uzest mesurée à l’aide de la norme ℓ0, qui correspond au nombre total d’éléments non nuls de R·uz:

kR·uzk0 ⁼# (𝑖| (R·uz)_𝑖 ≠0) (3.13) La transformation linéaire R peut prendre différentes formes :

— La régularisation d’ordre zéro qui favorise les solutions avec une norme ℓ𝑝 faible de uz:

R = R0 =I (3.14) — La régularisation de premier ordre qui favorise les solutions uz avec de petites

différences entre éléments adjacents :

R = R1 =             −1 1 0 0 0 0 0 0 −1 1             (3.15)

On note que par cette définition de R, le produit R·uzreprésente une discrétisation de la dérivée première du vecteur uz.

3.4.2 Pénalisationℓ

Il existe différents types de fonctions de pénalité [Gen21]. La régression de Ridge correspond à une pénalité de norme ℓ2. Comme le montre l’illustration simple ci-dessous, cette fonction n’annule pas les coefficients de R·uz mais les réduit à 0. Il s’agit d’un "rétrécissement" (shrinkage) des coefficients. La régression Lasso introduite par Tibshirani [Gen42] est une régression qui pénalise la norme ℓ1des coefficients de R·uz, ce qui favorise la parcimonie. Le Fused-Lasso est une variante qui prend en compte la spatialité des variables [Gen43]. L’objectif est d’avoir des estimations proches pour la même variable lorsqu’elles sont "proches dans le temps". Cela peut être fait en pénalisant la norme ℓ1de la différence de cette variable à deux instants consécutifs.

Une pénalisation plus naturelle que kR·uzk1est de considérer une contrainte kR·uzk𝜖 𝜖

(avec 0 ≤ 𝜖 1) qui non seulement rétrécit la valeur des différents éléments de R·uz

mais grâce à la forme des isolignes de kR·uzk𝜖

𝜖 force certains éléments de (R·uz)_𝑖 à être strictement à zéro pour 𝜆 assez grand. À titre d’illustration, nous considérons le problème d’optimisation :

u^∗_𝜆,𝑝 =arg min

𝐽_𝜆,𝑝(u) =arg min

(1 − 𝜆)·𝐽1_{(u) + 𝜆 · kuk}min(1,𝑝)

𝑝 (3.16) avec 𝐽¹(u) = (𝑢₁−2 + 𝑢2⁾²^{+ (𝑢}2⁻0.5)².

D’abord, nous constatons que ∀𝑝 ≥ 0, nous avons :        u^∗_0,𝑝 = 1.5 0.5𝑇 =arg min u 𝐽1_(u) u^∗_1,𝑝 = 0 0𝑇 =arg min u kuk^min(1,𝑝)𝑝

Entre ces deux extrêmes u∗ 0,𝑝et u∗

1,𝑝, la trajectoire Γ𝜆,𝑝paramétrée en 𝜆 suivie par le point optimal u∗

𝜆,𝑝 dans le plan 𝑢1− 𝑢2est représentée en rouge sur la figure 3.1. Les ellipsoïdes représentées en blanc sur ces figures sont des courbes isocritères de 𝐽¹(u). Quant au fond coloré, il représente en continu la valeur de kuk^min(1,𝑝)𝑝 en fonction de 𝑢1et 𝑢2. La forme des isocritères associés, qui dépend de la norme ℓ𝑝 choisie pour le terme de régularisation, est la même que la forme des contours apparaissant en projection de la surface tridimensionnelle kuk^min(1,𝑝)𝑝 sur la figure 3.2 pour différentes valeurs de 𝑝. Par conséquent, selon la valeur de 𝑝, la forme de la trajectoire Γ𝜆,𝑝 est très différente, comme on peut le voir sur chacune des sous-figures 3.1a-3.1h.

La régression Lasso (cf. Fig. 3.1c) offre une solution plus parcimonieuse que la régression Ridge (cf. Fig. 3.1b), qui tend à rendre les coefficients très faibles sans les annuler. Plus généralement, pour 𝑝 > 1, la trajectoire Γ𝜆,𝑝 tend vers u∗

1,𝑝 à mesure que 𝜆 augmente mais n’est pas "attirée" par les axes 𝑢₁ =0 et 𝑢₂=0. En revanche, dès que 𝑝 ≤ 1, on observe que la convergence vers u∗

1,𝑝 se fait selon l’un des axes 𝑢1 =0 ou 𝑢2 =0. Dans ce cas (𝑝 ≤ 1), il est important de noter la différence de résultats entre un terme de régularisation en norme ℓ_𝜖 et en norme ℓ₁. Dans cet exemple, il apparaît que l’axe d’attraction peut être différent (𝑢1 = 0 pour la norme ℓ1 (cf. Fig. 3.1c) vs. 𝑢2 = 0 pour la norme ℓ𝜖 (cf. Fig. 3.1d-3.1h)). Compte tenu de la forme des isocritères 𝐽¹(u), la solution privilégiée (dans le sens d’une

(a) 𝑝 −→ ∞ (b) 𝑝 = 2

(e) 𝑝 = 0.6 (f) 𝑝 = 0.4

(g) 𝑝 = 0.2 (h) 𝑝 = 0

Figure 3.1 – Trajectoire Γ𝜆,𝑝 (en rouge) paramétrée en 𝜆 suivie par u∗

(a) 𝑝 −→ ∞ (b) 𝑝 = 2

(e) 𝑝 = 0.4 (f) 𝑝 = 0.1

Figure 3.2 – Tracé des isocritères et de la surface tridimensionnelle de kuk𝑝^min(1,𝑝)dans le plan 𝑢1^{− 𝑢}2.

minimisation du critère 𝐽1(u)) est celle associée à 𝑝 = 𝜖 :          𝐽1_(u∗ 𝜆∗_,1^{) =} 2.25 avec u∗ 𝜆∗_,1 ⁼arg min u|𝑢1=0 𝐽_𝜆,1^(u) 𝐽1_(u∗ 𝜆∗_,0^{) =} 0.25 avec u∗ 𝜆∗_,0 ⁼arg min u|𝑢2=0 𝐽_𝜆,0^(u) (3.17)

Cette remarque est particulièrement intéressante car elle prouve que dans certains cas, la solution parcimonieuse u∗

𝜆∗_,1associée à la sélection Lasso n’est pas la meilleure solution parcimonieuse par rapport au critère non régularisé. En revanche, au sens du même critère, la solution parcimonieuse associée à la norme ℓ0 est la solution optimale. L’article récent [Gen23] confirme cette constatation. En effet, les auteurs ont montré que la solution au problème de l’approximation de bas rang d’une matrice par un terme de régularisation en norme nucléaire (généralisant au cas matriciel la norme ℓ1d’un vecteur) peut être très différente du problème original, et que l’utilisation de relaxations non convexes peut réduire cet écart.

Dans la suite de ce paragraphe, l’effet de 𝑝 sur la trajectoire Γ𝜆,𝑝est analysé précisément en fonction de la forme des isocritères kuzkmin(1,𝑝)

𝑝 qui apparaissent pour différentes valeurs de 𝑝 dans la figure 3.2. À cette fin, il est d’abord utile de reformuler la minimisation de la fonction 𝐽𝜆,Ω^(uz)(3.10) comme un problème d’optimisation sous contrainte, ce qui est équivalent lorsque la fonction 𝐽𝜆,Ω^(uz)est convexe :

       u^∗∗_𝛽,𝑝 =arg min uz∈R𝑛u 𝐽mpc^(uz,xz,s) subject to kR·uzkmin(1,𝑝)

𝑝 ≤ 𝛽

(3.18) Dans ce cas, (3.10) peut être interprété comme la forme lagrangienne équivalente du problème d’optimisation (3.18). Si la fonction d’objectifs 𝐽_mpc(uz,xz,s) est convexe et le terme de régularisation kR·uzkmin(1,𝑝)

𝑝 est en norme ℓ𝑝 avec 𝑝 ≥ 1 alors la solution des problèmes (3.10) et (3.18) est la même, comme nous le verrons plus tard. La relation exacte entre 𝛽 (3.18) et 𝜆 (3.10) est alors dépendante des données.

La figure 3.3 donne une interprétation géométrique de la solution du problème d’op-timisation (3.18) de l’exemple donné ci-dessus (3.16), défini par une fonction d’objectifs 𝐽1_(u) fortement convexe. Cela souligne l’intérêt de la norme ℓ𝜖 par rapport à la norme ℓ_𝑝 avec 𝑝 > 1. Pour un 𝛽 donné, les courbes de niveau pointillées rouges délimitent la zone du plan 𝑢1 ^{− 𝑢}2 centrée sur l’origine satisfaisant la condition kuk^min(1,𝑝)𝑝 ≤ 𝛽. La solution u∗∗

𝛽,𝑝 du problème d’optimisation (3.18) représente les coordonnées du point (𝑢1, 𝑢2) associé à la valeur minimale de 𝐽¹(u) et appartenant à la zone délimitée par l’isocritère kuk^min(1,𝑝)𝑝 = 𝛽. Les points optimaux u∗∗

𝛽,𝑝 associés à huit isocritères différents sont indiqués par des points rouges sur chaque sous-graphe. En changeant continuellement 𝛽 dans l’inter-valleh0, u^∗_0,𝑝 min(1,𝑝)

𝑝 i , la trajectoire Γ𝛽,𝑝paramétrée en 𝛽 suivie par le point optimal u∗∗ 𝛽,𝑝 est représentée en noir dans le plan 𝑢1^{− 𝑢}2. L’analyse de la forme des isocritères de kuk𝑝^min(1,𝑝)

près des axes 𝑢₁ = 0 et 𝑢₂ = 0 peut expliquer la "force d’attraction" de ces axes pour la trajectoire Γ𝛽,𝑝 quand 𝑝 ≤ 1. On peut d’abord remarquer que l’angle d’intersection entre les isocritères et les axes est égal à 𝜋/2, quel que soit 𝑝 > 1. En revanche, pour 0 ≤ 𝑝 ≤ 1, il devient inférieur ou égal à 𝜋/4. Cette caractéristique conduit à une modification de la forme de la surface tridimensionnelle de kuk^min(1,𝑝)𝑝 (cf. Fig. 3.2), qui présente un "pli" au niveau des axes dès que 𝑝 ≤ 1. Cette différence locale dans la forme des isocritères est un facteur déterminant de la force d’attraction des axes en fonction de 𝑝.

Le lien entre les trajectoires Γ𝜆,𝑝 et Γ𝛽,𝑝 est facile à voir sur les figures 3.1 et 3.3. Tout d’abord, on observe que ces trajectoires sont strictement identiques dans les cas où 𝑝 = 1, 2 et +∞. Plus généralement, ces trajectoires sont similaires quel que soit 𝑝 ≥1 mais sont

(a) 𝑝 −→ ∞ (b) 𝑝 = 2

Figure 3.3 – Trajectoire Γ𝛽,𝑝 (en noir) paramétrée en 𝛽 suivie par u∗∗

𝛽,𝑝dans le plan 𝑢1^{− 𝑢}2. différentes dans le cas contraire, comme on peut l’observer pour la valeur spécifique 𝑝 = 0, 2 avec les figures 3.3d (Γ𝛽,𝑝) et 3.1g (Γ𝜆,𝑝). Cependant, on peut noter le résultat suivant, qui a été démontré dans [Gen39] :

Γ𝜆,𝑝 ⊆ Γ𝛽,𝑝 (3.19) Il ressort clairement de cette étude que seuls les termes de régularisation définis selon la norme ℓ𝑝 avec 𝑝 ≤ 1 ont des capacités parcimonieuses. Cependant, la solution régularisée peut varier en fonction de la valeur de 𝑝. Même si l’utilisation de la régression Lasso (norme ℓ1) favorise une solution parcimonieuse, celle obtenue en considérant une norme ℓ_𝜖 peut conduire à une solution différente qui, du point de vue de la fonction d’objectifs 𝐽mpc^(uz,xz,s), est plus intéressante.

Malgré cet intérêt notable, l’inconvénient d’un terme de régularisation représenté par une norme ℓ𝜖 est qu’il n’est pas convexe et conduit à un problème d’optimisation NP-difficile. Cette non-convexité est caractérisée par des discontinuités dans la trajectoire Γ𝜆,𝑝, qui apparaissent lorsque 𝑝 est inférieur à 1 (cf. Fig. 3.1d-3.1h). Toutefois, étant donné que la minimisation de la fonction d’objectifs économique 𝐽mpc^(uz,xz,s)associée au modèle à temps variant (3.3) nécessite déjà la mise en œuvre d’un algorithme de résolution dédié, le terme de régularisation non convexe ne complique pas davantage la résolution. La section 3.6 propose une méthode numérique pour estimer la solution optimale du problème d’optimisation globale (3.10) sous sa forme non convexe (𝑝 = 𝜖). Dans ce contexte, il est important de prêter attention à l’article récent [Gen23], qui promeut l’application des relaxations non convexes en comparant différentes fonctions de relaxation. Les résultats expérimentaux montrent que les relaxations non convexes offrent généralement de nombreux avantages

par rapport aux relaxations convexes.

3.5 Confort hygrothermique dans les bâtiments

multi-zones

Dans le document Efficacité énergétique des bâtiments : modélisation hygrothermique et commande prédictive économique régularisée (Page 87-93)