HAL Id: tel-01790637
https://hal.archives-ouvertes.fr/tel-01790637
Submitted on 13 May 2018HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Contrôle optimal des systèmes semi-linéaires
Nihale El Boukhari
To cite this version:
Nihale El Boukhari. Contrôle optimal des systèmes semi-linéaires. Optimisation et contrôle [math.OC]. Faculté des Sciences de Meknès, 2017. Français. �tel-01790637�
THESE
Présentée par :
Nihale EL BOUKHARI
En vue de l’obtention de Doctorat en Mathématiques
Spécialité : Contrôle optimal
«Contrôle optimal des systèmes semi-linéaires»
Soutenue le 21 octobre 2017 devant le jury composé de :
Mr. Abdelhaq EL JAI Professeur Emérite, Université de Perpignan,
France Président et rapporteur
Mr. Larbi BERRAHMOUNE PES, Ecole Normale Supérieure, Rabat Rapporteur
Mme Karima ZTOT PES, Faculté des Sciences, Meknès Rapporteur
Mr. Ali BOUTOULOUT PES, Faculté des Sciences, Meknès Examinateur
Mr. El Houssine AZROUL PES, Faculté des Sciences Dhar El Mahraz, Fès Examinateur
Mr. Mohamed OUZAHRA PH, Ecole Normale Supérieure, Fès Examinateur
Remerciements
Je tiens à exprimer ma profonde gratitude au directeur de ma thèse, Monsieur El Has-san ZERRIK. Je le remercie pour sa confiance, sa disponibilité, et ses précieux conseils.
Préparer la thèse sous sa direction a été pour moi une expérience très enrichissante, tant sur le plan scientifique que sur le plan humain. J’ai été particulièrement inspirée par son esprit organisé, son énergie, et ses qualités de leadership.
J’adresse mes profonds remerciements à Monsieur Abdelhaq ELJAI, Professeur
Emé-rite à l’Université de Perpignan, pour avoir accepté de juger ce travail, et pour m’avoir fait l’honneur de présider le jury de cette thèse.
Mes vifs remerciements vont également à Monsieur Larbi BERRAHMOUNE,
Profes-seur à l’Ecole Normale Supérieure de Rabat, et à Madame Karima ZTOT, Professeur à la
Faculté des Sciences de Meknès, pour avoir accepté de juger ce travail, et pour avoir bien voulu siéger dans ce jury. Qu’ils trouvent ici l’expression de ma profonde reconnaissance. Je souhaite exprimer ma sincère gratitude à Monsieur Ali BOUTOULOUT, Professeur
à la Faculté des Sciences de Meknès, pour avoir accepté d’examiner cette thèse et de faire partie de son jury. En sa qualité de chef du laboratoire « Modélisation Analyse et Contrôle des Systèmes » (MACS), je le remercie également pour sa disponibilité et son soutien aux chercheurs du laboratoire.
Que Messieurs El Houssine AZROUL, Professeur à la Faculté des Sciences Dhar El Mahraz de Fès, et Mohamed OUZAHRA, Professeur à l’Ecole Normale Supérieure de Fès, soient sincèrement remerciés pour avoir accepté d’examiner cette thèse, et pour avoir bien voulu siéger dans son jury.
Je me dois de remercier vivement les professeurs du département de Mathématiques et Informatique, pour leur soutien et leur grande générosité. Je remercie également les membres du laboratoire MACS, ainsi que mes amis doctorants à la Faculté des Sciences de Meknès. Finalement, je dédie cette thèse à mes parents et à tous mes professeurs de mathématiques.
Table des matières
Notations . . . 3
Introduction 5 1 Préliminaires 17 1.1 C0 semi-groupes . . . 17
1.2 Solutions des systèmes semi-linéaires . . . 23
1.3 Quelques résultats utiles . . . 25
1.4 Rappel sur la contrôlabilité et le contrôle optimal . . . 28
1.4.1 Contrôlabilité . . . 28
1.4.2 Contrôle optimal . . . 34
2 Problème du contrôle optimal des systèmes semi-linéaires 39 2.1 Formulation du problème . . . 39
2.2 Existence du contrôle optimal . . . 42
2.2.1 Cas où l’espace des contrôles est réflexif . . . 43
2.2.2 Cas où l’espace des contrôles n’est pas réflexif . . . 47
2.2.3 Exemples . . . 52
3 Caractérisation du contrôle optimal 57 3.1 Conditions générales d’optimalité . . . 57
3.2 Etude de cas particuliers . . . 66
3.2.1 Contrôles à valeurs dans R . . . 66
3.2.2 Contrôles à valeurs dans Lp(Ω) (2 ≤ p < ∞) . . . . 74
3.2.3 Contrôles à valeurs dans L∞(Ω) . . . 78
4 Unicité du contrôle optimal et algorithmes 81 4.1 Unicité du contrôle optimal . . . 81
4.2 Algorithmes . . . 87
4.2.1 Cas où U = R, U = Lp(Ω) (2 ≤ p < ∞) . . . . 87
5 Applications 95
5.1 Systèmes de dimension finie . . . 95
5.1.1 Modèle à compartiments de chimiothérapie . . . 95
5.1.2 Système de refroidissement . . . 101
5.1.3 Capteur solaire . . . 104
5.2 Systèmes de dimension infinie . . . 107
5.2.1 Equation de transport . . . 107
5.2.2 Equation d’onde . . . 109
5.2.3 Equations de la chaleur . . . 111
Notations
X, Y, U espaces de Banach X0 dual topologique de X
h., .iX0×X produit de dualité entre X et son dual
h., .iX produit scalaire (si X est un espace de Hilbert)
k.kX norme définie sur l’espace X
σ(X, X0) topologie faible sur X σ(X0, X) topologie faible ∗ sur X0 → convergence forte * convergence faible
∗
* convergence faible ∗
L(X, Y ) espace des opérateurs linéaires bornés de X dans Y L(X) algèbre des opérateurs linéaires bornés de X dans X
vect(H, G) espace des combinaisons linéaires finies des éléments de H, G ⊂ X I opérateur identité
A opérateur linéaire de X dans X A∗ adjoint de A
D(A) domaine de A ker A noyau de A ImA image de A
ρ(A) ensemble résolvant de A
tM transposée de la matrice M
rangM rang de la matrice M int(C) intérieur de l’ensemble C C adhérence de C
Ω domaine (ouvert connexe) de Rn, n ≥ 1 ∂Ω frontière de Ω
|Ω| mesure de Lebesgue de Ω
diam(Ω) diamètre de Ω : diam(Ω) = sup
x1,x2∈Ω
|x1− x2|
Lp(Ω) espace des fonctions p-sommable sur Ω, à valeurs dans R (1 ≤ p ≤ ∞)
h|ω restriction de h ∈ Lp(Ω) à un ouvert non-vide ω ⊂ Ω
D(Ω) espace des fonctions de classe C∞, à support compact sur Ω supp(h) support d’une fonction h ∈D(Ω)
Hk(Ω) espace de Sobolev d’ordre k : Hk(Ω) = Wk,2(Ω), où
Wk,2(Ω) = {y ∈ L2(Ω) : Dαy ∈ L2(Ω), ∀|α| ≤ k}
H1
∂y ∂xi
dérivée partielle de y ∈ Lp(Ω) par rapport à xi
∇ opérateur gradient ∇y = t ∂y ∂x1
, . . . , ∂y ∂xn
!
∆ opérateur Laplacien ∆y =
n X i=1 ∂2y ∂x2 i
Lp(0, T ; U ) espace des fonctions p -sommables sur ]0, T [, à valeurs dans U
˙
y dérivée temporelle de y ∈ Lp(0, T ; U ) : ˙y(t) = dy dt(t) p0 conjugué de p, donné par 1
p+ 1 p0 = 1
Lp0(0, T ; U0) dual topologique de Lp(0, T ; U ), pour p ∈ [1, +∞[
C([0, T ]; U ) espace des fonctions continues sur [0, T ], à valeurs dans U |a| valeur absolue du réel a
bac partie entière du réel a p.p. presque partout
Introduction
Un système dynamique est décrit par une équation qui modélise l’évolution d’une grandeur physique par rapport au temps, et qui est munie d’une donnée initiale. Un sys-tème dynamique est dit continu s’il met en jeu la dérivée temporelle de cette grandeur physique. Sa forme générale est donnée par :
˙ y(t) = F (t, y(t)) y(t0) = y0 (1)
Il est dit discret s’il décrit la variation de la grandeur physique sur un pas de temps. Sa forme générale est :
y(k + 1) = F (k, y(k)) y(k0) = y0 (2) Dans la suite, nous nous intéresserons exclusivement aux systèmes dynamiques continus. La grandeur physique y(t) s’appelle l’état du système à l’instant t, tandis que la fonction t 7→ y(t) s’appelle la trajectoire du système.
On suppose qu’à tout instant t ≥ t0, l’état y(t) appartient à un espace vectoriel X. Alors
X s’appelle l’espace d’état. Si X est de dimension finie, on dit que le système (1) est de dimension finie. Dans le cas contraire, (1) est dit un système de dimension infinie. (La même appelation est valable pour le système discret (2)).
Les systèmes de dimension finie sont décrits par des équations différentielles ordinaires, et modélisent des phénomènes physiques dits « localisés », tels le mouvement d’un solide ayant un nombre fini de degrés de libertés, la croissance d’une population quand la densité géographique n’est pas considére, etc.
Par ailleurs, les systèmes de dimension infinie modélisent des phénomènes « distribués », souvent décrits par des équations aux dérivées partielles (EDP), tels la conduction ther-mique dans une barre métallique, la vibration d’une corde tendue, la dynather-mique d’une population répartie sur une zone géographique, etc. Les systèmes de dimension infinie décrivent aussi des phénomènes qui ne mettent pas en jeu une distribution spatiale, tels les systèmes à retards, les systèmes stochastiques, etc.
L’application F : (t, y) 7→ F (t, y) s’appelle la dynamique du système. Si F ne dépend pas de t (c’est-à-dire F (t, y) = F (ˆt, y), ∀t, ˆt ≥ t0), le système est dit autonome, dans
ce cas on peut toujours supposer que t0 = 0. Dans le cas contraire, le système est dit
non-autonome.
On suppose maintenant qu’on peut agir sur le système (1) par une fonction u, alors le système devient :
˙
y(t) = F (t, y(t), u(t)) y(t0) = y0
(3) La fonction u s’appelle le contrôle. La notation u provient du mot «upravlenie» (se lit
« upravlenie ») qui signifie contrôle en russe.
L’espace vectoriel auquel appartient u(t) est noté U et s’appelle l’espace des contrôles. La nature de la dynamique F détermine la classe du système. Le système (3) est dit semi-linéaire si :
F (t, y(t), u(t)) = Ay(t) + f (t, u(t), y(t))
où A : X → X est un opérateur linéaire (continu ou non), et f : [t0, tf] × U × X → X
est une application continue, vérifiant certaines conditions de régularité.
En particulier, si f (t, u(t), y(t)) = Bu(t), avec B ∈ L(U, X), alors le système est li-néaire. Si les applications u 7→ f (t, u, y) et y 7→ f (t, u, y) sont linéaires, alors le système est bilinéaire.
Le choix du contrôle u est souvent restreint, à cause de la nature du système, ou de ressources limitées. Par exemple, si u(t) modélise la dose d’un médicament, alors u(t) ne peut pas être strictement négatif. Si u(t) modélise la puissance d’un engin, alors u(t) ne peut pas dépasser la puissance maximale de cet engin. Lorsque u(t) décrit le taux d’achat d’une marchandise, et v(t) est son prix unitaire,
Z tf
t0
v(s)u(s)ds ne doit pas dépasser le budget de la transaction sur l’intervalle de temps [t0, tf].
Dès lors, les contraintes sur le choix du contrôle sont modélisées par un ensemble de contrôles admissibles Uad. C’est l’ensemble des contrôles qu’on peut choisir pour les
im-plémenter au système (3).
Parmi les contrôles admissibles, on cherche le « meilleur » contrôle qui permet de réaliser un objectif précis, consistant souvent à atteindre un état désiré, ou à améliorer la performance du système. Cet objectif est modélisé par une fonction J , qui dépend du contrôle et de l’état associé : J (u) = L(u, y). Dans la littérature, la fonction J est appelée la fonction coût, le critère, ou l’indice de performance.
La recherche d’un contrôle optimal, réalisant l’objectif fixé, est formulé par une minimi-sation de la fonction J sur l’ensemble des contrôles admissibles Uad.
for-mulé comme suit :
min J (u) = L(u, y)
sous la contrainte u ∈ Uad, y est solution de (3)
(4)
La théorie du contrôle optimal est un outil mathématique puissant qui permet de ré-soudre de nombreux problèmes réels, dans les domaines d’ingénierie, de médecine, de dynamique des populations, ou de finance. Afin d’illustrer la motivation derrière cette théorie, considérons, à titre d’exemple, le modèle de croissance logistique d’une popula-tion animale, décrit par le système suivant :
˙ y(t) = a 1 −y(t) K ! y(t) − u(t) y(0) = y0 (5)
où y(t) représente la population totale, a est le taux de croissance, et u(t) représente la décroissance de la population due à la chasse.
Il est clair que le système (5) est de dimension finie, dont l’espace d’état est X = R. Si la population en question fait partie d’une espèce en danger de disparition, et qu’on veut maintenir la population au dessus d’un seuil ymin à un instant final T , tout en autorisant la
chasse à un niveau raisonnable, alors on peut réguler l’activité de la chasse en minimisant la fonction coût suivante :
J (u) = ymin− y(T ) − r
Z T
0
u(t)dt
sur l’ensemble des contrôles admissibles :
Uad = {u ∈ L∞(0, T ) : 0 ≤ u(t) ≤ umax}
où r est un coefficient de pondération positif. Si maintenant on prend en compte la distri-bution de la population sur un domaine spatial Ω, le modèle devient :
∂y ∂x(x, t) = c∆y(x, t) + a(x) 1 − y(x, t) K ! y(x, t) − u(x, t) Ω×]0, T [ ∂y ∂ν(x, t) = 0 ∂Ω×]0, T [ y(x, 0) = y0(x) Ω (6)
où y(x, t) représente la densité de la population au point x et à l’instant t, ∆y modélise le mouvement aléatoire de la population et c > 0 la vitesse de ce mouvement.
Par suite, l’optimisation de la chasse consiste à minimiser la fonction coût donnée par : J (u) = ymin− Z Ω y(x, T )dx − r Z T 0 Z Ω u(x, t)dxdt sur Uad = {u ∈ L∞(Ω×]0, T [) : 0 ≤ u(x, t) ≤ umax}
Le système distribué (6) est de dimension infinie. En effet, l’espace d’état doit être un espace fonctionnel. Le choix le plus commode de cet espace est X = L2(Ω).
Revenons au modèle localisé (5), et supposons maintenant que l’évolution de la popula-tion dépend du nombre total de l’espèce, mais avec un retard ρ. Alors le modèle devient :
˙ y(t) = a 1 −y(t − ρ) K ! y(t − ρ) − u(t) y(0) = y0; y(t) = ϕ(t), t ∈ [−ρ, 0[ (7)
Le système (7) est un système à retard, dont l’évolution de l’état est liée à un effet de mémoire. Même si le système (7) ne dépend pas d’une distribution spatiale, il est de di-mension infinie. En effet, l’espace d’état dans ce cas serait R × L2(−ρ, 0).
Certes, il est plus simple d’optimiser le système de dimension finie (5) que les systèmes de dimension infine (6) et (7), car ces derniers font appel à des outils mathématiques plus sophistiqués. Cependant, maintes situations montrent que les systèmes de dimension fi-nie sont inadaptés pour modéliser avec précision des phénomènes réels. Ceci explique les efforts considérables pour développer la théorie du contrôle optimal dans le cadre de la dimension infinie.
La théorie du contrôle optimal a vu le jour au début des années 1950, et a connu depuis un progrès vigoureux. Pour les systèmes de dimension finie, les premiers travaux sur le contrôle optimal se sont appuyés sur la théorie du calcul des variations : En 1949 et 1950, Hestenes [72, 73] a publié des rapports au sein de la RAND Corporation, dans lesquels il a étudié le problème du temps minimal en aéronautique. En se basant sur la condition de Weierstrass et l’équation d’Euler-Lagrange, il a formulé un principe du maximum dans le cadre des hypoyhèses du calcul des variations, anticipant ainsi le principe du maximum de Pontryagin. Son ouvrage [74], paru en 1966, est une compilation de ses rapports et ses conférences.
De même, Bellman s’est appuyé sur le calcul des variations pour développer la program-mation dynamique [11, 12] durant les années 1950. Cette méthode d’optimisation repose sur un principe d’optimalité qui met en jeu une fonction valeur. Cette dernière vérifie l’équation d’Hamilton-Jacobi-Bellman, une condition nécessaire d’optimalité déjà déve-loppée par Carathéodory en 1926 [113]. L’équation d’Hamilton-Jacobi-Bellman n’admet
pas de solutions classiques en général. Elle était donc une condition d’optimalité formelle jusqu’à 1983, où Crandall et P. L. Lions [40] ont introduit la notion de « solution de vis-cosité », ce qui a permis de résoudre cette équation.
Les travaux d’Isaacs [77, 78] s’inscrivent dans la même perspective : étant le précurseur de la théorie des jeux différentiels, il s’est inspiré du calcul des variations pour développer le tenet de transition, un principe d’optimalité qui généralise le principe d’optimalité de Bellman. Il a montré que la théorie des jeux différentiels est applicable aux problèmes du contrôle optimal.
En 1960, Kalman [79] a étudié le problème linéaire quadratique. En considérant un sys-tème linéaire de dimension finie, il a étudié le problème de minimisation d’une fonction coût quadratique, qu’il a appelé problème de régulation. En utilisant les techniques du calcul des variations, notamment l’équation d’Hamilton-Jacobi, Il a montré l’existence d’un unique contrôle optimal, et a caractérisé ce contrôle en fonction d’un opérateur, so-lution d’une équation de Riccati. Sous certaines conditions de stabilisabilité, il a montré que son approche est applicable au problème linéaire quadratique sur un horizon de temps infini. Les résultats de Kalman ont motivé un grand nombre de généralisations, citons par exemple les travaux de Wonham [126], Willems [125], Ho et al. [75], etc.
Parallèlement à ces travaux, Pontryagin et son équipe1 à l’Institut Steklov ont intro-duit, en 1956 [18], le principe du maximum, qui donne des conditions nécessaires d’opti-malité pour des systèmes non-linéaires. Le principe du maximum est applicable dans plu-sieurs situations, y compris les problèmes avec un état final libre, ou un état final fixé, ou les problèmes de temps minimal. C’est un outil puissant qui constitue un jalon important dans l’histoire de la théorie du contrôle optimal. Contrairement à Hestenes et Bellman, Pontryagin et al. n’ont pas utilisé les techniques du calcul des variations pour démon-trer le principe du maximum. Dans leur ouvrage [114] paru en 1961, ils ont établi une comparaison entre le principe du maximum et la programmation dynamique, mettant en évidence que le principe du maximum peut être dérivé de l’équation d’Hamilton-Jacobi-Bellman, mais ne requiert pas les hypothèses de différentiabilité sur cette équation, ces hypothèses étant très difficiles à réaliser en général. Ils ont également montré que le prin-cipe du maximum généralise le problème de Lagrange et la condition de Weierstrass dans le calcul des variations. Dans leur livre [114], une attention particulière a été accordée au problème du temps minimal pour les systèmes linéaires : ils ont caractérisé le contrôle optimal, établi son unicité et sa nature bang-bang, et montré que le nombre des temps de commutation (en anglais : swithching times) est strictement inférieur à la dimension du système. Ils ont ainsi généralisé les résultats de LaSalle, parus en 1959 [86].
Les travaux de Hestenes, Bellman, Kalman, et de Pontryagin et al. ont ouvert la voie à
l’apparition d’une nouvelle discipline en mathématiques, qui est la théorie du contrôle optimal. La majorité des travaux postérieurs, dans les cas de la dimension finie et de di-mension infinie, correspondent à des généralisations basées sur les approches introduites par ces auteurs.
Concernant la question de l’existence du contrôle optimal, Filippov [66] a montré, en 1959, l’existence d’un contrôle optimal pour une classe importante de systèmes non-linéaires, généralisant ainsi les résultats éparses sur l’existence, précédemment élaborés par Boltyankii et al. [18], Bellman et al. [13], Krasovskii [83], etc. Son travail a été géné-ralisé en 1965 par Cesari [31], qui a affaibli les hypothèses sur le système et la fonction coût. En 1961, Lee et Markus [89] ont montré l’existence d’un contrôle optimal pour des systèmes non-linéaires, linéaires en contrôle. Leur résultat a été généralisé en 1963 par Neustadt [106], qui a considéré un ensemble de contrôles admissibles non-convexe. Une autre généralisation a été établie en 1967 par Stoddart [121], qui a éliminé l’hypothèse sur la bornitude de l’ensemble des contrôles admissibles. En 1967, Lee et Markus ont publié un ouvrage [90] qui dresse l’état de l’art sur la théorie du contrôle optimal à l’époque, et qui est devenu une référence dans le domaine.
A l’aube de la décennie 1970-1980, la théorie du contrôle optimal avait déjà atteint un haut niveau de maturité. De nombreux ouvrages de contrôle optimal ont vu le jour. Ci-tons à titre d’exemple les livres de Balakrishnan [5], Brockett [22], Mohler [103], Neus-tadt [107], Ioffe et Tihomirov [76], etc.
Une généralisation intéressante du principe du maximum de Pontryagin a été formu-lée par Krasovskii [83], puis par Neustadt [105] dans un cadre plus général. Ce dernier a considéré le problème du temps minimal pour un système linéaire, avec une contrainte supplémentaire sur le contrôle. Il a éliminé cette contrainte en augmentant la dimension du système, et a caractérisé le contrôle optimal en appliquant le principe du maximum. En 1977, Krener [85] a établi une généralisation du principe du maximum, qu’il appelée « le principe du maximum d’ordre supérieur ». Ce principe généralisé donne une condi-tion nécessaire d’optimalité supplémentaire, portant sur les perturbacondi-tions du contrôle. En 1985, Bressan [20] a considéré un système linéaire en contrôle et, en suivant l’approche de Krener, a obtenu une version généralisée du principe du maximum, applicable aux contrôles bang-bang.
Concernant les conditions suffisantes d’optimalité, Boltyanskii [17] a formulé en 1966 deux conditions suffisantes : la première condition est basée sur la programmation dyna-mique, et la seconde prend la forme du principe du maximum de Pontryagin, moyennant certaines conditions de régularité. En 1984, Zeidan [131] a considéré un système non-linéaire avec un état final fixé, et a établi une condition suffisante d’optimalité basée sur
l’équation d’Hamilton-Jacobi, en mettant en relief le lien entre le problème du contrôle optimal et le calcul des variations. Son approche a été généralisée aux problèmes avec des contraintes mixtes, sur l’état et le contrôle, par la même auteur en 1994 [132], puis par Maurer et Pickenhain en 1995 [101].
Osmolovskii [108, 109] a établi en 1988 des conditions suffisantes d’optimalité pour un système non-linéaire avec des contraintes mixtes sur l’état et le contrôle. Il a défini une forme quadratique, et formulé une condition suffisante d’optimalité en fonction de la définie-positivité de cette forme. Il a appelé cette condition « le principe du maximum strict ». Son livre, coécrit avec Milyutin et publié en 1998 [102], offre un exposé détaillé de ses résultats. Il a généralisé ses travaux dans un ouvrage récent, paru en 2012 et coécrit avec Maurer [110]. Sorger [120] a également formulé en 1989 un condition suffisante d’optimalité locale sous la forme d’un principe de maximum généralisé, en ajoutant aux conditions du principe de Pontryagin une « condition de saut ».
En 1976, Clarke [34] a établi une version généralisée du principe du maximum de Pontryagin. En utilisant les outils de l’analyse non-lisse et les inclusions différentielles, il a considérablement affaibli les hypothèses sur le système et la fonction coût, et a for-mulé des conditions nécessaires d’optimalité en termes d’inclusions différentielles, qu’il a appelées par la suite le « principe du maximum non-lisse ». Il a ensuite généralisé ses résultats dans une série d’articles et de livres [33, 35, 36].
La contribution de Clarke est pionnière, dans la mesure où elle a ouvert la voie à une nouvelle école en contrôle optimal par l’analyse non-lisse. Son approche a inspiré de nombreux travaux remarquables, notamment ceux de Cannarsa et Frankowska [29], Led-zewicz et Schättler [88], Biswas et De Pinho [16], De Pinho et Kornienko [45], etc. Bref, le contrôle optimal des systèmes de dimension finie reste, à ce jour, un domaine de recherche très actif .
Par ailleurs, l’intérêt pour le contrôle optimal des systèmes de dimension infinie date de 1960, et doit son développement au progrès de l’analyse fonctionnelle durant la pre-mière moitié du 20ème siècle. En effet, le premier travail sur le sujet a été publié en 1960 par Butkovskiy et Lerner [27], où le principe du maximum de Pontryagin est généralisé à une classe de systèmes distribués décrits par des équations intégrales. Une série d’articles sur le sujet a été publiée par Butkovskiy entre 1961 et 1966 [23–25]. L’auteur a compilé ses travaux en 1965 dans un livre, dont la traduction anglaise est parue en 1969 [26]. Le principe du maximum a été également généralisé par Kharatishvili en 1961 [82] à des systèmes à retard ordinaires, et par Yu V. Egorov en 1962 dans [52], pour des sys-tèmes linéaires évoluant dans un espace de Banach abstrait. Maintes généralisations ont été établies depuis, notamment par A. I. Egorov [51], Russell [117], Friedman [69], Fat-torini [62], etc.
En 1964 Wang et Tung ont publié leur article pionnier [124], dans lequel ils ont introduit les concepts de contrôlabilité et d’observabilité pour les systèmes linéaires distribués. Ils ont également formulé le problème du contrôle optimal, obtenu des conditions d’optima-lité en se basant sur le principe du maximum de Pontryagin, et discuté l’approximation des systèmes distribués par des systèmes localisés en utilisant une discrétisation spatiale. En 1964, Sakawa [118] a considéré une équation de la chaleur linéaire avec un contrôle frontière et une fonction coût quadratique. Il a obtenu des conditions d’optimalité sous la forme d’une équation intégrale de Fredholm, et donné des conditions pour que le contrôle optimal soit bang-bang ou continu.
Fattorini [61] a considéré en 1964 le problème du contrôle en temps minimal dans un es-pace de Hilbert. Il a montré que le contrôle optimal est unique et de type bang-bang, mais il n’a pas caractérisé ce contrôle. Son travail est une généralisation de celui de Bellman et al. [13]. En 1965, Balakrishnan [4] a étudié le contrôle optimal des systèmes linéaires évoluant dans un espace de Banach réflexif. Il a montré l’existence du contrôle optimal minimisant une fonction coût convexe, et caractérisé ce contrôle en construisant une équa-tion de type Riccati. L’auteur a également considéré le problème du temps minimal pour des systèmes linéaires évoluant dans un espace de Hilbert, avec un état initial nul. Contrai-rement à Fattorini [61], il a construit une suite qui converge vers un contrôle optimal, mais n’a pas montré que ce contrôle est de type bang-bang. Friedman [68] a également étudié le problème du temps minimal et a montré l’unicité du contrôle optimal.
Les travaux de J. L. Lions figurent parmi les contributions les plus remarquables en termes de contrôle des systèmes distribués. Son ouvrage monumental [96], paru en 1968, met le point sur le contrôle optimal des systèmes linéaires distribués : En considérant une fonction coût coercive et un ensemble convexe fermé de contrôles admissibles, il a étudié séparément les systèmes elliptiques, paraboliques et hyperbolique. Pour chaque classe de systèmes, il a montré l’existence d’un contrôle optimal, et donné des conditions nécessaires et suffisantes d’optimalité, pour les cas de contrôles internes et frontière. Il a également analysé le problème de temps minimal. Son exposé met en relief le lien entre ses méthodes et les approches existantes, telles le principe du maximum de Pontryagin, ou le calcul des variations.
Concernant les problèmes linéaires quadratiques en dimension infinie, Krasovskii [84] a considéré, en 1962, un système à retard linéaire, et a minimisé une fonction quadratique sur un horizon de temps infini, en s’appuyant sur la méthode de Luapunov. A l’opposé de Krasovskii, de nombreux auteurs ont adopté l’approche de Kalman, basée sur l’équation de Riccati, notamment Erzberger et Kim [58, 59] et Alvarado et Mukundan [3], pour des classes particulières de systèmes distibués. En 1969, Lukes et Russell [100] ont généralisé cette approche à des systèmes linéaires avec un opérateur de contrôle non-borné, vérifiant
certaines conditions. Parallèlement, Lions [96] a généralisé le problème linéaire quadra-tique aux systèmes paraboliques, en considérant les deux cas d’horizon fini et infini. Peu de temps après, Datko [44] a obtenu des résultats similaires à ceux de Lukes et Russell, mais sans avoir introduit une équation de Riccati. Son travail a été généralisé par Curtain et Pritchard [41] aux systèmes avec des opérateurs variables dans le temps. En 1972, Del-four et Mitter [47] ont étudié le problème linéaire quadratique pour des systèmes à retard. Leur approche est différente de celle de Krasovskii et suit la démarche de Kalman. Ils ont généralisé leurs résultats en 1975 [46] au cas de l’horizon infini. En 1976 Zabczyk [130] a étudié l’existence et l’unicité de la solution de l’équation de Riccati, relativement à un problème linéaire quadratique sur un horizon infini. Moyennant des conditions sur les opérateurs du système et de la fonction coût, il a montré l’équivalence entre l’existence et l’unicité de cette solution et la contrôlabilité exacte du système. En 1987, Salamon [119] a étudié le problème linéaire quadratique pour des systèmes avec un opérateur de contrôle strictement non-borné. Il a réécrit le système sous la forme d’un système à bord (en an-glais : boundary control system ou BCS ) et, en utilisant la théorie de perturbation des semi-groupes, a montré que le système est bien posé. Il a caractérisé le contrôle optimal en introduisant une équation de Riccati généralisée. Les résultats de Salamon sont plus généraux que ceux de Lukes et Russell, qui considèrent une classe restreinte d’opérateurs non-bornés. Le problème linéaire quadratique a été généralisé au cas de contrôles bornés par Balakrishnan [6]. Finalement, l’approche de Kalman a été généralisée aux systèmes bilinéaires par Banks et Yu [9] et El Alami [55], qui ont caractérisé le contrôle optimal en introduisant une équation de Riccati modifiée.
De nombreux auteurs ont tenté de généraliser le principe du maximum aux systèmes de dimension infinie. Or, en 1963, Yu V. Egorov [53] a montré que le principe du maxi-mum peut être faux en dimension infinie et a donné un contre-exemple. Ce qui explique le fait que beaucoup de généralisations se sont axées sur le problème du temps mini-mal des systèmes linéaires [4, 38, 62, 69], ou sur les systèmes sans contraintes sur l’état final [27, 104, 115, 124]. En particulier, Barbu [10] a considéré une classe de systèmes distribués semi-linéaires non-lisses, et sans contraintes sur l’état final. En étudiant sépa-rémént les systèmes elliptiques et paraboliques, il a introduit la méthode de pénalisation, qui consiste à approcher le problème non-lisse pare une famille de problèmes d’optimisa-tion lisses, pour obtenir un principe de maximum non-lisse, mettant en jeu des inclusions différentielles. Tiba [123] a généralisé les résultats de Barbu aux systèmes hyperboliques non-lisses. Le principe du maximum, relatif au problème du temps minimal, a été gé-néralisé aux systèmes semi-linéaires par Yao [127], puis par Yong [128] dans un cadre plus général. Des conditions d’optimalité de type Pontryagin ont été établis par Addou et Benbrik [1], et plus récemment par Clérin [37], pour des systèmes bilinéaires avec un opérateur de contôle non-borné.
Pour les systèmes avec des contraintes sur l’état final, la généralisation du principe du maximum est plus délicate, et nécessite des hypothèses supplémentaires. En 1967, A. I. Egorov [51] a généralisé le principe du maximum à une classe de systèmes parabo-liques et hyperboparabo-liques, dont l’état final vérifie un nombre fini d’équations. En 1985, Li et Yao [92] ont considéré un système semi-linéaire sur un espace de Banach, et ont mon-tré que le principe du maximum est vérifié si l’ensemble cible -auquel l’état final doit appartenir- est de co-dimension finie. En 1987, Fattorini [63] a considéré une classe de systèmes non-linéaires sur un espace de Hilbert, et a obtenu une version du principe de maximum par le principe variationnel d’Ekeland. Il a montré qu’en dimension infinie, le principe du maximum est vérifié si l’ensemble des états atteignables du système linéarisé est de co-dimension finie. Frankowska [67] a considéré, en 1990, un système semi-linéaire non-lisse avec des contraintes sur l’état final, et a dérivé un principe du maximum pour une fonction coût dépendant uniquement de l’état initial et de l’état final. Li et Yong [93] ont considéré en 1991 un système semi-linéaire, dans un espace de Banach dont le dual est strictement convexe. En s’appuyant sur le principe variationnel d’Ekeland, ils ont montré que le principe du maximum est vérifié sous certaines hypothèses sur les états atteignables du système. Leurs résultats généralisent ceux de Fattorini. Leur ouvrage [94], paru en 1995, compile leurs résultats et ceux de Yao et Fattorini, et se base partiellement sur cer-tains résultats de Clarke. Quant aux systèmes avec des contraintes mixtes sur le contrôle et la trajectoire, le principe du maximum a été généralisé par Fattorini [64], Casas et al. [30], Yu [129], Zhang et Liu [138], etc.
Ainsi, nous avons donné un aperçu général sur l’évolution de la théorie du contrôle optimal. La liste des références citées ci-dessus n’est pas exhaustive. Il est clair que mal-gré le développement considérable de cette discipline, beaucoup de problèmes restent toujours ouverts, ce qui ouvre des horizons vers de nouveaux sujets de recherche.
L’objet de cette thèse est l’étude du problème du contrôle optimal pour une classe de systèmes semi-linéaires, où le terme linéaire dépend linéairement du contrôle, et non-linéairement de l’état. La classe de systèmes en question comprend les systèmes linéaires et bilinéaires, ainsi que les systèmes semi-linéaires étudiés dans [2]. Notre système peut modéliser une classe importante d’EDP semi-linéaires, paraboliques et hyperboliques. Nous supposons le long de la thèse que l’espace d’état est de dimension infinie. Sauf mention spéciale, les résultats développés restent tout de même vrais en dimension finie. Le problème du contrôle optimal considéré consiste à trouver un contrôle, qui minimise une fonction coût, sur un ensemble convexe fermé de contrôles admissibles. L’étude de ce problème comprend trois volets : l’existence d’un contrôle optimal, la caractérisation de ce contrôle, et son unicité. L’approche utilisée repose sur l’obtention d’une inégalité variationnelle, qui permettra d’établir des conditions nécessaires d’optimalité en fonction
de la géométrie de l’ensemble des contrôles admissibles. Ainsi, nous généralisons les ré-sultats de J. L. Lions [96] à une classe importante de systèmes semi-linéaires.
La thèse s’organise comme suit :
Le chapitre 1 rappelle des résultats classiques sur la théorie des semi-groupes, ainsi que les types de solutions des systèmes semi-linéaires, leur existence et unicité. Le cha-pitre fournit également un rappel succint sur la contrôlabilité et le contrôle optimal des systèmes dynamiques. Le lecteur intéressé trouvera un exposé plus détaillé dans les ou-vrages de Curtain et Zwart [43], Lions [98], Li et Yong [94], ou dans des articles divers, tels [8, 60, 139].
Le chapitre 2 concerne la formulation du problème et l’existence du contrôle optimal. Après avoir défini le système semi-linéaire et la fonction coût à minimiser, nous donnons des conditions suffisantes pour l’existence d’un contrôle optimal, pour différentes classes de systèmes, moyennant des conditions de compacité. Des exemples concrets sont don-nés, pour illustrer les résultats développés.
Le chapitre 3 est consacré à la caractérisation du contrôle optimal. Nous établissons une condition nécessaire d’optimalité sous la forme d’une inégalité variationnelle. Cette condition permet de caractériser le contrôle optimal pour plusieurs cas de contrôles admis-sibles. En particulier, pour certaines classes de contraintes, nous obtenons des conditions d’optimalité de type Pontryagin.
Dans le chapitre 4, nous formulons une condition suffisante, assurant l’unicité du contrôle optimal, lorsque l’espace des contrôles est un espace de Hilbert. Nous déve-loppons ensuite des algorithmes afin de calculer numériquement le contrôle optimal.
Le chapitre 5 illustre les résultats théoriques par des simulations de problèmes réels. Nous considérons trois systèmes de dimension finie, décrivant respectivement des mo-dèles de chimiothérapie, d’un système de refroidissement, et d’un capteur solaire. Nous considérons par la suite quatre systèmes de dimension infinie, décrits par des EDP semi-linéaires : une équation de transport, une équation d’onde, et deux équations de la chaleur. Enfin, nous terminons ce mémoire de thèse par une conclusion et quelques problèmes ouverts.
Chapitre 1
Préliminaires
Dans ce chapitre nous rappelons quelques notions et résultats classiques qui seront uti-lisés dans les chapitres suivants. Commençons d’abord par quelques rappels sur la théorie des semi-groupes.
1.1
C
0semi-groupes
Définition 1.1.1. Soit X un espace de Banach. On appelle C0 groupe (ou
semi-groupe fortement continu) une famille (S(t))t∈R+ d’opérateurs linéaires bornés de X
dansX, vérifiant :
i. S(t + s) = S(t)S(s), ∀t, s ∈ R+ ii. S(0) = I
iii. lim
t→0+kS(t)x − xkX = 0, ∀x ∈ X
Remarque 1.1.2. En général, la condition iii. n’entraîne pas lim
t→0+kS(t) − IkL(X) = 0,
comme le montre l’exemple suivant :
SoitX un espace de Hilbert séparable de dimension infinie. Soit (φn)n∈N∗ une base
or-thonormale deX. On définit le C0semi-groupe(S(t))t∈R+ par
S(t)x =
+∞
X
n=1
e−nthx, φniφn, ∀x ∈ X
Pour toutx ∈ X, la condition iii. est vérifiée :
En effet, le casx = 0 est trivial. Soit x 6= 0, et soit 0 < ε < kxk. Il existeN ∈ N∗tel que
+∞ X n=N +1 (e−nt− 1)2hx, φ ni2 1 2 ≤ +∞ X n=N +1 hx, φni2 1 2 < ε 2 . Commeε < kxk, il s’ensuit que
" N X n=1 hx, φni2 #12 ≥ √ 3 2 ε .
Soitt0 = − 1 N ln 1 − ε 2 " N X n=1 hx, φni2 #12 −1 .
Alors pour tout0 < t ≤ t0, on a
N X n=1 (e−nt− 1)2hx, φ ni2 ! 1 2 < ε 2. Par suitekS(t)x − xk < ε. Ce qui implique la condition iii. Pourtant, lim
t→0+kS(t) − IkL(X) 6= 0 : En effet, pour tout t > 0, si n ≥
$ ln 2 t % + 1 alors kS(t)φn− φnk = 1 − e−nt > 1 2 d’oùkS(t) − IkL(X)> 1 2, ∀t > 0.
Seuls les semi-groupes uniformément continus, dont le générateur infinitésimal est un opérateur borné, (voir la définition 1.1.3) vérifient la conditionkS(t) − IkL(X) = 0 (voir
le théorème 1.2, chapitre 1 de [112]).
Définition 1.1.3. Soit (S(t))t∈R+unC0semi-groupe. Le générateur infinitésimal de(S(t))t∈R+
est un opérateur linéaire non-borné défini par :
Ax = lim
t→0+
S(t)x − x
t (1.1)
Le domaine deA, noté D(A), est donné par
D(A) = {x ∈ X : lim
t→0+
S(t)x − x
t existe} (1.2)
Proposition 1.1.4. Tout C0 semi-groupe fortment continu possède un unique générateur
infinitésimal(A, D(A)).
Démonstration. Voir le théorème 1.4, chapitre II de [57]. Définition 1.1.5. Un C0semi-groupe(S(t))t∈R+ est dit :
– de contractions sikS(t)kL(X) ≤ 1, ∀t ≥ 0 ;
– compact siS(t) est un opérateur compact pour tout t > 0.
Le théorème suivant donne une condition nécessaire et suffisante pour qu’un opérateur A génère un semi-groupe de contractions.
Théorème 1.1.6 (Hille-Yosida). Un opérateur linéaire non-borné A génère un semi-groupe de contractions(S(t))t∈R+ si et seulement si :
ii. L’ensemble résolvant deA, donné par ρ(A) = {λ ∈ R : (λI − A)−1 ∈ L(X)}, contient]0, +∞[ et pour tout λ > 0 on a
k(λI − A)−1k ≤ 1 λ Démonstration. Voir le théorème 3.1, chapitre 1 de [112].
Le théorème suivant généralise celui de Hille-Yosida, et est applicable à un C0
semi-groupe quelconque.
Théorème 1.1.7 (Feller-Miyadera-Phillips). Un opérateur linéaire non-borné A génère unC0semi-groupe(S(t))t∈R+ si et seulement si :
i. A est fermé et D(A) = X
ii. Il existe M ≥ 1 et ω ∈ R, tels que l’ensemble résolvant ρ(A) de A contient ]ω, +∞[, et pour tout λ > ω on a
k(λI − A)−nk ≤ M
(λ − ω)n, n = 1, 2 . . .
Dans ce cas,(S(t))t∈R+ vérifiekS(t)k ≤ M eωt,∀t ≥ 0.
Démonstration. Voir le théorème 5.3, chapitre 1 de [112].
Corollaire 1.1.8. Pour tout x ∈ X, l’application t 7→ S(t)x est continue de R+dansX. La proposition suivante caractérise le lien entre l’adjoint d’un C0semi-groupe et celui
de son générateur infinitésimal.
Proposition 1.1.9. Soit X un espace de Banach réflexif. Soit (S(t))t∈R+ un C0
semi-groupe sur X et A son générateur infinitésimal. On note par S∗(t) l’adjoint de S(t), pour tout t ≥ 0. Alors (S∗(t))t∈R+ est un C0 semi-groupe sur X0, dont le générateur
infinitésimal estA∗, l’adjoint deA.
Démonstration. Voir le corollaire 10.6, chapitre 1 de [112].
Remarque 1.1.10. Lorsque X n’est pas réflexif, (S∗(t))t∈R+ est unC0semi-groupe
seule-ment sur D(A∗), l’adhérence de D(A∗) dans X0 (voir le théorème 10.4, chapitre 1 de
[112]).
Les propriétés suivantes sont des relations liant un C0 semi-goupe et son générateur
infinitésimal.
Proposition 1.1.11. Soit (S(t))t∈R+ unC0semi-groupe etA son générateur infinitésimal,
i. Pour toutx ∈ D(A) on a S(t)x ∈ D(A), AS(t)x = S(t)Ax et d
dtS(t)x = AS(t)x = S(t)Ax, ∀t ≥ 0
ii. Pour toust ≥ 0 et x ∈ X on a
Z t 0 S(s)xds ∈ D(A) et S(t)x − x = A Z t 0 S(s)xds iii. (λI − A)−1 = Z ∞ 0 e−λtS(t)dt, ∀λ ∈ ρ(A) iv. S(t)x = lim n→+∞ I − tA n −n x, ∀x ∈ X, ∀t ≥ 0
Démonstration. Pour i. et ii., voir le lemme II.1.3 de [57]. Pour iii. voir le théorème II.1.10 de [57]. Pour iv. voir le corollaire III.5.5 de [57].
La propriété i. montre que si x ∈ D(A), alors t 7→ S(t)x est une solution de l’équation d’évolution suivante : dy dt = Ay y(0) = x (1.3)
On montre même que t 7→ S(t)x est l’unique solution de l’équation (1.3), l’unicité dé-coule du théorème 1.2, chapitre 4 de [112].
Lorsque x ∈ D(A), t 7→ S(t)x s’appelle la solution forte de (1.3).
On note toutefois que S(t)x existe même si x /∈ D(A). Dans ce cas t 7→ S(t)x s’appelle une solution faible de (1.3). Cette solution n’est pas nécessairement fortement différen-tiable, dans le sens où lim
h→0+
y(t + h) − y(t)
h n’existe pas forcément. Mais elle « vérifie l’équation(1.3) dans un sens plus faible ». La différence entre solutions fortes et faibles sera élucidée dans la section 1.2. Nous terminons cette section par quelques exemples de C0 semi-groupes.
Exemple 1.1.12. Soit A un opérateur borné, alors A génère le C0semi-groupe donné par
S(t) = ∞ X n=0 (tA)n n! = e tA
Dans ce cas on aD(A) = X.
Exemple 1.1.13. On considère sur R l’équation de transport suivante
∂y ∂t(x, t) = ∂y ∂x(x, t) y(x, 0) = y0(x)
où y0 ∈ Lp(R), avec 1 ≤ p < ∞. En posant X = Lp(R) et A =
∂
W1,p(R), A génère le semi-groupe de translation donné par
[S(t)y](x) = y(x + t), ∀y ∈ Lp(R)
et la solution (forte ou faible selon le choix de y0) de l’équation de transport s’écrit
y(x, t) = [S(t)y0](x).
Exemple 1.1.14. On considère sur ]0, L[ l’équation de transport suivante
∂y ∂t(x, t) = ∂y ∂x(x, t) y(0, t) = y(L, t) y(x, 0) = y0(x) oùy0 ∈ L2(0, L). On pose X = L2(0, L) et A = ∂ ∂x avecD(A) = {y ∈ H 1(0, L) :
y(0) = y(L)}. Pour tout y ∈ L2(0, L), on définit zy : R → R par
zy(x) = y(x − L x L ) p.p. sur R où x L
désigne la partie entière de x
L. AlorsA génère le C0 semi-groupe donné par [S(t)y](x) = zy(x + t), ∀t ≥ 0, ∀y ∈ L2(0, L)
et la solution de l’équation de transport s’écrity(x, t) = [S(t)y0](x).
Exemple 1.1.15. On considère sur ]0, π[ l’équation de la chaleur suivante
∂y ∂t(x, t) = ∂2y ∂x2(x, t) y(0, t) = y(π, t) = 0 y(x, 0) = y0(x)
On suppose que y0 ∈ L2(0, π). En posant X = L2(0, π) et A =
∂2
∂x2 avec D(A) =
H2(0, π) ∩ H1
0(0, π), A génère le C0semi-groupe donné par
S(t)y =
∞
X
n=1
e−n2thy, φniL2(0,π)φn, ∀y ∈ L2(0, π)
oùφn(x) = sin(nx), (φn)n∈N∗ est la base de fonctions propres du Laplacien∆ =
∂2
∂x2,
avec les conditions aux limites de Dirichlet.
Exemple 1.1.16. On considère sur Rnl’équation de la chaleur suivante ∂y ∂t(x, t) = ∆y(x, t) y(x, 0) = y0(x)
oùy0 ∈ L2(Rn). En posant X = L2(Rn) et A = ∆ avec D(A) = H2(Rn), A génère le
C0 semi-groupe donné par
S(0) = I, [S(t)y](x) = 1 (4πt)n2
Z
Rn
e−|x−ξ|24t y(ξ)dξ, ∀t > 0, ∀y ∈ L2(Rn)
La solution de l’équation de la chaleur s’écrit doncy(x, t) = [S(t)y0](x).
Exemple 1.1.17. On considère sur R l’équation à retard suivante :
˙x(t) = x(t − ρ)
x(0) = x0, x(t) = ϕ(t), t ∈ [−ρ, 0[
oùρ > 0. Cette équation admet une solution unique, qui se définit par récurrence comme suit : x0(t) = x0+ Z t−ρ −ρ ϕ(s)ds, 0 ≤ t < ρ xk+1(t) = xk((k + 1)ρ) + Z t−ρ kρ xk(s)ds, (k + 1)ρ ≤ t < (k + 2)ρ
Ainsi la solution de l’équation à retard s’écrit :x(t) = xk(t), ∀t ∈ [kρ, (k + 1)ρ[.
On poseX = R × L2(−ρ, 0), et on définit la famille d’opérateurs (S(t))t∈R+ par
S(t) x0 ϕ(.) = x(t) x(t + .) , ∀ x0 ϕ ∈ X
oùx(.) est la solution de l’équation à retard relativement à x0 etϕ, définie ci-dessus.
Alors(S(t))t∈R+ est unC0semi-groupe, dont le générateur infinitésimal est donné par :
D(A) = x0 ϕ ∈ R × H1(−ρ, 0) : ϕ(0) = x0 A x0 ϕ = ϕ(−ρ) dϕ ds
D’autres exemples seront fournis au chapitre 5.
Remarque 1.1.18. Lorsque le système (1.3) décrit une équation aux dérivées partielles, le semi-groupe généré par l’opérateur différentielA dépend en général de la géométrie
du domaine spatial et des conditions aux bords. Des exemples intéressants se trouvent dans [28].
1.2
Solutions des systèmes semi-linéaires
On considère l’équation suivante
˙ y(t) = Ay(t) + f (t), t ∈ [0, T ] y(0) = y0 (1.4)
où A : D(A) ⊂ X → X génère un C0 semi-groupe (S(t))t∈R+ sur l’espace de Banach
X, f ∈ L1(0, T ; X) et y 0 ∈ X.
On introduit d’abord les définitions suivantes.
Définition 1.2.1 (Solution forte). y est une solution forte de (1.4) si i. y(t) ∈ D(A) p.p. sur [0, T ]
ii. y ∈ C1(0, T ; X), ce qui signifie que ˙y(t) ∈ X, ∀t ∈ [0, T ] et t 7→ ˙y(t) est continue iii. y vérifie y(0) = y0 ety(t) = Ay(t) + f (t) p.p. sur [0, T ]˙
Définition 1.2.2 (Solution faible). y est une solution faible (en anglais : weak solution) de(1.4) si
i. y ∈ C(0, T ; X)
ii. Pour toutz ∈ D(A∗), t 7→ hy(t), zi est absolument continue sur [0, T ] et
hy(0), zi = hy0, zi,
d
dthy(t), zi = hy(t), A
∗
zi + hf (t), zi p.p. sur[0, T ]
Définition 1.2.3 (Solution « mild »). y est une solution « mild » (en anglais : mild solution) de(1.4) si
i. y ∈ C(0, T ; X) ii. y(t) = S(t)y0+
Z t
0
S(t − s)f (s)ds, ∀t ∈ [0, T ]
Proposition 1.2.4 (Ball). y ∈ C([0, T ]; X) est une solution « mild » du système (1.4) si et seulement siy est une solution faible de (1.4).
Démonstration. Voir [7]. Remarques 1.2.5.
1. Toute solution forte est nécessairement faible, mais la réciproque est fausse en général. 2. Les définitions ci-dessus montrent que si y est une solution forte de (1.4), alors ˙y(t) existe dans X, pour tout t ∈ [0, T ], tandis que si y est une solution faible, alors ˙y(t) n’existe pas nécessairement dans X, mais peut être identifiée à une forme linéaire sur
l’espaceD(A∗).
3. Soity une solution faible de (1.4). Si y0 ∈ D(A) et f ∈ C1(0, T ; X), alors y est une
solution forte de(1.4) (Voir le corollaire 2.5, chapitre 4 de [112]). On considère maintenant le système semi-linéaire suivant
˙
y(t) = Ay(t) + f (t, y(t)), t ∈ [0, T ] y(0) = y0
(1.5)
où A : D(A) ⊂ X → X génère un C0 semi-groupe (S(t))t∈R+ sur l’espace de Banach
X, y0 ∈ X et f : [0, T ] × X → X vérifie les hypothèses suivantes :
i. Pour tout x ∈ X, f (., x) ∈ L1(0, T ; X).
ii. Il existe une fonction positive L ∈ L1(0, T ), telle que
kf (t, y) − f (t, ˆy)kX ≤ L(t)ky − ˆykX, ∀t ∈ [0, T ], ∀y, ˆy ∈ X
kf (t, 0)kX ≤ L(t), ∀t ∈ [0, T ]
(1.6)
Similairement à la définition 1.2.3, y ∈ C([0, T ]; X) est une solution « mild » de (1.5) si et seulement si y est solution de l’équation ci-dessous :
y(t) = S(t)y0+
Z t
0
S(t − s)f (s, y(s))ds (1.7)
On a alors le résultat suivant.
Proposition 1.2.6. Le système (1.5) admet une solution « mild » unique, donnée par (1.7). Démonstration. Voir la proposition 5.3, chapitre 2 de [94].
Corollaire 1.2.7. On considère le système semi-linéaire suivant :
˙
y(t) = Ay(t) + f (u(t), y(t)) ]0, T [ y(0) = y0 ∈ X
(1.8)
oùA : D(A) ⊂ X → X est le générateur infinitésimal d’un C0 semi-groupe(S(t))t∈R+
sur un espace de BanachX.
u ∈ Lp(0, T ; U ), où 1 ≤ p ≤ ∞ et U est un espace de Banach.
On suppose qu’il existek1, k2, k3, k4 ∈ R+ tels que, pour tous u ∈ U et y, z ∈ X, f
vérifie
kf (u, y) − f (u, z)kX ≤ (k1kukU + k2)ky − zkX
kf (u, 0)kX ≤ k3kukU+ k4
(1.9) Alors, le système(1.8) admet une solution « mild » unique, donnée par
y(t) = S(t)y0+
Z t
0
Démonstration. Il suffit d’appliquer la proposition 1.2.6, avec ˆf (t, y(t)) = f (u(t), y(t)) et L(t) = max[(k1ku(t)kU+ k2), (k3kukU+ k4)].
Définition 1.2.8. Soit A un opérateur non-borné et n ∈ ρ(A). Alors l’opérateur An =
nA(nI − A)−1est borné et s’appelle l’approximation de Yosida deA. Le résultat suivant sera utilisé dans le chapitre 3 :
Proposition 1.2.9. Soit y la solution de (1.7). Soit ynla solution de l’équation suivante :
yn(t) = Sn(t)y0+
Z t
0
Sn(t − s)f (s, yn(s))ds
où (Sn(t))t∈R+ est le C0 semi-groupe généré par An, l’approximation de Yosida de A
pourn ∈ ρ(A). Alors
lim
n→∞t∈[0,T ]sup kyn(t) − y(t)kX = 0
Démonstration. Voir la proposition 5.4, chapitre 2 de [94].
1.3
Quelques résultats utiles
Dans cette section nous rappelons quelques résultats d’intégration et d’analyse fonc-tionnelle, qui seront utilisés dans les chapitres à venir.
Lemme 1.3.1 (Gronwall). Soit ψ ∈ L1(0, T ; R) tel que ψ ≥ 0 p.p. sur [0, T ], et soit
K ≥ 0 une constante positive.
Soitφ ∈ C([0, T ]; R) une fonction continue vérifiant, pour tout t ≥ t0 ≥ 0,
φ(t) ≤ K + Z t t0 ψ(s)φ(s)ds Alors φ(t) ≤ K exp Z t t0 ψ(s)ds , ∀t ≥ t0
Définition 1.3.2. Soit X un espace topologique. Une fonction ϕ : X →] − ∞, +∞] est dite semi-continue inférieurement (s.c.i.) si, pour tout λ ∈ R, l’ensemble {x ∈ X : ϕ(x) ≤ λ} est fermé.
Proposition 1.3.3. Soit X un espace de Banach et ϕ : X →] − ∞, +∞] une fonction convexe et semi-continue inférieurement (s.c.i.). Alors,ϕ est s.c.i. pour la topologie faible σ(X, X0). En outre, si xn* x faiblement dans X, alors
Démonstration. Voir le corollaire III.8 de [21].
Théorème 1.3.4. Soient X et Y deux espaces de Banach et Λ : X → Y un opérateur li-néaire. AlorsΛ est continu en norme si et seulement si Λ est continu de X faible σ(X, X0) dansY faible σ(Y, Y0).
Démonstration. Voir le théorème III.9 de [21].
Proposition 1.3.5 ( [94]). Soit (S(t))t∈R+ un semi-groupe compact sur un espace de
Ba-nachX et 1 < p ≤ ∞. Soit (yn)n∈Nune suite dansLp(0, T ; X) telle que
yn* y faiblement dansLp(0, T ; X) Alors lim n→∞0≤t≤Tsup Z t 0 S(t − s)(yn(s) − y(s))ds X = 0
Démonstration. Voir le corollaire 3.3, chapitre 3 de [94].
Définition 1.3.6. Soit U un espace de Banach et R : U → R+une application. R est dite coercive sur U si, pour tout r ≥ 0, l’ensemble
Br = {u ∈ U : R(u) ≤ r}
est borné dansU .
Proposition 1.3.7. Soient p, q ∈ [1, +∞[ tels que1 p+
1
q ≤ 1. Soit X un espace de Banach etX0 son dual topologique.
Alors, pour tousy ∈ Lp(0, T ; X), z ∈ Lq(0, T ; X0), tels que
˙ y ∈ Lp(0, T ; X), ˙z ∈ Lq(0, T ; X0) on a Z T 0 h ˙z(s), y(s)iX0×Xds + Z T 0
hz(s), ˙y(s)iX0×Xds = hz(T ), y(T )iX0×X− hz(0), y(0)iX0×X
Démonstration. Voir la proposition 2.5.2 de [50].
Définition 1.3.8. Soit X un espace vectoriel. On dit qu’un sous-espace H de X est un hypersous-espace siH 6= X, et s’il existe x0 ∈ X tel que X = vect(H, x0).
En particulier, sif est une forme linéaire non-nulle sur X, alors f−1(0) est un hypersous-espace.
Proposition 1.3.9. Soit X un espace vectoriel et H ⊂ X un hypersous-espace. Soient x0 ∈ H et λ 6= 0. Alors il existe une unique forme linéaire f sur X, vérifiant/
i. f−1(0) = H ; ii. f (x0) = λ.
Démonstration. Voir le théorème 2, paragraphe 2, chapitre II de [80].
Le théorème suivant donne un critère de compacité d’un opérateur linéaire lorsque l’espace d’arrivée est séparable.
Théorème 1.3.10 ( [80]). Soit X un espace normé et Y un espace de Banach séparable. Pour qu’un opérateur linéaire continu Λ : X → Y soit compact, il est nécessaire et suffisant que l’opérateur adjointΛ∗ associe à toute suite(yn)nqui converge faiblement∗
vers 0 dansY0(σ(Y0, Y )) une suite (Λ∗yn)nconvergeant en norme vers 0 dansX0.
Démonstration. Voir le théorème 4, paragraphe 3, chapitre IX, de [80].
Les deux théorèmes ci-dessous caractérisent une classe importante d’opérateurs com-pacts sur des espaces fonctionnels.
Théorème 1.3.11 ( [80]). Soient p, q ∈ [1, +∞] et Ω, Ω0 deux domaines bornés. On définit l’opérateur intégralΛ : Lp(Ω) → Lq(Ω0) par
(Λy)(x) = Z Ω K(x, ξ)y(ξ)dξ, ∀x ∈ Ω0 Si le noyauK vérifie K ∈ Lr0(Ω0× Ω) où r = min(p, q0), 1 r + 1 r0 = 1, 1 q + 1 q0 = 1
alors l’opérateurΛ est compact.
Démonstration. Voir le théorème 2, paragraphe 3, chapitre XI de [80].
Théorème 1.3.12 ( [80]). Soient p, q ∈ [1, +∞] et Ω, Ω0 deux domaines bornés. On définit l’opérateur intégralΛ : Lp(Ω) → Lq(Ω0) par
(Λy)(x) =
Z
Ω
K(x, ξ)y(ξ)dξ, ∀x ∈ Ω0
On suppose que le noyauK vérifie
Z Ω |K(x, ξ)|rdξ 1r ≤ C1, ∀x ∈ Ω0 Z Ω0|K(x, ξ)| σdx 1 σ ≤ C2, ∀ξ ∈ Ω
oùr, σ ∈]0, +∞[.
Alors, pour que l’opérateurΛ soit compact, il suffit d’avoir
q ≥ p, q > σ, 1 − σ q
!
p0 < r
Démonstration. Voir le théorème 3, paragraphe 3, chapitre XI de [80].
1.4
Rappel sur la contrôlabilité et le contrôle optimal
Dans cette section nous rappelons quelques résultats classiques, portant sur la contrô-labilité et le contrôle optimal des systèmes semi-linéaires.
1.4.1
Contrôlabilité
On considère le système suivant :
˙
y(t) = Ay(t) + f (u(t), y(t)) ]0, T [ y(0) = y0 ∈ X
(1.11)
où A : D(A) ⊂ X → X est le générateur infinitésimal d’un C0 semi-groupe (S(t))t∈R+
sur l’espace de Banach X, on suppose que X est réflexif et séparable.
Le contrôle est u ∈ Lp(0, T ; U ) (1 < p < ∞), où U est l’espace de contrôle, un espace
de Banach réflexif.
Dans la suite on entend par solution du système la solution « mild » de (1.11), donnée par y(t) = S(t)y0+
Z t
0
S(t − s)f (u(s), y(s))ds
Pour tout contrôle u, la solution du système (1.11) sera notée yu(ou simplement y s’il n’y
a pas d’ambiguïté).
On introduit alors la définition suivante. Définition 1.4.1.
i. Le système(1.11) est dit exactement contrôlable dans X à l’instant T si ∀yd∈ X, ∃u ∈ Lp(0, T ; U ) : yu(T ) = yd
ii. Le système(1.11) est dit faiblement contrôlable dans X à l’instant T si ∀yd∈ X, ∀ε > 0, ∃u ∈ Lp(0, T ; U ) : kyu(T ) − ydkX ≤ ε
iii. Le système(1.11) est dit localement exactement contrôlable à l’instant T (au voisinage deS(T )y0) si
∃α > 0, ∀yd∈ X tel que kyd− S(T )y0kX < α, ∃u ∈ Lp(0, T ; R) : yu(T ) = yd
iv. Le système(1.11) est dit localement faiblement contrôlable à l’instant T (au voisinage deS(T )y0) si
∃α > 0, ∀yd∈ X tel que kyd− S(T )y0kX < α, ∀ε > 0,
∃u ∈ Lp
(0, T ; R) : kyu(T ) − ydkX ≤ ε
v. Le système(1.11) est dit exactement contrôlable à 0 à l’instant T si ∃u ∈ Lp(0, T ; U ) : y
u(T ) = 0
Systèmes bilinéaires
Après avoir introduit les définitions générales, nous rappelons des résultats sur la contrôlabilité des systèmes bilinéaires, dont la forme est donnée par :
˙
y(t) = Ay(t) + u(t)By(t), ]0, T [ y(0) = y0 ∈ X
(1.12)
où A est le générateur infinitésimal d’un C0 semi-groupe (S(t))t∈R+ sur un espace de
Banach X, le contrôle est u ∈ Lp(0, T ; R) (1 < p < ∞), et B ∈ L(X).
Les résultats ci-après concernent la contrôlabilité locale du système (1.12). Ils reposent sur la linéarisation de l’application u 7→ yuau voisinage de 0, et du théorème de l’inverse
local.
Proposition 1.4.2. On définit l’opérateur linéaire L : Lp(0, T ; R) → X par
Lu =
Z T
0
S(T − s)u(s)B(S(s)y0)ds
Alors le système(1.12) est localement exactement contrôlable à l’instant T , au voisinage deS(T )y0, si et seulement siImL = X (i.e. L est surjectif).
De même, le système(1.12) est localement faiblement contrôlable à l’instant T , au voisi-nage deS(T )y0, si et seulement siImL = X.
Démonstration. Voir le théorème 3.1 de [8].
de classeCk(k ≥ 1), vérifiant
kB(y)kX ≤ C + KkykX, ∀y ∈ X
Pour les systèmes bilinéaires de dimension finie, les notions de contrôlabilité lo-cale exacte et faible sont identiques. En effet, puisque ImL est un sous-espace de X, et dim X < ∞, alors ImL est un sous-espace fermé, ce qui entraîne ImL = ImL, donc ImL = X équivaut à ImL = X, d’où l’équivalence.
Lorsque dim X = n < ∞, les opératurs A et B sont des matrices n × n. Dans ce cas, la contrôlabilité locale du système (1.12) est caractérisée par le résultat suivant, dû à Lo-bry [99] et à Hermes [71].
Corollaire 1.4.4. On suppose que X = Rn. Si
rang{By0, [A, B]y0, [A, [A, B]]y0, . . .} = n
où[A, B] = AB − BA, alors le système (1.12) est localement contrôlable à l’instant T , au voisinage deS(T )y0.
Par ailleurs, si dim X = ∞, alors le système (1.12) ne peut pas être localement exacte-ment contrôlable, comme le montre la proposition suivante.
Proposition 1.4.5. On suppose que dim X = ∞, alors l’opérateur L n’est pas surjectif. Démonstration. On suppose que dim X = ∞. Pour montrer que L n’est pas surjectif, il suffit de montrer que L est compact.
Soit (zn)nune suite qui converge faiblement vers 0 dans X0. Pour tout s ∈ [0, T ], on a
(L∗zn)(s) = hzn, S(T − s)B(S(s)y0)iX0×X
Donc la convergence faible zn * 0 entraîne
lim
n→∞(L
∗
zn)(s) = 0, p.p. sur [0, T ]
(zn)nest bornée, donc il existe µ ∈ R+ tel que µ = sup kznkX0. En plus, il existe M ≥ 1
et ω ∈ R tels que kS(t)kL(X) ≤ M eωt, d’où
|L∗zn(s)| ≤ (M e|ω|T)2µkBkL(X)ky0kX, p.p. sur [0, T ]
Alors, d’après le théorème de la convergence dominée de Lebesgue, on obtient lim
n→∞kL
∗
Par suite, en utilisant le théorème 1.3.10, l’opérateur L est compact. Il s’ensuit que l’image par L de la boule unité de Lp(0, T ; R), notée L(B(0, 1)), est relativement compacte. Or
dim X = ∞, donc en utilisant le théorème de Riesz, on obtient int[L(B(0, 1))] = ∅. D’où, par le théorème de l’application ouverte, L n’est pas surjectif.
La proposition suivante donne une condition suffisante pour la contôlabilité locale faible du système (1.12).
Proposition 1.4.6. On suppose que
( hz, S(T − s)B(S(s)y0)iX0×X = 0, ∀s ∈ [0, T ] ) ⇒ (z = 0)
alorsImL = X.
Démonstration. Voir la proposition 3.2 de [8].
Le théorème suivant est dû à Ball et al. [8], et démontre la contrôlabilité faible globale sur [0, ∞[ d’une classe importante de systèmes bilinéaires hyperboliques.
Théorème 1.4.7 ( [8]). On considère le système hyperbolique suivant :
¨
y(t) = Ay(t) + u(t)By(t) y(0) = y0 ∈ D((−A)
1
2), ˙y(0) = y1 ∈ X
oùX est un espace de Hilbert séparable. (−A) est positif auto-adjoint à domaine dense, etB : D((−A)12) → X est un opérateur linéaire borné.
L’espaceD((−A)12) est muni du produit scalaire hy, zi
D((−A)12)= h−Ay, ziX.
On suppose queA possède une base orthonormale de vecteurs propres {φn}n∈N∗, dont
les valeurs propres0 > λ1 > λ2 > . . . sont simples, et telles que
λn
σ ∈ N
∗,
∀n ∈ N∗,
pourσ < 0 fixé.
Alors l’ensemble des états atteignables sur[0, ∞[ A(y0) = [ t≥0 u∈L2 loc(0,∞;R) (yu(t), ˙yu(t))
est dense dansD((−A)12) × X.
Démonstration. Voir la sous-section 5.3 de [8].
Remarque 1.4.8. Concernant la contrôlabilité des systèmes bilinéaires avec des contrôles distribuésu(x, t), le lecteur pourra consulter l’ouvrage de Khapalov [81] ou l’article de Ouzahra [111].