1 Calcul de dérivées et mise sous forme exploitable

(1)

Faculté des Sciences de TOURS Préparation à l’Agrégation ANALYSE

Mini-cours de calcul différentiel par l’exercice

1 Calcul de dérivées et mise sous forme exploitable

Le problème du calcul différentiel c’est moins de savoir si une fonction est différentiable (ou dérivable) – car il existe des théorèmes simples pour vérifier cette propriété – que de savoir calculer la dérivée et surtout d’être capable de la mettre sous une forme exploitable.

Car calculer une dérivée n’est pas un but en soi, ce n’est qu’une étape qui peut être suivie d’une (ou de plusieurs) autre(s) où la manipulation de la dérivée sera nécessaire. Il est donc important de maîtriser le sens de la dérivée [ici la difficulté est algébrique] voire de décider sous quelle forme on l’appréhende.

La première définition de la dérivabilité d’une fonction f : O → R^p, où O est un ouvert de Rⁿ, en un point x0 ∈ O est la suivante :

“f est dérivable en O s’il existe une application linéaire L:Rⁿ →R^p telle que : f(x₀+h) = f(x₀) +L(h) +o(h),

où, si| · | désigne une norme sur Rⁿ, o(h) est une quantité telle que o(h)/|h| →0 quand h→0.

Outre le côté un peu austère de cette définition, plusieurs remarques en découle :

— Cette définition est un développement limité def au voisinage de x₀. Alors pour- quoi ne pas calculer L de cette manière quand cela s’y prête ?

— Le fait que L soit une application linéaire suggère que l’on peut soit utiliser L tel quel (approche “intrinsèque” où l’on ne choisit pas de bases), soit choisir des bases de Rⁿ et R^p [en général les bases canoniques de ces espaces] et considérer la matrice de L dans ces bases (en toute rigueur, il faut alors remplacer x, h par X, H les matrices colonnes de leurs coordonnées). Une dernière possibilité, dans le cas oùp= 1 est d’utiliser le “théorème de représentation” qui nous dit qu’il existe a∈Rⁿ tel que L(h) =ha, hisi h·,·i est un produit scalaire surRⁿ.

Ces deux remarques conduisent aux deux méthodes directes de calcul de la différen- tielles : soit via un développement limité que le lecteur pourra tester sur les exemples :

(i)x∈R^N 7→ ¹₂hAx, xi − hb, xi oùA est une matrice N ×N etb∈R^N, (ii) M ∈GL_N(R)7→M⁻¹,

Pour l’exercice (i), il est important de bien déterminer l’application linéaireLnotéef⁰(x₀) dans la suite, la matrice jacobienneDf(x₀) et le gradient ∇f(x₀), c’est-à-dire le vecteur a ci-dessus et de bien sentir la différence entre ces objets.

(2)

Le calcul des dérivées partielles, donc de la matrice de l’application linéaire L (dite matrice jacobienne), est plus classique et nous ne proposons pas d’exemple d’exercice sauf dans le cadre de la troisième méthode, qui est l’utilisation du théorème de composition que l’on pourra tester sur les exemples :

(iii) x ∈R 7→ ^R_h^h²^(x)

1(x) f(x, t)dt si h₁, h₂ : R →R et f :R² → R sont des fonctions de classeC¹.

(iv) Si f : R² → R est une fonction dérivable, calculer les dérivées partielles de l’applicationg :R² →R définie par :

g(r, θ) = f(rcos(θ), rsin(θ)).

On pourra soit calculer directement les dérivées partielles soit repasser par les matrices jacobiennes.

Il est à noter que, pour la dérivée seconde, on peut procéder de même, en privilégiant quand c’est possible l’utilisation des dérivées partielles. Ce qui n’exclut pas de mettre la matrice (symétrique) :

D²f(x) := ∂²f

∂x_i∂x_j

!

i,j

,

sous une forme utilisable. Exemple d’utilisation :

(v) Soit f :R→R une fonction de classeC², croissante et convexe. On note ||x||² =

Pn

i=1x²_i. Montrer que la fonction g :Rⁿ→R définie par : g(x) =f(||x||²), est convexe, i.e.hD²g(x)h, hi ≥0 pour tout x, h∈Rⁿ .

Il est néanmoins des exemples où le dévellopement limité semble nécessaire :

(vi) Si S⁺ est l’ouvert convexe¹ des matrices n ×n symétriques définies positives, prouver que l’applicationψde S⁺×Rⁿ dans R définie par :

ψ(M, p) =hM⁻¹p, pi

est convexe.

2 Le théorème des Accroissements Finis (TAF)

La première difficulté du TAF est de bien comprendre ce qu’est une norme d’application linéaire. Une première étape (simple) est de remarquer que siL :Rⁿ →R^p est une application linéaire et si | · |, || · ||, sont des normes sur Rⁿ et R^p respectivement alors il existe une constante C telle que :

||L(x)|| ≤C|x| pour tout x∈Rⁿ .

1. on pourra démontrer cette affirmation

(3)

La preuve de cette inégalité est simple en écrivant x = x₁e₁ +x₂e₂ +· · ·+x_ne_n où les e_i sont les vecteurs de la base canonique de Rⁿ et les x_i sont les coordonnées de x dans cette base. Alors, grâce à la linéarité deL et l’inégalité triangulaire :

||L(x)|| = ||x₁L(e₁) +x₂L(e₂) +· · ·+x_nL(e_n)||

≤ |x1|.||L(e1)||+|x2|.||L(e2)||+· · ·+|xn|.||L(en)||

≤ ||x||∞(||L(e₁)||+||L(e₂)||+· · ·+||L(e_n)||)

puisque ||x||∞ = maxi(|xi|). Donc quand | · | est la norme infinie, l’inégalité est réalisée pourC=||L(e₁)||+||L(e₂)||+· · ·+||L(e_n)||. Dans les autres cas, on utilise l’équivalence des normes.

On peut alors introduire :

|||L|||:= sup

x6=0

||L(x)||

|x| ,

qui est une norme d’application linéaire (exo ?). Il est à noter que, dans l’utilisation du TAF, et même si l’énoncé fait souvent référence à cette norme||| · |||, on n’a besoin dans 99% des cas que de l’inégalité obtenue ci-dessus (de manière assez simple ?) sans avoir à manipuler (et surtout sans avoir à calculer des normes ||| · |||). Mais nous introduisons cette notion pour nous simplifier la vie ( !) puisque nous nous restreindrons ici au cas des fonctions de classeC¹, i.e. des fonctions dérivables surO telles quex7→f⁰(x) est continu, ce qui signifie que :

|||f⁰(x)−f⁰(x₀)||| →0 quand x→x₀ , pour toutx₀ ∈ O.

L’avantage quand on suppose que f est de classe C¹ est de pouvoir écrire : f(y)−f(x) =

Z 1 0

d

dt[f(ty+ (1−t)x)]dt=

Z 1 0

f⁰(ty+ (1−t)x)(y−x)dt .

Évidemment ceci présuppose que tous les points de la forme ty+ (1−t)x pour t∈ [0,1]

(qui est, par définition, l’intervalle [x, y]) sont dans O : c’est l’hypothèse géométrique du TAF.

Il en résulte ensuite, par l’inégalité triangulaire, que :

|f(y)−f(x)| ≤

Z ₁

0

|f⁰(ty+ (1−t)x)(y−x)|dt .

Si on sait que |||f⁰(z)||| ≤ M pour tout z ∈ [x, y] ou ||f⁰(z)(h)|| ≤ M.|h| pour tous z∈[x, y] et h∈Rⁿ alors :

|f(y)−f(x)| ≤M|y−x|.

Il faut réinsister sur le fait que dans 99% des cas, seule l’inégalité “banale” ||f⁰(z)(h)|| ≤ M.|h| est utile. On n’a donc pas besoin d’avoir un recours fin à la norme d’application linéaire.

Quelques exercices d’applications : (i) Soitf :Rⁿ →R définie par :

f(x) = exp(−||x||²),

(4)

où||x||² =^Pⁿ_i=1x²_i. Démontrer que, pour tous x, y ∈Rⁿ :

|f(x)−f(y)| ≤C|x−y|,

pour une certaine constanteC. Déterminer la meilleure constante C possible.

(ii) En utilisant la fonction g(x) =||x|| et le théorème des accroissements finis, redé- montrer la deuxième inégalité triangulaire pour la norme euclidienne standard.

(iii) Soit f :Rⁿ\ {0} →R une fonction dérivable. On suppose que f se prolonge par continuité en 0 et on note ˜f ce prolongement. Montrer que, si l’on a de plus :

x→0limf⁰(x) = L, alors ˜f est dérivable en 0 et ˜f⁰(0) =L. Application ?

(iv) Soit Ω un ouvert connexe par arc deR^N etf : Ω→R^p une fonction de classeC¹. Six, y ∈Ω et si γ : [0,1]→Ω est un chemin tel que γ(0) =x et γ(1) =y, prouver que :

|f(x)−f(y)| ≤ sup

z∈γ([0,1])

|||f⁰(z)|||.l(γ),

oùl(γ) est la longueur du chemin γ, i.e. ^R₀¹|γ(t)|dt.˙

(v) [Plus délicat] Soitf :O ⊂Rⁿ→Rⁿ une fonction de classe C¹ et ¯x∈ O un point où f⁰(¯x) [application linéaire de Rⁿ dans Rⁿ] est inversible. On introduit la fonction T :O →Rⁿ définie par :

T(x) =x−[f⁰(¯x)]⁻¹f(x).

On suppose d’abord que f(¯x) = 0. Prouver qu’il existe r >0 tel que, si |x₀−x|¯ < r, la suite définie par la relation de récurrence

xk+1 =T(xk), converge vers ¯x. Estimer précisément |x_k−x|.¯

Maintenant, on veut plus supposer que f(¯x) = 0. Prouver que s’il existe r, M > 0, 0< b <1 tels que, pour tous x, y ∈B(x0, r), on ait :

|||[f⁰(x)]⁻¹||| ≤M , |||f⁰(x)−f⁰(y)||| ≤ b

M et |f(¯x)|< r(1−b)/M , alors l’équationf(x) = 0 a une solution unique dans B(x₀, r). Application ?

3 Formule de Taylor et applications

La meilleure façon d’appréhender la formule de Taylor est sans doute sous sa forme avec reste intégral. Dans R, on écrit le théorème fondamental de l’Analyse :

f(x+h) = f(x) +

Z h 0

f⁰(x+t)dt ,

(5)

puis on intègre par parties. Par exemple, sif est de classeC², on écritf⁰(x+t) = 1.f⁰(x+t), on intègre le 1 en (t−a) où a est une constante d’intégration et on dérive f⁰(x+t), ce qui donne :

f(x+h) = f(x) + (h−a)f⁰(x+h) +af⁰(x)−

Z h 0

(t−a)f⁰⁰(x+t)dt .

Comme on ne veut pas qu’il apparaisse de dérivées au pointx+h, le bon choix esta=h, ce qui donne :

f(x+h) =f(x) +f⁰(x)h−

Z h 0

(t−h)f⁰⁰(x+t)dt .

Pour obtenir la formule de Taylor à l’ordre 2, on fait apparaître f⁰⁰(x) dans l’intégrale :

−

Z h 0

(t−h)f⁰⁰(x+t)dt=−

Z h 0

(t−h)(f⁰⁰(x+t)−f⁰⁰(x))dt−

Z h 0

(t−h)f⁰⁰(x)dt , ce qui conduit en calculant la derniere intégrale à l’expression bien connue :

f(x+h) =f(x) +f⁰(x)h+ 1

2f⁰⁰(x)h²−

Z h 0

(t−h)(f⁰⁰(x+t)−f⁰⁰(x))dt .

L’intérêt de cette formule de Taylor est (évidemment) que l’on a explicitement le reste sous forme d’une intégrale facile à estimer.

DansRⁿ, rien ne change : on utilise simplement l’idée mise en place ci-dessus dans le cadre du TAF en considérant la fonctiont7→f(x+th) où x∈ O, h∈Rⁿ (suffisamment petit) ett ∈[0,1] ce qui donne :

f(x+h)−f(x) =

Z 1 0

f⁰(x+th)hdt .

L’intégration par partie se fait de manière analogue puisqu’on a affaire à une fonction de la variable réelle t. Exo : le faire !

Applications :

(i) Soit f : O → R une fonction de classe C² et x₀ ∈ O un point de minimum local de f. Prouver que f⁰(x₀) = 0 [ou Df(x₀) = 0 ou ∇f(x₀) = 0] et que D²f(x₀) ≥ 0. Puis prouver réciproquement que six₀ est un point de Ooùf⁰(x₀) = 0 etD²f(x₀)≥ηIdpour un certainη >0 alors x₀ ∈ O un point de minimum local de f.

(ii) Soitf :R →R une fonction de classe C^∞. Montrer que, pour tout x∈R, h >0 :

|f(x+h) +f(x−h)−2f(x)| ≤Ch²M(x, h), oùC est une constante à expliciter et M(x, h) = sup_[x−h,x+h]|f⁽²⁾(t)|.

(iii) Soit f :Rⁿ →R une fonction de classe C². On suppose que f,∇f, D²f sont bornés surRⁿ et on pose :

M₀ := sup

x∈Rⁿ

|f(x)|, M₁ := sup

x∈Rⁿ

|∇f(x)|, M₂ := sup

x∈Rⁿ

|||D²f(x)|||,

où la norme||| · ||| est celle de la matrice en tant qu’application linéaire. Prouver que : M₁² ≤4M₀.M₂.

(6)

4 Théorème des fonctions implicites

Le but de ce théorème est de prouver que, sous certaines conditions et localement, l’ensemble des points où :

F(x, y) = 0, peut s’écrire sous la forme plus explicite :

y=f(x). Mais comment retenir les conditions ?

La fonction F doit être suffisamment régulière, i.e. de classe C¹. C’est une condition naturelle car on va vouloir dériver. Ensuite on écrit que, si c’est le cas :

F(x, f(x)) = 0. Et on dérive :

D_xF(x, f(x)) +D_yF(x, f(x)).Df(x) = 0 .

C’est un bon exercice de se convaincre du bien fondé de cette égalité et du bon ordre des termes car les "matrices"D_yF(x, f(x)) et Df(x) ne commutent pas. Deux manières : composerF et x7→(x, f(x) en calculant les matrices jacobiennes (leurs formes) ou faire un DL !

Ensuite si on veut avoir Df(x), il faut pouvoir résoudre et donc écrire : Df(x) = −[D_yF(x, f(x))]⁻¹.D_xF(x, f(x)).

Pour cela, il est mieux en général queDyF(x, f(x)) soit inversible...

Pratique :

(i) Faire un développement limité pour a proche de 0 de la solution x(a) [proche de 10]

de l’équation :

xe^−ax= 10 .

On calculera les premiers termes puis on expliquera comme obtenir les autres.

(ii) Étudier les solutions de l’équation :

x³+px+ 1 = 0 pourp proche de 0.

Un exercice pour les “wizards” : inf-convolution.

Soit u : Rⁿ → R une fonction de classe C². On suppose que u, Du et D²u sont bornés surRⁿ. On pose :

u_ε(x) = inf

y∈Rⁿ{u(y) + |x−y|² ε² }.

Le but est de montrer que u_ε est de classe C² pour ε assez petit et on pourra proceder comme suit :

(i) Étudier le problème d’optimisation pour xfixé (on pourra se rapporter au mini-cours d’optimisation) : montrer que l’infimum est atteint en un seul point y(x) si ε est assez petit.

(ii) Utiliser le théorème des fonctions implicites pour prouver que x7→y(x) est de classe C¹ (la première question à se poser est : quelle équation satisfait y(x) ?).

(iii) En déduire le résultat.

(7)

5 Une incursion vers les formes différentielles

Le but de cette section est de discuter la question suivante : sig = (g₁,· · ·, g_n) est une fonction de classe C¹ surRⁿ, existe-t-il une fonction f telle queg =∇f?

La réponse est généralement non car, g étant C¹, f est de classe C² et le Théorème de Schwartz implique que :

∂²f

∂xi∂xj

(x) = ∂²f

∂xi∂xj

(x),

pour toutx∈Rⁿ et 1≤i, j ≤n ce qui donne des conditions nécessaires surg :

∂g_j

∂x_i(x) = ∂g_i

∂x_j(x), pour toutx∈Rⁿ et 1≤i, j ≤n.

Cet ensemble de conditions nécessaires est-il suffisant ? Dans Rⁿ (ou dans un ouvert étoilé), la réponse est oui !

On choisit arbitrairement le point 0 comme point de base. Sif existe, on devrait avoir : f(x)−f(0) =

Z 1 0

h∇f(tx), xidt =

Z 1 0

hg(tx), xidt .

Et donc on va montrer que cette formule donne effectivement une fonction de classe C¹ [ce qui est clair ?] dont le gradient estg. Pour cela, on commence par calculer _∂x^∂f

i :

∂f

∂x_i(x) =

Z 1 0

n

X

k=1

∂g_k

∂x_i(tx)tx_kdt+

Z 1 0

g_i(tx)dt . Puis on utilise la condition nécessaire qui conduit à :

∂f

∂x_i(x) =

Z 1 0

n

X

k=1

∂g_i

∂x_k(tx)tx_kdt+

Z 1 0

g_i(tx)dt .

Enfin on remarque que l’intégrande pour les deux intégrales vaut exactement _dt^d[tg_i(tx)].

Ce qui donne le résultat.

Exercice : Prouver (sans utiliser le résultat) que, si γ : [0,1] → Rⁿ est un lacet de classeC¹ alors l’intégrale :

Z 1 0

hg(γ(t)), γ⁰(t)idt = 0.

(on pourra penser à une intégration par partie). À quelle autre théorie mathématique cette propriété vous fait-elle penser ?

NB : Dans cette section, on a manipulé sans le dire la forme différentielle : dω = g₁(x)dx₁+g₂(x)dx₂· · ·+g_n(x)dx_net l’intégrale de cette forme sur un cheminγ : [a, b] → Rⁿ :

Z

γ

dω :=

Z b a

[g₁(γ(t))γ₁⁰(t) +g₂(γ(t))γ₂⁰(t)· · ·+g_n(γ(t))γ⁰_n(t)]dt.