• Aucun résultat trouvé

1 Calcul de dérivées et mise sous forme exploitable

N/A
N/A
Protected

Academic year: 2022

Partager "1 Calcul de dérivées et mise sous forme exploitable"

Copied!
7
0
0

Texte intégral

(1)

Faculté des Sciences de TOURS Préparation à l’Agrégation ANALYSE

Mini-cours de calcul différentiel par l’exercice

1 Calcul de dérivées et mise sous forme exploitable

Le problème du calcul différentiel c’est moins de savoir si une fonction est différentiable (ou dérivable) – car il existe des théorèmes simples pour vérifier cette propriété – que de savoir calculer la dérivée et surtout d’être capable de la mettre sous une forme exploitable.

Car calculer une dérivée n’est pas un but en soi, ce n’est qu’une étape qui peut être suivie d’une (ou de plusieurs) autre(s) où la manipulation de la dérivée sera nécessaire. Il est donc important de maîtriser le sens de la dérivée [ici la difficulté est algébrique] voire de décider sous quelle forme on l’appréhende.

La première définition de la dérivabilité d’une fonction f : O → Rp, où O est un ouvert de Rn, en un point x0 ∈ O est la suivante :

“f est dérivable en O s’il existe une application linéaire L:RnRp telle que : f(x0+h) = f(x0) +L(h) +o(h),

où, si| · | désigne une norme sur Rn, o(h) est une quantité telle que o(h)/|h| →0 quand h→0.

Outre le côté un peu austère de cette définition, plusieurs remarques en découle :

— Cette définition est un développement limité def au voisinage de x0. Alors pour- quoi ne pas calculer L de cette manière quand cela s’y prête ?

— Le fait que L soit une application linéaire suggère que l’on peut soit utiliser L tel quel (approche “intrinsèque” où l’on ne choisit pas de bases), soit choisir des bases de Rn et Rp [en général les bases canoniques de ces espaces] et considérer la matrice de L dans ces bases (en toute rigueur, il faut alors remplacer x, h par X, H les matrices colonnes de leurs coordonnées). Une dernière possibilité, dans le cas oùp= 1 est d’utiliser le “théorème de représentation” qui nous dit qu’il existe aRn tel que L(h) =ha, hisi h·,·i est un produit scalaire surRn.

Ces deux remarques conduisent aux deux méthodes directes de calcul de la différen- tielles : soit via un développement limité que le lecteur pourra tester sur les exemples :

(i)xRN 7→ 12hAx, xi − hb, xi oùA est une matrice N ×N etbRN, (ii) MGLN(R)7→M−1,

Pour l’exercice (i), il est important de bien déterminer l’application linéaireLnotéef0(x0) dans la suite, la matrice jacobienneDf(x0) et le gradient ∇f(x0), c’est-à-dire le vecteur a ci-dessus et de bien sentir la différence entre ces objets.

(2)

Le calcul des dérivées partielles, donc de la matrice de l’application linéaire L (dite matrice jacobienne), est plus classique et nous ne proposons pas d’exemple d’exercice sauf dans le cadre de la troisième méthode, qui est l’utilisation du théorème de composition que l’on pourra tester sur les exemples :

(iii) xR 7→ Rhh2(x)

1(x) f(x, t)dt si h1, h2 : RR et f :R2R sont des fonctions de classeC1.

(iv) Si f : R2R est une fonction dérivable, calculer les dérivées partielles de l’applicationg :R2R définie par :

g(r, θ) = f(rcos(θ), rsin(θ)).

On pourra soit calculer directement les dérivées partielles soit repasser par les matrices jacobiennes.

Il est à noter que, pour la dérivée seconde, on peut procéder de même, en privilégiant quand c’est possible l’utilisation des dérivées partielles. Ce qui n’exclut pas de mettre la matrice (symétrique) :

D2f(x) := 2f

∂xi∂xj

!

i,j

,

sous une forme utilisable. Exemple d’utilisation :

(v) Soit f :RR une fonction de classeC2, croissante et convexe. On note ||x||2 =

Pn

i=1x2i. Montrer que la fonction g :RnR définie par : g(x) =f(||x||2), est convexe, i.e.hD2g(x)h, hi ≥0 pour tout x, hRn .

Il est néanmoins des exemples où le dévellopement limité semble nécessaire :

(vi) Si S+ est l’ouvert convexe1 des matrices n ×n symétriques définies positives, prouver que l’applicationψde S+×Rn dans R définie par :

ψ(M, p) =hM−1p, pi

est convexe.

2 Le théorème des Accroissements Finis (TAF)

La première difficulté du TAF est de bien comprendre ce qu’est une norme d’applica- tion linéaire. Une première étape (simple) est de remarquer que siL :RnRp est une application linéaire et si | · |, || · ||, sont des normes sur Rn et Rp respectivement alors il existe une constante C telle que :

||L(x)|| ≤C|x| pour tout xRn .

1. on pourra démontrer cette affirmation

(3)

La preuve de cette inégalité est simple en écrivant x = x1e1 +x2e2 +· · ·+xnen où les ei sont les vecteurs de la base canonique de Rn et les xi sont les coordonnées de x dans cette base. Alors, grâce à la linéarité deL et l’inégalité triangulaire :

||L(x)|| = ||x1L(e1) +x2L(e2) +· · ·+xnL(en)||

≤ |x1|.||L(e1)||+|x2|.||L(e2)||+· · ·+|xn|.||L(en)||

≤ ||x||(||L(e1)||+||L(e2)||+· · ·+||L(en)||)

puisque ||x|| = maxi(|xi|). Donc quand | · | est la norme infinie, l’inégalité est réalisée pourC=||L(e1)||+||L(e2)||+· · ·+||L(en)||. Dans les autres cas, on utilise l’équivalence des normes.

On peut alors introduire :

|||L|||:= sup

x6=0

||L(x)||

|x| ,

qui est une norme d’application linéaire (exo ?). Il est à noter que, dans l’utilisation du TAF, et même si l’énoncé fait souvent référence à cette norme||| · |||, on n’a besoin dans 99% des cas que de l’inégalité obtenue ci-dessus (de manière assez simple ?) sans avoir à manipuler (et surtout sans avoir à calculer des normes ||| · |||). Mais nous introduisons cette notion pour nous simplifier la vie ( !) puisque nous nous restreindrons ici au cas des fonctions de classeC1, i.e. des fonctions dérivables surO telles quex7→f0(x) est continu, ce qui signifie que :

|||f0(x)−f0(x0)||| →0 quand xx0 , pour toutx0 ∈ O.

L’avantage quand on suppose que f est de classe C1 est de pouvoir écrire : f(y)f(x) =

Z 1 0

d

dt[f(ty+ (1−t)x)]dt=

Z 1 0

f0(ty+ (1−t)x)(yx)dt .

Évidemment ceci présuppose que tous les points de la forme ty+ (1−t)x pour t∈ [0,1]

(qui est, par définition, l’intervalle [x, y]) sont dans O : c’est l’hypothèse géométrique du TAF.

Il en résulte ensuite, par l’inégalité triangulaire, que :

|f(y)−f(x)| ≤

Z 1

0

|f0(ty+ (1−t)x)(yx)|dt .

Si on sait que |||f0(z)||| ≤ M pour tout z ∈ [x, y] ou ||f0(z)(h)|| ≤ M.|h| pour tous z∈[x, y] et hRn alors :

|f(y)−f(x)| ≤M|y−x|.

Il faut réinsister sur le fait que dans 99% des cas, seule l’inégalité “banale” ||f0(z)(h)|| ≤ M.|h| est utile. On n’a donc pas besoin d’avoir un recours fin à la norme d’application linéaire.

Quelques exercices d’applications : (i) Soitf :RnR définie par :

f(x) = exp(−||x||2),

(4)

où||x||2 =Pni=1x2i. Démontrer que, pour tous x, yRn :

|f(x)−f(y)| ≤C|xy|,

pour une certaine constanteC. Déterminer la meilleure constante C possible.

(ii) En utilisant la fonction g(x) =||x|| et le théorème des accroissements finis, redé- montrer la deuxième inégalité triangulaire pour la norme euclidienne standard.

(iii) Soit f :Rn\ {0} →R une fonction dérivable. On suppose que f se prolonge par continuité en 0 et on note ˜f ce prolongement. Montrer que, si l’on a de plus :

x→0limf0(x) = L, alors ˜f est dérivable en 0 et ˜f0(0) =L. Application ?

(iv) Soit Ω un ouvert connexe par arc deRN etf : Ω→Rp une fonction de classeC1. Six, y ∈Ω et si γ : [0,1]→Ω est un chemin tel que γ(0) =x et γ(1) =y, prouver que :

|f(x)−f(y)| ≤ sup

z∈γ([0,1])

|||f0(z)|||.l(γ),

l(γ) est la longueur du chemin γ, i.e. R01|γ(t)|dt.˙

(v) [Plus délicat] Soitf :O ⊂RnRn une fonction de classe C1 et ¯x∈ O un point où f0x) [application linéaire de Rn dans Rn] est inversible. On introduit la fonction T :O →Rn définie par :

T(x) =x−[f0x)]−1f(x).

On suppose d’abord que fx) = 0. Prouver qu’il existe r >0 tel que, si |x0x|¯ < r, la suite définie par la relation de récurrence

xk+1 =T(xk), converge vers ¯x. Estimer précisément |xkx|.¯

Maintenant, on veut plus supposer que f(¯x) = 0. Prouver que s’il existe r, M > 0, 0< b <1 tels que, pour tous x, yB(x0, r), on ait :

|||[f0(x)]−1||| ≤M , |||f0(x)−f0(y)||| ≤ b

M et |f(¯x)|< r(1b)/M , alors l’équationf(x) = 0 a une solution unique dans B(x0, r). Application ?

3 Formule de Taylor et applications

La meilleure façon d’appréhender la formule de Taylor est sans doute sous sa forme avec reste intégral. Dans R, on écrit le théorème fondamental de l’Analyse :

f(x+h) = f(x) +

Z h 0

f0(x+t)dt ,

(5)

puis on intègre par parties. Par exemple, sif est de classeC2, on écritf0(x+t) = 1.f0(x+t), on intègre le 1 en (t−a) où a est une constante d’intégration et on dérive f0(x+t), ce qui donne :

f(x+h) = f(x) + (ha)f0(x+h) +af0(x)−

Z h 0

(t−a)f00(x+t)dt .

Comme on ne veut pas qu’il apparaisse de dérivées au pointx+h, le bon choix esta=h, ce qui donne :

f(x+h) =f(x) +f0(x)h−

Z h 0

(t−h)f00(x+t)dt .

Pour obtenir la formule de Taylor à l’ordre 2, on fait apparaître f00(x) dans l’intégrale :

Z h 0

(t−h)f00(x+t)dt=−

Z h 0

(t−h)(f00(x+t)f00(x))dt−

Z h 0

(t−h)f00(x)dt , ce qui conduit en calculant la derniere intégrale à l’expression bien connue :

f(x+h) =f(x) +f0(x)h+ 1

2f00(x)h2

Z h 0

(t−h)(f00(x+t)f00(x))dt .

L’intérêt de cette formule de Taylor est (évidemment) que l’on a explicitement le reste sous forme d’une intégrale facile à estimer.

DansRn, rien ne change : on utilise simplement l’idée mise en place ci-dessus dans le cadre du TAF en considérant la fonctiont7→f(x+th) où x∈ O, hRn (suffisamment petit) ett ∈[0,1] ce qui donne :

f(x+h)f(x) =

Z 1 0

f0(x+th)hdt .

L’intégration par partie se fait de manière analogue puisqu’on a affaire à une fonction de la variable réelle t. Exo : le faire !

Applications :

(i) Soit f : O → R une fonction de classe C2 et x0 ∈ O un point de minimum local de f. Prouver que f0(x0) = 0 [ou Df(x0) = 0 ou ∇f(x0) = 0] et que D2f(x0) ≥ 0. Puis prouver réciproquement que six0 est un point de Ooùf0(x0) = 0 etD2f(x0)≥ηIdpour un certainη >0 alors x0 ∈ O un point de minimum local de f.

(ii) Soitf :RR une fonction de classe C. Montrer que, pour tout xR, h >0 :

|f(x+h) +f(x−h)−2f(x)| ≤Ch2M(x, h),C est une constante à expliciter et M(x, h) = sup[x−h,x+h]|f(2)(t)|.

(iii) Soit f :RnR une fonction de classe C2. On suppose que f,∇f, D2f sont bornés surRn et on pose :

M0 := sup

x∈Rn

|f(x)|, M1 := sup

x∈Rn

|∇f(x)|, M2 := sup

x∈Rn

|||D2f(x)|||,

où la norme||| · ||| est celle de la matrice en tant qu’application linéaire. Prouver que : M12 ≤4M0.M2.

(6)

4 Théorème des fonctions implicites

Le but de ce théorème est de prouver que, sous certaines conditions et localement, l’ensemble des points où :

F(x, y) = 0, peut s’écrire sous la forme plus explicite :

y=f(x). Mais comment retenir les conditions ?

La fonction F doit être suffisamment régulière, i.e. de classe C1. C’est une condition naturelle car on va vouloir dériver. Ensuite on écrit que, si c’est le cas :

F(x, f(x)) = 0. Et on dérive :

DxF(x, f(x)) +DyF(x, f(x)).Df(x) = 0 .

C’est un bon exercice de se convaincre du bien fondé de cette égalité et du bon ordre des termes car les "matrices"DyF(x, f(x)) et Df(x) ne commutent pas. Deux manières : composerF et x7→(x, f(x) en calculant les matrices jacobiennes (leurs formes) ou faire un DL !

Ensuite si on veut avoir Df(x), il faut pouvoir résoudre et donc écrire : Df(x) = −[DyF(x, f(x))]−1.DxF(x, f(x)).

Pour cela, il est mieux en général queDyF(x, f(x)) soit inversible...

Pratique :

(i) Faire un développement limité pour a proche de 0 de la solution x(a) [proche de 10]

de l’équation :

xe−ax= 10 .

On calculera les premiers termes puis on expliquera comme obtenir les autres.

(ii) Étudier les solutions de l’équation :

x3+px+ 1 = 0 pourp proche de 0.

Un exercice pour les “wizards” : inf-convolution.

Soit u : RnR une fonction de classe C2. On suppose que u, Du et D2u sont bornés surRn. On pose :

uε(x) = inf

y∈Rn{u(y) + |x−y|2 ε2 }.

Le but est de montrer que uε est de classe C2 pour ε assez petit et on pourra proceder comme suit :

(i) Étudier le problème d’optimisation pour xfixé (on pourra se rapporter au mini-cours d’optimisation) : montrer que l’infimum est atteint en un seul point y(x) si ε est assez petit.

(ii) Utiliser le théorème des fonctions implicites pour prouver que x7→y(x) est de classe C1 (la première question à se poser est : quelle équation satisfait y(x) ?).

(iii) En déduire le résultat.

(7)

5 Une incursion vers les formes différentielles

Le but de cette section est de discuter la question suivante : sig = (g1,· · ·, gn) est une fonction de classe C1 surRn, existe-t-il une fonction f telle queg =∇f?

La réponse est généralement non car, g étant C1, f est de classe C2 et le Théorème de Schwartz implique que :

2f

∂xi∂xj

(x) = 2f

∂xi∂xj

(x),

pour toutxRn et 1≤i, jn ce qui donne des conditions nécessaires surg :

∂gj

∂xi(x) = ∂gi

∂xj(x), pour toutxRn et 1≤i, jn.

Cet ensemble de conditions nécessaires est-il suffisant ? Dans Rn (ou dans un ouvert étoilé), la réponse est oui !

On choisit arbitrairement le point 0 comme point de base. Sif existe, on devrait avoir : f(x)−f(0) =

Z 1 0

h∇f(tx), xidt =

Z 1 0

hg(tx), xidt .

Et donc on va montrer que cette formule donne effectivement une fonction de classe C1 [ce qui est clair ?] dont le gradient estg. Pour cela, on commence par calculer ∂x∂f

i :

∂f

∂xi(x) =

Z 1 0

n

X

k=1

∂gk

∂xi(tx)txkdt+

Z 1 0

gi(tx)dt . Puis on utilise la condition nécessaire qui conduit à :

∂f

∂xi(x) =

Z 1 0

n

X

k=1

∂gi

∂xk(tx)txkdt+

Z 1 0

gi(tx)dt .

Enfin on remarque que l’intégrande pour les deux intégrales vaut exactement dtd[tgi(tx)].

Ce qui donne le résultat.

Exercice : Prouver (sans utiliser le résultat) que, si γ : [0,1] → Rn est un lacet de classeC1 alors l’intégrale :

Z 1 0

hg(γ(t)), γ0(t)idt = 0.

(on pourra penser à une intégration par partie). À quelle autre théorie mathématique cette propriété vous fait-elle penser ?

NB : Dans cette section, on a manipulé sans le dire la forme différentielle : = g1(x)dx1+g2(x)dx2· · ·+gn(x)dxnet l’intégrale de cette forme sur un cheminγ : [a, b] → Rn :

Z

γ

:=

Z b a

[g1(γ(t))γ10(t) +g2(γ(t))γ20(t)· · ·+gn(γ(t))γ0n(t)]dt.

Références

Documents relatifs

Étant donné, dans un plan P, un axe Oir, on demande de déterminer dans ce plan une courbe G, passant par le point O, telle que Vaire engen- drée par la rotation d'un arc OM de

2° Déterminer sur la surface une courbe telle qu'en cha- cun de ses points le plan formé par la tangente à la courbe et la normale à la surface soit parallèle à Oz.. 3°

Donner une condition nécessaire et suffisante sur les coefficients diagonaux d’une matrice triangulaire supérieure pour qu’elle soit inversible..

[r]

F ici, la dérivée @a @ ln (4a 1) fait apparemment sens pour plus de réels a que pour ce dont elle est la dérivée (ici ln (4a 1)) : il ne faut pas oublier qu’on ne peut dériver

On propose ici un calcul détaillé des dérivées avec uniquement des fonctions et sans se soucier des problème

[r]

Dans cette d´ efinition, la norme de R 2 intervient (la notion de limite d´ epend a priori de la norme choisie sur R 2 ), la notion de d´ erivabilit´ e et de d´ eriv´ ee en un point