• Aucun résultat trouvé

Dérivées partielles de deuxième ordre et matrice hessienne

Dans le document Gloria Faccanoni (Page 41-45)

¯<r2ª .

Soitf:R→Rune fonction de classeC1(R). Alors, pour tout (x1,y1)∈R, on a la majoration suivante :

¯¯f¡ x1,y1¢

f ¡ x0,y0¢¯

¯≤ sup

(x,y)∈R|(x1x0)xf(x,y)+(y1y0)yf(x,y)| ≤Ar1+Br2 avecA(resp.B) un majorant de|∂xf(x,y)|(resp.|∂yf(x,y)|) surR.

3.2.3. Fonctions homogènes

3.15 Définition (Fonction homogène)

Soit la fonctionf:Rn→R. Elle est dite homogène de degréksi

f(λx)=λkf(x), ∀(x,λ)∈Rn×R+.

Les fonctions homogènes bénéficient de la propriété suivante qui découle de lachain rule.

3.16 Théorème (d’EULER)

Si la fonctionf:Rn→Rest homogène de degréket différentiable dansRn, alors

n

X

i=1

xixif(x)=k f(x), ∀∈Rn.

EXEMPLE

La fonction de production de COBB-DOUGLASà rendements constants s’écrit f(x,y)=xαy1−α, oùα∈R+. Elle est homogène de degré 1 puisquef(λx,λy)=(λx)α(λy)1−α=λ(xαy1−α)=λf(x,y). Dans ce cas, la formule d’EULERs’écrit

x∂xf(x,y)+y∂yf(x,y)=f(x,y).

Le résultatf(x,y) de la production obtenue avec les quantités respectivesxetyde facteurs permet donc de rémunérer ces facteurs au niveau de leur productivité marginale.

3.3. Dérivées partielles de deuxième ordre et matrice hessienne

Si les fonctions dérivées partielles admettent elles-mêmes des dérivées partielles en (x0,y0), ces dérivées sont appelées dérivées partielles secondes, ou dérivées partielles d’ordre 2, def en (x0,y0). On peut, de la même façon, introduire les dérivées partielles d’ordres supérieurs. Les définitions suivantes s’énoncent dans des ensembles ouverts pour éviter les problèmes liés au calcul de limites au bord du domaine.

3.17 Définition (Dérivées partielles d’ordre 2 pour une fonction de deux variables)

Soit la fonctionf:D⊂R2→RoùDest un ouvert deR2. On a 2 dérivées partielles d’ordre 1 et donc 4 dérivées partielles d’ordre 2 ainsi notées :

2f

∂x2(x0,y0)=

∂x µ∂f

∂x

(x0,y0) (notée aussixxf(x0,y0)),

2f

∂x∂y(x0,y0)=

∂x µ∂f

∂y

(x0,y0) (notée aussix yf(x0,y0)),

2f

Les dérivées partielles d’ordre supérieur à2se définissent par récurrence de façon analogue. Soit la fonction f:Rn→R; on aura n dérivées partielles d’ordre1, n2dérivées partielles d’ordre2, etc. donc nkdérivées partielles d’ordre k.

3.18 Théorème (Théorème de SCHWARZ(ou de CL AIRAUT))

Si les dérivées partielles mixtesx yf ety xf sont continues en (x0,y0) alorsx yf(x0,y0)=y xf(x0,y0).

Relations de MAXWELLet Carré thermodynamique En thermodynamique, on appellerelations de MAXWELL des équations obtenues grâce aux définitions des potentiels thermodynamiques et à l’égalité de SCHWARZ. Pour un système entièrement décrit par les variables pressionP, températureT, entropieSet volumeV, on retient généralement un ensemble de quatre relations relatives aux quatre potentiels thermodynamiques énergie interneU, enthalpieH, énergie libreFet enthalpie libre (ou potentiel de GIBBS)G:

dF(V,T)= −P(V,T)dV−S(V,T)dT, =⇒ P(V,T)= − ∂F si bien qu’en utilisant l’égalité de SCHWARZl’on a les relations de MAXWELL

∂P

Le «carré thermodynamique» ci-dessous a été conçu pour mémoriser simplement l’ensemble de ces relations (différen-tielles des potentiels thermodynamiques et relations de MAXWELL).

V T

Le long des quatre cotés on écrit les quatre potentiels thermodynamiquesf,g,hetε, disposés en ordre alphabétique et en sens horaire, à partir def sur le coté haut. Aux deux coins de gauche on pose les variables extensivesVetStandis qu’aux coins de droite on pose les variables intensivesPetT.

Chacun des quatre potentiels thermodynamiques se trouve entre les variables indépendantes des quelles il est fonction naturelle. On a donc que²est fonction naturelle deVetS;f deVetT etc.

Ce carré permet de lire facilement les dérivées partielles qui lient les potentiels aux variables naturelles respectives : plus précisément, la dérivée partielle d’un potentiel par rapport à une variable (coin) est donnée simplement par la variable qui se trouve au coin opposé et les flèches diagonales en déterminent le signe (positif dans la direction de la flèche, négatif sinon). Par exemple, on a (V,T)7→f et Vf

Même les relations de MAXWELLpeuvent se lire sur le schéma : la dérivée de la variable (coin) par rapport à la variable sur la même arrête (en considérant constante la variable dans la diagonale opposée) est égale à la dérivée le long de l’autre diagonale. De nouveau, les signes doivent être choisis selon la direction des diagonales. Par exemple VS¯

¯

3.3.1. Développements limités à l’ordre 2

La linéarisation d’une fonctionf en un point (x0,y0) est un polynôme de degré inférieur ou égal à 1 tel que





L(x0,y0)=f(x0,y0),

xL(x0,y0)=xf(x0,y0),

yL(x0,y0)=yf(x0,y0).

Les polynômes de TAYLORgénéralisent cette construction pour des polynômes de degrés quelconques. Ici on va se limiter aux polynômes de degré au plus 2.

3.19 Définition (Développement limité à l’ordre 2 dansR2)

Soitf:D⊂R2→Rune fonction de classeC2(D). Alors au voisinage de (x0,y0)∈Don a f(x,y)=f(x0,y0)

+(x−x0)xf(x0,y0)+(y−y0)yf(x0,y0) +1

2

£(x−x0)2xxf(x0,y0)+2(x−x0)(y−y0)x yf(x0,y0)+(y−y0)2y yf(x0,y0)¤ +o((xx0)2+(y−y0)2).

3.20 Définition (Matrice hessienne)

Soit la fonctionf :D⊂R2→RoùDest un ouvert deR2. La matrice hessienne def en (x0,y0) est la matrice de taille 2×2 dont les entrées sont les dérivées partielles secondes :

Hf(x0,y0)=

µxxf(x0,y0) x yf(x0,y0)

y xf(x0,y0) y yf(x0,y0)

¶ .

Son déterminant est le réel dét(Hf(x0,y0))≡xxf(x0,y0)y yf(x0,y0)−x yf(x0,y0)y xf(x0,y0).

Cette notion se généralise naturellement pourn>2.

EXEMPLE

Les dérivées premières et secondes de la fonctionf(x,y)= −2x2+3x y2y3sont

xf(x,y)= −4x+3y2, yf(x,y)=6x y−3y2,

xxf(x,y)= −4, x yf(x,y)=6y, y xf(x,y)=6y, y yf(x,y)=6x−6y.

La matrice hessienne est

Hf(x,y)=

µ−4 6y 6y 6x−6y

¶ .

Dans cet exemple, on remarque que la matrice hessienne def est symétrique du fait que les dérivées secondes mixtes,

x yf ety xf, sont égales.

Remarque (Développement limité à l’ordre 2 dansRn)

La notation matricielle permet d’écrire le développement limité à l’ordre 2 d’une manière plus compacte et généralisable à un nombre quelconque de variables : soitf:D⊂Rn→Rune fonction de classeC2(D). Alors pour toutx∈B(x0,δ)∩D on a

f(x)=f(x0)+(x−x0)T· ∇f(x0)+1

2(x−x0)T·Hf(x0)·(x−x0)+ kxx0k2ε(x) avec limxx0ε(x)=0.

3.21 Définition (Fonction de classeCk)

Sif et les fonctions dérivées partielles d’ordre 1, 2, . . . ,ksont continues surD, on dit quef est de classeCksurD. Si les dérivées partielles de tout ordre existent et sont continues,f est dite de classeCsurD.

Comme la dérivée seconde pour les fonctions d’une seule variable, la matrice hessienne permet d’étudier la convexité des fonctions de plusieurs variables et joue, dès lors, un rôle important dans leur optimisation.

3.22 Définition (Convexité dansR2)

SoitDunsous-ensemble convexedeR2etf:D→Rune fonction.

B f est concave dansDsi f¡

(1−t)(x0,y0)+t(x1,y1

≥(1−t)f(x0,y0)+t f(x1,y1) ∀(x0,y0), (x1,y1)∈Det∀t∈[0; 1];

B f est strictement concave dansDsi f¡

(1−t)(x0,y0)+t(x1,y1

>(1−t)f(x0,y0)+t f(x1,y1) ∀(x0,y0), (x1,y1)∈Det∀t∈]0; 1[;

B f est convexe dansDsi f¡

(1−t)(x0,y0)+t(x1,y1

≤(1−t)f(x0,y0)+t f(x1,y1) ∀(x0,y0), (x1,y1)∈Det∀t∈[0; 1];

B f est strictement convexe dansDsi f¡

(1−t)(x0,y0)+t(x1,y1

<(1−t)f(x0,y0)+t f(x1,y1) ∀(x0,y0), (x1,y1)∈Det∀t∈]0; 1[;

Comme pour les fonctions d’une variable, la concavité et la convexité des fonctions denvariables suffisamment régulières peuvent être caractérisées à l’aide des dérivées d’ordres 1 ou 2.

3.23 Propriété

SoitDunsous-ensemble convexedeR2etf:D→Rune une fonction différentiable dansD. Alors

1. f est concave dansD ⇐⇒ ∀(x0,y0), (x1,y1)∈D,f(x1,y1)≤f(x0,y0)+(x1x0)xf(x0,y0)+(y1y0)yf(x0,y0) ; 2. f est convexe dansD ⇐⇒ ∀(x0,y0), (x1,y1)∈D,f(x1,y1)≥f(x0,y0)+(x1x0)xf(x0,y0)+(y1y0)yf(x0,y0).

Si, de plus,f ∈C2(D), alors

1. f est concave dansD ⇐⇒ ∀(x,y)∈D,Hf(x,y) est semi-définie négative (i.e.dét(Hf(x,y))≥0 etxxf(x,y)≤0) ; 2. f est convexe dansD ⇐⇒ ∀(x,y)∈D,Hf(x,y) est semi-définie positive (i.e.dét(Hf(x,y))≥0 etxxf(x,y)≥0) ; 3. ∀(x,y)∈D,Hf(x,y) est définie négative (i.e.dét(Hf(x,y))>0 etxxf(x,y)<0) =⇒ f est strictement concave

dansD;

4. ∀(x,y)∈D,Hf(x,y) est définie positive (i.e.dét(Hf(x,y))>0 etxxf(x,y)<0) =⇒ f est strictement convexe dansD.

Les deux premiers énoncés expriment que tout plan tangent au graphe d’une fonction concave (resp. convexe) se trouve au-dessus (resp. au-dessous) de ce graphe. Les deux derniers, relatifs à la matrice hessienne, rappellent celui qui fait référence au signe de la dérivée seconde d’une fonction d’une seule variable. De la même manière, la condition stricte ne s’applique que dans un seul sens. Dès lors, une fonction peut être strictement convexe sans que sa matrice hessienne soit définie positive en tout point.

EXEMPLE

1. Soitf(x,y)=x2+y2. On a B f ∈C2(R2),

B Hf(x,y)=¡2 0

0 2

¢pour tout (x,y)∈R2,

B dét(Hf(x,y))=4>0 etxxf(x,y)=2>0 doncHf(x,y) est définie positive pour tout (x,y)∈R2. Il s’en suit quef est strictement convexe dansR2. En effet, pour tout (x,y)∈R2\ { (0, 0) },

f(x,y)=x2+y2>f(0, 0)+x∂xf(0, 0)+y∂yf(0, 0).

2. Soitf(x,y)=x4+y4. On a B f ∈C2(R2),

B Hf(x,y)=

³12x2 0 0 12y2

´

pour tout (x,y)∈R2,

B dét(Hf(x,y))=144x2y2≥0 etxxf(x,y)=12x2≥0 doncHf(x,y) est définie positive pour tout (x,y)∈(R)2 et semi-définie positive en (0, 0).

On peut cependant montrer à l’aide de la définition que la fonction est strictement convexe dansR2car f(x,y)=x4+y4>f(0, 0)+x∂xf(0, 0)+y∂yf(0, 0)=0 ∀(x,y)6=(0, 0).

EXEMPLE(GAZ PARFAITS)

Considérons l’entropie d’un gaz parfait en fonction de l’énergie interne spécifiqueεet du volume spécifiqueτ: s: (R+)2→R

(τ,ε)7→cvln¡ ετγ−1¢

=cvln(ε)+cv(γ−1) ln(τ) aveccvetγ>1 deux constantes. L’entropiesest de classe∈C((R+)2) et l’on a

τs=cv(γ−1)

τ >0 εs=cv ε >0 donc l’entropie est strictement croissante enτet enεet

ττs= −cv(γ−1)

τ2 <0 τεs=ετs=0 εεs= −cv ε2 donc dét(Hs(τ,ε))=c

2v(γ−1)

τ2ε2 >0 : l’entropie est strictement concave.

Dans le document Gloria Faccanoni (Page 41-45)

Documents relatifs