• Aucun résultat trouvé

Minima conditionnels – multiplicateurs de Lagrange

Dans le document Math´ematiques pour Informaticiens (Page 50-54)

A 5 A 1©Œ ? ¬ ¤ ­ ® ¯ °²± ³ ° ³%´ ³ °²µ

(folium cartesii). Ses courbes de niveau sont dessin´ees dans la figure d’`a cˆot´e. On commence par calculer le gradient

§ Ñ)š Œ 1wŒ Œ 1wŒ

et les valeurs de  o`u § ÑZ?*

P . Pour cet exemple simple, on trouve tout de suite 

ŽP*LP/ et & &

. Pour des fonc-tions plus compliqu´ees, on est oblig´e d’utiliser des m´ethodes num´eriques.

Pour v´erifier s’il s’agit d’un minimum, nous calculons la matrice Hessienne

¨ š — 1#Œ 1®Œ — Le valeurs propres de ¨

?* sont les z´eros du polyn ˆome caract´eristique ?Uß1z—*¡ ?Uß1€—*1

Ó . Au point  –P*P/ , nous trouvons Ua 1®Œ et

Œ comme valeurs propres de ¨

Ž* . Il ne s’agit donc ni d’un minimum ni d’un maximum, comme on peut le voir sur le dessin. Par contre, les valeurs propres de¨

?* pour & & sont Ua Œ etUC Ó

. Comme elles sont positives, il s’agit d’un minimum relatif.

Remarquons que, pour une fonctionÑ»b ¤f

, la condition§ ÑZš

P donne ´equations `a inconnues `a r´esoudre, notamment

_ Ñ _ L _ Ñ _ 4L _ Ñ _ 4 P*

Pour v´erifier si une solution J repr´esente un minimum relatif de ÑZš , il faut calculer les valeurs propres de la matrice Hessienne ¨

?* . Les deux probl`emes (la r´esolution d’un syst`eme non lin´eaire dans et le calcul des valeurs propres d’une matrice de dimension ) seront trait´es dans le cours ‘Analyse Num´erique’.

IV.2 Minima conditionnels – multiplicateurs de Lagrange

Pour mieux comprendre les id´ees, commenc¸ons par le probl`eme

ÑZ Ž f j8|}Ÿ .5 1.0 −1.0 −.5 .5 1.0 −1.0 −.5 jßk(l j8|•Ÿ jß|}Ÿ j8kLl sur 2 Q V 0 n6b 5 1 &% P/*

On voit sur le dessin d’`a cˆot´e que les solutions de ce probl`eme sont Ւ¶ et Ւ¶ .

Raisonnement g´eom´etrique. On sait que§

ÑZŽC est orthogonal aux lignes de niveau carÑZ?

5 "1gÑZ?* § ÑZ?* ÷ 5¸· 4:): . De plus, §0

?* est orthogonal `a 2 (formule (8.2) du para-graphe III.8). Si la courbe de niveau deÑZš et la sous-vari´et´e

2 se coupent transversalement en  , on ne peut pas avoir un minimum. Donc, aux solutions de ce probl`eme, on a

§ ÑZŽ* U §0 ŽC4

Optimisation 51 Raisonnement analytique. La sous-vari´et´e2

Q V 5 1

P* peut ˆetre param´etris´ee `a l’aide de ë ñd ›œ/ ñ(  |•Ÿ

ñdŠ÷. Le probl`eme qui consiste `a minimiser ÑZš sur 2 est alors ´equivalent `a minimiser la fonction

I ñd ÑZ ë ñd4 ›œ/ ñ  |}Ÿ ñ  |•Ÿ ñ sur . La condition Ie§ ñd ›Lœ/ ñ

P est satisfaite pourñ

ò  *`Œò  *a˜ò Â

* etc. CommeI§§ ñd  |•Ÿ ñ , les minima sont obtenus pourñ

Œò  et pourñ žò  .

Pour une fonction arbitraire ÑZ et pour une sous-vari´et´e de

donn´ee par une courbe param´etriqueë

ñd , l’approche analytique donne pourI ñd ÑZ ë ñd4 la condition I § ñd Ñ § ë ñd4 i ë ñd § ÑZ ë ñd ÷ i ë ñd P*

Avec l’interpr´etation g´eom´etrique, on a donc au minimum:

§ ÑZ?*C- tangente `a2 en R § ÑZŽ*‚: §0 ŽC R § Ñ)?* U §0 ?*

Le but est de g´en´eraliser cet exemple `a une fonctionÑ de variables et `a une sous-vari´et´e arbitraire de de dimension$ .

Le probl`eme `a traiter dans ce paragraphe est alors le suivant: soient donn´ees une fonction

ÑÈb ¸f

continˆument diff´erentiable et une sous-vari´et´e 2 de dimension $ . Calculer les solutions de

Ñ)š

f

j8|}Ÿ

sur 2 (2.1)

c.-`a-d. on cherche B¹2 tel que ÑZš6OðÑ)?* pourM›2 proche de  . On dit aussi que B›2

est un minimum relatif de la fonctionÑ

(restriction de Ñ `a2 ).

Th´eor`eme 2.1 Soit Ñ9b

f

deux fois continˆument diff´erentiable et soit ë

b

!

f

une param´etrisation locale de2 pr`es de S›2 (etë

Ž>⠍ ). Alors § ÑZ?*‡÷ ë § Ž>â P et ¨ est d´efinie positive £

Ñ poss`ede un minimum relatif en  £ § ÑZŽ*Š÷ ë § ?>â P et ¨ est semi-d´efinie positive o`u¨ est la matrice Hessienne de l’application>¥û

f Ñ) ë Ž>K4 , c.-`a-d. ¨ b ë § ?>â ÷ § ÑZŽ* ë § Ž>â 5 ƒ•c0 _ Ñ _ Ž* § ë ƒŽ>â (2.2)

Notons que la matrice Hessienne §

ÑZ?* de la fonction Ñ est de dimension , mais que la matrice¨ est seulement de dimension$ .

D´emonstration. La restriction de la fonctionÑ sur2 poss`ede un minimum relatif enB¹2 si et seulement si I

?>Ԃb

ÑZ

ë

?>Ô4 en poss`ede un en . En observant que Ie§ ?>Ô Ñ § ë ?>Ô4 ë § ?>K § Ñ) ë Ž>K4 ÷ ë § Ž>K et que§ I Ž>K ë § Ž>K ÷ § ÑZ ë ?>K ë § ?>K 5 ƒ•c0 b W b ç²» ë Ž>K4 § ƒ.Ž>K , l’affirmation est une cons´equence du th´eor`eme 1.1.

Si on veut ´eviter la notation matricielle, la conditionI § Ž>â § Ñ)?* ÷ ë § ?>â P s’´ecrit _ I _ >ª† ?>⠃•c0 _ Ñ _ ?* _ ë ƒ _ >ª† ?>â P pour ‹ W& ($

et les ´el´ements de la matrice¨

§ I ?>â sont ] †ä _ I _ >ª† _ >ªä Ž>â _ Ñ _ _ "r ?* _ ë ƒ _ >ª† Ž>â _ ë r _ >ªä ?>â 5 _ Ñ _ ?* _ ë ƒ _ >ª† _ >ªä ?>â

52 Optimisation Ce th´eor`eme donne un crit`ere satisfaisant si la sous-vari´et´e 2 est donn´ee par une param´e-trisation. Mais dans la plupart des applications, la sous-vari´et´e est donn´ee sous la forme 2

È V 0 š

P* . Le but est alors d’exprimer les conditions n´ecessaires et suffisantes du th´eor`eme 2.1 en termes de0

š et non deë Ž>K .

La condition sur la premi`ere d´eriv´ee. La condition§ Ñ)?*Š÷ ë § ?>â P , i.e. § ÑZŽC‡÷ ë § Ž>â P pour tout !

, signifie que le vecteur §

ÑZŽ* est orthogonal `a l’espace tangentü

z

2 (voir la formule (8.1) du paragraphe III.8). Il suffit d’utiliser la formule (8.2) du paragraphe III.8 qui dit queü z 2 Ÿ¡ ¢ 0 §

Ž* et un th´eor`eme du cours d’Alg`ebre1pour conclure que §

ÑZŽC% žuj

0

§

?* ÷. Ceci implique qu’il existeU

ŽUa 4UØ¬Š÷ tel que

§ ÑZŽ* 0 § ?* ÷ U Ø !c0 U¡! §0 !?* (2.3)

Ici, on d´enote par0

!š les composantes de la fonction0

b

;f

Ø

. Les param`etresU, (U¡Ø

s’appellent les multiplicateurs de Lagrange. En introduisant la fonction de Lagrange

¼ UZb Ñ)šš1”U ÷ 0 š ÑZšš1 Ø !c0 U! 0 !š4 (2.4)

cette condition devient§

ç

¼

U"

P , o`u §

ç d´enote le vecteur des d´eriv´ees partielles par rapport aux composantes de . En r´esum´e, un point M^2 satisfait la condition §

Ñ)?* ÷ ë § ?>â P du th´eor`eme 2.1 si et seulement si ŽCU" est solution du syst`eme

§ ç ¼ U P* 0 š P* (2.5)

Il faut donc r´esoudre ce syst`eme `a

5 Ý conditions pour 5 Ý inconnues (» etUY Ø ).

La condition sur la deuxi`eme d´eriv´ee. Essayons maintenant d’´ecrire la condition “¨ est d´efinie (ou semi-d´efinie) positive” du th´eor`eme 2.1 seulement `a l’aide de la fonction0

š . Comme on a0 ë ?>K

P , en d´erivant par rapport `a>ª†, on obtient ƒ bŠ‚ Þ b ç²» bŠ½ » bŠ¾ ` P et en d´erivant une deuxi`eme fois, on obtient ƒtmr

b é ‚ Þ b ç²» b 磿 bŠ½ » bŠ¾ ` bŠ½ ¿ bt¾<À 5 ƒ bŠ‚ Þ b ç²» b é ½ » bt¾ ` bt¾<À P . En utilisant (2.3), l’´el´ement

‹å¡ du deuxi`eme terme de (2.2) est donc

ƒ _ Ñ _ Ž* _ ë ƒ _ >ª† _ >ªä ?>â !@mƒ U¡! _ 0 ! _ ŽC _ ë ƒ _ >ª† _ >ªä ?>â 1 !@mƒtmr U¡! _ 0 ! _ _ "r Ž* _ ë ƒ _ >ª† Ž>â _ ë r _ >ªä ?>â4

L’expression `a ´etudier devient alors

÷ ¨ ÷ ë § Ž>â ÷ § ÑZ?*š1 Ø !c0 U¡! § 0 !?* ë § ?>â, En posant& ë § ?>â et en utilisantü z 2 —žuj ë §

?>â (voir le paragraphe III.8), la condition “÷ ¨ ’ P poury ! ” devient & ÷ § ç ¼ ?CU!& & ÷ § Ñ)?*21 Ø !c0 U! § 0 !?* & ’ P pour ü z 2

Celle-ci ne d´epend plus de la param´etrisationë

?>K mais uniquement de0 š.

1

Rappel du cours d’Alg`ebre. Pour une matrice arbitraire Á on aÂ+ÃtÄÅIÁÇÆÈÊɋËÍÌÎÁMÏ . On utilise ici la notation

Ð

ÈÑɛÒFÓÕÔ×Ö.Ø%ÙÍÓ%ÏÚ)ÉÜÛ pour toutÚ)Ô ÐÞÝ

.

D´emonstration. Ceci suit des ´equivalencesÚ)ÔãÄÅIÁàß ÁÚÎÉáÛ8ß Ó%Ï ÁÚÎÉâÛ pour toutÓãß Ú,ä›ÁMÏÓ pour

toutÓ ß Ú,ä¸ËÍÌ,Á*ÏÕß Ú,ÔhÂ+ËÍÌ)Á*ÏFÆ+È et du fait queÂ

Ð

ÈÆÈÑÉ

Ð

Optimisation 53 Nous avons alors d´emontr´e le r´esultat suivant:

Th´eor`eme 2.2 Soient ÑÉb f suffisamment diff´erentiable,2 ' 9 V 0 š P/ une sous-vari´et´e,B›2 etUY Ø . Avec ¼

U" donn´ee par (2.4), on a alors

§ ç ¼ ŽCU" P et &Á÷ § ç ¼ Ž¡U"!& ’ P pour ü z 2 A&; P £ Ñ poss`ede un minimum relatif en  £ § ç ¼ Ž¡U" P et &Á÷ § ç ¼ Ž¡U"!&ÈOQP pour ü z 2

Corollaire 2.3 Situation comme dans le th´eor`eme 2.2. Alors on a

§ ç ¼ ?CU P et &‚÷ § ç ¼ ?CU!&ÈxP pour ü z 2 A&; P £ Ñ poss`ede un maximun relatif en  £ § ç ¼ ?CU P et &Á÷ § ç ¼ ?CU!&È[QP pour ü z 2

Exemple 2.4 Consid´erons un parall´el´epip`ede droit dont la largeur,

la profondeur et la hauteur sont respectivement 4. et A . Le probl`eme consiste `a maximiser le volume ÑZ @A

?A

tout en gardant le p´erim`etre constant et ´egal `a: (i.e. la sous-vari´et´e

2 est donn´ee par0

4@.A 5 5 LAe1: P ). La fonction de Lagrange pour ce probl`eme est

¼ U ?A­1©UŽ 5 5 LA­1n:® A

et la condition n´ecessaire (2.5) devient

A=1©*U P ?A=1©*U P ?=1©*U P 5 5 LA=1c: P*

Les solutions de ce syst`eme sont :

 *P/P/ , ŽP/a:  *P/ , –P*P*:  / avec U

P dans chaque cas et : Â0& *a: Â0& *a: Â0& / avecU : Â

˜/žK— . Il est facile de deviner que le volume est maximal pour

A : Â0&

, mais v´erifions tout de mˆeme la condition suffisante du corollaire 2.3. Pour ceci, nous calculons

§ ç ¼ U P A A P P

ainsi que l’espace tangent pour2 @A‡÷ V 0 .@A P* : ü z 2 Ò KKA ÷ V 0 5 K 5 ÔA P* W] & 1 & LP/ ÷ ­ & P*1 & ÷ _ La condition& ÷ § ç ¼

?CU!&Èx€P pour

ü

z

2 A&;

P est alors ´equivalente `a la propri´et´e que

& 1 & P & P 1 & P A A P P & & 1 & P P 1 & 1#A 1J­13A š1J%1ÉA

soit d´efinie n´egative. Cette condition est satisfaite pour le point : Â0& *: ÂÒ& *a: Â0& K . Pour les autres trois points critiques, les deux valeurs propres de cette matrice sont de signes oppos´es.

54 Optimisation

Exemple 2.5 Cherchons `a minimiser la fonctionÑZ .A

13%13A sur la sous-vari´et´e

2 ð @AŠ÷ V 5 L 1 P/%Œ 1”A

P* . Cette derni`ere repr´esente l’intersection d’un cylindre vertical avec un plan, c.-`a-d. une ellipse dans l’espace. La fonction de Lagrange est

¼ 4@.AU, 4UC 1É=13A­1©U, 5 1 & š1”UCCŽŒL 1wLA

et la condition n´ecessaire (2.5) devient

& 1©*U, Ž š1©Œ*U¡ P 1 & 1©*Ua – P 1 & 5 *U¡ P 5 1 P Œ š1©A P

dont les solutions sont

UC ¤ å Ua $ æ $ ¤  èç ¦  A $ ¤ å (2.6)

On aimerait d´eterminer laquelle de ces deux solutions repr´esente un minimum (ou maximum) de la fonctionÑ . Nous calculons alors

§ ç ¼ U 1#Ua P P P P P P P

et l’espace tangent pour2 (au points de la solution (2.6))

ü z 2 +0 4KKA ÷ V L 0 5 K P*7ŒÒ 1w£KA P* \] –* & ŒK ÷ _4 Avec&Öb –* & LŒ/ ÷ on a& ÷ § ç ¼ U!&

1#ŒK—*Ua . La fonction Ñ est donc minimale sur2 au point Ž1 &L Œ*  Œ*1

/ ÷ o`uUa est n´egatif et elle est maximale sur2 au point Œ*1#  Œ* K ÷.

Dans le document Math´ematiques pour Informaticiens (Page 50-54)