• Aucun résultat trouvé

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT --

N/A
N/A
Protected

Academic year: 2022

Partager "DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT --"

Copied!
11
0
0

Texte intégral

(1)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT --

Master MIMSE - Année 2

Optimisation 2

Optimisation sans contraintes - (R)appels

(2)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Fonctions à une variable

• On veut optimiser une fonction f : ℜ → ℜ sur un espace X ⊂ ℜ.

• X est un intervalle ou une collection d’intervalles.

• On suppose que f est dérivable sur l’intérieur de X.

• L’optimum est soit sur une borne d’un des intervalles,

• soit en un point xˆ de l’intérieur de X vérifiant : f(ˆx) = 0.

• Si de plus f est deux fois dérivable,

f′′(ˆx) > 0 implique un minimum local, f′′(ˆx) < 0 implique un maximum local.

• S’il y a des points de X où f n’est pas dérivable, ils peuvent être optimaux.

(3)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Fonctions à une variable - Méthode de Newton

• Ne donne qu’un optimum local : information locale : résultat local.

• Pour avoir un optimum global, il faut des informations glob- ales : convexité.

• Résoudre f(x) = 0 n’est généralement pas facile, même pour des polynômes.

• Pas d’écriture analytique.

• On peut calculer de façon approchée une solution de f(x) = 0 par la méthode de Newton :

xn+1 = xn − f(xn) f′′(xn),

• Partir d’un point initial x0 pas trop loin de la solution !

(4)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Fonctions à plusieurs variables

• Conditions analogues au cas à une variable, mais qui font ap- pel aux dérivées partielles et aux gradient.

• Optimums toujours éventuellement présents à la frontière de X.

• Soit x = (x1, . . . , xn).

• Si ∂x∂f

i(x) existe pour tout x et tout i,

• Si f a un extremum local en xˆ dans l’intérieur de X,

• Alors ∂x∂f

i(ˆx) = 0 ∀i

• Ou encore ∇f(ˆx) = 0.

• Si f est deux fois différentiable, soit ∇2f sa matrice hessi- enne (matrice des ∂x2f

i∂xj).

• Si ∇2f(ˆx) ≻ 0 (toutes ses valeurs propres > 0) alors mini- mum local,

• Si −∇2f(ˆx) ≻ 0 alors maximum local.

En général, ni l’un ni l’autre : point-selle !

(5)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Fonctions à plusieurs variables -

Méthode de Newton-Raphson

• Les mêmes remarques que précédemment s’appliquent : – Résultats seulement locaux,

– Difficultés à résoudre ∇f = 0

– En plus, système de n équations à n inconnues.

• On peut toujours calculer de façon approchée une solution de

∇f(x) = 0 par la méthode de Newton-Raphson : xn+1 = xn − [∇2f(xn)]1∇f(xn),

• Attention ! Il faut pouvoir calculer l’inverse de ∇2f en tous les points !

• Attention (bis) ! Le conditionnement de ∇2f peut causer des erreurs de calcul qui se répercutent.

(6)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Fonctions à plusieurs variables - Convexité

• On dit qu’un espaceS est convexe si pour toute paire de points x, y de S et tout0 ≤ α ≤ 1, le point αx+ (1−α)y ∈ S.

• Le segment [x, y] ⊂ S.

• Une fonctionf définie surS convexe est convexe si pour toute paire de points x, y de S et tout 0 ≤ α ≤ 1,

f(αx + (1 − α)y) ≤ αf(x) + (1 − α)f(y).

• De plus,

f(x) − f(y) ≥ ∇f(x)T(x − y).

• La courbe de f est en-dessous de ses cordes et au-dessus de ses tangentes.

• Si f est convexe sur X convexe et si xˆ est un minimum local de f alors xˆ est un minimum global de f.

• Si f est concave sur X convexe et si xˆ est un maximum local de f alors xˆ est un maximum global de f.

• Si ∀x ∇2f(x) 0 alors f est convexe.

(7)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Cas d’une fonction quadratique

• On considère le cas d’une fonction quadratiquef(x) = P

aix2i+ P Paijxixj + P

bixi + c.

• On veut minimiser f sur ℜn.

• On peut écrire f sous la forme f(x) = 1

2xTAx + bTx + c avec Aii = 2ai et Aij = Aji = aij.

• ∇f = Ax + b.

• ∇2f = A.

• Si A ≻ 0 alors f admet un minimum unique au point x =

−A1b.

• Sinon, pas de minimum (peut partir à −∞) en général.

(8)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Algorithmes de descente

• Pour trouver un minimum local de f quelconque, on a des algorithmes de descente.

• Principe :

1. Point initial x0.

2. Trouver une direction de descente d : une direction telle que dT∇f(xn) < 0.

3. Eventuellement calculer un pas de descente ρ.

4. xn+1 = xn + ρd.

5. Si ∇f(xn+1) 6= 0 réitérer.

• ρ peut être fixe, mais ρ petit : convergence longue, ρ grand : risque de diverger.

• ρ décroissant selon un schéma donné.

• ρ obtenu par recherche linéaire.

(9)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Recherche linéaire

• But : Minimiser selon ρ la fonction f(xn + ρd).

• Approche 1 : exprimer φ(ρ) = f(xn + ρd) et optimiser φ.

On doit tout recalculer quand on change xn, risques d’erreur, difficultés à programmer.

• Approche 2 : il existe des méthodes pour optimiser f(xn +

ρd) sans avoir à l’exprimer explicitement, par réduction d’intervalles.

• On suppose φ unimodale : elle décroît jusqu’à ρ puis elle recroît.

• Méthode de Fibonacci :

si = ai + (bi − ai)Ani/An+2i

¯

si = ai + (bi − ai)An+1i/An+2i

avec lesAi les éléments de la suite de Fibonacci 0,1,1,2,3,5,...

• On évalue aux points si et s¯i et on réduit l’intervalle.

• Méthode de la section dorée : on approche les points précé- dents avec la formule :

si = ai + (bi − ai)3 − √ 5 2

¯

si = ai + (bi − ai)

√5 − 1 2

• Approche 3 : Théorème fondamental :

∇f(xn + ρd)Td = 0.

(10)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Algorithme de plus forte pente

• On montre que la direction de descente qui fait décroître le plus vite f(xn + ρd) est

d = −∇f(xn).

• Algo très basique.

• En pratique, convergence pas toujours très bonne : voir exem- ple graphique.

• Si les xn convergent vers x et que f est C1 sur un voisinage de x alors x est un minimum local pour f.

• Algo du gradient accéléré : on fait plusieurs itérations du gra- dient, et le résultat nous donne la “vraie” direction de recherche.

(11)

DRAFT -- DRAFT -- DRAFT -- DRAFT -- DRAFT -- Algorithmes de quasi-Newton

• Newton-Raphson : amélioration du gradient (tient compte de la géométrie). Optimise instantanément des fonctions quadra- tiques.

• En général, on l’améliore en introduisant un pas ρ.

• Difficultés calculatoires : on approche la méthode (Quasi- Newton).

• Ex. Davidon-Fletcher-Powell 1. H1 = I, x1 point initial.

2. Itération k :

(a) dk = −Hkgk (on note gk = ∇f(xk)) (b) Trouver ρ

(c) σk = ρdk

(d) xk+1 = xk + σk (e) γk = gk+1 − gk

(f) Hk+1 = Hk + Ak + Bk avec Ak = σkσTkkTγk

et Bk = HkγkγkTHkkTHkγk (g) Cas d’arrêt ? Sinon réitérer.

Références

Documents relatifs

• mais calculs parfois importants pour reformuler (loi de sommes...). • et après calculs parfois ardus (P

The first are representative of the computing power achieved by general purpose computer architectures on the calorimeter: this year’s fastest computer on a chip; compared to

These procedures are documented in the service manual (FIPs). Examples: Verification of Power Normal LED indication, power supply verification via test points,

A component of an II-dimensional array variable is denoted by the variable followed by an index expression. The main variable of the array variable is the main

It is interesting to note that in all cases, each variant of the records specified in the Channel interface consist of a single field whose type had already been

Although the global frame overhead (now ten words) will be reduced, the fact that external links currently start at a fixed offset from the beginning of the

A subwindow of the stack window is reserved for showing context information about the current configuration, psb, module, global frame, and local frame. When Ule

preparations for the regional intergovernmental preparatory meeting to be held in Arusha in September 1984, where representatives would work out an African position to be presented