B. Population de l’étude
VI- Conclusion :
4.3.1 Relação com a condição de qualificação conjunta MFCQ+WCR
Direitamente da Proposição 4.1.4 e do Teorema 4.2.1 temos que o resultado a seguir. Proposição 4.3.1. A condição CCP2 é implicada por MFCQ+WCR.
De fato, a condição CPP2 é estritamente mais fraca que MFCQ+WCR, como o seguinte exemplo mostra.
Exemplo 4.3.1. (A condição CCP2 não implica MFCQ+WCR.)
Em R, considere x∗ = 0 e as restrições de desigualdade definidas pelas funções
g1(x) = x e g2(x) =−x. (4.3.1)
Em x∗, temos que CPP2 vale mas MFCQ falha (como consequência MFCQ+WCR falha). Para ver
isso, notemos que desde que os gradientes das funções g1 e g2são positivamente dependente, MFCQ
não vale em x∗ = 0. Calculemos o cone KW
2 (x) para todo x ∈ R. Como ∇g1(x) = 1,∇2g1(x) =
0,∇g2(x) = −1 e ∇2g2(x) = 0 temos que CW(x, x∗) = 0. Desta forma, qualquer matriz H ∈
Sym(1) = R satisfaz a desigualdade matricial:
H µ1∇2g1(x) + µ2∇2g2(x) = 0 sobre CW(x, x∗) ={0} para todo µ1, µ2 ≥ 0 .
Por conseguinte, KW
2 (x) = R× R para todo x ∈ R e K2W(x) é semicontínua exteriormente em R.
4.3.2 Relação com a condição de qualificação RCRCQ
Nesta subseção provaremos que RCRCQ é estritamente mais forte que a condição CPP2. Para continuar, precisaremos dos seguintes lemas preparatórios. O primeiro lema é consequência de um resultado clássico de análise: o Teorema do posto constante, cf. (Spi65, Teorema 13.2).
Lema 4.3.2. Sejam I e J dois conjuntos de índices. Suponha que os gradientes {∇hi(z),∇gj(z) :
i∈ I, j ∈ J } têm posto constante em uma vizinhança de x ∈ Rn. Então, para cada d∈ Rn tal que
h∇hi(x), di = 0 para i ∈ I e h∇gj(x), di = 0 para j ∈ J (4.3.2)
existe uma curva t→ φ(t), t ∈ (−T, T ), T > 0 duas vezes diferenciável tal que φ(0) = x, φ′(0) = d
e para todo i∈ I e j ∈ J temos que hi(φ(t)) = hi(x) e gj(φ(t)) = gj(x) ∀t ∈ (−T, T ).
4.3 RELAÇÕES COM AS CQS CONHECIDAS 65 Lema 4.3.3. (AHSS12a, Lema 1) Suponha que v =Pi∈Iαipi+Pj∈Jβjqj com pi, qj ∈ Rn para
todo i ∈ I, j ∈ J , {pi}i∈I é um conjunto linearmente independente e αi, βj são diferentes de zero
para todo i ∈ I, j ∈ J . Então existe um subconjunto J′ ⊂ J e escalares ˆαi, ˆβj para todo i ∈ I,
j∈ J′ tais que
• v =Pi∈Iαˆipi+Pj∈J′βˆjqj;
• Para todo j ∈ J′ temos βjβˆj > 0;
• {pi, qj}i∈I,j∈J′ é um conjunto linearmente independente.
Uma caracterização útil de RCRCQ é feita a seguir.
Teorema 4.3.4. (AHSS12a, Teorema 1) Seja I ⊂ {1, . . . m} um conjunto de índices tal que {∇hi(x) : i ∈ I} é uma base linear de span{∇hi(x) : i ∈ {1, . . . , m}}. Um ponto viável x ∈ Ω
satisfaz RCRCQ se, e somente se, existe uma vizinhança V de x tal que a) {∇hi(y) : i∈ {1, . . . , m}} tem o mesmo posto para todo y ∈ V ;
b) Para cada J ⊂ A(x), se {∇hi(x),∇gj(x) : i ∈ {1, . . . , m}, j ∈ J} é linearmente dependente
então{∇hi(y),∇gj(y) : i∈ {1, . . . , m}, j ∈ J} é linearmente dependente para todo y ∈ V .
A próxima proposição estabelece a primeira relação entre a CCP2 e a RCRCQ. Proposição 4.3.5. A condição CCP2 é implicada pela RCRCQ.
Demonstração. Seja (w, W ) um elemento de lim supx→x∗K2W(x). Pela definição de limite exterior,
existem sequências {xk}, {λk
i}, {µkj} com µkj = 0 para j /∈ J(x∗) e {Hk} tais que xk→ x∗,
wk:= m X i=1 λki∇hi(xk) + X j∈J(x∗) µkj∇gj(xk)→ w e Hk→ W, (4.3.3) onde HkPm i=1λki∇2hi(xk) +Pj∈J(x∗)µkj∇2gj(xk) sobre CW(xk, x∗).
Seja I ⊂ {1, . . . , m} um subconjunto de índices tal que os gradientes {∇hi(x∗)}i∈Iformem uma base
linear do subespaço linear gerado por {∇hi(x∗) : i∈ {1, . . . , m}}. Da continuidade, {∇hi(xk) : i∈
I} é linearmente independente para k suficientemente grande. Pelo Teorema 4.3.4, item (a), temos que {∇hi(xk) : i∈ I} é uma base do subespaço linear gerado por {∇hi(xk) : i∈ {1, . . . , m}} para k
suficientemente grande. Então, existe uma sequência ¯λk
i ∈ R para i ∈ I tal que
Pm
i=1λki∇hi(xk) =
P
i∈Iλ¯ki∇hi(xk). Assim, podemos escrever:
wk =X i∈I ¯ λki∇hi(xk) + X j∈J(x∗) µkj∇gj(xk). (4.3.4)
Usando o Lema 4.3.3 para a expressão acima, encontramos um subconjunto de índices Jk ⊂
J(x∗) e multiplicadores ˆλk
i ∈ R, i ∈ I e ˆµkj ∈ R+, j∈ Jk para k suficientemente grande tal que
wk=X i∈I ˆ λki∇hi(xk) + X j∈Jk ˆ µkj∇gj(xk) (4.3.5)
e {∇hi(xk),∇gj(xk) : i ∈ I, j ∈ Jk} é um conjunto linearmente independente. Como A(x∗) é um
conjunto de índices finitos, sem perda de generalidade, podemos supor que J := Jk para todo k
suficientemente grande. Do Teorema 4.3.4, item (b), temos que {∇hi(x∗),∇gj(x∗) : i ∈ I, j ∈ J }
é um conjunto linearmente independente e {ˆλk
i, ˆµkj : i ∈ I, j ∈ J }k∈N é uma sequência limitada,
assim sem perda de generalidade podemos supor que ˆλk
i → λi e ˆµkj → µj. Tomando limites em
i /∈ I e ˆµk
j = 0 para j /∈ J , defina também λi = 0 para i /∈ I e µj = 0 para j /∈ J . Agora, mos-
traremos que d ∈ CW(x∗) se cumpre H(d, d)i ≤Pm
i=1λi∇2hi(x∗)(d, d)+Pj∈J(x∗)µj∇2gj(x∗)(d, d).
Defina para cada k ∈ N, Λk
i = λki − ˆλki, Υkj = µkj − ˆµkj. De (4.3.5) e (4.3.3) temos que m X i=1 Λki∇hi(xk) + X j∈J(x∗)
Υkj∇gj(xk) = 0 para k∈ N suficientemente grande. (4.3.6)
Seja d ∈ CW(x∗). Uma vez que RCRCQ implica WCR, temos que existe uma sequência dk→ d
tal que dk∈ CW(xk, x∗), ver Lema 4.1.3, portanto
Hk(dk, dk) ≤ m X i=1 λki∇2hi(xk)(dk, dk) + X j∈J(x∗) µkj∇2gj(xk)(dk, dk) (4.3.7) ≤ m X i=1 ˆ λki∇2hi(xk)(dk, dk) + X j∈J(x∗) ˆ µkj∇2gj(xk)(dk, dk) + Ξk, (4.3.8) em que Ξk:= m X i=1 Λki∇2hi(xk)(dk, dk) + X j∈J(x∗) Υkj∇2gj(xk)(dk, dk). (4.3.9)
De RCRCQ, temos que para k suficientemente grande, existe uma vizinhança de xk, na qual o
posto {∇hi(x),∇gj(x) : i∈ {1, . . . , m}, j ∈ J(x∗)} é constante, assim pelo Lema 4.3.2, existe uma
curva t → φk(t) para t∈ (−Tk, Tk), Tk > 0 com φk(0) = xk, φ′k(0) = dk tal que hi(φk(t)) = hi(xk)
para todo i ∈ {1, . . . , m} e gj(φk(t)) = gj(xk) para todo j∈ J(x∗). Denote vk:= φ′′k(0) Derivando
hi(φk(t)) = 0, i∈ {1, . . . , m} e gj(φk(t)) = 0, j ∈ J(x∗) duas vezes em t = 0, obtemos:
h∇hi(xk), vki + ∇2hi(xk)(dk, dk) = 0, para todo i∈ {1, . . . , m}; (4.3.10)
h∇gj(xk), vki + ∇2gj(xk)(dk, dk) = 0, para todo j ∈ J(x∗). (4.3.11)
Assim, substituindo as expressões (4.3.10) e (4.3.11) em (4.3.9)
Ξk = − m X i=1 Λkih∇hi(xk), vki − X j∈J(x∗) Υkjh∇gj(xk), vki (4.3.12) = −h m X i=1 Λki∇hi(xk) + X j∈J(x∗) Υkj∇gj(xk), vki = 0, (4.3.13)
onde na última igualdade usamos (4.3.6). Como Ξk= 0 para todo k suficientemente grande, temos
que (4.3.8) torna-se Hk(dk, dk)≤ m X i=1 ˆ λki∇2hi(xk)(dk, dk) + X j∈J(x∗) ˆ µkj∇2gj(xk)(dk, dk). (4.3.14)
Tomando limite em (4.3.14), concluímos com a demonstração. Como consequência, CRCQ também implica CCP2.
4.3 RELAÇÕES COM AS CQS CONHECIDAS 67 Em R2, considere x∗ = (0, 0)⊤ e o seguinte conjunto de restrições definidas pelas funções
h1(x1, x2) = x1;
g1(x1, x2) = −x21+ x2;
g2(x1, x2) = −x21+ x32.
Do cálculo, temos que ∇h1(x1, x2) = (1, 0)⊤, ∇g2(x1, x2) = (−2x1, 1)⊤e ∇g3(x1, x2) = (−2x1, 3x22)⊤.
Desta forma, RCRCQ falha em x∗ = (0, 0). Agora, desde que CW(x, x∗) = {(0, 0)⊤}, temos que
KW
2 (x) = R× R+× Sym(2). Claramente, K2W(x) é semicontínua exteriormente.
4.3.3 Relação com a condição de Baccari-Trad.
Outra condição de qualificação de segunda ordem conhecida na literatura relacionada com MFCQ, foi é introduzida por Baccari e Trad, (BT05):
Definição 4.3.1. A condição de Baccari-Trad vale em x∗ ∈ Ω se MFCQ vale e o posto dos gradi-
entes das restrições ativas é, no máximo, o número total das restrições ativas menos um .
Apesar da condição de Baccari-Trad garantir a validade de WSONC em um minimizador local, analogamente a CCP2, elas não estão relacionadas.
Exemplo 4.3.3 (A condição de Baccari-Trad não implica CCP2).
Considere em R2 o ponto x∗ = (0, 0) e as restrições de desigualdades definidas pelas funções
g1(x1, x2) = −x2;
g2(x1, x2) = x21− x2.
Então, a condição de Baccari-Trad vale em x∗ mas CCP2 falha.
A condição de Baccari-Trad vale em x∗.
Do cálculo, ∇g1(x1, x2) = (0,−1)⊤ e ∇g2(x1, x2) = (2x1,−1)⊤. Assim, em x∗ = (0, 0)⊤, temos
que MFCQ vale e que o posto dos gradientes das restrições ativa é exatamente um a menos que o número das restrições ativas (nosso caso, 2).
A condição CCP2 não é satisfeita em x∗.
Da forma dos gradientes, temos que CW(x∗, x∗) = R× {0} e CW(x, x∗) = {(0, 0)}, se x
1 6= x∗1.
Assim, para qualquer sequência {xk} com xk→ x∗ e xk
1 > 0, o cone K2W(xk) = R+× R−× Sym(2)
mas KW
2 (x∗) é um subconjunto próprio de {0} × R−× Sym(2). Por conseguinte, CCP2 falha.
Para ver que a condição CCP2 não implica a condição de Baccari-Trad, é suficiente notar que MFCQ+WCR implica CCP2, Proposição 4.3.1, enquanto MFCQ+WCR não implica a condição de Baccari-Trad, (AMS07, contra-exemplo 5.2).
A independência entre CCP2 e a condição Baccari-Trad tem implicações práticas. Devido ao Teorema 4.2.1, a condição de Baccari-Trad não é suficiente para garantir que um ponto limite de uma sequência AKKT2 cumpra WSONC, como mostra o seguinte exemplo.
Exemplo 4.3.4 (AKKT2, sob a condição de Baccari-Trad, não implica WSONC). Considere o problema de otimização não linear:
Minimizar f(x1, x2) =−2x21 sujeito a g1(x1, x2) =−x2 ≤ 0, g2(x1, x2) = x21− x2 ≤ 0. (4.3.15)
Devido ao Exemplo 4.3.3, a condição de Baccari-Trad vale em x∗ = (0, 0)⊤. Para mostrar que
x∗ é um ponto AKKT2, escolha xk
1 := 1/k, xk2 := xk1, µk1 := 0, µk2 := 0, θ2k:= 2(xk1)−2, θk1 := 2θk2 e
δk := 0. Com essas escolhas temos que∇f(xk) + µk1∇g1(xk) + µ2k∇g2(xk) = (−4xk1, 0)⊤→ (0, 0)⊤ e
∇2L(xk, µk) + θ1k∇g1(xk)∇g1(xk)T + θk2∇g2(xk)∇g2(xk)T = 4 −2θk 2xk2 −2θk 2xk2 3θk2 ,
onde a última matriz é semi-definida positiva. Observe que WSONC falha em x∗ e que x∗ não é
uma solução otima para o problema (4.3.15).
Assim, neste exemplo, temos um ponto x∗= (0, 0)⊤que não é uma solução otima e nem satisfaz
WSONC, mas ele pode ser atingido por uma sequência AKKT2 (sequência, talvez, gerada pelo método de lagrangiano aumentado ou pelo método SQP regularizado) e como consequência aceito como possível solução. Isto não acontece, se em lugar da condição de Baccari-Trad, consideramos qualquer outra condição de qualificação que implique CPP2, como LICQ, MFCQ+WCR, CRCQ, RCRCQ ou mesmo CCP2.
Resumindo esta seção, definimos uma nova condição de qualificação CPP2 e provamos que CCP2 é uma condição de qualificação para o qual WSONC vale para um minimizador local. A condição CCP2 é estritamente mais fraca que a condição MFCQ+WCR e que a condição RCRCQ. Ainda mais, esta condição é a mínima condição para assegurar que qualquer ponto AKKT2 (ponto limite de uma sequência AKKT2) satisfaz a condição WSONC. Veja o teorema 4.2.1. Isto tem consequência práticas, porque melhora os resultados de convergência para pontos estacionários de segunda ordem de qualquer algoritmo que gere sequências AKKT2, como é o caso do lagrangiano aumentado de (ABMS10) ou o método de regiões de confiança de (DV97). Além disso, esse tipo de resultado não pode ser melhorado usando condições de qualificação mais fracas que CCP2.