Академический Документы
Профессиональный Документы
Культура Документы
Otimizacao
PRINCIPAIS PROPRIEDADES DE
FUNC
OES
CONVEXAS
Vanessa Hlenka
Curitiba
2006
ii
RESUMO
Sum
ario
Introdu
c
ao
1 Fun
c
oes convexas de uma vari
avel real
1.1 Definicoes basicas e exemplos . . . . . . . . . . . . . . . . .
1.1.1 Primeiras definicoes de uma funcao convexa . . . . .
1.1.2 Desigualdades com mais que dois pontos . . . . . . .
1.1.3 Definicao moderna de convexidade . . . . . . . . . .
1.2 Primeiras propriedades . . . . . . . . . . . . . . . . . . . . .
1.2.1 Estabilidade sob operacoes funcionais . . . . . . . . .
1.3 Propriedades de continuidade . . . . . . . . . . . . . . . . .
1.3.1 Continuidade no interior do domnio . . . . . . . . .
1.3.2 Semi-continuidade inferior: funcoes convexas fechadas
1.4 Reconhecendo funcoes convexas . . . . . . . . . . . . . . . .
1.4.1 Formula de Taylor . . . . . . . . . . . . . . . . . . .
1.4.2 Caracterizacao de funcoes convexas diferenciaveis . .
Refer
encias Bibliogr
aficas
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
3
15
18
19
19
20
20
22
25
25
30
36
iii
Introduc
ao
Um importante conceito no contexto de otimizacao e a convexidade, propriedade que, quando presente numa funcao, garante que seu mnimo local e global.
Seja I um intervalo nao vazio de IR. A funcao f : I IR e dita convexa em IR
quando
f (x + (1 )x ) f (x) + (1 )f (x ),
para todos os pares de pontos (x, x ) em I e todo ]0, 1[.
Podemos reconhecer uma funcao convexa de outras maneiras, sendo uma
delas observar o epigrafo de f , que e definido por
epi f := {(x, r) | x Dom f, r f (x)},
e um conjunto convexo.
A desigualdade que define uma funcao convexa f pode ser generalizada para
mais que dois pontos: Para qualquer colecao {x1 , . . . , xk } de pontos em P
I e qualquer
colecao de n
umeros {1 , . . . , k } satisfazendo i 0 para i = 1, . . . , k e ni=1 i = 1,
vale a desigualdade de Jensen:
!
n
n
X
X
f
i xi
i f (xi ).
i=1
i=1
Captulo 1
Func
oes convexas de uma vari
avel
real
Funcoes convexas de uma variavel real formam uma importante classe de
funcoes no contexto geralmente chamado de analise real. Elas sao muito utilizadas
em otimizacao e tambem em diversas areas de matematica aplicada.
As definicoes e propriedades da secao a seguir podem ser encontradas em
[3].
1.1
Defini
c
oes b
asicas e exemplos
ua
(0, 1).
ba
(1.1)
3
Observac
ao 1.1 u definido desta maneira e dito combinacao convexa de a e b.
Finalmente, lembramos a definicao basica de uma funcao f : D IR.
Definic
ao 1.2 O grafico de f e o subconjunto de D IR
gr f := {(x, r)| x D e r = f (x)}.
O epigrafo de f e tudo o que esta acima do grafico:
epi f := {(x, r)| x IR e r f (x)}.
O epigrafo estrito e definido igualmente, substituindo por >.
epi( f )
(x,y)
(x,f(x))
1.1.1
Primeiras definic
oes de uma func
ao convexa
A primeira definicao de uma funcao convexa e a que segue:
Definic
ao 1.3 (Analtica) Seja I um intervalo nao vazio de IR. A funcao f : I
IR e dita convexa em I quando
f (x0 + (1 )x1 ) f (x0 ) + (1 )f (x1 ),
(1.2)
(=0)
(=1)
f(x )
2
f(x )+(1)f(x )
1
f(z)
f(x )
1
f(x1)
Px
z
f(x )
Pz
Px
f(u)
Pu
u
x0
x1
y1 y0
(x u).
x1 x0
(1.3)
Como qualquer ponto da reta que une Px0 e Px1 satisfaz a equacao (1.3), em particular o ponto Px0 , facamos x = x0 e y = y0 ; entao temos
y0 z =
y1 y0
(x0 u).
x1 x0
y1 y0
(u x0 ).
x1 x0
Sabemos que a imagem de u por f e menor que a imagem de u pela reta dada por
(1.3), ou seja, v z, ou
y1 y0
v y0 +
(u x0 ).
x1 x0
Como u x0 > 0, temos
y1 y0
v y0
,
u x0
x1 x0
6
que e justamente a propriedade (ii).
(ii)(iii): Temos que
v y0
y1 y0
.
u x0
x1 x0
Como u x > 0 e x1 x0 > 0, podemos escrever
(v y0 )(x1 x0 ) (y1 y0 )(u x0 ),
vx1 vx0 y0 x1 + y0 x0 uy1 uy0 x0 y1 + x0 y0 ,
uy0 uy1 y0 x1 vx0 vx1 x0 y1 .
y1 y0
y1 v
.
x1 x0
x1 u
(iii)(i): Temos que
y1 v
y1 y0
.
x1 x0
x1 u
Como x1 x0 > 0 e x1 u > 0, entao
(y1 y0 )(x1 u) (y1 v)(x1 x0 ),
y1 x1 y1 u y0 x1 + y0 u y1 x1 y1 x0 vx1 + vx0 ,
vx1 vx0 x1 y0 x0 y1 + y1 u y0 u.
v y0 +
y1 y0
(u x0 ).
x1 x0
,
u x0
x1 x0
x1 u
(1.4)
7
expressao que pode ser obtida atraves da representacao (1.1) de u (x0 , x1 ) aplicada
na definicao (1.2) de convexidade. Temos que
u = x0 + (1 )x1 .
Entao,
=
e
x1 u
x1 x0
1 =
Substituindo em (1.2), obtemos
f (u)
u x0
.
x1 x0
x1 u
u x0
f (x0 ) +
f (x1 ).
x1 x0
x1 x0
f (x0 ) f (x1 )
f (x1 ) f (x0 )
(u x0 ) = f (x1 ) +
(x1 u),
x1 x0
x1 x0
o que mostra a conexao entre (1.2) e relacoes de valor medio semelhantes `a (1.4).
Combinando a definicao geometrica de funcao convexa com a equivalencia
enunciada na Definicao 1.4, chegamos `a seguinte caracterizacao de convexidade:
Proposic
ao 1.6 (Crit
erio de inclinac
oes crescentes) Seja I um intervalo n
ao
vazio de IR. A funcao f : I IR e convexa em I se e somente se, para todo x0 I,
a funcao-inclinacao
f (x) f (x0 )
x 7
=: s(x)
(1.5)
x x0
e crescente em I \ {x0 }.
Prova. Sejam x1 , x2 I com x1 < x2 . Seja x0 I, com x0 6= x1 e x0 6= x2 . Temos
tres casos a considerar:
(i) x0 < x1 < x2 ;
(ii) x1 < x0 < x2 ;
(iii) x1 < x2 < x0 .
8
Provemos primeiro, para cada caso, que, se s e crescente, entao f e convexa. Como
s e crescente, temos que
s(x1 ) < s(x2 ),
ou seja,
f (x1 ) f (x0 )
f (x2 ) f (x0 )
<
.
x1 x0
x2 x0
(1.6)
f (x1 ) f (x0 )
f (x2 ) f (x0 )
<
.
(x2 x0 )
x2 x0
9
ou seja, f e convexa para todo x0 > x2 .
Agora provemos para cada caso que, se f e convexa, entao s e crescente.
(i): Para (0, 1), temos que
x1 = x2 + (1 )x0 .
(1.7)
x0 = x2 + (1 )x1 .
(1.8)
10
De (1.8), temos que x2 = x0 (1 )x1 , logo
f (x1 ) f (x0 )
f (x2 ) f (x0 )
<
,
x1 x0 + (1 )x1
x2 x0 + (1 )x1 (1 )x1
f (x1 ) f (x0 )
f (x2 ) f (x0 )
<
,
x1 x0
x2 x0
x2 = x0 + (1 )x1 .
(1.9)
11
a x < x b,
x := x + (1 )x ,
e chamemos
:= f (x ) f (x) (1 )f (x ),
que deve ser nao-positiva ( 0), para que tenhamos
f (x ) f (x) + (1 )f (x ),
ou seja, queremos que f seja convexa.
Temos
= f (x ) f (x) (1 )f (x ).
Rx
Substituimos f (x) por a (u)du:
Z
(u)du
(u)du (1 )
(u)du
a
Z x
Z x
Z x
Z x
(u)du
(u)du +
(u)du
(u)du
=
a
a
a
a
Z x
Z x
=
(u)du +
(u)du.
Como x x x , temos
=
=
Z
Z
(u)du +
x
(u)du +
x
(u)du +
"Z
Z
(u)du +
(u)du +
(u)du
x
(u)du
x
Z x
(u)du +
(u)du
x
Z x
Z x
=
(u)du + ( 1)
(u)du.
x
Temos que a x < x < x b. Como e crescente em [a, b], se u (x, x ), entao
(u) (x ). Logo, vale
=
(u)du + ( 1)
(x )du + ( 1)
(u)du
(x )du.
12
Trocando o segundo e o quarto x da desigualdade acima por x+(1)x, obtemos
=
=
=
Logo,
f (x ) f (x) (1 )f (x ) 0,
f (x ) f (x) + (1 )f (x ),
ou seja, f e convexa.
f (x ) f (x) + (1 )f (x ),
ou seja, queremos que f seja convexa.
Temos que
= |x | |x| (1 )|x |.
= |x + (1 )x | |x| (1 )|x |.
Aplicando a desigualdade triangular, obtemos
|x| + |(1 )x | |x| (1 )|x |
= |x| + (1 )|x | |x| (1 )|x |
= 0.
Como 0, concluimos que f e convexa.
Teorema 1.7 Seja f definida em (0, +). Entao a funcao
1
0 < x 7 g(x) := xf
x
e convexa em (0, +) se e somente se f tambem e convexa em (0, +).
13
Prova. Suponhamos que f e convexa em (0, +); seja x0 > 0 e consideremos a
funcao-inclinacao
1
1
xf
x0 f
g(x) g(x0 )
x
x0
sg (x) :=
=
,
x x0
x x0
f
= f
x
0
x0
x
x0
1
x
1
1
1
1
f
= f
f
1
1
x0
x
x0
x0
x x0
1
1
f
f
1
1
x
x0
= f
1
1
x0
x0
x x0
1
1
1
= f
.
sf
x0
x0
x
1
1
Quando x cresce,
decresce, pela Proposicao 1.6
decresce; entao sf
x
x
e, portanto, sg cresce, logo g e convexa.
Analogamente, podemos mostrar que, se g e convexa em (0, +), entao g
tambem e convexa em (0, +). Como
1
,
g(x) = xf
x
temos
Logo,
1
1
g
= f (x).
x
x
1
f (x) = xg
.
x
Entao as demais linhas desta demonstracao seguem as mesmas da demonstracao
anterior.
A seguir, apresentamos dois exemplos em que aplicamos o Teorema 1.7.
14
Exemplo 3 Sejam as funcoes
f (x) = log x,
convexa em (0, +) e
1
g(x) := xf
.
x
Entao
g(x) =
=
=
=
1
x log
x
1
x log
x
1
1
x log
x
x log x.
log (x)
x log(x)
15
convexa em (0, +) e
1
g(x) := xf
.
x
Entao
1
g(x) = x exp
x
x exp (1/x)
exp(x)
1.1.2
Uma caracterstica essencial da desigualdade basica (1.2) e que ela pode ser
generalizada para mais que dois pontos. Nesta subsecao, alem de [3], temos [4] como
referencia.
Teorema 1.8 Sejam I um intervalo nao vazio de IR e f uma funcao convexa em
I. Entao, para qualquer colecao {x1 , . . . , xk } de pontos em I e qualquer colecao de
n
umeros {1 , . . . , k } satisfazendo
i 0 para i = 1, . . . , k e
k
X
i = 1,
i=1
k
X
i=1
i xi
k
X
i=1
i f (xi ).
(1.10)
16
Prova. Considere primeiro k = 2. A relacao e trivial se 1 ou 2 e zero; se nao,
temos justamente (1.2).
Agora, suponha por inducao que a relacao e verdadeira para k 1; sejam
as colecoes {xi } e {i } como em (1.10). Se k e 0 ou 1, nao ha o que provar. Se
nao, fixemos
k1
X
i (0, 1).
:=
i=1
Entao, temos
k
X
i = 1,
i=1
k +
k1
X
i = 1,
i=1
+ k = 1.
Portanto,
k = 1
,
i
, para i = 1, ..., k 1. Temos que
i 0 e
Entao
k
X
i=1
i xi =
k1
X
i=1
k1
X
i = 1.
(1.11)
i=1
i xi + (1 )x
k.
P
Nesta relacao, o ponto x := k1
i xi esta em I, isto e, entre o menor xi e o maior
i=1
xi . Aplicando (1.11), obtemos:
f(
k
X
i=1
i xi ) f
(
x) + (1
)f (xk )
= f
(
x) + k f (xk ).
k1
X
i f (xi )
i=1
k1
X
i f (xi ).
i=1
O conjunto descrito por (1.10) e chamado de simplex unitario de IRk . Uma colecao
de iP
s satisfazendo (1.10) e chamado de multiplicadores convexos e o correspondente
x = ki=1 i xi e uma combinacao convexa dos xi s.
17
Dizemos que a maioria das desigualdades u
teis entre n
umeros reais sao
conseq
uencias da desigualdade de Jensen acima, mesmo que nem sempre seja facil
descobrir a funcao convexa latente. A seguir, alguns exemplos tpicos.
Exemplo 5 Suponhamos que sabemos que a funcao log x e convexa em (0, +).
Entao, vale a desigualdade de Jensen:
!
k
k
X
X
i log xi
log
i xi
i=1
i=1
k
X
log xi i
i=1
k
Y
= log
xi i
i=1
xi i
i=1
k
X
i xi .
i=1
1
Observa
ca
o 1.9 No caso particular em que i = , i = 1, . . . , n, temos a classica
n
desigualdade entre a media aritmetica e a media geometrica:
x1 x2 . . . xn
x1 + + xn
.
n
log
i=1
k
X
i xi
i=1
!Pki=1 i xi
i=1
k
X
log xi i xi
i=1
= log
k
Y
xi i xi
i=1
i xi
!Pki=1 i xi
k
Y
i=1
xi i xi .
18
1.1.3
Definic
ao moderna de convexidade
(1.12)
(1.13)
Isto nao tem sentido para x < 0 mas, para x 0, o valor otimo e x, uma
funcao convexa de x. Em vista da convencao inf = +, temos uma funcao
convexa no sentido da Definicao (1.10). Isso e bom para saber que problemas
do tipo (1.13) fornecem funcoes convexas de x, mesmo que eles possam nao
ter sentido para todos os valores de x.
Associada a uma dada funcao f , temos a chamada funcao conjugada, dada
por
x 7 sup{xy f (y) | y IR} com x IR
Aqui, mais uma vez os valores de x para os quais o supremo e finito nao sao
necessariamente conhecidos antecipadamente. Este supremo e, deste modo,
uma funcao estendida de x, uma funcao que se torna de extrema importancia.
19
Suponha que uma funcao g, convexa em I, precisa ser minimizada em algum
sub-intervalo C IR. A restricao x C pode ser includa na funcao objetiva
pela definicao:
g(x)
se x C,
f (x) :=
+
caso contrario.
A funcao f resultante pertence a Conv IR e minimiza-la (em todo o IR) e
equivalente ao problema original.
1.2
1.2.1
Primeiras propriedades
Estabilidade sob operac
oes funcionais
Nesta secao, listamos algumas das operacoes que podem ser provadas para
preservar convexidade, simplesmente em vista das proprias definicoes.
Proposic
ao 1.12 Sejam f1 , . . . , fm m funcoes convexas em IR e t1 , . . . , tm n
umeros
positivos. Se existe x0 IR tal que fj (x0 ) < +, para todo j = 1, . . . , m, entao a
funcao
m
X
f :=
tj fj
j=1
obtemos
m
X
j=1
ou seja, f :=
tj fj (x + (1 )x )
m
P
j=1
tj fj Conv IR.
m
X
j=1
tj fj (x) + (1 )
m
X
tj fj (x ),
j=1
Proposic
ao 1.13 Se f : I IR e g : J IR sao funcoes convexas, com f (I) J,
e g monotona nao-decrescente, entao g f e convexa.
20
Prova. Dados x, x I e [0, 1], temos que
f ((1 )x + x ) (1 )f (x) + f (x ),
pois f e convexa, por hipotese. Temos que f (I) J. Tambem temos que g e nao
decrescente, logo
g(f ((1 )x + x )) g((1 )f (x) + f (x )).
Sabemos que g e convexa, entao
g((1 )f (x) + f (x )) (1 )g(f (x)) + g(f (x)),
ou seja,
g f ((1 )x + x ) (1 )g f (x) + g f (x ),
o que significa que g f e convexa.
1.3
Propriedades de continuidade
Ao longo desta secao, utilizamos conceitos de analise que podem ser verificados em [5].
1.3.1
.
z1 (x )
x z1
Agora, aplicando a propriedades das inclinacoes crescentes para os pontos z1 , x, x+,
temos
f (x) f (z1 )
f (x + ) f (z1 )
f (x + ) f (x)
.
x z1
(x + ) z1
Logo,
f (x + ) f (x)
f (x) f (z1 )
f (x) f (x )
x z1
21
Seja agora um ponto z2 (x, x + ). Aplicando a propriedade das inclinacoes
crescentes para os pontos x , x, z2 , temos
f (x) f (x )
f (z2 ) f (x )
f (z2 ) f (x)
z2 (x )
z2 x
Agora, aplicando a propriedade das inclinacoes crescentes para os pontos x, z2 , x+ ,
temos
f (z2 ) f (x)
f (x + ) f (x)
f (x + ) f (z2 )
.
z2 x
(x + ) z2
Logo,
f (z2 ) f (x)
f (x + ) f (x)
f (x) f (x )
z2 x
xz
Seja
L=
f (x + ) f (x)
.
22
Tomemos, entao,
t1 > t2
e multipliquemos ambos os membros da desigualdade por d para obter
dt1 < dt2 ,
pois d < 0, por hipotese. Somamos x0 em ambos os lados e obtemos
x0 + dt1 < x0 + dt2 .
Temos que
f (x0 + dt1 ) f (x0 )
f (x0 + dt2 ) f (x0 )
<
,
(x0 + dt1 ) x0
(x0 + dt2 ) x0
pois funcoes inclinacao sao crescentes. Multiplicando ambos os membros da desigualdade por d, chegamos em
f (x0 + dt2 ) f (x0 )
f (x0 + dt1 ) f (x0 )
>
,
t1
t2
logo
q(t1 ) > q(t2 ),
portanto q(t) e funcao crescente. A partir de
f (x0 + td) f (x0 )
= q(t),
t
temos
f (x0 + td) = f (x0 ) + tq(t) f (x0 ) + (x0 a) =: f (a+ ) IR {+}.
Entao coloquemos t t
cao
0 na rela
q(t) q(t0 ) =
f (a) f (x0 )
,
x0 a
f (a+ ) f (x0 )
f (a) f (x0 )
,
x0 a
x0 a
1.3.2
De acordo com a Proposicao 1.16, o comportamento de uma funcao convexa nos pontos extremos de seu domnio assemelha-se a um dos casos ilustrados
na Figura 1.7. Vemos que o caso (2) e um tanto anormal; ele esta fora da definicao seguinte, que e importante para a existencia de solucoes em problemas de
minimizacao. Pode-se ler mais a respeito em [3]. Tambem temos [1] como referencia
e utilizamos ferramentas de analise que podem ser encontradas em [6].
23
f(a)[f(a ),+]
+
f(a+)
(1) Contnua
(3) Ilimitada
(1.14)
xk x
ou seja, (x, t) epi f . Como (x, t) e ponto de aderencia de epi f , temos que epi f e
um conjunto fechado.
(ii)(iii): Tomemos xk Lt (f ) tal que xk a. Precisamos provar que
a Lt (f ). Seja a seq
uencia (xk , t). Como xk Lt (f ), temos que f (xk ) t. Por
definicao, (xk , t) epi f , pois t f (xk ). Como epi f e um conjunto fechado, por
24
hipotese, e (xk , t) (a, t), entao (a, t) epi f , ou seja, t f (a). Logo Lt (f ) e
fechado para todo t IR.
(iii)(i): Suponhamos agora, por contradicao, que f nao e semi-contnua
inferior para algum x. Entao existe uma seq
uencia {xk } convergindo para x tal
que f (xk ) converge para r < f (x) +. Consideremos t (r, f (x)). Quando k
e suficientemente grande, temos f (xk ) t < f (x), ou seja, Lt (f ) nao contem seu
limite x. Entao, Lt (f ) nao e fechado.
Exemplo 7 Seja f uma funcao convexa cujo domnio e todo o IR, e seja C um
intervalo fechado nao-vazio. Entao a restricao convexa de f a C:
f (x) para x C,
fC (x) :=
+ para x
/ C,
e fechada e convexa. Seu epigrafo e a interseccao do epi f com a barra vertical
gerada por C.
Exemplo 8 Seja C um intervalo nao-vazio de IR. A funcao indicadora de C e
0 para x C,
IC (x) :=
+ para x
/ C.
IC e uma funcao convexa se e somente se C e fechado (seus conjuntos de nvel s
ao
vazios ou C).
Definic
ao 1.19 O fecho de f Conv IR e a funcao definida por
(
lim inf f (y) para x cl Dom f,
yx
cl f (x) :=
+ para x
/ cl Dom f.
Teorema 1.20 Seja f Conv IR. Para todo x0 pertencente ao interior de seu
domnio, f admite uma derivadas `a direita e `a esquerda finitas:
D f (x0 ) := lim
f (x) f (x0 )
f (x) f (x0 )
= sup
,
x x0
x x0
x<x0
(1.15)
D+ f (x0 ) := lim+
f (x) f (x0 )
f (x) f (x0 )
= sup
.
x x0
x x0
x>x0
(1.16)
xx0
xx0
Elas satisfazem
D f (x0 ) D+ f (x0 ).
(1.17)
Prova. Aplicando o criterio de inclinacoes crescentes, o quociente diferenca envolvido em (1.15), (1.16) e justamente a funcao inclinacao s. Para quaisquer dois
pontos x, x no interior do domnio de f satisfazendo x < x0 < x , s(x) e s(x ) sao
n
umeros finitos satisfazendo s(x) s(x ). Quando x x
0 , s(x) cresce e, quando
+
25
Teorema 1.21 Se f Conv IR, entao f e contnua no int Dom f . Alem disso, para
cada intervalo compacto [a, b] int Dom f , existe L 0 tal que
|f (x) f (x )| L|x x |,
(1.18)
f (x) f (a)
D f (x) D+ f (x)
xa
f (x ) f (x)
D f (x ) D f (b).
x x
As desigualdades relevantes valem mesmo se x = a. Seja
1.4
Reconhecendo func
oes convexas
1.4.1
F
ormula de Taylor
f (a)
(x a)2 .
2!
Alem disso,
f (x) p2 (x)
= 0,
xa
(x a)2
lim
isto e, a diferenca entre f (x) e p2 (x) vai para zero mais rapidamente do que (xa)2 .
Em outras palavras,
f (x) = f (a) + f (a)(x a) +
f (a)
(x a)2 + R2 (a, x),
2!
26
com
R2 (a, x)
= 0.
xa (x a)2
lim
(1.19)
f (a)
.
2!
f (a)
a.
2!
f (a)
(x a)2 .
2!
27
Agora, utilizando duas vezes a regra de LHopital, temos
f (x) p2 (x)
f (x) p2 (x)
=
lim
xa
xa
(x a)2
2(x a)
f (x) p2 (x)
= lim
xa
2
f (a) p2 (a)
=
2
= 0,
lim
isto e, o erro R2 (a, x) = f (x) p2 (x) vai para zero mais rapidamente do que a
expressao (x a)2 .
Exemplo 9 Seja a funcao f (x) = exp(x). O polinomio de Taylor de ordem 1
(aproximacao linear) em torno do ponto 0 e
p1 (x) = 1 + x.
O polinomio de Taylor de ordem 2 (aproximacao quadratica) em torno do ponto 0 e
p2 (x) = 1 + x +
x2
.
2
Aproximao
quadrtica
Aproximao
linear
28
Teorema 1.23 Considere uma funcao f : D IRn IR de classe C 2 e a um ponto
interior de D. Entao existe um u
nico polinomio p2 de grau 2 de n variaveis que
satisfaz as condicoes:
p2 (a) = f (a),
p2 (a) = f (a),
2 p2 (a) = 2 f (a).
1
p2 (x) = f (a) + f t (a)(x a) + (x a)t 2 f (a)(x a).
2
Alem disso,
f (x) = p2 (x) + R2 (a, x),
(1.20)
isto e, o erro R2 (a, x) vai para zero mais rapidamente do que o quadrado da distancia
entre a e x. A equacao (1.20) e a chamada formula de Taylor com resto infinitesimal.
Prova. Seja o polinomio
1
p2 (x) = + ut (x a) + (x a)t A(x a).
2
Fazendo x = a em p2 , temos
1
p2 (a) = + ut (a a) + (a a)t A(a a),
2
logo,
p(a) = = f (a).
Temos que
p(x) = u + A(x a),
entao, para x = a,
p(a) = u = f (a).
2 p(x) = A = 2 f (a).
Portanto,
1
p(x) = f (a) + f (a)(x a) + (x a)t 2 f (a)(x a).
2
A prova de que
lim
xa
f (x) p2 (x)
R2 (a, x)
= lim
= 0,
2
xa
||x a||
||x a||2
29
Lema 1.24 Seja r : U IR uma funcao p vezes diferenciavel no ponto 0 U. Se
r, juntamente com todas as suas derivadas parciais de ordem menor que, ou igual a
p, se anula no ponto 0, entao
r(v)
lim
= 0.
v0 |v|p
Prova. Usaremos inducao em p. O resultado e obvio se p = 0 (interpretando
derivada parcial de ordem zero como o valor da funcao). Supondo-o valido para
p, seja r uma funcao p + 1 vezes diferenciavel no ponto 0, com todas as derivadas
parciais de ordem menor que, ou igual a p+1, nulas na origem. Entao, para cada
r
i = 1, . . . , n, a funcao
: U IR e p vezes diferenciavel e goza de propriedade
xi
semelhante, com p em vez de p + 1. Pela hipotese de inducao, temos
r
(v)
xi
lim
= 0.
v0 |v|p
Seja
f (t) = r(tv),
para 0 t 1. Entao
f (t) = f (tv)v
n
X
f
(tv)i ,
=
xi
i=1
onde v = (1 , . . . , n ). Pelo Teorema do Valor Medio, temos que existe [0, 1] tal
que
f (1) f (0) = f () 1,
n
X
r
(v)i .
r(v) r(0) =
x
i
i=1
Entao
e, portanto,
n
X
r
r(v) =
(v)i
xi
i=1
r
r
n
n
(v)i X
(v)
X
i
r(v)
xi
xi
=
=
,
p+1
p+1
p
|v|
|v|
|v|
|v|
i=1
i=1
i
e sempre menor que ou igual a 1, em valor absoluto. (Basta tomar
|v|
em IRn a norma da soma.) Segue-se entao que
Temos que
r(v)
= 0,
v0 |v|p+1
lim
A seguir, e dada, para funcoes diferenciaveis, uma caracterizacao alternativa
de convexidade.
30
f(z)
t
y=f(x)+(zx) f(x)
1.4.2
Caracterizac
ao de func
oes convexas diferenci
aveis
Esta subsecao foi escrita tendo [2] como base e o auxlio de [1].
Proposic
ao 1.25 Sejam C um subconjunto convexo de IRn e f : IRn IR diferenciavel sobre IRn .
(i) f e convexa sobre C se e somente se
f (z) f (x) + (z x)t f (x),
(1.21)
31
Somando estas duas u
ltimas desigualdades obtidas, temos
f (x) + (1 )f (y)
=
=
=
f (x + (z x)) f (x)
.
(1.22)
com desigualdade estrita se g e estritamente crescente, assim mostrando que a desejada desigualdade (1.21) vale, e vale estritamente se f e estritamente convexa. De
fato, considere quaisquer 1 , 2 , com 0 < 1 < 2 < 1, e sejam
1
,
2
z = x + 2 (z x).
(1.23)
f
(
z ) + (1
)f (x),
f (x + (
z x))
(f (
z ) f (x)) + f (x),
f (x + (
z x)) f (x)
f (
z ) f (x).
(1.24)
32
f (x + 1 (z x)) f (x)
f (x + 2 (z x)) f (x)
,
1
2
f (x + 2 (z x)) f (x)
f (x + 1 (z x)) f (x)
,
1
2
ou seja,
g(1 ) g(2 ).
Agora, seja x 6= y. Queremos provar que
lim g() g(1) = f (z) f (x).
0+
(1.25)
Seja
< g(1).
(1.26)
Temos que g(1) > 0. Pela definicao de limite, existe > 0 tal que, se (0, ),
entao < g() < + . Por (1.26), temos > g(1). Conseq
uentemente,
g() > > g(1), isto e, g() > g(1), o que contradiz (1.25).
A seguir, a ilustracao geometrica das ideias que estao nas entrelinhas da
prova da Proposicao 1.25. Na Figura 1.10, aproximamos linearmente f por z =
x + (1 )y. A desigualdade (1.21) implica que
f (x) f (z) + (x z) f (z),
f (y) f (z) + (y z) f (z).
Como pode ser visto na figura, segue que f (x) + (1 )f (y) esta acima de f (z),
entao f e convexa.
Na Figura 1.11, assumimos que f e convexa, e da geometria da figura notamos que
f (x + (z x)) f (x)
f (x) +
,
33
f(y)
f(z)+(yz)t f(z)
f(x)+(1)f(y)
f(x)
f(z)
f(z)+(xz)t f(z)
x
z= x+(1)y
34
f(z)
f(x)+[f(x+(zx))f(x)]/
f(x)+(zx)t f(x)
x+(zx)
(ii) Suponhamos que 2 f (x) seja definido positivo para todo x C. Entao,
por definicao, pt 2 f (x)p > 0, para todo p 6= 0. Sejam x, y C, com x 6= y. Como
f e continuamente duas vezes diferenciavel sobre Rn , existe (0, 1) tal que
1
f (x) = f (y) + f t (y)(x y) + (x y)t 2 f (z)(x y),
2
onde z e um ponto no segmento de reta que liga x em y, isto e,
z = x + (1 )y.
Como C e convexo, temos que z C. Por hipotese, temos que
(x y)t2 f (z)(x y) > 0,
para todos x, y tais que x 6= y. Portanto,
f (x) > f (y) + f t (y)(x y).
Logo f e convexa, pela Proposicao 1.25
35
tais que
Consideremos a funcao
g() = f (y + d).
Entao
g () = f t (y + d)d
e
g () = dt 2 f (y + d)d.
Para = 0, temos g(0) = f (y), o que implica que g e convexa no ponto 0. Logo,
g (0) = dt 2 f (y)d < 0.
Pela conservacao de sinal, temos que existe > 0 tal que g () < 0 para todo
(, ). Seja
x = y + d.
2
Por Taylor, temos que existe (0, 1) tal que
1
f (x) = f (y) + f t (y)(x y) + (x y)t 2 f (z)(x y),
2
onde
z = y + (x y) = y + d.
2
Entao
1
f (x) = f (y) + f (y)(x y) +
2
t
t 2
d f y+ d
d .
2
2
2
Temos que
1
2
logo
t 2
d f y+ d
d < 0,
2
2
2
f (x) < f (y) + f t (y)(x y),
Refer
encias Bibliogr
aficas
[1] N.
Andrei.
Convex
Functions.
CAMO
http://www.ici.ro/camo/neculai/convex.pdf
research
report.
36