Академический Документы
Профессиональный Документы
Культура Документы
A.
Concavidad y convexidad
A.1. Una variable. Decimos que una funcin real de una variable
f (x) es cncava si todas las rectas tangentes a ella pasan por encima suyo;
si, en cambio, todas pasan por debajo, decimos que es convexa. Por encimaen realidad queremos decir no por abajo; cuando la funcin comparta
slo el punto de tangencia con su tangente diremos que es estrictamente
cncava. Lo mismo ocurre con la convexidad. As, la recta es el lmite
entre ambas deniciones: la recta es cncava y convexa a la vez (ella es
su propia tangente, en todos los puntos), pero no estrictamente cncava ni
estrictamente convexa.
Consideremos un punto x : Si f (x) es diferenciable en x ,2 entonces
existe una nica recta tangente a ella en x , cuya pendiente es f 0 (x ) : La
recta tangente a f (x ) en x tiene la ecuacin:
T (xjx ) = n + mx
donde:
m = f 0 (x )
n = f (x ) f 0 (x ) x
Por otro lado, la recta tangente a f (x) en x est por encima de f (x)
en el punto x si T (xjx ) f (x). As, cuando f (x) es diferenciable, decir
2 f (x) no es diferenciable en x cuando los lmites de f (x) al acercarce por la izquierda
y la derecha de x dieren:
lm
x!x
f (x)
x
f (x)
f (x )
6= l m f
x!x+
x
x
f (x )
x
En ese caso, si le llamamos a al menor de esos lmites y b al mayor, por denicin sabemos
que en la vecindad de x :
f (x) f (x )
2 [a; b]
x x
El conjunto [a; b] recibe el nombre de subdiferencial de f en x , y se denota por @f (x ) :
La funcin es diferenciable en el punto, por lo tanto, cuando el subdiferencial tiene un nico
elemento (es decir, es un singleton).
Si la funcin no es diferenciable, an podemos decir que es cncava si sus tangentes
estn por encima de ella, entendiendo por tangente cualquier recta con alguna pendiente
m 2 [a; b].
335
336
APNDICE MATEMTICO
que f (x) es cncava equivale a decir que para todo x se cumple que:
T (xjx )
f (x)
8x
(A.1)
Reescribiendo, tenemos:
f (x )
f 0 (x ) x + f 0 (x ) x
, f (x ) + f 0 (x ) (x
x )
f (x)
f (x)
8x; x
8x; x
Ahora bien, del Teorema de Taylor sabemos que toda funcin real puede
ser aproximada mediante polinomios. En particular, de una expansin de
Taylor de segundo orden en torno a un punto x tenemos:
1
f (x) f (x ) + f 0 (x ) (x x ) + f 00 (x ) (x x )2
2
Luego, f es cncava si:
1
f (x )+f 0 (x ) (x x ) f (x )+f 0 (x ) (x x )+ f 00 (x ) (x x )2 8x; x
2
esto es:
f 00 (x ) 0
8x
(A.2)
Tenemos entonces la siguiente caracterizacin de concavidad:
Teorema 5. f : R ! R diferenciable dos veces es cncava si y slo si
8x :
f 00 (x ) 0:
La caracterizacin de la concavidad estricta es ms intrincada. De la
expansin de Taylor deducimos que si f 00 (x ) < 0, entonces f (x) < T (xjx )
para todo x 6= x en la vecindad. Sin embargo, esta condicin no es necesaria. Por ejemplo, la funcin f (x) = x4 es estrictamente cncava en
x = 0 pese a que f 00 (0) = 0 (de hecho, sus tres primeras derivadas). Si
considerramos una expansin de cuarto orden, tendramos:
1
f (x)
f (x ) + f 0 (x ) (x x ) + f 00 (x ) (x x )2
2
1 000
1 0000
3
+ f (x ) (x x ) + f (x ) (x x )4
6
24
1 (iv)
Entonces, si 21 f 00 (x ) (x x )2 + 16 f 000 (x ) (x x )3 + 24
f
(x ) (x x )4 <
0, sabramos que la funcin es estrictamente cncava. En el ejemplo, 12 0 (x 0)2 +
1
1
0)3 + 24
( 24) (x 0)4 = (x 0)4 < 0: Pero nuevamente se trata
6 0 (x
de una condicin suciente, por cuanto podemos encontrar ejemplos en que
la concavidad estricta la podemos comprobar slo con la sexta derivada, etc.
A. CONCAVIDAD Y CONVEXIDAD
337
c, donde c > 0 es
f (x) = R (xjx ) ;
(A.3)
con x < x
^: Entonces, para todo x 2 (x; x
^) ;
)x
^)
R ( x + (1
)x
^jx )
Pero:
R ( x + (1
)x
^:
8 2 [0; 1]
)x
^jx ) = T ( x + (1
)x
^jx ) c
0
= f (x ) + f (x ) ( x + (1
)x
^
(A.4)
x )
)x
^jx ) =
f (x ) + f 0 (x ) (x
+ (1
x )
) f (x ) + f 0 (x ) (^
x
c
x )
Ahora bien, x y x
^ satisfacen (A.3), por lo que:
f (x) = f (x ) + f 0 (x ) (x
f (^
x) = f (x ) + f 0 (x ) (^
x
x )
x )
c
c
)x
^)
f (x) + (1
) f (^
x)
8 2 [0; 1]
Resumiendo:
Teorema 6. f : R ! R diferenciable una vez es cncava si y slo si
8 2 [0; 1] y 8x; x
^:
f ( x + (1
)x
^)
f (x) + (1
) f (^
x) :
338
APNDICE MATEMTICO
f (x ) +
n
X
@f (x )
(xi
@xi
xi ) +
i=1
f (x ) + g0 (x
xi )2
i=1
1 X @ 2 f (x )
(xi
2
@ 2 xi
x )+
1
(x
2
x )0 H (x
x )
1
(x x )0 H (x x )
2
donde g es la gradiente de f en el punto x (el vector de primeras derivadas)
y H el hessiano de f en x (la matriz de segundas derivadas). La funcin
f (x) est dbilmente por debajo de su hiperplano tangente si (x x )0 H (x x )
0:
= T (xjx ) +
Recordemos que:
Definicin 31. Si A una matriz simtrica de n n, entonces A se dice:
Denida negativa si el producto y0 Ay es negativo para cualquier
y 2 Rn :
Semi-denida negativa si el producto y0 Ay es no positivo para
cualquier y 2 Rn :
Semi-denida positiva si el producto y0 Ay es no negativo para
cualquier y 2 Rn :
Denida positiva si el producto y0 Ay es positivo para cualquier
y 2 Rn :
Indenida si no satisface ninguna de las condiciones anteriores.
De esta forma, la condicin de concavidad de f en x est atada a la
denicin negativa de su hessiano. Las siguientes caracterizaciones son muy
tiles:
Lema 1. Sea A una matriz de n n, sea Mk un menor principal de
orden k; y Dk el k simo menor principal lder3 (k = 1; :::; n).
x0 Ax es denida negativa si y slo si ( 1)k Dk > 0 para k =
1; :::; n.
3 Un menor de orden k de una matriz cuadrada A es el determinante de la matriz
generada eliminando (n
n
n
n
k
k
menores de orde k.
El menor es principal si las las y columnas eliminadas son las mismas; hay enn
tonces
menores principales. El menor principal es lder si las las y columnas
n k
eliminadas son las ltimas (n k); lder de orden k hay uno solo.
A. CONCAVIDAD Y CONVEXIDAD
339
x1 x2
1
1
x1 + x2
2
2
p
p
, x1 2 x1 x2 + x2 = ( x1
<
x2 )2 > 0
H=
1
4
1
4
1
4
<0 y
1
4
1
4
f ( x + (1
)x
^)
f (x) + (1
) f (^
x)
8 2 [0; 1]
340
APNDICE MATEMTICO
)x
^)
m n ff (x) ; f (^
x)g
m n ff (x) ; f (^
x)g, por lo que una
Un resultado interesante es que cualquier transformacin montona creciente aplicada sobre una funcin cncava resulta en una funcin cuasicncava. As, si g : R ! R es creciente y f es cncava, entonces h g f es
cuasicncava (estricta si f es estrictamente cncava). En efecto,
h ( x + (1
)x
^) = g (f ( x + (1
g ( f (x) + (1
)x
^))
) f (^
x))
B. OPTIMIZACIN
341
)x
^)
g ( f (x) + (1
) f (^
x))
g (f (x)) = h (x) :
Optimizacin
342
APNDICE MATEMTICO
y
25
12.5
0
-5
-2.5
2.5
5
x
-12.5
-25
(B.1)
@f
dx > 0
@x
B. OPTIMIZACIN
343
de manera que si @f
@x > 0, con un movimiento a la derecha de x (dx > 0)
se consigue una mejora en el objetivo, y si @f
@x < 0, basta con moverse
innitesimalmente a la izquierda de x (dx < 0) para mejorar.
Pero por supuesto esto no es suciente, porque la misma condicin puede
ser usada para evitar una cada de y (dy < 0). Por ejemplo, la funcin
y = sen(x) tiene una primera derivada igual a 0 en 2 y en 2 , y obviamente
-1 no es el mximo, como se aprecia en el grco:
seno(x)
0.5
0
-2.5
-1.25
1.25
2.5
x
-0.5
-1
@2f
(dx)2 = f 00 (x) (dx)2 < 0
@x2
(B.2)
344
APNDICE MATEMTICO
que un mnimo tambin la satisface) para obtener un mximo local interior. Es suciente para un mximo local interior que ambas se satisfagan
simultneamente.
Enfatizamos la palabra local porque la bsqueda se restringi a la vecindad del punto. Es posible que otros puntos satisfagan ambas condiciones; el
mximo global en ese caso se obtiene por comparacin directa de los valores
de f (x) entre los candidatos.
Enfatizamos tambin la palabra interior, porque es posible que el mximo en un dominio acotado ocurra en los extremos. Por ejemplo, el mximo
de 3x2 + 1 en el intervalo [0; 1] ocurre en el punto x = 1. En este punto no
se cumplen ni la condicin de primer orden ni la de segundo y sin embargo es un mximo, de lo que se desprende que estas condiciones no pueden
considerarse necesarias ni sucientes en cualquier caso.
Con ms de una variable, la intuicin se mantiene. La nica diferencia
es que no basta con chequear una dimensin, sino que se hace necesario
vericar movimientos en toda direccin posible. As,
y = f (x1 ; x2 ; :::; xn )
@f
@f
@f
dx1 +
dx2 + ::: +
dxn = 0
dy =
@x1
@x2
xn
n
X
=
fi dxi = 0
d2 y =
i=1
@2f
@x21
(dx1 )2 +
(B.3)
@2f
@2f
dx1 dx2 + ::: +
dx1 dxn
@x1 @x2
@x1 @xn
@2f
@2f
@f
2
dx2 dx1 +
(dx
)
+
:::
+
dx2 dxn + :::
2
@x2 @x1
@xn @x2
@x22
@f
@2f
@2f
dxn dx1 +
dxn dx2 + ::: + 2 (dxn )2
@xn @x1
@xn @x2
@xn
n
n
XX
=
fij dxi dxj < 0
(B.4)
i=1 j=1
B. OPTIMIZACIN
345
= 0
(B.5)
= 0
..
.
@f
xn
= 0
dx1
dx2
dx1
f11 (dx1 )
f11 f22 )
p
< f11 (dx1 )2 2 f11 f22 dx1 dx2 + f22 (dx2 )2
p
p
2
=
f11 dx1 +
f22 dx2
< 0
346
APNDICE MATEMTICO
Una manera compacta de escribir la condicin anterior es que la matriz de segundas derivadas (tambin conocida como el Hessiano de f ) sea
negativa denida:
f11 f12
neg. def.
f21 f22
Recuerde que una matriz H es negativa denida si los determinantes de
los menores alternan signo, empezando en negativo. Recuerde tambin que
los menores son las matrices que se forman eliminando las y columnas de la
matriz principal. Partiendo del extremo superior izquierdo, el primer menor
es la primera entrada. El segundo menor se forma agregando al primero la
la y la columna contiguas. El tercero de la misma forma, a partir del
segundo, y as sucesivamente.
Por ejemplo, en el caso de dos variables, H negativa denida se traduce
en:
jH1 j = jf11 j < 0 , f11 < 0
f11 f12
jH2 j =
> 0 , f11 f22
f21 f22
(f12 )2 > 0
>
(f12 )2
) f22 <
f11 < 0
2
(f12 )
<0
f11
B. OPTIMIZACIN
347
2 2
Ejemplo 11. La funcin 20x
n 1 x2 x1 x2 satisface
o la condicin de primer
10
orden en fx1 = 0; x2 = 0g y en x1 = x2 ; x2 = x2 . El grco de la primera
gura corresponde a f en sus tres dimensiones. El de la segunda gura
corresponde a la gradiente de f:
-2
-4
xz
-4
y
-2 0 0
0
42
-200
-400
-600
Funcin f = 20x1 x2
-3
-2.5
-2
-1.5
-1
-0.5
0
-0.5
0.5
1.5
2.5
3
x
-1
-1.5
-2
-2.5
-3
Gradiente de f
348
APNDICE MATEMTICO
B.2. Maximizacin con restricciones. La maximizacin con restricciones se reere al mismo problema anterior, con la salvedad de que la
bsqueda se restringe a un subconjunto propio del dominio original de la
funcin. Para facilitar la exposicin, normalmente se distinguen dos clases
de restricciones: de igualdad y de desigualdad. La restriccin de desigualdad
es la ms general, y corresponde a acotar arbitrariamente el dominio de la
funcin objetivo. La de igualdad es aquella en la que el conjunto de puntos
en los que se permite buscar pueden expresarse por medio de una funcin
del tipo g(x1 ; x2 ; :::; xn ) = b. Siguiendo la prctica comn, comenzaremos
por esta ltima.
B.2.1. Restricciones de igualdad. Para abordar este problema hay en
general dos estrategias posibles; la eleccin se hace sencillamente por conveniencia.
La primera estrategia reduce la dimensin del problema. En efecto, el
problema inicial
max f (x1 ; x2 ; :::; xn ) sujeto a
x2Rn
(B.6)
b = g(x1 ; x2 ; :::; xn )
se transforma obteniendo de b = g(x1 ; x2 ; :::; xn ) una expresin para alguna
variable, digamos x2 = h(x1 ; x3 ; :::; xn ; b), y reemplazndola en la funcin
objetivo para obtener:
max f (x1 ; h(x1 ; x3 ; :::; xn ); :::; xn )
x2Rn
(B.7)
x2Rn
g(x1 ; x2 ; :::; xn )]
(B.8)
donde el escalar
es considerado como una variable ms al obtener las
condiciones de primer orden pero no es una variable ms, como veremos
ms adelante. Observe lo siguiente:
1. Si la restriccin es de hecho satisfecha, la nueva funcin L = f (x1 ; x2 ; :::; xn )+
[b g(x1 ; x2 ; :::; xn )] alcanza el mismo mximo que el objetivo inicial.
2. Al considerar a como una variable de eleccin, la condicin de
primer orden va a exigir la satisfaccin de la restriccin: @L
=
@
B. OPTIMIZACIN
349
= f1
g1 = 0
= f2
g2 = 0
= b
g(x1 ; x2 ) = 0
f2
f1
=
g1
g2
CP O :
CSO :
@F
= F1 = 0
@x1
@2F
= F11 < 0
@x21
350
APNDICE MATEMTICO
0
dx2
@h (x1 )
)
=
= h1 =
dx1
@x1
g1
g2
h1 =
g1 (x1 ; x2 )
=
g2 (x1 ; x2 )
g1 (x1 ; h (x1 ))
g2 (x1 ; h (x1 ))
obtenemos:
h11 =
=
=
g1
g2
3
5
B. OPTIMIZACIN
351
g1
g2
= f11 + 2f12
+ f22
"
#
f2
g22 (g1 )2
g2 g11 2g1 g12 +
g2
(g2 )2
"
1
2
2g1 g2 f12 + f22 (g1 )2
=
2 f11 (g2 )
(g2 )
1 h
2
=
2g1 g2 f12 + f22 (g1 )2
2 f11 (g2 )
(g2 )
1 h
(g2 )2 (f11
g11 ) 2g1 g2 (f12
=
(g2 )2
lo que corresponde a
0
0 g1
H @ g1 L11
g2 L21
f2 g22 (g1 )2
g2
es el hessiano orlado (o con bordes) de L, puesto que se construye agregndole un borde al hessiano de f .
As, en el caso de dos variables hay una sola condicin de segundo orden puesto que la bsqueda se reduce a una lnea, tal como en el caso de
optimizacin sin restricciones en una variable.
Ahora bien, con ms de dos variables (o en general, si m es el nmero de
restricciones, con n m 2), el problema obviamente se complica porque
ya no se busca en una lnea sino en conjuntos ms complicados y surgen
restricciones adicionales. En general, entonces, tenemos:
Resumen 2. Resumen de Optimizacin con Restricciones de Igualdad
El problema
max f (x1 ; :::; xn ) sujeto a
x1 ;:::;xn
b1 = g1 (x1 ; :::; xn )
..
.
bm = gm (x1 ; :::; xn )
con el lagrangeano asociado
L = f (x1 ; :::; xn ) +
tiene como solucin:
m
X
j=1
[bj
gj (x1 ; :::; xn )]
g22 (g1 )2
i
g22 ) < 0
352
APNDICE MATEMTICO
B
= B
@
@g 1
@xn
:::
@g m
@x1
..
.
@g m
@xn
:::
(0)m
@gj
@xi
0
..
.
0
n m
@g 1
@x1
@g 1
@xn
:::
..
.
..
.
@g m
@x1
@2L
@x21
:::
:::
@g m
@xn
@2L
@x1 @xn
..
.
..
.
@2L
@x1 @xn
@gj
@xi
@2L
@x2ii0
:::
m n
n n
@2L
@x2n
1
C
C
C
C
C
C
C
C
C
C
A
C
C
A
B. OPTIMIZACIN
353
Es importante notar que el multiplicador de Lagrange tiene la interpretacin del aporte de una unidad del recurso restringido al objetivo. En
efecto,
#
" n
n
X
X @g(x)
dL(x )
@xi
@xi
@f (x)
=
+
db
@xi x @b
@xi x @b
i=1
i=1
"
#
n
n
X
X
@xi @f (x)
@g(x)
=
+
@b
@xi x
@xi x
i=1
i=1
b1
bm
..
.
g m (x1 ; x2 ; :::; xn )
sujeto a
en que el conjunto de restricciones nuevamente reduce el dominio de la funcin, pero no limitadas a funciones sino que ahora permitiendo la delimitacin de reas (o volmenes, o lo que corresponda de acuerdo a la dimensin
del problema).
Consideremos primero el caso de una restriccin. En general, dos cosas
pueden suceder: o la restriccin se cumple con igualdad, o lo hace con desigualdad estricta. Si el ptimo irrestricto se encuentra dentro del rea
encerrada por la restriccin, entonces decimos que la restriccin se satisface
con holgura, y el hecho de que exista no altera en absoluto el problema.
Ahora bien, si el ptimo irrestricto se encuentra fuera de lo permitido por
las restricciones, entonces lo natural es que la restriccin se satisfaga con
igualdad.
354
APNDICE MATEMTICO
L = f (x1 ; x2 ; :::; xn ) +
m
X
bj
g j (x1 ; x2 ; :::; xn )
j=1
= fi
@L
@ j
= bj
m
X
j
j gi
=0
j=1
g j (x1 ; x2 ; :::; xn )
@L
=0
@ j
La condicin de holgura complementaria resume lo sealado anteriormente: o j = 0, es decir, la restriccin no es operativa, en cuyo caso es
perfectamente posible que bj g j (x1 ; x2 ; :::; xn ) < 0, o bien j > 0, vale
decir, la restriccin afecta el mximo valor alcanzable del objetivo y, por
tanto, debe satisfacerse con igualdad. Observe que si todas las restricciones
se satisfacen con holgura, obtenemos la misma condicin de gradiente nula
que en un problema de optimizacin sin restricciones.
Este conjunto de condiciones se conoce como condiciones de KarushKuhn-Tucker (KKT).
Respecto de las condiciones de segundo orden, baste decir que dependen
de si las restricciones se satisfacen con o sin holgura y, por tanto, se prosigue
como se describe en las secciones anteriores.
Ocurre que en general las condiciones de KKT no son ni necesarias ni
sucientes para la obtencin de un mximo. Sin embargo, las excepciones
son tremendamente inusuales y pueden ser identicadas por no satisfacer la
siguiente condicin:
dg(x )
B. OPTIMIZACIN
355
x2Rn
x1 ; x2 ; :::; xn
ste es un caso particular del anterior, pero su forma simple permite una
solucin que prescinde de los multiplicadores, usando la siguiente condicin
de primer orden:
@f
@f
0 con holgura complementaria xi
=0
@xi
@xi
Si ambas clases de restricciones se dan simultneamente, tenemos que el
problema:
b1
bm
0
..
.
g m (x1 ; x2 ; :::; xn )
x1 ; x2 ; :::; xn
sujeto a
m
X
bj
g j (x1 ; x2 ; :::; xn )
j=1
@L
@ j
= bj
g j (x1 ; x2 ; :::; xn )
@L
=0
@ j
B.3. Esttica comparativa. El problema que abordamos a continuacin es preguntarnos qu ocurre tanto con el punto ptimo como con el
valor maximizado del objetivo cuando alguno de los parmetros del objetivo
se modica.
En efecto, sea
1
x1 (a)
B
C
..
@
A = arg max f (x1 ; :::; xn ; a)
.
xn (a)
356
APNDICE MATEMTICO
Nos preguntamos:
1. Cmo cambian las variables ptimas al cambiar el parmetro?
2. Cmo cambia el nivel del objetivo alcanzado?
La primera pregunta es lo que tradicionalmente se entiende por esttica comparativa, y se centra en el signo (y ocasionalmente magnitud) de
funciones de la forma:
@xi (a)
@a
La segunda pregunta se reere al mximo. Sobre el particular, usaremos
intensivamente el siguiente resultado:
Teorema 7 (de la envolvente).
@y
@f (x1 ; :::; xn ; a)
=
@a
@a
En efecto,
n
X @f (x ; :::; x ; a) @x
@y
@f (x1 ; :::; xn ; a)
n
1
i
=
+
@a
@xi
@a
@a
i=1
0 8i = 1; :::; n
@f (x1 ; :::; xn ; a)
@y
=
@a
@a
m ; a)
C. FUNCIONES HOMOGNEAS
C.
357
Funciones homogneas
f (x1 ; :::; xn )
la expresin:
f (x1 ; :::; xn )
obtenemos:
@f ( x1 ; :::; xn )
@f ( x1 ; :::; xn )
x1 + ::: +
xn = r
@ ( x1 )
@ ( xn )
Evaluando en
r 1
f (x1 ; :::; xn )
=1:
n
X
@f (x1 ; :::; xn )
@xi
i=1
xi = rf (x1 ; :::; xn ) = ry
f (x1 ; x2 )
x2
x2
xr1 g
x1
x1
@f (x1 ; x2 )
x2
) f1 =
= rxr1 1 g
@x1
x1
@f (x1 ; x2 )
x2
) f2 =
= xr1 1 g 0
@x2
x1
=
xr1 f
1;
x2 xr1
2 0
x2
x1
358
APNDICE MATEMTICO
1 ;x2 )
1 ;x2 )
Luego, si computamos @f (x
x1 + @f (x
x2 = f1 x1 + f2 x2 obtenemos lo
@x1
@x2
enunciado en el teorema:
x2
x2
x2
f1 x1 + f2 x2 = rxr1 g
x2 xr1 1 g 0
+ x2 xr1 1 g 0
x1
x1
x1
x2
= rxr1 g
x1
= rf (x1 ; x2 ) = ry
rxr1
xr1
rg
x2
x1
g0
x2
x1
x2 xr1
x2
x1
1 0
g
2 0
g
x2
x1
x2
x1
x2
x1