Вы находитесь на странице: 1из 8

PROGRAMACIÓN NO LINEAL

Se considera-como tal al conjunto de métodos utilizados para optimizar una función


objetivo, sujeta a una serie de restricciones en los que una o más de las variables
incluidas es no lineal.
De manera general, un problema de PNL consiste en encontrar 𝑥 = (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) tal
que
max 𝑓(𝑥)
𝑠. 𝑎
𝑔𝑖 (𝑥) ≤ 𝑏𝑖 , ∀𝑖 = 1, 2, . . . , 𝑚

𝑥 ≥ 0
donde 𝑓(𝑥) 𝑦 𝑔𝑖 (𝑥) son funciones dadas de n variables de decisión (Calvete and
Mateo, 1994)

En notación extendida:
𝑚𝑎𝑥 𝑓(𝑥1 , 𝑥2 , . . . , 𝑥𝑛 )
𝑠. 𝑎
𝑔1 (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) ≤ 𝑏1
𝑔2 (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) ≤ 𝑏2

...
𝑔𝑚 (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) ≤ 𝑏𝑚
𝑥𝑗 ≥ 0, ∀𝑗 = 1, 2, . . . , 𝑛

Cuando un problema de PNL tiene solo una o dos variables, se puede representar en
forma gráfica. Si las funciones no son lineales, dibujaremos curvas en lugar de rectas,
por lo que función objetivo y región factible dejaran de tener el aspecto que adquieren
en la PL. La solución no tiene por qué estar en un vértice de la región factible, ni siquiera
tiene porque encontrarse en la frontera de esta. Por lo que la desaparece ahora la gran
simplificación que se utiliza en PL, que permite limitar la búsqueda de solución ´optima
a las soluciones en los vértices. Además, en PNL un máximo local no es necesariamente
un máximo global y en general, los algoritmos de PNL no pueden distinguir cuando se
encuentra en un ´optimo local o en uno global. Por tanto, es crucial conocer las
condiciones en las que se garantiza que un máximo local es un máximo global en la
región factible. Recuerde que, en Análisis Matemático, cuando se maximiza una función
ordinaria (doblemente diferenciable) de una sola variable f(x) sin restricciones, esta
garantía está dada cuando (Salazar, 2011)
𝑑2 𝑓
∀𝑥, ≤ 0,
𝑑𝑥 2
es decir, cuando la función es cóncava hacia abajo, o simplemente cóncava.

1. DEFINICIÓN:
Sea una función de una sola variable 𝑓(𝑥) y consideremos cada par de valores
de 𝑥, 𝑥 ′ 𝑦 𝑥"

Se dice que es una función convexa (o cóncava hacia arriba) si se cumple


𝑓(𝜆𝑥′′ + (1 − 𝜆)𝑥 ′ ) ≤ 𝜆𝑓(𝑥 ′′) + (1 − 𝜆)𝑓(𝑥 ′ ), ∀𝜆 ∈ (0, 1).

Se dice que es una función estrictamente convexa si se cumple


𝑓(𝜆𝑥′′ + (1 − 𝜆)𝑥 ′ ) < 𝜆𝑓(𝑥 ′′) + (1 − 𝜆)𝑓(𝑥 ′ ), ∀𝜆 ∈ (0, 1).

Se dice que es una función cóncava (o cóncava hacia abajo) si se cumple


𝑓(𝜆𝑥′′ + (1 − 𝜆)𝑥 ′ ) ≥ 𝜆𝑓(𝑥 ′′) + (1 − 𝜆)𝑓(𝑥 ′ ), ∀𝜆 ∈ (0, 1).

Se dice que es una función estrictamente cóncava si se cumple


𝑓(𝜆𝑥′′ + (1 − 𝜆)𝑥 ′ ) > 𝜆𝑓(𝑥 ′′) + (1 − 𝜆)𝑓(𝑥 ′ ), ∀𝜆 ∈ (0, 1).

Obsérvese 𝑞𝑢𝑒 𝜆𝑥′′ + (1 − 𝜆)𝑥 ′ es el segmento que une los dos puntos 𝑥 ′ y 𝑥 ′′, por
lo que en una funci´on c´oncava hacia arriba (convexa) el segmento queda por encima
de la funci´on, mientras que en una funci´on cóncava hacia abajo (cóncava) el segmento
queda por debajo. Por ejemplo, f(x) = 𝑥 2 es convexa, 𝑓(𝑥) = −𝑥 2 es cóncava, 𝑓(𝑥) =
𝑥 es simultáneamente cóncava y convexa, f(x) = 𝑥 3 no es ni cóncava ni convexa. En la
Figura 1.1 observamos gráficamente los diferentes casos de funciones según su
concavidad (Salazar, 2011)

2. DEFINICIÓN
Sea la función 𝑓: 𝐷 ⊂ 𝐼𝑅 𝑛 → 𝐼𝑅 con derivadas parciales de segundo orden en el
punto 𝑥 ∗ ∈ 𝐷, entonces definimos

el gradiente como el vector de derivadas parciales de primer orden


la matriz hessiana como

MÁXIMOS Y MÍNIMOS DE FUNCIONES DE VARIAS VARIABLES

Existen varias definiciones a continuación presentamos las más importantes

1. DEFINICIÓN

La función 𝑓: 𝐷 𝑅 2→ 𝑅 definida en un conjunto abierto, 𝐷 𝑅 2 tiene un valor máximo


absoluto sobre el conjunto si existe un punto 𝑃( 𝑅 2∈ 𝐷 tal que 𝑓( 𝑥0 , 𝑦0 ) ≤ 𝑓( 𝑥0 , 𝑦0 ),
( 𝑥, 𝑦) ∈ 𝐷 en este caso 𝑓(𝑥0 , 𝑦0 ). Es el valor máximo absoluto de 𝑓 𝑒𝑛 𝐷. (Espinoza,
2012)

2. DEFINICIÓN.

La función 𝑓: 𝐷 𝑅 2 → 𝑅 la definida en un conjunto abierto 𝐷 𝑅 2 tiene un mínimo


absoluto sobre el conjunto 𝐷 𝑅2 si existe un punto 𝑃(𝑥0 , 𝑦0 ) ∈ 𝐷 tal que 𝑓( 𝑥0 , 𝑦0 ) ≤
𝑓(𝑥0 , 𝑦0 ), ( 𝑥, 𝑦) ∈ 𝐷 en este caso 𝑓( 𝑥0 , 𝑦0 ) es el valor mínimo absoluto de 𝑓 𝑒𝑛 𝐷
(Espinoza, 2012)

 Observación: Si la función 𝑓: 𝐷 𝑅 2 → 𝑅 es continua en un conjunto


cerrado 𝐷 𝑅 2 entonces existe al menos un punto donde tiene un valor
máximo absoluto y al menos un punto 𝑄 ∈ 𝐷 donde tiene un mínimo valor
absoluto.

3. DEFINICIÓN.
La función 𝑓: 𝐷 𝑅 𝑛 → 𝑅 definida en un conjunto abierto 𝐷 𝑅 𝑛 tiene un valor mínimo
relativo en el punto →∈ 𝐷 si existe una bola abierta 𝐵 (→, 𝜀) 𝐷 tal que 𝑓( →) ≤ 𝑓( →),∀
𝑥0 𝑥0 𝑥0 𝑥
𝑥 ∈ 𝐵 (→, 𝜀) 𝐷 (Espinoza, 2012)
𝑥0

4. DEFINICIÓN.

La función 𝑓: 𝐷 𝑅 𝑛 → 𝑅 definida en un conjunto abierto 𝐷 𝑅 𝑛 tiene un valor máximo


relativo en el punto → ∈ 𝐷 si existe una bola abierta 𝐵 (→, 𝜀)  𝐷, tal que 𝑓( 𝑥 ) ≤ 𝑓( →),∀
𝑥0 𝑥0 𝑥0
𝑥 ∈ 𝐵 ( →, 𝜀)  𝐷 (Espinoza, 2012)
𝑥0

 Observación A los máximos y mínimos relativos de la función 𝑓: 𝐷 𝑅 𝑛


→ 𝑅 le llamaremos extremos de la función 𝑓

5. DEFINICIÓN.

Sea la función 𝑓: 𝐷 𝑅 𝑛 → 𝑅 definida en un conjunto abierto 𝐷 𝑅 𝑛 . Los puntos → D


𝑥0
donde todas las derivadas parciales de primer orden de 𝑓 son ceros o no existen, se
llaman puntos estacionarios o puntos críticos de 𝑓 (Espinoza, 2012).

CRITERIOS DE LA SEGUNDA DERIVADA

Sea f: D ⊂𝑅 2 → 𝑅 una función definida en el conjunto abierto D de tal manera


que las derivadas parciales primeras y segundas de 𝑓 sean continuas en la
𝜕𝑓(𝑎,𝑏) 𝜕𝑓(𝑎,𝑏)
relación abierta. Contienes un punto (a, b) tal que =0𝑦 = 0, para
𝜕𝑥 𝜕𝑦
determinar si en dicho punto hay un extremo relativo de 𝑓, definimos la cantidad
(Espinoza, 2012).

2
(𝜕2 𝑓(𝑎,𝑏) (𝜕2 𝑓(𝑎,𝑏) (𝜕2 𝑓(𝑎,𝑏)
. ∆= ∂ x2
. 𝑓 ∂ y2
−( 𝜕𝑦𝜕𝑥
)

(𝝏𝟐 𝒇(𝒂,𝒃)
I. Si ∆>0 y 𝛛 𝐱𝟐
> 0, entonces 𝑓 (a, b) es un valor mínimo relativo.

(𝝏𝟐 𝒇(𝒂,𝒃)
II. si ∆>0 y 𝛛 𝐱𝟐
< 0, entonces 𝑓 (a, b) es un valor máximo relativo.

III. si ∆<0, entonces (a, b), 𝑓 (a, b) es un punto de silla.

IV. si ∆=0, este criterio no da información.


Nota: En forma práctica se puede recordar la formula ∆ en el criterio de la
segunda derivada y que viene dado por el determinante.

(𝜕 2 𝑓(𝑎, 𝑏) (𝜕 2 𝑓(𝑎, 𝑏)
∂ x2 𝜕𝑦𝜕𝑥 |
∆= || 2
(𝜕 𝑓(𝑎, 𝑏) (𝜕 2 𝑓(𝑎, 𝑏)|
𝜕𝑥𝜕𝑦 ∂ y2

Siendo:
(𝜕 2 𝑓(𝑎, 𝑏) (𝜕 2 𝑓(𝑎, 𝑏)
=
𝜕𝑥𝜕𝑦 𝜕𝑦𝜕𝑥

MATRIZ HESSIANA DE UNA FUNCIÓN DE VARIAS VARIABLES

HISTORIA
El hessiano, conocido también como discriminante o matriz hessiana, fue introducido en
el año de 1844 por Hess, matemático alemán quien nació en 1811 y murió en 1874.
Esto sucedió luego de que Carl Gustav Jacob Jacobi (1804- 1851) introduje jacobianos”.
Lo que hizo Jacobi con de variable de las integrales múltiples en términos de estos.
Respecto a los detalles biográficos de Ludwig Otto Hess se sabe que nació
precisamente en Konigsberg, Alemania (actualmente Rusia) el 22 de abril de 1811.
Estudió con Jacobi en su ciudad natal (Konigsberg), donde se desempeñó primero
comomaestro de física y química; posteriormente como profesor. En 1856 se trasladó a
Heidelberg, donde permaneció doce años, antes de tomar un puesto en Munich, donde
falleció el 4 de agosto de 1874. Ludwig Otto Hess se hizo tan famoso por una matriz que
introdujo en un artículo de 1842 referido a curvas cúbicas y cuadráticas.

SIGNIFICADO DE CADA ELEMENTO DE LA MATRIZ HESSIANA

Con el objetivo de explicar cada detalle con la mayor claridad posible, se expresa el
significado de cada uno de los elementos que aparecen dentro de la matriz: (Espinoza,
2012)

 𝒇𝒙𝒙 Significa que se deriva la función original por primera vez con respecto a x
y luego ese resultado se deriva por segunda vez con respecto a x nuevamente.

 𝒇𝒙𝒚 Significa que se deriva la función original por primera vez con respecto a y
y luego ese resultado se deriva por segunda vez, pero ahora con respecto a x.

 𝒇𝒙𝒛 Significa que se deriva la función original por primera vez con respecto a z
y luego ese resultado se deriva por segunda vez, pero ahora con respecto a x.
 𝒇𝒚𝒙 Significa que se deriva la función original por primera vez con respecto a x
y luego ese resultado se deriva por segunda vez, pero ahora con respecto a y.

 𝒇𝒚𝒚 Significa que se deriva la función original por primera vez con respecto a y
y luego ese resultado se deriva por segunda vez con respecto a y nuevamente.

 𝒇𝒚𝒛 Significa que se deriva la función original por primera vez con respecto a z
y luego ese resultado se deriva por segunda vez, pero ahora con respecto a y.

 𝒇𝒛𝒙 Significa que se deriva la función original por primera vez con respecto a x
y luego ese resultado se deriva por segunda vez, pero ahora con respecto a z.

 𝒇𝒛𝒚 Significa que se deriva la función original por primera vez con respecto a y
y luego ese resultado se deriva por segunda vez, pero ahora con respecto a z.

 𝒇𝒛𝒛 Significa que se deriva la función original por primera vez con respecto a z y
luego ese resultado se deriva por segunda vez con respecto a z nuevamente.

Nota: Tome en cuenta que las siguientes se denominan derivadas mixtas o cruzadas y
si existen son iguales: 𝒇 𝒙𝒚 = 𝒇 𝒚𝒙, 𝒇 𝒙𝒛 = 𝒇 𝒛𝒙, 𝒇 𝒚𝒛 = 𝒇 𝒚𝒛

.
ENCONTRAR MÁXIMOS Y MÍNIMOS UTILIZANDO MATRICES HESSIANAS

a) Tener la función original que se va a trabajar.

b) Calcular las primeras derivadas parciales de la función con respecto a


cada una de las variables que se tiene la función original.

c) Igualar a cero las derivadas que se calcularon en el inciso anterior.

d) Simultanear las ecuaciones generadas en la igualación a cero, para


encontrar el valor de cada una de las variables. Dichos valores para cada
una de las variables serán las coordenadas de los puntos críticos.

e) Una vez se tienen los puntos críticos se debe calcular las segundas
derivadas parciales en cada uno de estos puntos, para identificar los
elementos de la matriz Hessiana, ya sea matriz 2 x 2 (si la función es de
dos variables), 3 x 3 (si la función es de tres variables), 4 x 4 (si la función
es de cuatro variables), n x n (si la función es de n variables).

f) Resolver el determinante de la matriz, el resultado que se obtenga será


la respuesta.

g) Con la respuesta se puede clasificar el punto

Una forma cuadrática, 𝐹: 𝑅 𝑛 → 𝑅 es una función cuyo valor en 𝑎 = (𝑎1 , 𝑎2 , …, 𝑎𝑛 ) es


dado por:
𝐹 = (𝑎)∑𝑛𝑖=0 ∑𝑛𝑖=𝑜 ℎ𝑖𝑗 𝑎𝑖 𝑎𝑗 donde 𝐻 = [ℎ𝑖𝑗 ] es una matriz simétrica de orden
𝑛𝑥𝑛
𝑛𝑥𝑛 esto es:

En forma simétrica la forma cuadrática está definida por:

Observación:
Se observó que el desarrollo de una forma cuadrática en términos de las
variables (𝑎1 , 𝑎2 , …, 𝑎𝑛 ) corresponden a un polinomio homogéneo de grado 2,
en donde los coeficientes de los términos cuadráticos (𝑎𝑖2 ) son los elementos de
la diagonal de la matriz simétrica H, y cada coeficiente de un termino 𝑎𝑖 𝑎𝑗 el doble
del elemento ℎ𝑖𝑗 de la misma matriz (𝑖 ≠ 𝑗)

CRITERIO DE LA MATRIZ HESSIANA PARA LOS MÁXIMOS Y MÍNIMOS

Consideremos la función 𝑓: 𝐷 ⊂ 𝑅 𝑛 → 𝑅 , en donde sus derivadas parciales de


segundo orden son continuas en un conjunto abierto 𝐷 𝑅 𝑛 y sea 𝑥0 ∈ 𝐷 un punto
para el cual 𝐷1𝑓(𝑥0 ) = 0, 𝐷2 𝐹(𝑥0 ) = 0, … . , 𝐷𝑛 𝑓( 𝑥0 ) = 0, supongamos que el
determinante de la matriz, Hessiana
𝐻(𝑓( 𝑥0 )) se denota por: (Espinoza, 2012)

Entonces:
𝑥0 Corresponde a un mínimo relativo si ∆1 > 0, ∆2 > 0, … , ∆𝑛 > 0, …, cuyo
valor mínimo es 𝑓(𝑥0 )

𝑥0 Corresponde a un máximo relativo si ∆1 < 0, ∆2 > > 0, ∆3 > < 0, …, cuyo


valor máximo es 𝑓(𝑥0 )

BIBLIOGRAFIA

Espinoza E. (2012) Análisis Matemático III Para Estudiantes De Ciencias e Ingeniería (6°
edición), Perú Editorial Servivios Gráficos J.J Mary A. (01 de junio de 2013) Discriminante o
hessiano. Recuperado el 28 de junio de 2015, de
http://es.slideshare.net/maryanabella/discriminante-ohessiano

H. Calvete and P. Mateo, Programación lineal, entera y meta. Colección Textos Docentes. Prensa
Universitaria de Zaragoza, 1994.

J. J. Salazar, Programación Maten ática. Ed. Díaz de Santos, 2011

Вам также может понравиться