Академический Документы
Профессиональный Документы
Культура Документы
ALVARADO, VER.
MATERIA:
Investigacin de Operaciones ii
SEMESTRE- GRUPO:
V-AC
PRODUCTO ACADEMICO:
Investigacin
Tema(S):
Programacin Dinmica Probabilstica y
Determinstica.
PRESENTAN:
Wilber Lizandro Lpez Ramn
DOCENTE:
M. en I. A. Christian Romn Clara
30/Octubre/2014
Contenido
INTRODUCCIN ............................................................................................................. 3
DESAROLLO ................................................................................................................... 3
Caractersticas de los problemas de programacin dinmica ........................................... 3
Ejemplo .......................................................................................................................... 5
El problema de la diligencia. .......................................................................................... 5
Formalizacin de los clculos de programacin dinmica ............................................... 9
PROGRAMACIN DINMICA DETERMINSTICA (PDD) ....................................... 10
Aplicaciones de programacin dinmica determinstica ............................................... 10
Modelo del tamao de la fuerza de trabajo .................................................................... 11
Ejemplo ........................................................................................................................ 11
Modelo de reposicin de equipo ................................................................................... 13
Ejemplo ........................................................................................................................ 14
PROGRAMACIN DINMICA PROBABILSTICA (PDP).......................................... 17
Aplicaciones de programacin dinmica probabilstica ................................................ 17
Un juego aleatorio ........................................................................................................ 17
Ejemplo ........................................................................................................................ 18
CONCLUSIN................................................................................................................ 22
BIBLIOGRAFA. ............................................................................................................ 22
Pgina 2
INTRODUCCIN
La PD fue desarrollada por Richard Bellman y G B Dantzing. Sus importantes
contribuciones sobre esta tcnica cuantitativa de toma de decisiones se publicaron en 1957
en un libro del primer autor denominado Dynamic Programming (Princeton University
Press. Princeton, New Jersey) (Domnguez, 2000).
Inicialmente a la PD se le denomin programacin lineal estocstica problemas de
programacin lineal con incertidumbre.
La programacin dinmica (PD) determina la solucin ptima de un problema de
n variables descomponindola en n etapas, con cada etapa incluyendo un subproblema de
una sola variable. La principal contribucin de la PD es el principio de optimalidad, el cual
establece que una poltica ptima consiste de subpolticas ptimas, un marco de referencia
para descomponer el problema en etapas.
La programacin dinmica es una tcnica que se puede aplicar para resolver muchos
problemas de optimizacin. La mayor parte de las veces, la programacin dinmica obtiene
soluciones con un avance en reversa, desde el final de un problema hacia el principio con lo
que un problema grande y engorroso se convierte en una serie de problemas ms pequeos
y ms tratables.
As, la programacin dinmica se puede definir como una tcnica matemtica til que
resuelve una serie de decisiones secuenciales, cada una de las cuales afecta las decisiones
futuras. Proporciona un procedimiento sistemtico para determinar la combinacin de
decisiones que maximiza la efectividad total (Taha, 2004).
En contraste para el problema de programacin dinmica, trata de un enfoque de tipo
parcial para la solucin de problemas y las ecuaciones especficas que se usan se deben
desarrollar para que represente cada situacin individual.
DESAROLLO
Caractersticas de los problemas de programacin dinmica
Las caractersticas de la programacin dinmica se emplean para formular e identificar la
estructura de los problemas de este tipo.
A continuacin se presentarn estas caractersticas bsicas que distinguen a los problemas
de programacin dinmica.
1. El problema se puede dividir en etapas que requieren una poltica de decisin en
cada una de ellas. En muchos problemas de programacin dinmica, la etapa es la
cantidad de tiempo que pasa desde el inicio del problema, en ciertos casos no se
necesitan decisiones en cada etapa.
Pgina 3
2. Cada etapa tiene un cierto nmero de estados asociados a ella. Por estado se
entiende la informacin que se necesita en cualquier etapa para tomar una decisin
ptima.
3. El efecto de la poltica de decisin en cada etapa es transformar el estado actual en
un estado asociado con la siguiente etapa (tal vez de acuerdo a una distribucin de
probabilidad).
4. El procedimiento de solucin est diseado para encontrar una poltica ptima para
el problema completo, es decir, una receta para las decisiones de la poltica ptima
en cada etapa para cada uno de los estados posibles.
5. Dado el estado actual, una poltica ptima para las etapas restantes es independiente
de la poltica adoptada en etapas anteriores. (este es el principio de ptimalidad para
la programacin dinmica). En general en los problemas de PD, el conocimiento del
estado actual del sistema expresa toda la informacin sobre su comportamiento
anterior, y esta informacin es necesario para determinar la poltica ptima de ah en
adelante.
6. El procedimiento de solucin se inicia al encontrar la poltica ptima para la ltima
etapa. La poltica ptima para la ltima etapa prescribe la poltica ptima de
decisin para cada estado posible en esa etapa.
7. Se dispone de una relacin recursiva que indica la poltica ptima para la etapa dada
la poltica ptima para la etapa (n+1)
A pesar de esta caracterstica, los problemas que pueden ser atacados con la PD tienen otras
dos propiedades adicionales:
Slo un nmero reducido de variables se debe conocer en cualquier etapa con el fin
de describir al problema. En efecto, los problemas de la PD se caracterizan por la
dependencia de los resultados derivados de decisiones sobre un nmero reducido de
variables.
El resultado de una decisin en cualquier etapa altera los valores numricos de un
nmero reducido de variables relevantes al problema. La decisin actual ni
incrementa ni decrementa el nmero de factores sobre los cuales depende el
resultado. As, para la siguiente decisin en la secuencia, el mismo nmero de
variables se considera (Hillier, 1991).
En un problema de PD una serie de decisiones se deben tomar en una secuencia dada.
Cuando esto se cumple, una poltica ptima se debe perseguir. No importa cules fueron
los estados y decisiones iniciales, las decisiones restantes constituirn una poltica ptima
con respecto al estado resultante de la primera decisin.
Pgina 4
Ejemplo
El problema de la diligencia.
Un problema construido especialmente por el Profesor H M Wagner de la Universidad de
Stanford para ilustrar las caractersticas e introducir la terminologa de la PD es el
problema de la diligencia.
Este problema se refiere a un vendedor mtico que tuvo que viajar hacia el oeste utilizando
como medio de transporte una diligencia, a travs de tierras hostiles, en el ltimo cuarto del
siglo XIX. An cuando su punto de partida y destino eran fijos, tena un nmero
considerable de opciones para elegir qu estados (o territorios que posteriormente se
convirtieron en estados) recorrer en su ruta.
En la figura 5.1 se muestran las rutas posibles, en donde cada estado se representa por un
bloque numerado.
Pgina 5
As la pregunta central es: cul ruta (conjunto de caminos) minimiza el costo total de la
pliza?, para contestar esta pregunta es necesario hacer notar que, el procedimiento poco
inteligente de seleccionar el camino ms barato ofrecido en cada etapa sucesiva no
necesariamente conduce a una decisin ptima global.
La PD parte de una pequea porcin del problema y encuentra la solucin ptima para ese
problema ms pequeo. Entonces gradualmente agranda el problema, hallando la solucin
ptima en curso a partir de la anterior, hasta que se resuelve por completo el problema
original.
A continuacin se explican los detalles involucrados en la implementacin de esta filosofa
general.
La idea es calcular el costo mnimo (acumulativo) de la pliza de seguros entre los dos
estados de cada etapa y despus utilizar esos costos como datos de entrada para la etapa
inmediata siguiente.
CLCULOS PARA LA ETAPA 1
Considerando los estados asociados con la etapa 1, se puede ver que los estados 2, 3 y 4
estn conectados cada uno con el estado inicial 1 por una sola flecha como se puede
apreciar en la figura 5.2. Por consiguiente, para la etapa 1 se tiene
Figura 5.2 etapa 1: estados 2, 3,4
conectados con el estado inicial 1
Pgina 6
Figura 5.3
Etapa 2: estados 5, 6, 7 conectados
con los estados 2, 3, 4.
Esta informacin, junto con los costos mnimos de los estados 2, 3 y 4 (figura 5.4)
determinan el costo mnimo (acumulativo) para el estado 5 como:
Pgina 7
Figura 5.6
Etapa 2: Estados 7 conectados
con los estados 2, 3, 4.
Figura 5.7
Etapa 3: estados 8, 9 conectados
con los estados 5, 6, 7.
Pgina 8
i=1, 2,3n
Pgina 9
Pgina 10
Ejemplo
Un contratista constructor estima que la fuerza de trabajo necesaria durante las prximas 5
semanas ser de 5, 7, 8, 4 y 6 trabajadores, respectivamente. La mano de obra en exceso
que se conserve le costara $300 por trabajador semanalmente, y la nueva contratacin en
cualquiera semana tendr un costo fijo de $400 ms $200 por trabajador y por semana.
Los datos del problema se resumen como sigue:
Pgina 11
Pgina 12
Pgina 13
ms o reemplazarla por una nueva. Sean r(t), c(t), los ingresos y el costos de operacin
anuales, y s(t) el valor de recuperacin de una maquina con t aos de antigedad. El costo
de adquisicin de una mquina nueva en cualquier ao es I.
Los elementos del modelo de programacin dinmica son:
Ejemplo
Una empresa debe determinar la poltica ptima, durante los prximos 4 aos (n=4), de
reemplazo de una mquina, que en la actualidad tiene 3 aos. La tabla 5.1 muestra los
datos del problema. La empresa establece que toda mquina que tenga 6 aos de edad debe
reemplazarse. El costo de una maquina nueva es $100,000.
Tabla 5.1.
Aos con relacin a sus utilidades,
costos y valor de rescate
Pgina 14
La red indica que al comenzar el ao 2, las edades posibles de las maquinas son de 1 4
aos.
Para el comienzo del ao 3, las antigedades posibles son 1, 2 y 5 aos, y para el comienzo
del ao 4, las antigedades posibles son 1, 2, 3 y 6 aos.
La solucin de la red de la figura 5.9 equivale a determinar la ruta ms larga, del inicio del
ao 1 al final del ao 4. Se iniciara la forma tabular para resolver el problema. Todos los
valores son en miles de $. Ntese que si se reemplaza una mquina en el ao 4 (es decir, al
final del horizonte de planeacin) los ingresos incluirn el valor de recuperacin, s(t), de la
mquina reemplazada y el valor de recuperacin, s(1) de la mquina de repuesto.
Pgina 15
Pgina 16
Figura 5.10
Las polticas alternativas ptimas empezando en el ao 1 son (R, K, K, R) y
(R, R, K, K). El costo total es de 55,300 dlares.
Un juego aleatorio
Es una variacin del juego de la ruleta rusa, se hace girar una rueda con marcas de n
nmeros consecutivos: 1 a n, en su superficie. La probabilidad de que la rueda se detenga
en el nmero i despus de un giro es pi. Un jugador paga $x por el privilegio de hacer girar
Wilber Lizandro Lpez Ramn.
Pgina 17
2 j, si termina
fi j max n
k 1 pk fi 1 k , si contina
Entonces, la ecuacin recursiva se puede escribir como sigue:
Los clculos comienzan con fm+1 y terminan con f1, de modo que hay m+1 etapas. Como
f1(0) representa el rendimiento esperado de las m vueltas, as que el rendimiento esperado
neto, Rn, es:
Ejemplo
Rn f1 0 x
Supongamos que la ruleta est marcada con los nmeros 1 a 5 y que las probabilidades de
que se detenga en cada nmero son p1 = 0.30, p2 = 0.25, p3 = 0.20, p4 = 0.15, p5 = 0.10.
El jugador paga $5 por un mximo de cuatro vueltas. Determine la estrategia ptima para
cada una de las cuatro vueltas y encuentre el rendimiento esperado neto asociado.
Wilber Lizandro Lpez Ramn.
Pgina 18
Etapa 5
f5(j) = 2j
Resultado de la
vuelta 4
Solucin ptima
f5(j)
Decisin
Terminar
Terminar
Terminar
Terminar
10
Terminar
Etapa 4
f4(j) = mx.{2j,(pkf5(k))}
= mx.{2j, p1f5 (1)+ p2f5(2)+ p3f5 (3)+ p4f5 (4)+ p5f5 (5)}
= mx.{2j,0.3x2 + 0.25x4 + 0.2x6 + 0.15x8 + 0.1x10}
= mx.{2j,5}
Resultado de
la vuelta 4
Rendimiento esperado
Solucin ptima
Terminar
Girar
f4(j)
Decisin
Girar
Girar
Terminar
Terminar
10
10
Terminar
Pgina 19
Etapa 3
Resultado de la
vuelta 3
Rendimiento esperado
Solucin ptima
Terminar
Girar
f4(j)
Decisin
6.15
6.15
Girar
6.15
6.15
Girar
6.15
6.15
Girar
6.15
Terminar
10
6.15
10
Terminar
Etapa 2
Resultado de
la vuelta 3
Rendimiento esperado
Terminar
Girar
f4(j)
Decisin
6.8125
6.8125
Girar
6.8125
6.8125
Girar
Solucin ptima
Pgina 20
6.8125
6.8125
Girar
6.8125
Terminar
10
6.8125
10
Terminar
Etapa 1
Vuelta nmero
Estrategia ptima
Pgina 21
CONCLUSIN
La programacin dinmica (Sea PDD o PDP) es una tcnica muy til para tomar una
sucesin de decisiones interrelacionadas. Requiere la formulacin de una relacin recursiva
apropiada para cada problema individual. Sin embargo, proporciona grandes ahorros
computacionales en comparacin con la enumeracin exhaustiva para encontrar la mejor
combinacin de decisiones, en especial cuando se trata de problemas grandes.
A s que, Programacin Dinmica consiste en solucionar el presente suponiendo que en
cada etapa futura siempre se toman las decisiones correctas.
Nombre de la bsqueda:
Como lo encontr:
Consultado en:
Link:
Autor:
BIBLIOGRAFA.
programacin dinmica probabilstica
Programacin dinmica - SlideShare
es.slideshare.net
http://es.slideshare.net/elmergabrielchanpech/programacin-dinmica15433493
Elmer Gabriel Chan Pech
Pgina 22