Вы находитесь на странице: 1из 3

IN3702 - Investigación de Operaciones

Profesor: D. Sauré
Auxiliares: C. Aguayo, P. Galaz, S. Gallardo,
S. Maccioni, J. Siebert

Pauta Control # 1
29 de agosto de 2017

Pregunta 1. Usted ha sido asignada/o para planificar los coffee breaks que se realizarán desde ahora
en el curso de Investigación de Operaciones durante las clases auxiliares en las próximas T semanas
del semestre. En particular, usted esta encargado de decidir cuanta comida ordenar en cada semana.
Para simplificar el problema, asuma que el consumo de cada alumno se puede medir en “porciones”,
que cada alumno consume a lo más una porción en cada break, que todos los alumnos quieren una
porción cada semana, que las porciones que no se consumen al fin del break se desechan, y que hay
un break por clase, una clase a la semana.

Cada alumno asiste a la primera clase auxiliar, pero lanza una moneda semana a semana para
decidir si asiste o no a la siguiente. Existen dos excepciones a este comportamiento: en el caso de faltar
a una clase, un alumno no asiste a clases en lo que queda del semestre; en el caso de consumir una
porción durante un break, un alumno asiste con seguridad a la próxima clase.

Cada porción tiene un costo de $c, e inicialmente el curso cuenta con un presupuesto de $B (para
todo semestre). Usted estima que la nota de la encuesta docente del curso baja b décimas cada vez
que un alumno que asiste a clases no consume una porción en un break, y sube a décimas por cada
alumno que asiste a la última clase auxiliar. Formule modelo de programación dinámica que permita
maximizar:

1. El ńumero acumulado de alumnos que asiste a clases durante el semestre. (4 pts.)

2. La nota en la encuesta docente. (2 pts.)

Solución: Comenzaremos definiendo las componentes comunes a ambos problemas:

a) Etapas: semanas t = 1, ..., T

b) Decisión: xt : número de porciones a comprar para la semana t

c) Variables de estado: St = (At , Ft , Pt ), donde

At : número de alumnos que asistirán con seguridad en semana t


Ft : número de alumnos que lanzaran una moneda para decidir asistencia en semana t
Pt : presupuesto disponible en semana t
d) Variable aleatoria: Yt : personas que lanzan moneda y asisten en semana t
!
Ft
P(Yt = y) = (1/2)Ft y = 0, . . . , Ft .
y

e) Recurrencias:
At+1 = mı́n{xt , At + Yt }

Ft+1 = máx{Ft + Yt − xt , 0}

Pt+1 = Pt − c · xt

f) Condiciones de borde:
P1 = B

A1 = N

Y1 = 0

F1 = 0

1. Maximizar el número de alumnos que asiste durante el semestre:

Ft
!
X Ft ∗
(1/2)Ft y + Vt+1

V (xt , St ) = At + (St+1 )
y=0
y

con
Vt∗ (St ) = máx V (xt , St )
0≤xt ≤Pt /c

2. Maximizar la nota de la encuesta docente


Ft
!
Ft
V ∗ (St ) = ∗
X
(1/2)Ft −bFt+1 + Vt+1

máx (St+1 )
0≤xt ≤Pt /c
y=0
y

con
VT∗+1 (ST +1 ) = a · (AT +1 + FT +1 )

Pregunta 2. Suponga que usted se encuentra en un casino jugando en la ruleta.1 Usted solo apuesta
(i) al color de la casilla donde cae la bola o (ii) al numero 0, y solo realiza una apuesta por jugada.
Apuntar al color de la casilla donde cae la bola paga el doble de las fichas apostadas (en total ud.
recupera sus fichas apostadas, y suma el número de fichas apostadas), mientras que apuntar al 0 paga
36 veces lo apostado. Considerando una fortuna inicial W fichas, formule un modelo de programación
estocástica que maximize su fortuna al final de las próximas N jugadas.

1
La ruleta tiene 37 casillas, numeradas del 0 al 36, con 18 números de color rojo y 18 de color negro - el cero no tiene
color.
Solución. Notar que solo basta considerar un color. Definimos un evento como un vector w ∈
{C, 0, N }, donde C denota que apuesta en color gana, 0 el evento que apuesta en 0 gana, y N que
ninguna apuesta gana. Para este evento definimos xn e yn las fichas apostadas en color y 0, respec-
tivamente. También definimos la variable auxiliar zn = 1 si se apuesta al 0, y zn = 0 si se apuesta a
color. Maximizamos la fortuna resolviendo la siguiente formulación.

máx WN +1
s.a. Wn+1 = (Wn − xn − yn ) + 2 · xn · 1{wn = C} + 36 · yn · 1{wn = 0}
xn ≤ M · (1 − zn )
yn ≤ M · zn
yn + x n ≥ Wn /M
xn , yn ∈ N, zn ∈ {0, 1},

donde W1 = W . Transformamos este problema en un problema de programación estocástica replicando


variables y restricciones (1 por posible evento) y agregamos restricciones de no-anticipatividad. La
formulación resultante es

· WNk +1
P
máx k qk

s.a. k
Wn+1 = (Wnk − xkn − ynk ) + 2 · xkn · 1{wnk = C} + 36 · ynk · 1{wnk = 0}
xkn ≤ M · (1 − znk )
ynk ≤ M · znk
ynk + xkn ≥ Wnk /M
k l
ynk − ynl = 0 ∀ k 6= l, wm = wm ,m<n [no-anticipatividad]
k l
xkn − xln = 0 ∀ k 6= l, wm = wm ,m<n [no-anticipatividad]
xkn , ynk ∈ N, znk ∈ {0, 1},

k
18|{n≤N |wn =C}|
donde qk denota la probabilidad del escenario k: qk := 37N
.

Вам также может понравиться