Академический Документы
Профессиональный Документы
Культура Документы
SIMULACIN
Sistemas, Modelos y Simulacin
Funcionamiento de un Sistema
Modelo y sus hiptesis para estudiar un Sistema
Modelo matemtico para relaciones sencillas (dos variables)
Simulacin, a travs de un modelo para obtener soluciones
INTRODUCCIN
CONCEPTOS BSICOS
EJEMPLO: Un empresario que desea ampliar la
planta productiva de su empresa, pero no sabe si la
ganancia potencial de productividad justifica los
costos.
Sera una error ejecutar la ampliacin y observar los
resultados, y si no son satisfactorios volver atrs.
La alternativa es simular la operacin actual y la de
la planta ampliada y comparar sus productividades.
Estado de un sistema es el conjunto de variables
necesarias para describir el sistema en un instante
determinado, de acuerdo con los objetivos del estudio
EJEMPLO: Para determinar el nmero ptimo de cajeros
de una sucursal de un Banco que atienden clientes que
realizan depsitos y cobros, el sistema se define como la
proporcin de los empleados y los clientes haciendo fila
para ser atendidos.
Variables de Estado para un modelo de ste ejemplo
pueden ser: nmero de empleados ocupados, nmero de
clientes en el Banco, instante de llegada de cada cliente al
Banco, nmero de operaciones que realiza el cliente, entre
otras.
Simulacin: Para estudiar el sistema real es necesario
reemplazarlo por un sistema que en la mayora de los
casos es una versin simplificada (abstraccin), que
implementa un Modelo necesario para realizar las
experiencias necesarias, sin los inconvenientes del
sistema real.
Diseo de un plan de experimentacin con las
variables de Estado
Optimizacin a partir de las diferentes soluciones
obtenidas que permita adoptar la mejor decisin
Entrenamiento o Capacitacin para aprender a
conducir el sistema.
SISTEMA
Conjunto de objetos o ideas que estn interrelacionados
entre s como una unidad para la consecucin de un fin
(Shannon, 1988)
MODELO
Un objeto X es un modelo del objeto Y para el
observador Z, si Z puede emplear X para responder
cuestiones que le interesan acerca de Y (Minsky)
(Constructo Conceptual resultante de un proceso cognitivo,
que mediante la abstraccin logra una representacin de
una realidad).
SIMULACIN
Proceso de diseo de un modelo del sistema real y de
llevar a cabo experiencias con l, con la finalidad de
aprender el comportamiento del sistema o evaluar
diversas estrategias para el funcionamiento del sistema
(Shannon, 1988).
Ejemplos de Sistemas:
Una red de telecomunicacin es un complejo entramado
de recursos fsicos y lgicos (medios y equipos de
transmisin, conmutadores, protocolos de comunicacin,
etc.), cuyo objetivo es encauzar eficientemente el flujo de
informacin entre los usuarios [Pazos-Surez-Daz,
2004].
Sistema predictivo de la calidad del aire en Santiago,
compuesto por una serie de estaciones en distintas
comunas con equipos para medir diversas variables
fsicas y medioambientales
Sistema de Atencin Hospitalaria, compuesto por una
serie de Postas, Consultorios y Hospitales, con distintas
especialidades mdicas, nmero de camas, pabellones
quirrgicos, poblacin objetivo, entre otras
Los modelos de Simulacin se clasifican:
Discretos: Las variables de Estado pueden cambiar de
valor slo un nmero finito de veces por unidad de tiempo.
Ejemplo: Para modelar el flujo de trfico vehicular se usar
un modelo discreto si son relevantes las caractersticas y
movimientos de los vehculos individuales.
Continuo: Las variables de Estado pueden cambiar
continuamente con el tiempo.
Ejemplo: Para modelar el flujo de trfico vehicular se usar un
modelo continuo si son relevantes las caractersticas tiempo
de semforo, tiempo de llegada a destino, distancia recorrida,
etc.
La decisin de uno u otro modelo dependen del objetivo
especfico del estudio y no del sistema en s.
Esttico: Representa al sistema en un determinado
instante, para un valor fijo de las variables estado. Ej.
Modelos de programacin lineal
Dinmico: la evolucin del sistema, su caracterstica es
el cambio que presentan las variables en funcin del
tiempo. Ej. Modelos de series de tiempo, modelos de
pronsticos
Determinista: Se conoce el resultado con exactitud
para un conjunto de variables, dado que los valores de
las ellas no son afectados por variaciones aleatorias.
Los datos de salida son nicos para un conjunto de
entradas dadas
Ej. Ley de enfriamiento de los cuerpos de Newton. Ley de
descarga de un condensador.
Estocstico: Los valores de las variables
experimentan variaciones aleatorias con respecto a un
valor promedio, involucran distribuciones de probabilidad.
Los datos de salida pueden ser a su vez aleatorios
Ej. Modelos de colas. Modelos de epidemias
En el mbito de la Ingeniera, dependiendo del sistema, se
usan principalmente Modelos Discretos, Dinmicos o
Estocsticos.
Cundo usar la Simulacin
Si no existe una formulacin matemtica analticamente
resoluble. Ej, la conducta de un cliente en un Banco
Existe una formulacin matemtica, pero es difcil obtener una
solucin analtica. Ej, modelos matemticos usados para
modelar un reactor nuclear o una planta qumica; imposibles de
resolver analticamente sin realizar serias simplificaciones
No existe el sistema real; disear un nuevo sistema. El diseo
del sistema mejorar notablemente si se cuenta con un modelo
adecuado para realizar experimentos
Los experimentos no son factibles debido a
impedimentos econmicos, de seguridad, de calidad o
ticos (el sistema real est disponible, pero ...). Ej.,
provocar fallas en un avin (real) para evaluar la conducta
del piloto; variar el valor del impuesto para evaluar la
reaccin del mercado. Administrar un medicamento nuevo
a un paciente para ver como reacciona su organismo.
El sistema real evoluciona muy lentamente, Ej. evolucin
de un ecosistema; o muy rpidamente, Ej. Evolucin de
una epidemia. O en la evolucin de un maremoto en que
no se puede esperar a que arrase una localidad para luego
dar la alarma.
Desventajas de la Simulacin
El desarrollo de un modelo puede ser costoso,
laborioso y lento.
Existe la posibilidad de cometer errores; si el modelo
est mal definido o se cometen errores en su manejo,
los resultados sern tambin incorrectos.
No se puede conocer el grado de imprecisin de los
resultados; por lo general, el modelo se utiliza para
experimentar situaciones nunca planteadas en el
sistema real, por lo que no existe informacin previa
para estimar el grado de correspondencia.
Algunas reas de Aplicacin
Proceso de Manufacturas: detectar cuellos de botella,
distribuir personal, determinar polticas de produccin.
Plantas Industriales: condiciones ptimas de operacin,
elaboracin de procedimientos de operaciones y de
emergencias.
Sistemas Pblicos: predecir demanda de energa, de
propagacin de enfermedades, de niveles de contaminacin,
comportamiento del clima.
Sistemas de Transporte: detectar zonas de posible
congestionamiento, zonas con mayor riesgo de accidentes,
prediccin de demanda.
Construccin: predecir efecto de los vientos y temblores,
condiciones de iluminacin y ambientales al interior, detectar
partes estructurales a ser reforzadas.
Diseo: seleccin adecuada de materiales y formas,
anlisis de sensibilidad con respecto de parmetros no
controlables.
Capacitacin: para implementar el mtodo ms natural
para aprender, el de prueba y error, evitando los costos y
riesgos del sistema real.
Objetivos de un Modelo
Permitir la comprensin de lo que puede suceder en un
sistema si cambian los estados de las variables.
Si no refleja el conocimiento que se tiene del sistema, el
modelo no tiene sentido, quizs fue mal diseado.
Si el modelador no tiene un adecuado conocimiento del
sistema a modelar, con seguridad los resultado no tengan
utilidad, o bien las estimaciones sean distintas a lo real.
Algunos sistemas no podrn ser modelados correctamente
o la simulacin no resultar ni econmica ni fcil de aplicar
correctamente.
El tiempo y costo asociado a la recoleccin de datos y de
los ciclos de proceso computacional para obtener resultados
precisos, no debe subestimarse ni subvalorarse.
Suponiendo que un modelo sea vlido, mientras ms
sencillo mejor .
Estrategia: de lo general a lo particular. Gradualmente se
va detallando el modelo, complejizando su desarrollo,
depuracin y ejecucin, como tambin la explicacin e
interpretacin de las salidas.
La alternativa al uso de modelos matemticos es el uso
de Modelos Fsicos o tambin llamados Modelos Icnicos;
implementaciones fsicas a escala del sistema real.
Sistema
Experimentar Experimentar
con el con un modelo
sistema real del sistema
Modelo Fsico Modelo Matemtico
Solucin Analtica Simulacin
REVISIN DE CONCEPTOS REQUERIDOS
Variables Aleatorias
2
3
4
5
6
7
8
9
10
11
12
Se lanzan dos dados normales, sea X : la variable aleatoria suma de las pintas de las
caras superiores
O
9
f(x)
s s
s s
= = =
caso otro
x si
x
x si
x
x X P x f
0
12 8
36
13
7 2
36
1
) ( ) (
>
< s
< s
< s
< s
<
=
12 1
12 11 36 / 35
.
.
5 4 36 / 6
4 3 36 / 3
3 2 36 / 1
2 0
) (
x si
x si
x si
x si
x si
x si
x F
1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
p=1/36 p=2/36 p=3/36 p=4/36 p=5/36 p=6/36 p=5/36 p=4/36 p=3/36 p=2/36 p=1/36
Dr. Pedro Vergara V.
ESPERANZA Sea X una variable aleatoria discreta, la esperanza matemtica
se define por
=
= =
1
) ( ) (
i
i i
x X P x x E
7
36
1
12 ...
36
3
4
36
2
3
36
1
2 ) ( ) (
1
= + + + + = = =
= i
i i
x X P x x E
Para el ejemplo de los dos dados
VARIANZA Sea X una variable aleatoria discreta, la esperanza matemtica se
define por
| |
2
2
) ( ) ( ) ( x E x E x V =
83 . 5 ) 7 (
36
1
12 ...
36
2
3
36
1
2 ) (
2 2 2 2
= + + + = x V
42 . 2 53 . 5 ) ( = = x S
Desviacin estndar
Dr. Pedro Vergara V.
DISTRIBUCIN DE POISSON Una variable aleatoria discreta se
distribuye Poisson si su funcin de probabilidad est dado por :
!
) (
x
e
x X P
x
= =
= ot o: nmero de eventos que ocurren por unidad de tiempo t
valor promedio de eventos durante un intervalo t
De acuerdo a la informacin registrada durante varios aos, se sabe que el nmero de
accidentes con causa de muerte tiene una frecuencia de 30 casos al mes. Calcule la
probabilidad que haya un muerto en un lapso de 2 das. Calcule la probabilidad que
haya dos muertos en un lapso de 5 das.
2707 . 0
! 1
2
) 1 (
1 2
= = =
e
X P 0842 . 0
! 2
5
) 2 (
2 5
= = =
e
X P
Dr. Pedro Vergara V.
E(X)= y V(X)=
DISTRIBUCION UNIFORME Una variable aleatoria continua de recorrido
[a,b] se distribuye uniforme si su funcin de probabilidad es :
s s
=
caso otro en
b x a si
a b
x f
0
1
) (
12
) (
) ( ,
2
) (
2
a b
x V
b a
x E
=
+
=
Una sustancia qumica contaminante se distribuye uniformemente en el
rango de 10 a 20 partes por milln (ppm). No se considera nociva para la
salud si la concentracin es menor que 11 ppm. Cul es la probabilidad que
no sea nociva?
>
s s
<
=
b x si
b x a si
a b
a x
a x si
x F
1
0
) (
10 . 0
10
1
10 20
10 11
) 11 ( F = =
=
Dr. Pedro Vergara V.
=
X
dt
a b
1
) x ( F
DISTRIBUCION NORMAL Sea X una variable aleatoria continua con con
recorrido 9, la variable X tiene distribucin normal de parmetros u y o
2
si su
funcin de probabilidad es
0
2
1
2
2
2
2
2
> o 9 e u 9 e
to
=
o
u
, , x ; e ) x ( f
) x (
u
0.6826
u-3o u-2o u-o u u+o u+2o u+3o
Dr. Pedro Vergara V.
u-3o u-2o u-o u u+o u+2o u+3o
0.6826
0.9544
0.9974
0 0
( )
0
x
e si x
f x
en otro caso
o
o o
> . >
=
Distribucin exponencial
Sea X una variable aleatoria continua con recorrido los reales
positivos, X tiene distribucin exponencial si su funcin de
densidad est dada por:
1 0
( )
0 0
x
e si x
F x
si x
o
>
=
<
1
( ) E x
o
=
2
1
( ) V x
o
=
La funcin de probabilidad acumulativa est dada por:
Dada una variable aleatoria con distribucin exponencial su
esperanza y varianza est dada por:
i) ii)
.
.
( )
>
=
0 00125x
0 00125e si x 0
f x
0 enotro caso
.
( ) ( ) ( ) .
> = < = =
0 00125 20
P t 20 1 P t 20 1 1 e 0 3771
Ejemplo. El tiempo de espera de las personas en el Sernac
para realizar una denuncia tiene una distribucin exponencial
de parmetro =0.00125 (t en minutos). Qu porcentaje de
los denunciantes espera ms de 20 minutos para realizar una
denuncia en el Sernac?
De acuerdo a la informacin se tiene que la funcin de
probabilidad est dada por:
Distribucin de Weibull
Esta distribucin se utiliza para modelar el tiempo entre fallas de
maquinarias o componentes electrnicos.
Una variable aleatoria tiene de Weibull si su funcin de
probabilidad est dada por:
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso
o
| |
|
| o
\ .
o
|
|
\ .
o | =
En la figura se muestras las distintas curvas resultantes para:
=0.8 ,=1 ; =2 ,=1 ; =2 ,=2 ; =2 ,=3
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso
o
| |
|
| o
\ .
o
= < s
< s
< s
>
n
i
i 1
n
1/ x
x
=
~ =
n
i
i 1
x
m x
n
=
= =
n
2
i
2 2
i 1
*
(x x)
S
n 1
=
o ~ =
n=10 ; B=0.518
Ahora el problema se reduce a determinar los valores de los
parmetros que hacen mnima la suma de los errores al
cuadrado.
k
c
2
n k
k 1
Mn
(f f(M ))
=
k
k
c
M 2
n
k 1
Mn
(f e )
El problema es minimizar:
como:
k
M
k
y e aplicando ln se tiene
lny ln M
=
=
k
c
2
n k
k 1
Mn
G( ) (lnf ln M )
=
=
luego, la funcin a minimizar:
k
c
n k k
k 1
G( ) 1
0 2 (lnf ln M ) ( M )
=
c
= = +
c
+ + + =
Este problema se resuelve fcilmente con una planilla de clculo, y el
resultado es 0.83; el cual es un valor mucho mejor que el obtenido
por el mtodo bsico.
1.28320287x
y 1.28320287e
=
x
y e
=
0.83x
y 0.83e
=
=1,28320287 =1 =0,83 e=y-y e=y-y
x y y y e=y-y e=y-y
0 1,283202870 1,00000000 0,83 0,283202870 0,17000000
1 0,355637376 0,36787944 0,36192091 -0,012242066 0,00595853
2 0,098564261 0,13533528 0,15781535 -0,036771022 -0,02248007
3 0,027316908 0,04978707 0,06881527 -0,022470160 -0,01902820
4 0,007570832 0,01831564 0,03000685 -0,010744807 -0,01169121
5 0,002098243 0,00673795 0,01308447 -0,004639704 -0,00634652
6 0,000581524 0,00247875 0,00570547 -0,001897228 -0,00322672
7 0,000161168 0,00091188 0,00248787 -0,000750714 -0,00157598
8 0,000044668 0,00033546 0,00108483 -0,000290795 -0,00074937
9 0,000012380 0,00012341 0,00047304 -0,000111030 -0,00034963
10 0,000003431 0,00004540 0,00020627 -0,000041969 -0,00016087
promedio 0,017567580 0,010031814
desvest 0,088857848 0,053746151
Evaluacin del Ajuste
Para evaluar si realmente la distribucin propuesta representa al
conjunto de datos se pueden utilizar mtodos estadsticos como
por ejemplo:
Kolmogorov-Smirnov: Decide en base a la mxima desviacin
entre la distribucin acumulada terica y la experimental.
Chi-cuadrado: Decide en base a la suma de errores al cuadrado
que surgen de comparar el histograma con la distribucin terica.
Estas pruebas son una buena gua para evaluar una distribucin.
Sin embargo, ya que no existe una distribucin terica que ajuste
perfectamente a los datos del mundo real, no se deberan tomar
los resultados de estas pruebas en forma categrica.
Es muy importante comprender el efecto del tamao de la muestra.
Si la muestra es pequea, las pruebas aceptarn cualquier distribucin.
Por el contrario, si la muestra es grande, las pruebas rechazarn a todas las
distribuciones propuestas.
Por lo tanto, estas pruebas son slo un elemento ms a tener en cuenta
durante la evaluacin.
Grfico q-q
Una alternativa al empleo de histogramas para identificar la
distribucin de los datos es el grfico
quantile -quantile.
ste tipo de grfico puede utilizarse an cuando los datos son
escasos (menos que 30), y al no depender de parmetros
arbitrarios, como el nmero de clases y el ancho de los intervalos,
facilita la evaluacin del grado de ajuste de la distribucin
propuesta al conjunto de datos analizados.
Si X es una variable aleatoria con distribucin acumulada F(X), el
q-quantile de X es el valor g tal que
F() = P(X ) = q para 0 < q < 1.
Cuando F(X) tiene inversa, el quantile es igual a = F
-1
(q).
Sea {x
i
, i = 1, 2, ..., n} una muestra de X.
Dicha lista ordenada de menor a mayor origina la
nueva lista {y
j
, j = 1, 2, ..., n} donde y
1
y
2
... y
n
El grfico q-q se basa en que y
j
es una estimacin del
(j-0.5)/n quantile de X, con n tamao de la muestra
Suponga que se est probando una distribucin con funcin de
probabilidad acumulada F(X) para representar los datos en estudio.
Si F(X) es de la familia de distribuciones adecuada; entonces, el
grfico y
j
vs F
-1
((j-0.5)/n) ser aproximadamente una lnea recta.
Si adems, los parmetros de F(X) tienen los valores adecuados;
entonces, la lnea recta tendr pendiente 1.
Si F(X) no es la funcin adecuada, los puntos no estarn alineados.
La verificacin de la distribucin exponencial que se ajust en la
seccin anterior con = 1,2833 se muestra en la Tabla, Figura 6 y
Figura 7.
j
1.2832 y
j
F(y ) 1 e
=
1
j j
1
F (q ) ln(1 q )
1,2832
=
j y
j
q
j
=(j-0,5)/10 F(Y
j
) F
-1
(q
j
)
1 0,014 0,05 0,01780 0,03997
2 0,328 0,15 0,34354 0,12665
3 0,343 0,25 0,35605 0,22419
4 0,408 0,35 0,40758 0,33571
5 0,633 0,45 0,55615 0,46590
6 0,684 0,55 0,58427 0,62228
7 1,183 0,65 0,78086 0,81813
8 1,199 0,75 0,78531 1,08034
9 1,433 0,85 0,84100 1,47843
10 1,568 0,95 0,86629 2,33458
Figura 7: Grfico q-q modificado
Figura 6: Grfico q-q
La verificacin de la distribucin exponencial ajustada para = 0.83
se muestra en la siguiente Tabla
j
0,83 y
j
F(y ) 1 e
=
1
j j
1
F (q ) ln(1 q )
0,83
=
j y
j
q
j
=(j-0,5)/10 F(y
j
) F
-1
q
j
)
1 0,014 0,05 0,01155 0,06180
2 0,328 0,15 0,23833 0,19581
3 0,343 0,25 0,24775 0,34660
4 0,408 0,35 0,28726 0,51902
5 0,633 0,45 0,40868 0,72029
6 0,684 0,55 0,43318 0,96206
7 1,183 0,65 0,62540 1,26485
8 1,199 0,75 0,63034 1,67023
9 1,433 0,85 0,69559 2,28569
10 1,568 0,95 0,72786 3,60932
Es posible determinar un nuevo valor de utilizando el principio
del grfico q-q, para ello se debe resolver uno de los siguientes
problemas:
La solucin de ambos problemas da el mismo resultado: = 1.06.
Este mtodo tiene la ventaja de no depender de un nmero
arbitrario como es el nmero de clases de un histograma.
Ahora consideremos el siguiente ejemplo, datos de la Tabla 4.
El valor medio es 99.99 y la varianza de la muestra es 0.28322.
Estos valores pueden utilizarse como estimaciones de los
correspondientes parmetros de una distribucin normal.
Como puede apreciarse en la Figura 3, no es fcil determinar
grficamente si los datos en realidad poseen distribucin normal.
La Tabla 5 muestra los datos ordenados y los clculos realizados
para comprobar si pueden ser representados por una distribucin
normal.
Los puntos estn alineados a lo largo de una recta con pendiente 1; por
lo tanto, se puede concluir que los datos tienen una distribucin normal
con valor medio 99.99 y varianza 0.28322.
Notar que es posible realizar un grfico equivalente que no emplee la
funcin inversa de la distribucin acumulada, la cual puede no existir;
para ello, se grafica F(y
j
) vs q
j
.
Esta ltima Figura muestra el grfico de q
j
vs F(y
j
), nuevamente los
puntos estn distribuidos a lo largo de una lnea recta con
pendiente 1.
Generalmente los puntos ubicados en los extremos del grfico
pueden alejarse de la lnea recta; Sin embargo, la atencin debe ser
puesta en los puntos centrales para decidir si la distribucin que
est siendo probada es la correcta.
Es posible tambin detectar si una variable X tiene una misma
distribucin que otra Z; Para ello, se grafican los valores ordenados
de la primera variable versus los valores ordenados de la segunda
variable.
Si el grfico resulta en una lnea recta, ambas variables pueden ser
representadas con la misma distribucin.
Seleccin de una Distribucin sin Datos
Cuando el sistema no existe an o el proceso de medicin no
puede realizarse por algn motivo, ser necesario seleccionar una
distribucin sin contar con los datos del sistema.
La informacin necesaria para ello puede obtenerse de distintas
fuentes:
Especificaciones tcnicas: Generalmente se cuenta con datos
tcnicos de un producto o proceso; por ejemplo, tiempo medio
entre fallas, velocidad de impresin, consumo promedio, etc.
Opinin de expertos: Las personas que conocen el sistema pueden
hacer estimaciones acerca de los valores mnimos, mximos y
probables de las variables. Con estos datos es posible construir una
distribucin triangular (Figura 8).
Limitaciones fsicas o de diseo: Dada la naturaleza del sistema,
los valores de las variables estn limitados a ciertos intervalos; por
ejemplo, la luz roja de un semforo no puede durar menos de 10 s.
La naturaleza del proceso: Este es un dato importante debido a
que varias distribuciones tericas fueron desarrolladas para
procesos determinados.
Sea cual fuere la fuente, es necesario evaluar la sensibilidad de los
resultados con respecto a la distribucin propuesta de esta
manera.
Si la sensibilidad es alta, ser necesario refinar las estimaciones.
Modos de Simulacin
Como se ha planteado, cuando se simula se experimenta con un
modelo para obtener ciertos resultados.
De acuerdo al tipo de Variable de Salida, la simulacin pueden ser:
Modo Anlisis
Las variables de salida del modelo representan a las variables de
salida del sistema real. Es el modo ms empleado y se utiliza para
estimar la respuesta del sistema real ante entradas especficas.
Debido a que imita a un sistema que realmente funciona, el
modelo es matemticamente ms estable y se asegura la
existencia de una solucin.
Modo Control
Las variables de salida del modelo representan a las variables de
entrada del sistema real. Es el modo que se utiliza para determinar
los valores que debern adoptar las variables de entrada del
sistema para producir los resultados deseados.
Se utiliza cuando se desea determinar las condiciones de
operacin de un sistema.
Modelado
Modelado es el proceso de construccin de un modelo.
Un Modelo es un constructo conceptual que representa un
objeto, sistema o idea, generado mediante un proceso cognitivo
que hace uso de la abstraccin.
Un modelo se representa a travs de un Diagrama, el que
corresponde a un conjunto de smbolos cuya interpretacin es
previamente acordada.
Los modelos son tiles para:
El Pensamiento: al construir un modelo necesariamente se debe
ordenar, estructurar y completar el conocimiento que se tiene del
sistema real.
La Comunicacin: un modelo reduce y a veces elimina la
ambigedad del lenguaje para comunicarse con expertos.
El Entrenamiento y la Instruccin: un modelo se puede utilizar
para entrenar con costo y riesgo casi nulo. Por ejemplo, los
submarinos a escala (Modelo Fsico o Icnico) usados por la marina
alemana para entrenar en secreto antes de la segunda guerra
mundial.
La Prediccin: un modelo sirve para predecir la conducta del un
sistema real. Por ejemplo, los modelos utilizados mediante la
simulacin para predecir la evolucin del clima mundial. El modelo
de la teora de la relatividad predice, sin hacer una simulacin, que
es posible superar la velocidad de la luz.
La Experimentacin: hecha con un modelo es barata y segura. Se
emplea frecuentemente en el diseo de sistemas. Por ejemplo, el
tnel de viento con un modelo a escala de un avin o automvil.
El modelar consiste en la habilidad para analizar un problema
(proceso cognitivo), resumir sus caractersticas esenciales
(abstraccin), seleccionar y modificar los supuestos bsicos que
caracterizan el sistema (conceptos) y luego, enriquecer y elaborar el
modelo (constructo) hasta obtener una aproximacin til.
Cualquier conjunto de reglas para desarrollar modelos tiene una
utilidad limitada y slo puede servir como una gua sugerida.
Los pasos sugeridos son:
Establecer una definicin clara de los objetivos
Analizar el sistema real
Dividir el problema del sistema en problemas menores y simples
Buscar analogas (Patrones)
Considerar como referencia un ejemplo numrico especfico del
problema
Determinar las variables de inters
Documentar los datos obvios
Documentar las ecuaciones tericas o empricas que describen los
fenmenos presentes y relacionan las variables de inters
Si se logra un modelo manejable, enriquecerlo. De otra manera,
simplificarlo
Simplificar un modelo implica, generalmente:
Convertir variables en constantes
Eliminar o combinar variables
Suponer linealidad
Agregar suposiciones ms fuertes y restricciones
Restringir los lmites del sistema
Enriquecer un modelo implica operar en la forma contraria.
Durante el proceso de modelado se debe lograr un equilibrio
entre el grado de detalle y el riesgo de la falta de exactitud.
El mejor modelo es el modelo ms simple que puede resolver el
problema con el grado de exactitud requerido.
El modelo resultante debe ser:
Fcil de entender por lo expertos y tambin por los usuarios
Dirigido claramente a metas u objetivos
Sensato, en cuanto a no entregar resultado absurdos
Fcil de manipular y controlar por parte del usuario, es decir, de
fcil interaccin
Completo en lo referente a aspectos importantes del sistema
Adaptable en cuanto a su modificacin o actualizacin
(mantenible)
Evolutivo en cuanto a comenzar sencillo y volverse completo en
el tiempo
Ejemplo
Se desea construir un modelo para ({objetivo}) determinar el
tiempo y la velocidad de contacto con el suelo de un paracaidista.
El sistema ser el paracaidista en su descenso.
Las caractersticas esenciales ({variables de inters}) sern la
velocidad de descenso, la fuerza de friccin, la altura inicial, etc.
A fin de mantener el modelo en su forma ms simple posible se
supondr despreciable la variacin de la aceleracin de gravedad
con respecto a la altura, como tambin la elevacin de la
temperatura provocada por la friccin y se considerar un cuerpo
estndar para el paracaidista.
Luego se determinan las variables que representan las
caractersticas esenciales del sistema (F
r
, h
0
, C
r
, etc.), formulando
las ecuaciones que vinculen dichas variables:
donde:
g es la aceleracin de gravedad
h es la altura
mes la masa del paracaidista
t es el tiempo
C
r
es el coeficiente de friccin
F
r
es la fuerza de friccin
El modelo es manejable, pero se puede simplificar ms si es que
se determina que la velocidad terminal (la que equilibra el peso
con la fuerza de friccin) se alcanza pronto; si esto es as, se podr
considerar que la velocidad es constante.
2
r
r r
F dv dh
g v F C v
dt m dt
= + = =
Clasificacin de Modelos
Como se mencion, los modelos son a su vez sistemas, por lo que
se le aplican las mismas clasificaciones vistas:
Determinsticos
Estocsticos
Continuos
Discretos
Adicionalmente se califican como modelos Experimentales o
Tericos.
Modelos Experimentales
Son aquellos modelos que se construyen slo para reproducir las
salidas del sistema real, sin intentar modelar su comportamiento
interno. Tambin se les denomina Modelos de Caja Negra.
Estos modelos requieren una gran cantidad de datos para
calibrarlos o ajustarlos correctamente y su rango de validez est
limitado a este conjunto de datos.
Modelos Tericos
Son aquellos modelos que adems intentan reproducir las relaciones
funcionales del sistema, con base terica matemtica.
Estos modelos requieren una cantidad menor de datos y pueden ser
utilizados fuera del rango de los mismos, ya que la validez est dada
por la teora utilizada y no por los datos.
Modelos de Caja Negra
Ejemplo de modelos experimentales o caja negra
Se desea determinar el espacio recorrido por un cuerpo mvil a
velocidad constante en funcin del tiempo.
Para una velocidad dada se puede construir una grfica de espacio
v/s tiempo a partir de medidas experimentales.
Esta grfica slo se podr emplear para el caso en que la velocidad
del mvil sea idntica a la utilizada en los experimentos y para los
tiempos que pertenezcan al intervalo del experimento.
x v t =
Este problema no se presenta si se utiliza un modelo terico
simple ( ), en donde ni siquiera son necesarios los datos
experimentales.
Si se estudia el comportamiento del enfriamiento de un cuerpo
puesto en un ambiente a una temperatura T
a
, para ello es
necesario medir la temperatura T
c
en N instantes t
i
y luego ajustar
grficamente una curva T
c
v/s t.
O bien, ajustar matemticamente con el criterio de mnimos
cuadrados de los errores de los coeficientes de Regresin Lineal
del polinomio P(a,t), en un sistema semilogartmico, resolviendo el
problema de optimizacin:
Min SS
a
i
N
2
c i i
i 1
SS (T P(a,t ) )
=
=
k t
c a c a
T (t) T (T T ) e
= +
una temperatura especificada estar dada por el polinomio
ajustado, en el sistema semilogartmico:
P(t)=a
1
t + a
2
La incorporacin de ms variables en un modelo se requiere
obtener el modelo a travs de modelos de Regresin Lineal
Mltiple, pudiendo llegar a hacerse necesario reemplazar el
polinomio por un modelo ms potente; ejemplo, una red
neuronal.
Debido a las limitaciones del conocimiento actual (no existe una
teora apropiada) o por la complejidad involucrada
(implementacin demasiado compleja), todo modelo con base
terica siempre posee una parte con base emprica; siempre ser
necesario recurrir a experimentos para determinar el valor de
algn parmetro o definir algunas relaciones entre variables.
Cuando se desarrolla un modelo estadstico, se pueden utilizar
un sin nmero de funciones tericas, pero invariablemente ser
necesario determinar algn parmetro en forma experimental,
como por ejemplo el valor medio y la varianza de la muestra.
El modelo de caja negra ms simple es un polinomio.
Si el orden del polinomio ya est fijado, el problema se reduce a
determinar los valores de los coeficientes que minimicen la
sumatoria de los cuadrados de los errores.
Si el orden del polinomio tambin debe ser determinado,
entonces el orden ptimo surge de minimizar la varianza de los
errores de la muestra, es decir, de resolver el siguiente problema
de optimizacin general:
Min S
2
M,a
donde se desea ajustar los coeficientes a y el orden M del
polinomio P que es funcin de x para que los valores devueltos
minimicen la varianza de los errores de una muestra con N puntos
experimentales (x
i
,y
i
).
N
2
i i
2
i 1
(y P(M,a, x ))
S
N M 1
=
=
x n x
|
=
=
=
0 1
y x | | =
n
i i
i 1
xy
n n
2 2
2 2
i i
i 1 i 1
x y n x y
r 0,9645
x n x y n y
=
= =
= =
X
i
Y
i
X
i
Y
i
X
i
2
Y
i
2
0 8 0 0 64
1 14 14 1 196
4 80 320 16 6400
9 385 3465 81 148225
10 485 4850 100 235225
14 945 13230 196 893025
15 1095 16425 225 1199025
= 53 3012 38304 619 2482160
1
= 71,18897638
0
= -108,716535
r
xy
= 0,96446915
INFERENCIA
Parmetro: es la caracterizacin
numrica de una poblacin, que describe parcialmente
o en forma completa la funcin de densidad (o de
probabilidad) de la caracterstica en estudio
Estadgrafo o Estadstico : es una
funcin de las variables aleatorias que se observan
en una muestra.
Ejemplos :
La distribucin de probabilidad de un
estadstico recibe el nombre de distribucin muestral.
2
*
1
2
2
1
1
1
) (
) ( ) ( s
n
x x
x f x
n
x
x f
n
i
i
n
i
i
=
= = =
= =
Dr. Pedro Vergara V.
Distribucin muestral de un estadstico
Al extraer de una poblacin todas las muestras de un determinado
tamao y calculando en cada una de ellas el parmetro de inters,
se obtendrn muchos valores diferentes de ese estadstico
muestral, lo que se conoce como la variabilidad natural del
muestreo, todos estos valores posibles de un estadstico generan lo
que se denomina su distribucin muestral.
Si se tiene una poblacin de tamao 1000 y se quiere tomar una
muestra aleatoria de tamao 100, existen por tanto 1000 sobre 100
combinaciones posibles de realizar esta eleccin
139
!
6,3850511926305130236698511142022 10
! !
| |
= =
|
\ .
1000
1000
100 900 100
que es el nmero total de muestras distintas de tamao 100 que se
pueden escoger. Si a cada una de estas muestras se le calcula el
estadstico de inters, se tendrn igual nmero de resultados de este
estadstico, con ellos se puede obtener la distribucin muestral del
mismo
Dr. Pedro Vergara V.
Para explicar este concepto, se considera un universo de tamao
N=5, integrado por los elementos en kilos.
luego, , si se toman muestras de tamao 3,
{ }
, , , , P 25 26 27 28 29 =
u o = =
2
27kilos y 2kilos
5
5
10
3 2 3
| |
= =
|
\ .
!
! !
existen muestras distintas
Muestra Valores en la muestra Promedio de la muestra
1 25 26 27 26,000
2 25 26 28 26,333
3 25 26 29 26,667
4 25 27 28 26,667
5 25 27 29 27,000
6 25 28 29 27,333
7 26 27 28 27,000
8 26 27 29 27,333
9 26 28 29 27,667
10 27 28 29 28,000
Dr. Pedro Vergara V.
luego, la distribucin muestral de la media est dada
por:
Promedio de la muestra frecuencia Probabilidad de la media
26 1 0.10
26.333 1 0.10
26.667 2 0.20
27 2 0.20
27.333 2 0.20
27.667 1 0.10
28 1 0.10
se puede verificar que :
( ) . . . .
1 1 2 2 2 1 1
E x 26 26 333 26 667 27 27 333 27 667 28 27kg
10 10 10 10 10 10 10
u = + + + + + + = =
y
. . . . 26 26 333 26 667 2 27 27 333 2 27 667 28
y X 27kg
10
+ + + + + +
= =
Dr. Pedro Vergara V.
( )
m 2
i
i 1
x
X X
m
o
=
=
Error Muestral
Se conoce como error muestral de un estadstico a la
diferencia entre el valor calculado de ste y el parmetro
de la poblacin, para el ejemplo, como =27 se tiene:
Promedio de la muestra Error muestral
26 -1
26.333 -0.667
26.667 -0.333
27 0
27.333 0.333
27.667 0.667
28 1
Error tpico muestral
El error tpico de la distribucin muestral se define por:
m nmero de muestras, mide la variacin de las medias
muestral respecto a la media general. Para el ejemplo, el
error tpico muestral es 0.3333 kg.
Dr. Pedro Vergara V.
DISTRIBUCIN MUESTRAL DE LA MEDIA
Teorema central del lmite : Sean x
1
, x
2
,..., x
n
una
muestra aleatoria de tamao n, con distribucin de probabilidad no
especificada, que tiene media u y varianza finita o
2
.
El promedio muestral
tiene una distribucin con media u y varianza finita o
2
/n,
que tiende a una distribucin normal cuando n tiende a infinito, es
decir la variable aleatoria
n
x x x
x
n
__
+ + +
=
2 1
X ~ ( u , o
2
) ~ ( u , )
__
X
si n es grande, sin importar cual sea la distribucin de probabilidad a
partir de la cual se obtuvo la muestra.
) 1 , 0 ( N
n
x
~
o
u
n
2
o
Dr. Pedro Vergara V.
DISTRIBUCIN MUESTRAL DE p
Sea x una v.a con distribucin de Bernoulli de parmetro
p.
Se toma una muestra aleatoria de tamao n, se estima p,
por
n
x
p
n
i
i
=
=
1
N(0,1) ~
n
q p
p p
=
Dr. Pedro Vergara V.
DISTRIBUCIN MUESTRAL DE (n-1)S
2
/o
2
Si S
2
es la varianza de una muestra
aleatoria de tamao n tomada de una poblacin normal
que tiene varianza o
2
, entonces el estadstico
se distribuye ;
2
con v=n-1 grados de libertad, con
2
2
*
2
1
( 1)
~
n
n S
o
;
2
2
1
*
( )
1
n
i
x x
i
S
n
=
=
( E
Proposicin
Dada una muestra aleatoria x
1
, x
2
,...,x
n
proveniente de
una poblacin, la varianza de los x
i
definida por
1 n
) x x (
S
n
1 i
2
i
2
*
=
es un estimador insesgado de
| |
{ }
u u
u u u u
= = =
=
| | | | | |
= = =
| | |
\ . \ . \ .
| |
= +
|
\ .
n n n
2
2 2 2
* i i i
i 1 i 1 i 1
n
2 2
i 1
1 1 1
E( S ) E (x x) E (x x) E (x ) (x )
n 1 n 1 n 1
1
E (x ) 2(x )(x ) (x )
i i
n 1
u u u u
u u u u
u u
u u
o
o
o
= =
=
=
=
| |
= +
|
\ .
| |
= +
|
\ .
| |
=
|
\ .
=
n n
2 2
i 1 i 1
n
2 2
i 1
n
2 2
i 1
n
2 2
i 1
2
2
1
E (x ) 2(x ) (x ) n(x )
i i
n 1
1
E (x ) 2(x )n(x ) n(x )
i
n 1
1
E (x ) n(x )
i
n 1
1
E(x ) nE(x )
i
n 1
1
n n
n 1 n
2
Dr. Pedro Vergara V.
2) Estimador Consistente
Es razonable esperar que un buen estimador de un
parmetro sea cada vez mejor si el tamao de la muestra
aumenta.
0 = u u = u
)
( V lim , )
( E lim
n n
Dr. Pedro Vergara V.
( ) ( ) ( ) ( )
n n n
i i i
n n n n n
i 1 i 1 i 1
n n
1 1 1
lmE lmE x lmE x lm E x lm E x
n n n
1
lm n lm
n
0
= = =
| |
= = = =
|
\ .
= = =
( ) ( ) ( ) ( )
n n n
i i i
2 2
n n n n n
i 1 i 1 i 1
2
n n
1 1 1
lm V lm V x lm V x lm V x lm V x
n n n
1
lm n lm 0
n n
0
= = =
| |
= = = =
|
\ .
= = =
para el ejemplo de la distribucin de Poisson, se tiene :
3) Estimador Eficiente
Un estimador es eficiente si la varianza del estimador es la menor
posible
Dr. Pedro Vergara V.
Un estimador puntual es eficiente si la varianza del estimador es
la menor posible. Si E
1
y E
2
son dos estimadores insesgados con
varianzas V(E
1
) y V(E
2
), respectivamente, con V(E
1
) < V(E
2
), se
dice que el estimador E
1
es ms eficiente que E
2
.
Sea x
1
, x
2
, ..., x
n
una muestra aleatoria de tamao n. Se ha
probado que
y x
1
son estimadores insesgados de .
es ms eficiente que x
1
para estimar puesto que
x
x
x
Pero,
2
1
2
) x ( V
n
) x ( V o = <
o
=
Estimadores de Mxima Verosimilitud
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente
de una poblacin con funcin de densidad f( x , ). La funcin de
densidad conjunta o funcin de verosimilitud est dada por :
Dr. Pedro Vergara V.
1 2 n
L( ) f(x , ) f(x , ) f(x , ) u u u u =
Si se encuentra una funcin de x
1
, x
2
,...,x
n
, definida por g(x
1
,
x
2
,...,x
n
) tal que cuando es reemplazado por g(x
1
, x
2
,...,x
n
) la
funcin de verosimilitud es mxima. Entonces el estadstico
= g(x
1
, x
2
,...,x
n
) se llama Estimador Mximo Verosmil de
u
Ejemplo : Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de
tamao n proveniente de una poblacin con funcin de
Poisson de parmetro , luego la funcin de verosimilitud
est dada por
L f x f x f x
n
( ) ( , ) ( , ) ( , ) =
1 2
=
e
x
x
e
x
x
e
x
n
x
n
1
1
2
2
! ! !
Dr. Pedro Vergara V.
es decir,
n
i
i 1
x
n
n
i
i 1
e
L( )
x !
=
I
aplicando logartmo natural a esta expresin, se tiene :
| |
n
i
i 1
n
ln L( ) n x ln ln x !
i
i 1
=
| |
= +
| I
|
= \ .
n 0 x
n
= =
+ = = =
por tanto, el estimador mximo verosmil de es x
=
.
A) Intervalo de Confianza para la media u de una poblacin normal
i) Cuando es conocida
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente de
una poblacin con distribucin donde es conocida,
luego
2
o
( )
2
o u, N
o
2
por tanto,
|
|
.
|
\
| o
u ~
n
, N x
2
) , ( N
n
x
z 1 0 ~
o
u
=
Definiendo el Nivel de Confianza por 1-o, y el percentil , se tiene:
z
o
2
( )% 1
2
o
z z
o o
2
1
2
o =
|
|
.
|
\
|
o
< u <
o
o =
|
|
.
|
\
|
<
o
u
<
o
o o
o
1 1
2
1
2 2
1
2
n
z x
n
z P z
n
x
z P
o
+
o
o
n
z x ;
n
z x
2
1
2
1
intervalo de confianza
para u del (1-o)%
2 2
1
o o
= z z
Dr. Pedro Vergara V.
En un municipio se desea estimar cual es el gasto promedio diario en
combustible, para limpiar las calles. Para ello, se selecciona una
muestra aleatoria de 20 das de un mes. Los gastos diarios fueron
:107361, 112055, 111362, 112756, 116055, 101562, 112304, 111795,
112656, 108011, 105062, 112395, 112307, 111976, 112757, 111361,
109422, 111806, 111307, 108100. Supngase que los gastos diarios
se distribuyen aproximadamente normal con desviacin estndar
$3200. Construir un intervalo de confianza estimado del 95% para el
valor promedio del gasto diario.
975 0
2
1 025 0
2
05 0 5 110620 . . . , x = = = =
o o
o
z
0.025
= -1.96 z
0.975
=1.96 z
0.025
= z
0.975
=1.96
+ < u <
o
+ < u <
o
o
20
3200
96 1 5 110620
20
3200
96 1 5 110620
2
1
2
1
. . . .
n
z x
n
z x
| | 96 112022 04 109218 . ; , c u
Dr. Pedro Vergara V.
025 0
2
. =
o
025 0
2
. =
o
ii) Cuando es desconocida
Sea x
1
,x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente de
una poblacin con distribucin
a) b) c)
( )
2
o u, N
) , ( N
n
x
1 0 ~
o
u
1
2
2
2
; ~
o
n
nS
v ;
=
v
2
1 0 ) , ( N
T
Donde son los grados de libertad de un distribucin 1 = n v ;
2
n 1
*
x
T t
S n
luego
El intervalo de confianza del 100(1- o )% para cuando es
desconocida est dado por :
u o
2
* *
(n 1),1 (n 1),1
2 2
S S
x t ; x t
n n
o o
+
o
2
Dr. Pedro Vergara V.
En un proceso de llenado de bolsas de azcar, se desea estimar el valor medio
por bolsa. Se toma una muestra aleatoria de 15 bolsas, obteniendo los
siguientes pesos en gramos: 22.5 , 28.2 , 29.5 , 22.2 , 24.8 , 25.4 , 23.7 , 22.5,
24.3 , 22.9 , 22.4 , 28.7 , 26.5 , 28.2 y 20.5. Si se supone que la cantidad de de
azcar que se envasa en cada bolsa se distribuye aproximadamente normal
Obtener un intervalo de confianza del 95% para el contenido medio real de
cada bolsa.
975 0
2
1 025 0
2
05 0 80718466 2 82 24 . . . . S . x
*
=
o
=
o
= o = =
t
0.025, 14
= -2.145 t
0.975, 14
= 2.145 t
0.025
= t
0.975
+ < <
15
80718466 . 2
145 . 2 82 . 24
n
S
t x
n
S
t x
*
2
1
*
2
1
o o
u
| | 3747 . 26 ; 2652 . 23 c u
Dr. Pedro Vergara V.
B) Intervalo de Confianza para una proporcin
Para construir un intervalo de confianza para el parmetro p desconocido de
una distribucin binomial con n conocido, se considera una muestra aleatoria
x
1
, x
2
,...,x
n
, donde:
Sea el estimador puntual, luego
por tanto
el intervalo aproximadamente del (1- o)% para una muestra grande est dado
por :
=
=
p q ad probabilid con
p ad probabilid con
x
i
1 0
1
p x
n
x
i
i
n
= =
=
1
1
n
) p ( p
) x ( V ) p ( V , p ) x ( E ) p ( E
= = = =
1
) , ( N
n
) p ( p
p p
1 0
1
~
1 1
2 2
p(1 p) p(1 p)
P Z ; P Z
n n
o o
+
Dr. Pedro Vergara V.
Se recibe un gran cargamento de radio transmisores y se sabe que
algunos son defectuosos. Se selecciona una muestra aleatoria de
tamao 1000 de este envo, y se realiza una prueba de
funcionamiento, encontrndose que 5 de ellos eran defectuosos.
Determine un intervalo de confianza aproximado del 95% para la
proporcin de radio transmisores que funcionan correctamente.
975 0
2
1 025 0
2
05 0 995 0 005 0
1000
5
. . . . p , q =
o
=
o
= o = = =
z
0.025
= -1.96 z
0.975
=1.96 z
0.025
= z
0.975
=1.96
2 2
p(1 p) p(1 p)
P Z ; P Z
n n
o o
+
1000
005 0 995 0
96 1 995 0
1000
005 0 995 0
96 1 995 0
, ,
, , ;
, ,
, ,
| | 99937 0 99063 0 , ; ,
La proporcin est entre con una certeza del
95%
Dr. Pedro Vergara V.
C) Intevalo de confianza para o
2
Para u desconocida
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente
de una poblacin con distribucin ,
si u es desconocida se sabe que :
( )
2
o u, N
) n (
nS
1
2
2
2
; ~
o
2 ,
) (
) 1 (
2
2
1
2
> ~
n
x x
n
n
i
i
;
o
;
;
o
o
2
1
2
2
2
1 1
2
2
1 1
, ) n (
*
, ) n (
* S ) n (
;
S ) n (
324 . 110 ) 1 ( 880285715 . 7 *
2
*
2
= = S n S
13 26 975 0 14
2
. . , = ; 62 5 025 0 14
2
. . , = ;
| | 6306 . 19 ; 2221 . 4
62 . 5
324 . 110
;
13 . 26
324 . 110
=
| | 6306 . 19 ; 2221 . 4
2
e o
| | 430643 . 4 ; 05477 . 2 e o
Dr. Pedro Vergara V.
PRUEBAS DE BONDAD DE AJUSTE
Se utilizan para determinar si una poblacin tiene una
distribucin terica especfica. La prueba se basa en que tan
buen ajuste se tiene entre la frecuencia de ocurrencia de las
observaciones en una muestra, y las frecuencias esperadas que
se obtienen de la distribucin hipottica. Considere una muestra
aleatoria de tamao n, dividida en k clases exhautivas y
mutuamente excluyentes, sea O
i
, i=1,2,...,k el valor observado
en la muestra para la clase i ; sea E
i
, i=1,2,...,k, el valor
esperado de la distribucin hipottica para la clase i.
El estadstico de la prueba est dado por la expresin :
( ) 1
2
1
2
2
=
; ~
= ;
k
k
i
i
i i
E
) E O (
cal
Dr. Pedro Vergara V.
Ejemplo :
Se desea determinar si el nmero de accidentes fatales
se encuentra distribuido de igual forma para el color de los
automviles involucrados en los accidentes. Para ello, se tom
una muestra aleatoria de 700 accidentes automovilsticos en los
cuales ocurri por lo menos una muerte y se consign el color del
automvil involucrado, obteniendo la siguiente informacin :
Blanco Azul Burdeo Negro Plomo Amarillo Violeta
43 120 125 156 135 54 67
Para un nivel de significacin del 1%, existe evidencia para
afirmar que la distribucin de accidentes segn el color del
automvil es la misma?
Como el total de accidentes es 700, y si se supone que la
distribucin es uniforme, el nmero de accidentes debiera ser el
mismo independiente del color del automvil, por ello, el valor
esperado sera E
i
=100
Dr. Pedro Vergara V.
H
0
: La distribucin de accidentes segn el color es la misma, es decir, la
distribucin de accidentes es uniforme segn el color del automvil
H
1
: La distribucin de los accidentes segn el color del automvil no es
la misma
Blanco Azul Burdeo Negro Plomo Amarillo Violeta
O
i
73 106 110 123 122 79 87
E
i
100 100 100 100 100 100 100
El estadstico a calcular para efectuar esta prueba est dado por :
)
k
(
cal
k
i
i
i i
E
) E O (
1
2
1
2
2
; ~
= ;
=
si las frecuencias observadas son prximas a las correspondientes frecuencias
esperadas, el valor del estadstico ser pequeo, lo que indica un buen ajuste,
de lo contrario si las frecuencias observadas difieren considerablemente de las
frecuencias esperadas, el valor ser grande, y por tanto, no habr un buen
ajuste, el valor calculado caer en la regin de rechazo de H
0
. Para este tipo de
dcima, la hiptesis alternativa es unilateral, la regin crtica se ubicar en la
cola derecha de la distribucin, luego si > se rechaza H
0
;
2
cal
1
2
o ; k ,
Dr. Pedro Vergara V.
81 16
6 99 0
2 2
.
, . crit
= ; = ;
Regin de rechazo de H
0
81 16 88 24
6 99 0
2 2
. .
, . cal
= ; > = ;
como
se rechaza H
0
, es decir, existe evidencia estadstica para afirmar que la
distribucin de los accidentes con causa de muerte dependen del color del
vehculo
o = 0.01
Dr. Pedro Vergara V.
Prueba para una distribucin normal
Si se quiere realizar una prueba de hiptesis para verificar si una
variable aleatoria X tiene distribucin normal, se definen:
H
0
: la variable aleatoria X tiene distribucin normal
H
1
: la variable aleatoria X no tiene distribucin normal
Para realizar esta dcima de bondad de ajuste, se estimarn los
parmetros y
2
de la distribucin normal, mediante los estadsticos x
y S
2
de una muestra aleatoria, agrupando las observaciones continuas en
un nmero k de intervalos, se rechazara Ho si los valores esperados si
fuesen muy diferentes a los valores observados en cada intervalo.
Intervalo O
i
p
i
E
i
= np
i
- y`
1
O
1
p
1
=P(x y`
1
) E
1
= np
1
y`
1
y`
2
O
2
p
2
=P(y`
1
x y`
2
) E
2
= np
2
y`
2
y`
3
O
3
p
2
=P(y`
2
x y`
3
) E
3
= np
3
. . . .
y
k-1
+ O
k
p
2
=P(y`
k-1
x) E
k
= np
k
Total n 1 n
2
;
2
;
Si el valor calculado es mayor al valor
y se puede afirmar que la variable X no tiene distribucin
normal.
crtico, se rechaza H
0
Dr. Pedro Vergara V.
Ejemplo. En una empresa se aplic un test a 100 trabajadores, con
una escala de puntajes de 0 a 100 puntos. Verificar si los puntajes
obtenidos tienen distribucin normal.
24 76 80 84 88 31 52 83 37 74
52 81 72 63 75 67 87 62 59 34
39 83 94 39 55 54 92 58 56 69
65 96 101 58 103 60 69 88 104 51
57 73 48 64 67 43 46 43 40 45
67 33 26 89 32 53 84 55 65 45
75 68 61 76 68 88 63 66 90 84
77 50 72 42 68 68 102 61 77 97
86 44 47 89 59 74 55 93 43 74
55 44 66 61 70 55 82 88 90 34
Los estimadores puntuales de los parmetros de la distribucin normal
obtenidos a partir de esta muestra son
x = 65.52 puntos y = 19.2928 puntos.
Dr. Pedro Vergara V.
Para construir la tabla de distribucin de frecuencias, se tiene que el
puntaje mnimo es 24 y el mximo es 104, luego, el recorrido
R= x
mx
x
min
= 104 - 24 = 80
El nmero k de intervalos, conocido el tamao de la muestra N, se
puede determinar a travs de la frmula de Sturgess:
k 1 3.32 log(N) = +
es decir, k = 1 + 3.32 log(100) = 7.64, que aproximado al entero superior
es 8, la amplitud del intervalo est dada por A = R/k = 80/8 = 10
0 20 40 60 80 100 120
0
4
8
12
16
20
f
r
e
q
u
e
n
c
y
Puntaje f
i
24 - 34 6
34 - 44 10
44 - 54 11
54 - 64 19
64 - 74 20
74 - 84 14
84 - 94 13
94 -104 6
Total 100
Dr. Pedro Vergara V.
la distribucin de frecuencia muestra que los puntajes podran tener una
distribucin aproximadamente normal. Las hiptesis sern:
H
0
: X se distribuye normal con = 65.52 puntos y
2
= (19.2928)
2
(puntos)2
H
1
: X no se distribuye normal con = 65.52 puntos y
2
= (19.2928)
2
(puntos)
2
2 2
0.95, 7
14.073 ; ; = =
crit
1 0.95 o =
0.05 o =
i LI LS O
i
z
i
P(X<x)
Probabilidad
del Intervalo E
i
=np
i
(O
i
-E
i
)
2
/E
i
1 34 7 -1,6338 0,05115 0,05115 5,12 0,694
2 34 44 10 -1,1154 0,13234 0,08118 8,12 0,436
3 44 54 11 -0,5971 0,27522 0,14289 14,29 0,757
4 54 64 19 -0,0788 0,46859 0,19339 19,34 0,006
5 64 74 20 0,4395 0,66985 0,20126 20,13 0,001
6 74 84 14 0,9579 0,83094 0,16107 16,11 0,276
7 84 + 13 1,4762 0,93006 0,09912 9,91 0,962
8 94 104 6 1,9945 0,97695 0,06995 6,99 0,141
Total 100 1 100 3,274
Dr. Pedro Vergara V.
2
;
2
;
El valor calculado = 3,274 es menor que el valor
por tanto, no existe evidencia estadsticamente significativa para
rechazar H
0
, es decir, se acepta que los datos provienen de una
distribucin normal con = 65.52 puntos y = 19.2928 puntos.
crtico = 14.073
) c ( ) f (
cal
f
i
ij
ij ij
c
j
E
) E O (
1 1
2
1
2
1
2
; ~
= ;
= =
n
n x n
E
j i
ij
- -
=
con
DCIMAS ;
2
PARAANLISIS DE TABLAS DE ASOCIACIN
Esta prueba permite determinar si existe alguna relacin entre dos
caractersticas diferentes de una poblacin, en que cada una de ellas ha
sido dividida en un cierto nmero de categoras. Para realizar esta
dcima se supone que las dos clasificaciones son independientes, y se
utiliza el estadstico :
Dr. Pedro Vergara V.
Ejemplo :
En un estudio de preferencias por una marcas se tom una
muestra aleatoria en 300 personas, se clasific la informacin de
acuerdo con el tipo de marca y regin en donde vive el encuestad,
obteniendo la siguiente informacin :
Para un nivel de significacin del 5%, existe asociacin entre el tipo de marca que se elige
y la regin donde vive el encuestado?
H
0
: No hay asociacin entre el tipo de marca que se elige y regin
H
1
: Existe asociacin entre el tipo de marca que se elije y la regin
como 99 5 681 2
133 54
133 54 60
8 38
8 38 42
2 05 0
2
2 2
2
. .
.
) . (
...
.
) . (
, . cal
= ; < =
+ +
= ;
no existe evidencia estadsticamente significativa para rechazar H
0
Regin Regin I Regin II Regin III Total
Marca O
i
E
i
O
i
E
i
O
i
E
i
A 42 38.80 35 32.333 20 25.866 97
B 78 81.20 65 67.666 60 54.133 203
Total 120 100 80 300
Dr. Pedro Vergara V.
Ejercicio.- Se realiza un estudio para determinar si existe asociacin
entre el hbito de fumar respecto de morir por cncer en las vas
respiratorias, para ello, se toma una muestra aleatoria de 650
personas, obteniendo la siguiente informacin
Con causa
de muerte
Sin causa
de muerte
Total
Fumadores 250 50 300
No fumadores 60 220 280
Total 310 270 580
Para un nivel de significacin del 5%, qu puede concluir?
Dr. Pedro Vergara V.
MODELOS DE REGRESIN LINEAL
Grficos de correlacin
Permiten obtener una impresin visual del grado de dependencia lineal
existente entre dos variables
Tiempo(x) Crecimiento(y)
1,8 9,5
2,5 11,2
3,2 12,7
3,9 14,5
4,6 16,1
5,3 17,9
6 19,7
6,7 21,2
7,6 23,4
8,1 24,7
Dr. Pedro Vergara V.
El coeficiente de correlacin permite determinar el grado de asociacin
lineal existente entre dos variables cuantitativas
= =
=
=
n
i
i
n
i
i
n
i
i i
xy
y n y x n x
y x n y x
r
1
2 2
1
2 2
1
( ) ( )
99988 0
09 17 10 03 3162 97 4 10 45 288
09 17 97 4 10 37 949
2 2
,
, , , ,
, , .
r
xy
=
=
Caractersticas
1) -1s r
xy
s 1
2) Valores prximos a cero indican que no existe asociacin lineal entre las variables
3) Valores prximos a uno o menos uno indican que existe asociacin lineal entre las
variables
Coeficiente de
variacin
9997656 0
2
, r xy =
x y x*y x*x y*y
1,8 9,5 17,1 3,24 90,25
2,5 11,2 28 6,25 125,44
3,2 12,7 40,64 10,24 161,29
3,9 14,5 56,55 15,21 210,25
4,6 16,1 74,06 21,16 259,21
5,3 17,9 94,87 28,09 320,41
6 19,7 118,2 36 388,09
6,7 21,2 142,04 44,89 449,44
7,6 23,4 177,84 57,76 547,56
8,1 24,7 200,07 65,61 610,09
49,7 170,9 949,37 288,45 3162,03
09 17 97 4 . y , . x = =
Dr. Pedro Vergara V.
Regresin lineal
Introduccin
El nombre genrico de modelos de regresin, proviene de los
trabajos de Galton en biologa a finales del siglo XIX. Galton estudi
la dependencia de la estatura de los hijos (y) respecto a la de sus
padres (x), encontrando lo que denomin una regresin a la media :
los padres altos tienen, en general, hijos altos, pero, en promedio, no
tan altos como sus padres; los padres bajos tienen hijos bajos, pero,
en promedio, ms altos que sus padres. Desde entonces, los
modelos estadsticos que explican la dependencia de una variable y
respecto de una o varias variables cuantitativas x se denominan
modelos de regresin Daniel Pea 1989.
Segn Daniel Pea, 1989, se debe admitir que todos los factores o
causas que influyen en una variables respuesta (y) pueden dividirse
en dos grupos : el primero contiene una variable (x), conocida al
observar (y), que tiene una influencia lineal en la respuesta; el
segundo incluye un conjunto muy grande de factores, cada uno de
los cuales influye en la respuesta slo en una pequea magnitud,
que se engloba dentro del nombre comn de error aleatorio.
Dr. Pedro Vergara V.
i i i
e x y + | + | =
1 0
La hiptesis bsica del modelo
donde y
i
y e
i
son variables aleatorias, bajo los siguientes supuestos
1. Los errores tiene esperanza cero
2. La varianza de los errores es constante
3. Los errores tiene distribucin normal
4. Los errores e
i
son independientes entre s
| | 0 =
i
e E
c
2
i
) e ( Var o =
) , ( N ~ e
i
2
0 o
j i ) e , e ( E
j i
= = 0
Dr. Pedro Vergara V.
5. La variable respuesta se distribuye normal ) , ( N ~ y
i
2
o u
Test de Normalidad
5.3, 4.6, 1.8, 6.7, 2.5, 3.2, 8.1, 3.9, 7.6, 6.0
valores i Pi
1,8 1 0,05
2,5 2 0,15
3,2 3 0,25
3,9 4 0,35
4,6 5 0,45
5,3 6 0,55
6 7 0,65
6,7 8 0,75
7,6 9 0,85
8,1 10 0,95
datos de numero k ,
k
. i
p
i
5 0
=
120 130 140 150 160 170
valores
Normal Probability Plot
0.1
1
5
20
50
80
95
99
99.9
c
u
m
u
l
a
t
i
v
e
p
e
r
c
e
n
t
Frmula Yates con correccin de continuidad
10
5 0. i
p
i
=
Dr. Pedro Vergara V.
1.8
Model fitting results for: Peso
--------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
--------------------------------------------------------------------------------------------------
Constant 5.097406 0.07015 72.6641 0.0000
Tiempo 2.412997 0.013062 184.7406 0.0000
--------------------------------------------------------------------------------------------------
R-SQ. (ADJ.) = 0.9997 SE= 0.084083 MAE= 0.064989
10 observations fitted, forecast(s) computed for 0 missing val. of dep. var.
Tiempo * 412997 . 2 097406 . 5 o Crecimient + =
Analysis of Variance for the Full Regression
--------------------------------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
--------------------------------------------------------------------------------------------------------
Model 241.292 1 241.292 34129.1 0.0000
Error 0.0565599 8 0.00706999
-------------------------------------------------------------------------------------------------------
Total (Corr.) 241.349 9
R-squared = 0.999766
Dr. Pedro Vergara V.
Crecimiento Fitted Standardized
Number Tiempo Observed Values Residual Residual
1 1,8 9,5 9,4408 0,00592 0.85341
2 2,5 11,2 11,1299 0,0701 0.95570
3 3,2 12,7 12,819 -0,119 -1,74724
4 3,9 14,5 14,5081 -0,00809 -0.09646
5 4,6 16,1 16,1972 -0,09719 -1,26577
6 5,3 17,9 17,8863 0,01371 0.16132
7 6 19,7 19,5754 0,12461 1,78994
8 6,7 21,2 21,2645 -0,06448 -0.82602
9 7,6 23,4 23,4362 -0,03618 -0.47772
10 8,1 24,7 24,6427 0,05732 0.81949
9 13 17 21 25
Predicted
-0.12
-0.07
-0.02
0.03
0.08
0.13
R
e
s
i
d
u
a
l
s
Residual Plot for Peso
-0.12 -0.07 -0.02 0.03 0.08 0.13
Residuals
Normal Probability Plot
0.1
1
5
20
50
80
95
99
99.9
c
u
m
u
l
a
t
i
v
e
p
e
r
c
e
n
t
0 2 4 6 8 10
Edad
9
13
17
21
25
P
e
s
o
Plot of Peso vs Edad
Tiempo * 412997 . 2 097406 . 5 o Crecimient + =
Dr. Pedro Vergara V.
Tiempo
C
r
e
c
i
m
i
e
n
t
o
Linealizacin de modelos
En muchas situaciones experimentales no se conoce el tipo de
modelo que es posible ajustar para relacionar una variable
dependiente con una independiente, slo se dispone de un pequeo
nmero de pares ordenados correspondientes a los resultados del
estudio, que al graficarlos muestran una nube de puntos y se quiere
ajustar un modelo por lo que se necesita obtener los parmetros que
lo determinan, a continuacin se analizan distintos tipos de modelos
y el procedimiento que permite estimar sus parmetros.
Modelo exponencial
Un modelo exponencial es de la forma
=
bx
y a e
Dr. Pedro Vergara V.
Dr. Pedro Vergara V.
= + ln ln y a bx
| | = +
0 1
Y X
se aplica logartmo natural a esta expresin obteniendo
designado por Y a ln y, por
0
= ln a, por
1
=b y X=x, se tiene un modelo
lineal de la forma
que es la ecuacin de una recta en un sistema semilogartmico. Para
obtener los valores estimados de
0
y
1
se utiliza el mtodo de
mnimos cuadrados, donde
=
bx
y a e
1
= m = b y a = antilogaritmo(
0
)
Se puede afirmar que si el coeficiente de correlacin lineal de estos
puntos dibujados en este sistema semilogartmico, en valor absoluto
es prximo a 1, se debera ajustar un modelo exponencial a los
datos obtenidos.
Dr. Pedro Vergara V.
Ejemplo: Se intenta obtener la ecuacin que permita estimar a la
carga que tiene un condensador de un radiotransmisor operando en
forma continua, en un instante dado, para ello, se midi el voltaje
del condensador cada 15 minutos obteniendo:
Tiempo 1 2 3 4 5 6 7 8 9
Voltaje 7,08 5,35 4,26 3,19 2,53 1,98 1,62 1,21 1,00
en la figura, se aprecia que podra existir un modelo exponencial que
ajuste estos valores, luego se aplica logartmo natural a los valores
de voltaje, obteniendo:
Dr. Pedro Vergara V.
0.2449856
8.780084
x
y e
=
Tiempo 1 2 3 4 5 6 7 8 9
ln Voltaje 1,96 1,68 1,45 1,16 0,93 0,68 0,48 0,19 0,00
el coeficiente de correlacin lineal de los datos en
este sistema semilogartmico es r
xy
=-0.999305, por
tanto, la variacin explicada por el modelo es de
un 99.86%, el modelo que permite estimar la carga
en cada instante de tiempo est dado por:
Tiempo 1 2 3 4 5 6 7 8 9
Voltaje 7,08 5,35 4,26 3,19 2,53 1,98 1,62 1,21 1,00
Voltaje estimado 6,87 5,38 4,21 3,30 2,58 2,02 1,58 1,24 0,97
e
i
0,21 -0,03 0,05 -0,11 -0,05 -0,04 0,04 -0,03 0,03
aplicando mnimos cuadrado se obtiene:
1
=m=b=-0.2449856 a = antilogaritmo(2.17248599)=8.780084
Dr. Pedro Vergara V.
Modelo Potencial
Dado un modelo potencial de la forma
b
y a x =
Dr. Pedro Vergara V.
b
y a x =
ln ln ln y a b x = +
| | = +
0 1
Y X
Para obtener los parmetros a y b del modelo
se aplica logartmo natural a esta expresin obteniendo
designado por Y a ln y, por
0
= ln a, por
1
=b y X = ln x, se tiene un
modelo lineal de la forma
que es la ecuacin de una recta en un sistema bilogartmico. Para
obtener los valores estimados de
0
y
1
se utiliza el mtodo de
mnimos cuadrados, donde
1
= m = b y a = antilogaritmo(
0
)
Se puede afirmar que si el coeficiente de correlacin lineal de estos
puntos dibujados en este sistema bilogartmico, en valor absoluto es
prximo a 1, se debera ajustar un modelo potencial a los datos
obtenidos. Dr. Pedro Vergara V.
Ejemplo. Se obtienen los valores del aumento de la presin de una
caldera a medida que aumenta la temperatura
Temperatura 0,1 0,5 0,9 1 1,25 2 2,3 2,8 3,2
Presin 0,58 1,63 2,34 2,5 2,86 3,84 4,15 4,6 5,21
en el grfico de correlaciones se puede apreciar que existe una curvatura
que podra suponer la existencia de un modelo potencial.
ln(Temperatura) -2,3026 -0,6931 -0,1054 0,0000 0,2231 0,6931 0,8329 1,0296 1,1632
ln(presin) 0,6259 0,8329 0,9002 0,9163 0,9478 1,0043 1,0152 1,0473 1,0647
1
= m =0.125744135 = b y a = antilogaritmo(0.916546185) = 2.5006
aplicando logartmo natural a la tabla de observaciones medidas se tiene:
Dr. Pedro Vergara V.
el coeficiente de correlacin lineal de los datos en este sistema
bilogartmico es r
xy
=0.999743553, por tanto, la variacin explicada por
el modelo es de un 99.95%.
El modelo de la presin en funcin de la temperatura est dado
por: 0.125744135
2.5006 y x =
Temperatura 0,1 0,5 0,9 1 1,25 2 2,3 2,8 3,2
Presin 0,58 1,63 2,34 2,5 2,86 3,84 4,15 4,6 5,21
Presin estimada 1,8720 2,2919 2,4677 2,5006 2,5718 2,7283 2,7767 2,8462 2,8944
e
i
-0,0020 0,0081 -0,0077 -0,0006 0,0082 0,0017 -0,0167 0,0038 0,0056
Dr. Pedro Vergara V.
Modelo Hiperblico
ax
y
bx c
=
+
Considerando a, b y c positivos, la curva tiene la siguiente forma:
para linealizar este modelo, se
requiere toma el recproco de
la expresin
1 1 1 ax bx c b c
y
bx c y ax y a a x
+
= = = +
+
que es una recta en un sistema 1/x versus 1/y.
Luego
0 1
b
=
a
c
y
a
| | =
determinados
0
y
1
basta fijar a en 1 y obtener los valores de b y c.
Para un modelo hiperblico de la forma
Dr. Pedro Vergara V.
Ejemplo. En un proceso de reaccin qumica, la velocidad de
reaccin est dada en funcin de la concentracin de sustrato que
intervenga. En la tabla de muestran diferentes velocidades de
reaccin en funcin de las concentraciones que se ocupen.
Concentracin 0,2 0,8 1,2 1,6 2,5 3,1 3,5
Velocidad 0,48 1,075 1,235 1,34 1,458 1,505 1,53
Concentracin 4,2 5,1 6,3 7,2 8,6 10
Velocidad 1,56 1,589 1,613 1,634 1,651 1,665
Dr. Pedro Vergara V.
Los valores de los recprocos se muestran en la tabla:
Rec(Concentracin) 5 1,25 0,833 0,625 0,4 0,323 0,286
Rec(Velocidad) 2,083 0,93 0,81 0,746 0,686 0,664 0,654
Rec(Concentracin) 0,238 0,196 0,159 0,139 0,116 0,1
Rec(Velocidad) 0,641 0,629 0,62 0,612 0,606 0,601
la grfica de estos recprocos esta dada por:
Dr. Pedro Vergara V.
0 1
b
= 0,56610657 0,302408524
a
c
y
a
| | = = =
0.55610657 0.302408524
i
x
y
x
=
+
si a=1, b=0.56610657 y c=0.302408524, luego el modelo es
el coeficiente de correlacin r
xy
=0,999874212, luego la variacin
explicada por el modelo es de un 99.97%.
Concentracin 0,2 0,8 1,2 1,6 2,5 3,1 3,5
Velocidad 0,480 1,075 1,235 1,340 1,458 1,505 1,530
Velocidad
estimada
0,484 1,071 1,237 1,342 1,477 1,530 1,556
e
i
-0,004 0,004 -0,002 -0,002 -0,019 -0,025 -0,026
Concentracin 4,2 5,1 6,3 7,2 8,6 10
Velocidad 1,560 1,589 1,613 1,634 1,651 1,665
Velocidad
estimada
1,592 1,625 1,655 1,672 1,691 1,705
e
i
-0,032 -0,036 -0,042 -0,038 -0,040 -0,040
Dr. Pedro Vergara V.
MTODOS MULTIVARIADOS
Regresin mltiple
Introduccin
El modelo de regresin de regresin mltiple es la extensin para n
variables explicativas del modelo de regresin lineal simple. En
general, una variable respuesta y, depende de muchas otras variables
x
1
, ..., x
n
, aunque algunas de stas pueden ser no observables o,
incluso, desconocidas para el investigador. El modelo de regresin
pretende medir el efecto de las ms importantes, y representa el de
las restantes mediante una variable aleatoria que se denomina error
del modelo. Es decir:
y = f(X
1
, ... ,X
k
) + e(X
k+1
, ... , X
n
)
Suponiendo que, en el rango de valores de inters, la funcin
f(X
1
, ... ,X
k
) admite una aproximacin lineal, con lo que resulta el
modelo de regresin mltiple:
c + | + + | + | + | + | =
k k
X . . . . X X X X y
2 1 12 2 2 1 1 0
Dr. Pedro Vergara V.
Considerando algunos ejemplos :
1) tratar de determinar como influye sobre el rendimiento de un
alumno, la cantidad de horas que estudia, el nmero de horas que
asiste a clases, el nmero de ejercicios que resuelve, etc.;
2) explicar la remuneracin de los cargos directivos de las empresas
chilenas en funcin de las caractersticas del individuo que lo ocupa
(edad, titulo, aos de experiencia, cursos de capacitacin, etc.), del
puesto analizado (nmero de personas que de l dependen, nivel
jerrquico, etc.), y de la empresa (sector tamao, beneficios, etc.)
3) se estudia la calidad de un servicio en funcin del tiempo de
espera en una fila, del tiempo de atencin, del nmero de
certificados exigidos, etc.
Para construir un modelo de regresin mltiple, primero se debe
establecer un conjunto de hiptesis respecto a la distribucin del
error, como la relacin entre la variable dependiente y las
independientes; segundo, tomar una muestra para estimar los
parmetros del modelo, construyendo intervalos de confianza para
describir la incertidumbre presente en su estimacin; tercero, se
debe contrastar la validez de las hiptesis.
Dr. Pedro Vergara V.
Modelo general de regresin
Hiptesis bsicas : Sean X
1
, . . . , X
k
, variables matemticas, e y una
variable aleatoria. Las variables X se llaman variables explicativas,
independientes, o regresores; la variable y, se conoce como variable
explicada, respuesta, o dependiente. Una observacin cualquiera
puede escribirse por :
i k k
X . . . . X X X X y c + | + + | + | + | + | =
2 1 12 2 2 1 1 0
donde cada coeficiente |
i
mide el efecto marginal sobre la respuesta de
un aumento unitario en X
i
cuando todas las otras variables permanecen
constantes; c
i
es el error aleatorio.
Para el error se deben suponer las siguientes hiptesis :
(a) la media de los errores debe ser cero;
(b) la varianza de los errores debe ser constante;
(c) los errores deben ser independientes entre si;
(d) los errores deben tener distribucin normal.
Dr. Pedro Vergara V.
se debe exigir que las variables explicativas son realmente
distintas, para evitar ambigedades:
(e) ninguna de las variables explicativas es una combinacin
lineal exacta de las dems. (Las variables X
i
son linealmente
independientes).
Las hiptesis respecto de los errores pueden escribirse en trminos de la
variable respuesta por :
(a) para cada conjunto fijo de valores de las X, la distribucin de y tiene
media:
| |
k k n
X . . . . X X X , ... , X / y E | + + | + | + | =
2 2 1 1 0 1
(b) la varianza de y es constante y no depende de los valores de las X:
| |
2
1
o =
n
X , ... , X / y Var
Dr. Pedro Vergara V.
(c) las variables X
i
son independientes entre s;
(d) la variable respuesta se distribuye normal.
Clculo de los estimadores
La distribucin de la variable aleatoria y es, por hiptesis, normal,
por lo que el mtodo de mxima verosimilitud equivale a mnimos
cuadrados. La funcin a minimizar es:
| | | = =
2
1 1 0
2
) X . . . . X y ( e Q
ki k i i i
derivando respecto a |
0
, los estimadores deben verificar:
y llamando a los residuos del modelo, la ecuacin
anterior es:
= | | | 0
1 1 0
) X
. . . . X
y (
ki k i i
i i i
y
y e =
= 0
i
e
derivando respecto a |
j
, se obtiene:
= = k ,..., j X e
ji i
1 0
k
k k k k
k k
k k
X
... X X
yX
.
.
X X
... X
yX
X
... X
n y
2
1 1 0
1
1
2
1 1 0 1
1 1 0
| + + | + | =
| + + | + | =
| + + | + | =
y se obtiene el sistema de ecuaciones
Dr. Pedro Vergara V.
matricialmente:
|
|
|
|
|
|
.
|
\
|
|
|
|
|
|
|
|
|
|
.
|
\
|
|
|
|
|
|
|
.
|
\
|
=
|
|
|
|
|
|
|
|
|
.
|
\
|
|
|
|
|
|
|
.
|
\
|
k
kn n
k
k
kn k
n
n
kn k
n
x x
x x
x x
x x
x x
y
y
x x
x x
|
|
.
..
.
... 1
.
.
.
.
.
.
.
.
... 1
... 1
...
.
.
.
.
.
.
...
1 ... 1
.
.
.
.
.
...
.
.
.
.
.
.
...
1 ... 1
0
1
2 12
1 11
1
1 11
1
1
1 11
|
|
|
|
|
|
|
.
|
\
|
|
|
|
= = |
k
T T
.
.
.
Y X ) X X (
1
0
1
Dr. Pedro Vergara V.
Se desea estimar la contaminacin (y) de un terreno, dependiendo
de las variables : ndice de radiacin solar, X
1
, cantidad de agua
lluvia cada en el mes, X
2
, y la porosidad de la tierra, X
3
.
Y X1 X2 X3
31,1 0,43 3,82 0,28
35,6 0,47 5,13 0,32
31,4 0,44 3,98 0,29
37,8 0,48 6,25 0,3
40,2 0,5 7,12 0,25
42,5 0,49 8,52 0,15
47,2 0,68 9,01 0,1
43,6 0,5 8,61 0,16
46,5 0,65 8,71 0,19
43,8 0,51 8,72 0,18
43,7 0,49 8,63 0,17
Dr. Pedro Vergara V.
Model fitting results for: REGREM1.SL
s s
=
caso otro en 0
1 x 0 si 1
) x ( f
12
1
) x ( V ,
2
1
) x ( E = =
Como consecuencia de las propiedades de uniformidad e independencia se tiene:
1. Si el intervalo (0, 1) es dividido en n clases, o subintervalos de longitudes
iguales, el nmero esperado de observaciones en cada intervalo es N/n,
donde N es el nmero total de observaciones.
2. La probabilidad de observar un valor en un intervalo en particular es
independiente de los valores previamente observados.
>
s s
<
=
1 x si 1
1 x 0 si x
0 x si 0
) x ( F
Generacin de nmeros pseudos aleatorios
La palabra pseudos se refiere a que los nmeros generados por
los mtodos a estudiar no son completamente aleatorios puesto
que se conoce el modo de generarlos, y esta secuencia puede ser
reproducida cuantas veces sea necesaria.
Realizada esta observacin, el objetivo de cualquier generador de
nmeros aleatorios es producir una secuencia de nmeros entre
cero y uno que tenga las propiedades ideales de uniformidad e
independencia.
A esto se agrega la necesidad de contar con una longitud de ciclo
suficientemente grande.
La longitud de ciclo, o perodo, representa la longitud de la
secuencia de nmeros aleatorios que el generador siempre
repite.
1) Mtodo de congruencia lineal: El mtodo de congruencia
lineal es ampliamente utilizado. Este mtodo produce una
secuencia de nmeros enteros, X
1
, X
2
, ... Entre cero y m-1 de
acuerdo a la siguiente relacin recursiva:
El valor inicial X
0
se llama semilla, a es la constante
multiplicativa, c es el incremento, y m es el mdulo.
Si c 0, se tiene el mtodo de congruencia mixta.
Cuando c = 0, se tiene el mtodo de congruencia multiplicativa.
La seleccin de los valores a, c, m, y X
0
afecta fuertemente a las
propiedades estadsticas y la longitud de ciclo del generador.
i 1 i
X (ax c)mod m
+
= +
Como ejemplo del mtodo de congruencia lineal se generar una secuencia para
a = 17, c = 43, m = 100 y X
0
= 27.
En este caso, el entero generado estar entre 0 y 99 debido al valor del mdulo.
Ntese tambin, que si se necesita generar una secuencia de nmeros
aleatorios entre 0 y 1, esta puede ser generada por:
Con esto, las secuencias generadas son:
i 0 1 2 3
X 27 2 77 52
R - 0,02 0,77 0,52
Como puede deducirse de este ejemplo, debido a que X
i
es un entero del
conjunto {0, 1, 2, ..., (m-1)}, los nmeros aleatorios R
i
generados con este
mtodo slo pueden asumir valores del conjunto finito
I = {0, 1/m, 2/m, ..., (m-1)/m}.
i
i
X
R
m
=
Esto significa que se tiene una distribucin discreta en lugar de una continua. sta
ser una buena aproximacin cuando el mdulo sea grande. Cuando esto ocurra,
no existirn grandes huecos (gaps) entre los nmeros generados, y se tendr una
mxima densidad.
Para obtener la mxima densidad y evitar los ciclos (recurrencia de la misma
secuencia de nmeros ya generados) el generador debera tener el perodo ms
grande posible.
El mximo perodo puede lograrse eligiendo apropiadamente los valores de los
parmetros del generador, por ejemplo (Banks et al., 1996):
Para m = 2
b
y c0, el mximo perodo es P = m, y puede lograrse con un valor de c
que sea un nmero primo relativo a m (esto es, que el mximo factor comn entre
ambos sea 1), y a = 1+4k. k y b son enteros.
Para m = 2b y c = 0, el mximo perodo es P = m/4, y puede lograrse con un valor
impar para la semilla X
0
, y a = 3+8k, o a = 5+8k. k y b son enteros.
Para m nmero primo y c = 0, el mximo perodo es P =m-1, y puede lograrse con un
valor de a tal que el menor entero k que hace que ak-1sea divisible por m es k = m-1
La Tabla muestra la determinacin del perodo de un generador
congruencial multiplicativo para a = 13, m = 2
6
= 64, X
0
= 1, 2, 3, 4.
i X
i
X
i
X
i
X
i
0 1 2 3 4
1 13 26 39 52
2 41 18 59 36
3 21 42 63 20
4 17 34 51 4
5 29 58 23
6 57 50 43
7 37 10 47
8 33 2 35
9 45 7
10 9 27
11 53 31
12 49 19
13 61 55
14 25 11
15 5 15
16 1 3
Se puede ver que el mximo perodo, 16, se alcanza para las semillas
impares, y ste es igual al mximo terico P = m/4 ya que a = 5+8k
con k = 1.
Cuando la semilla es 1, la secuencia generada asume valores del
conjunto {1, 5, 9, 13, ..., 53, 57, 61}.
Los huecos entre los nmeros aleatorios R
i
son grandes (5/64-1/64 =
0.0625, densidad insuficiente), el perodo es demasiado corto; por
lo tanto, no se recomienda la utilizacin de este generador.
Un generador bastante utilizado en la prctica tiene los siguientes
parmetros a = 7
5
= 16807, m = 2
31
-1 =2147483647 (un nmero
primo) y c = 0.
Estos valores aseguran un perodo P = m-1. Para una semilla
igual a 123457, los valores generados son:
i 0 1 2 3
X 123457 2074941799 559872160 1645535613
R 0,9662 0,2607 0,7662
Simulacin de nmeros aleatorios con ARENA
Iniciar ARENA
Tools
Input analyzer
Nuevo archivo
File
Data File
Generate new
Seleccionar distribucin y parmetros. OK
Se obtiene histograma.
Para ver los datos: Opcin Windows
Input data
Generacin de nmeros aleatorias con Excel
=ALEATORIO() genera un nmero aleatorio uniforme (0,1)
=ALEATORIO()*(100-75)+75 genera un aleatorio uniforme (75,100)
=ENTERO(ALEATORIO()*(20-10)+10 ) genera un aleatorio entero
uniforme (10,20)
En planilla Excel
Seleccionar datos
Anlisis de datos
Generacin de nmeros aleatorios
(se puede elegir cuantas variables se quieren generar, cantidad
de valores a generar, la distribucin (uniforme, normal,
bernoulli, binomial, poisson, discreta)
Generadores combinados
Cuando la aplicacin requiere de un perodo mayor al que se
puede alcanzar con un generador simple, se recurre a los
generadores combinados de congruencia lineal.
Para generar la secuencia de X
i
y R
i
requerida, este generador
necesita las salidas X
i,j
, j = 1..k, de k diferentes generadores de
congruencia multiplicativa cuyos parmetros tienen los valores
apropiados para asegurar un perodo m
j-1
.
El generador j produce la salida X
i,j
entera uniformemente distribuida
de 1 a m
j-1
. La combinacin se calcula mediante las siguientes
frmulas:
k
j 1
i i,j i
j 1
i
i
i
i 1
i
i
i
X ( 1) X mod(m 1)
X
X 0
R
R
m 1
X 0
m
=
+
| |
=
|
\ .
>
= =
0 0 0
P(X x ) P(R F(x )) F(x ) s = s =
Puesto que F(x
0
) pertenece al intervalo [0,1], la segunda igualdad
plantea que R es un nmero uniformemente distribuido en dicho
intervalo, y como F(x) es la funcin de probabilidad acumulada de
X, se concluye que esta variable tendr la distribucin deseada.
Distribucin exponencial
Utilizando el mtodo de la transformada inversa a continuacin se
desarrolla un generador de variables aleatorias con distribucin
exponencial. La funcin de densidad de probabilidad es:
su funcin de probabilidad acumulada:
0 0
( )
0
> . >
=
x
e si x
f x
en otro caso
1 0
( )
0 0
>
=
<
x
e si x
F x
si x
1
ln( ) = X R
R X X Lambda=1,25
0,59110451 0,71543654 0,42060996
0,4380435 0,46106466 0,66034966
0,62464297 0,78390209 0,37646004
0,43365688 0,45484414 0,66840132
0,96405124 2,66052846 0,02928867
0,02458119 0,01991068 2,96461911
0,36060334 0,35778422 0,81598136
0,93921887 2,24038078 0,05016539
0,98857798 3,57776991 0,0091902
0,56727619 0,67012449 0,45352719
0,46536478 0,50093647 0,61194697
0,15034968 0,13034432 1,51583321
0,95446638 2,4714434 0,03728229
0,55702591 0,6513952 0,46811482
0,58697314 0,70739412 0,42622097
0,25888422 0,23967874 1,08109947
0,59664542 0,7263514 0,41314583
0,01554062 0,01253011 3,33143861
0,53903864 0,61955285 0,49437441
0,00338389 0,0027117 4,55098415
0,20628634 0,18482601 1,26279207
0,56203945 0,66050114 0,4609466
0,42988517 0,44953398 0,67538972
0,38496843 0,38886534 0,76367517
0,97844583 3,06974873 0,01743188
0,56107296 0,65873767 0,46232346
0,80615288 1,31254836 0,17238551
0,92203962 2,04124364 0,06493367
0,56423119 0,66451474 0,45783296
0,5680745 0,67160173 0,45240217
1
ln(1 ) = X R
1
ln( ) = X R
Distribucin uniforme
Para generar una variable X con distribucin uniforme en el
intervalo [a, b], la funcin de densidad de probabilidad es:
s s
=
caso otro en 0
b x a si
a b
1
) x ( f
>
s s
<
=
b x si 1
b x a si
a b
a x
a x si 0
) x ( F
R ) a b ( a x R
a b
a x
) x ( F + = =
=
X
38,6729844
28,4201077
47,4092859
48,0310293
30,7926068
21,279972
36,3700607
38,4353661
42,149538
45,8420384
25,357894
20,0202726
27,6878115
29,5517251
25,9290588
39,8169465
29,0013061
47,1359989
25,4047049
42,0880286
36,9083132
45,3504397
41,6561099
20,2509217
23,069311
23,4577998
44,8087374
44,0212941
20,6080279
45,007181
=aleatorio()*(50-20)+20
X a (b a) R obien X R (b a) a = + = +
Distribucin de Weibull
Esta distribucin se utiliza para modelar el tiempo entre fallas de
maquinarias o componentes electrnicos.
Cuando el parmetro de localizacin es nulo ( = 0), la funcin de
densidad de probabilidad es:
El mtodo de la transformada inversa plantea que:
Simplificando se tiene que:
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso
o
| |
|
| o
\ .
o
( )
x
1
( )
F(x) 1 e R x ln(1 R)
o
|
o
= = = |
( )
1
x ln(R)
o
= |
Distribucin triangular
Dada una variable aleatoria tiene distribucin triangular con
funcin de probabilidad dada por:
x 0 x 1
f(x) 2 x 1 x 2
0 en otro caso
s s
= < s
< s
< s
>
s s
< s
s s
= s s
2(x 5)
x 5
5 x 10
5 x 10
(10 5)(15 5)
25
2(15 x) 15 x
f(x) 10 x 15 10 x 15
(15 10)(15 5) 25
0 en otro caso
0 en otro caso
s s
s s
= s s = s s
= + =
= + =
x 5
5 x 10
25
15 x
f(x) 10 x 15
25
0 en otro caso
s s
= s s
x
2
t
5
x
2
10
t 5 (x 5)
dt si 5 x 10
25 50
F(x) P(X x) f(t)dt
1 15 t (15 x)
dt 1 si 10 x 15
2 25 50
= s s
= s =
+ = s s
2
2
(x 5) 1
si 5 x 10 5 50R 0 R
50 2
F(x) X
1
(15 x)
15 50(1 R) R 1
1 si 10 x 15
2
50
s s + s s
= =
< s
s s
b a
a (b a)(c a)R 0 R
c a
X
b a
c (c a)(c b)(1 R) R 1
c a
+ s s
< s
Distribuciones discretas
Las distribuciones discretas se pueden generar utilizando la
transformada inversa de la misma manera que se utiliz para las
distribuciones empricas, slo que esta vez no es necesario la
interpolacin.
Por ejemplo, si se desean generar los nmeros 0, 1 y 2 con las
probabilidades 0.50, 0.30 y 0.20 respectivamente, se construye la
siguiente tabla donde ya se calcul la probabilidad acumulada:
Con esta tabla, el valor de X se calcula de la siguiente forma:
I Entrada r
i
Salida x
i
1 0,50 0,00
2 8,00 1,00
3 1,00 2,00
Con la tabla anterior, el valor de X se calcula de la siguiente forma:
0 R 0,5
X 1 0,5 x 0,8
2 0,8 x 1,0
s
= s s
s s
o
=
o t
Dado que no es posible obtener analticamente la funcin inversa
de la probabilidad acumulada, se recurre a mtodos alternativos.
Uno de los mtodos ms empleados considera dos variables con
distribucin estndar normal Z
1
y Z
2
(media nula y varianza igual a
uno), y las expresa en coordenadas polares como sigue:
1
2
Z Bcos( )
Z Bsin( )
= u
= u
Se sabe que B
2
= Z
1
2
+ Z
2
2
tiene una distribucin chi-cuadrado con 2
grados de libertad, la cual es equivalente a una distribucin
exponencial con media 2. Entonces, el radio B puede ser generado
con:
Debido a la simetra de la distribucin normal, se supone que est
uniformemente distribuido en el intervalo [0, 2]. Entonces, el ngulo
se genera con:
Finalmente, los valores Z
1
y Z
2
con distribucin normal estndar se
obtienen generando B y con las ecuaciones anteriores
respectivamente.
( )
1
2
1
B 2ln(R ) =
2
2 R u = t
El valor de X con una distribucin normal con media y varianza
2
se calcula con:
X Z = u+ o
Cuando, como en este caso, no es posible obtener analticamente la
funcin inversa de la probabilidad acumulada, entonces se puede
aproximar esta funcin ya sea numricamente o con expresiones
simplificadas.
Por ejemplo, se puede utilizar el siguiente generador de Schmeiser
que da una distribucin aproximada a la normal estndar:
Otro generador de distribucin normal utiliza el teorema del lmite
central que plantea: La distribucin del promedio de n variables
aleatorias independientes idnticamente distribuidas con media y
varianza
2
se aproxima a una distribucin normal con media y
varianza
2
/n. El generador est dado por:
0,135 0,135
R (1 R)
Z
0,1975
=
12
i
i 1
X R 6
=
| |
= u + o
|
\ .
= u+o X Z
Este generador utiliza la sumatoria de una serie de nmeros
aleatorios para obtener la distribucin deseada.
En la seccin siguiente se estudian otros generadores que utilizan
este mismo principio.
Mtodo de la convolucin
La distribucin de probabilidad de la suma de dos o ms variables
aleatorias independientes se denomina convolucin de las
distribuciones correspondientes a las variables sumadas.
El mtodo de la convolucin suma dos o ms variables aleatorias
para obtener una nueva variable con la distribucin deseada.
El centro del estudio ya no es la funcin de probabilidad acumulada
de la distribucin deseada, sino su relacin con otras distribuciones
ms fcilmente generables.
Distribucin de Erlang
Una variable aleatoria X con distribucin Erlang con parmetros (K, )
puede ser modelada con la suma de K variables aleatorias
independientes X
i
con distribucin exponencial y media 1/(K ); esto
es:
Utilizando el generador de distribucin exponencial presentado
anteriormente y operando, se obtiene el generador con la istribucin
deseada:
Como ejemplo, suponga que a un depsito llegan camiones cuyos
tiempos entre arribos siguen una distribucin exponencial con media
0.1 h. A la entrada son desviados alternativamente hacia el sur y hacia
el norte. Se desea modelar el arribo de camiones al sector sur.
K
i
i 1
X X
=
=
K K K
i i
i 1 i 1 i 1
1 1
X ln R ln R
K K
= = =
| | | |
| |
= =
| | |
u u
\ .
\ . \ .
I I
Los tiempos de llegada entre los camiones que llegan al sector sur
sern iguales a la suma de dos tiempos de arribos sucesivos al
depsito; es decir, seguirn una distribucin Erlang con K=2 y
1/=0,2 h.
Tcnica de aceptacin y rechazo
En este mtodo se generan valores aleatorios que son sometidos a
una prueba para verificar si cumplen o no con la distribucin
deseada.
El resultado de esta prueba determina si el nuevo valor es aceptado
o rechazado. Un generador eficiente debe mantener el nmero de
rechazos lo ms bajo posible.
Distribucin de Poisson
Una variable N con distribucin Poisson puede ser interpretada
como el nmero de arribos por unidad de tiempo a velocidad en
un proceso Poisson.
En este proceso, los tiempos entre arribos A
1
, A
2
, ... estn
exponencialmente distribuidos con una velocidad (es el nmero
medio de arribos por unidad de tiempo). Por lo tanto, se puede
construir un generador que determine n tal que:
A
1
+A
2
+...+A
n
A
1
+A
2
+...+A
n+1
Utilizando el generador exponencial anteriormente presentado, se
tiene:
n n 1
i i
i 1 i 1
1 1
ln(R ) 1 ln(R )
+
= =
| | | |
s <
| |
\ . \ .
Operando
n n 1
i i
i 1 i 1
n n 1
i i
i 1 i 1
n n 1
i i
i 1 i 1
ln(R ) ln(R )
ln( R ) ln( R )
R e R
+
= =
+
= =
+
= =
> >
> >
> >
I I
I I
Entonces, el procedimiento para generar N con distribucin de
Poisson es:
1. Hacer n 0, P 1.
2. Generar un nmero aleatorio R
n+1
y hacer P P R
n+1
.
3. Si P < e
-a
, aceptar el nuevo valor N n, sino rechazar n, hacer
n n + 1, y retornar al paso 2.
Note que en promedio ser necesario generar +1 nmeros con
distribucin exponencial por cada valor de N. Cuando 15 esta
tcnica se vuelve ineficiente, y conviene utilizar una tcnica
basada en la distribucin normal:
N
Z
=
= s = > = + = >
x
X
x
2
0
f (x) e (x)
1 1
E(X) x e dx ; Var(X)
= u
= = =
=
> = u =
Lo que ocurre despus de t
0
es independiente de lo que
ocurri antes de t
0
Relacin entre el proceso de Poisson y la
distribucin Exponencial
Ejemplo: Llegadas Aleatorias, el proceso de llegadas es
Poisson.
Los tiempos entre llegadas son independientes y
distribuidos exponencialmente con parmetro
Llegadas
Duracin media de la llamada
N N
i i
i
i i h k k
i i i
i k 1 k 1
L
i j
i j 0
N 1 1
Sea a E(T ) t t
T N T
1
a a jt
T
= =
=
= = =
= =
Tiempo
medio de
ocupaci
n de una
lnea
Promedio de
lneas ocupadas
simultneamente
Nmero de
ocupacione
s
simultnea
s
Tiempo total en el que
exactamente j lneas estn
ocupadas
Cadena de Markov: Proceso de Markov en tiempo discreto con
un conjunto numerable de estados a
i.
Especificado en trminos
de:
p
i
(n)=P(X
n
=a
i
) Probabilidad de estado
ij
(n
1
,n
2
)=P(X
n2
=a
j
/ X
n1
=a
i
) Probabilidad de transicin
ij
(a
i
a
j
) es la probabilidad condicional para que el proceso
que se encuentra en el estado a
i
se mueva al estado a
j
en
un slo paso
ij
(n
1
,n
2
) (probabilidad de transicin de un slo
paso).
Si todas estas probabilidades son conocidas para todos los
pares de estados se ordenan en una matriz cuadrada que
recibe el nombre de matriz de transicin. = [
ij
]
Ejemplo:
Dada una persona sentada en el asiento de en
medio de una fila de cinco asientos [marcados
con A,B,C,D,E] de izquierda a derecha. Esta
persona se mueve por seis veces de una silla a
la otra, estando sus movimientos controlados por
una moneda que se tira al aire.
a) Si no est al final de una fila de asientos se
mueve hacia la derecha si sale CARA y hacia la
izquierda si sale SELLO.
b) Si est al final se quedar donde est salga lo
que salga.
Espacio de Estados: [ A, B, C, D, E ]
P[A A] = P[E E] = 1 ya
que se queda donde est.
AA
= P(X=A/X=A) = 1 =
EE
= P(X=E/X=E)
P[B A] = 1/2 puesto que la
probabilidad de que salga
cara es 1/2.
AB
= P(X =B / X=A) = 1/2
BA
= P(X =A / X=B) = 1/2
DE
= P(X =E / X=D) = 1/2
DC
= P(X =C / X=D) = 1/2
P[C C] = 0 ya que aqu no se
puede quedar.
BB
=
CC
=
DD
= 0
Se tiene que
A B C D E
A 1 0 0 0 0
B 0 0 0
C 0 0 0
D 0 0 0
E 0 0 0 0 1
5
ij
j 1
p 1 j
=
=
Las matrices que tienen elementos no negativos y la suma de los elementos de sus
filas valen la unidad se llaman matrices estocsticas
Vector probabilidad inicial
Existe un vector probabilidad inicial tal que:
a = (a
1
, a
2
,....a
n
) en la que los elementos a
i
son
las probabilidades que el estado inicial del proceso
sea S
i
.
En este ejemplo, el vector de probabilidad inicial es:
a = (0, 0, 1, 0, 0)
puesto que el proceso comienza en la silla C.
Si se considera una secuencia S
i
, S
j
, S
k
de un
experimento cuyo vector y matriz inicial son conocidos,
la secuencia de probabilidad ser:
Se puede ampliar esta regla para cubrir secuencias
de cualquier nmero de pasos. A los procesos a los
cuales se puede aplicar esta regla se dicen que tienen
la propiedad de Markov.
i j k i i j j k i
P(S,S,S ) = P(S ) P(S S ) P(S S ) P(S )
Para tales procesos la probabilidad de la siguiente
direccin depende del estado presente del proceso y no
depende del estado precedente.
Ejemplo:
En el ejemplo calcular la probabilidad de la secuencia.
1 1 1 1 1
P[C,D,C,B,A,A,A] = P[C] P[C D] P[D C] P[C B] P[B A] P[A A] P[A A] =1 1 1 =
2 2 2 2 16
Cadena de Markov finita y estacionara.
Una cadena de Markov estacionara y finita
queda completamente definida cuando se conoce:
a) Espacio de estados finito.
b) Una matriz [Pij] de probabilidades de transicin de
un slo paso estacionara.
c) El vector de probabilidad inicial.
Ejemplo: Cadena de 2 estados
Aplicacin: En un modelo para voz en paquetes.
Estado 0: inactivo (silencio). La probabilidad de que la prxima TS
sea activa es a, y la probabilidad de que permanezca en el estado
inactivo es 1-a.
Estado 1: activo (habla). La probabilidad de que la prxima TS sea
inactiva es b, y la probabilidad de que permanezca en el estado
activo es 1-b. En el estado activo, una TS contiene una celda con
probabilidad p, y se tiene un proceso de Bernoulli.
El ascensor de un edificio con tres pisos realiza viajes de uno a
otro piso. El piso en el que finaliza el viaje n-simo del
ascensor sigue una cadena de Markov.
Se sabe que la mitad de los viajes que parten del primer piso
se dirigen a cada uno de los otros dos, mientras que si un viaje
comienza en el segundo piso, slo el 25% de las veces finaliza
en el tercero. Por ltimo, si un trayecto comienza en el tercer
piso, siempre finaliza en el primero. Se pide:
a) Calcular la matriz de probabilidades de transicin de la
cadena
b) Dibujar el grafo asociado
c) Cul es la probabilidad que, a largo plazo, el ascensor se
encuentre en cada uno de los tres pisos
SOLUCIN: Los estados de la cadena se denotan por {1, 2, 3}
haciendo corresponder el 1 al primer piso, 2 y 3 a los otros.
Las probabilidades de transicin son:
p
11
= P(R
n
=0 / R
n-1
=0)
esto es la probabilidad de que el ascensor se encuentre en el
primer piso si en la etapa anterior estaba en el primero, es 0,
se supone que de etapa a etapa el ascensor se mueve.
p
12
= P(R
n
=2 / R
n-1
=1)
esto es la probabilidad que el ascensor se encuentre en el
segundo piso si en la etapa anterior estaba en el primero es .
As sucesivamente se obtienen las distintas probabilidades de
transicin cuya matriz es:
11 12 13
21 22 23
31 32 33
p p p 0 1/ 2 1/ 2
a) P= p p p 3/ 4 0 1/ 4
p p p 1 0 0
| | | |
| |
=
| |
| |
\ . \ .
c) q P q, siendo q (x,y,z) los valores de las probabilidades pedidas, y como x y z 1 = = + + =
0 1/ 2 1/ 2
(x, y,z) 3/ 4 0 1/ 4 (x, y,z) aadiendo x y z 1se tiene:
1 0 0
| |
|
= + + =
|
|
\ .
4x 3y 4z 0
x 2y 0
x 8/17 ; y 4/17 ; z 5/17
2x y 4z 0
x y z 1
=
= = =
+ =
+ + =
+ =
= = =
+ =
+ + =
= = =
+ =
+ =
= = =
+ =
+ + =
+ =
= = =
+ + =
+ =
= = =
+ =
+ + =
s =
t
P(tiempodeservicio t) 1 e
Sistemas de colas:
Las llegadas Distribucin exponencial
Media Tiempo
0
P(t)
Sistemas de colas:
Las llegadas Distribucin exponencial
La distribucin exponencial supone
una mayor probabilidad para tiempos
entre llegadas pequeos
En general, se considera que las
llegadas son aleatorias
La ltima llegada no influye en la
probabilidad de llegada de la siguiente
Sistemas de colas:
Las llegadas - Distribucin de Poisson
Es una distribucin discreta
empleada con mucha frecuencia
para describir el patrn de las
llegadas a un sistema de colas
Para tasas medias de llegadas
pequeas es asimtrica y se hace
ms simtrica y se aproxima a la
binomial para tasas de llegadas altas
Sistemas de colas:
Las llegadas - Distribucin de Poisson
Su forma algebraica es:
Donde:
P(k) : probabilidad de k llegadas por
unidad de tiempo
: tasa media de llegadas
k
e
P(k)
k!
=
Sistemas de colas:
Las llegadas - Distribucin de Poisson
Llegadas por unidad de tiempo 0
P
Sistemas de colas: La cola
El nmero de clientes en la cola es el
nmero de clientes que esperan el
servicio
El nmero de clientes en el sistema
es el nmero de clientes que
esperan en la cola ms el nmero de
clientes que actualmente reciben el
servicio
Sistemas de colas: La cola
La capacidad de la cola es el nmero
mximo de clientes que pueden
estar en la cola
Generalmente se supone que la cola
es infinita
Aunque tambin la cola puede ser
finita
Sistemas de colas: La cola
La disciplina de la cola se refiere al
orden en que se seleccionan los
miembros de la cola para comenzar
el servicio
La ms comn es PEPS: primero en
llegar, primero en servicio (FIFO)
Puede darse: seleccin aleatoria,
prioridades, UEPS, entre otras.
Sistemas de colas: El servicio
El servicio puede ser brindado por un
servidor o por servidores mltiples
El tiempo de servicio vara de cliente a
cliente
El tiempo esperado de servicio
depende de la tasa media de servicio
(u)
Sistemas de colas: El servicio
El tiempo esperado de servicio
equivale a 1/u
Por ejemplo, si la tasa media de
servicio es de 25 clientes por hora
Entonces el tiempo esperado de
servicio es 1/u = 1/25 = 0.04 horas,
o 2.4 minutos
Sistemas de colas: El servicio
Es necesario seleccionar una
distribucin de probabilidad para los
tiempos de servicio
Hay dos distribuciones que
representaran puntos extremos:
La distribucin exponencial
(o=media)
Tiempos de servicio constantes
(o=0)
Sistemas de colas: El servicio
Una distribucin intermedia es la
distribucin Erlang
Esta distribucin posee un parmetro
de forma k que determina su
desviacin estndar:
1
media
k
o =
Sistemas de colas: El servicio
Si k = 1, entonces la distribucin
Erlang es igual a la exponencial
Si k = , entonces la distribucin
Erlang es igual a la distribucin
degenerada con tiempos constantes
La forma de la distribucin Erlang
vara de acuerdo con k
Sistemas de colas: El servicio
Media Tiempo
0
P(t)
k =
k = 1
k = 2
k = 8
Sistemas de colas:
Distribucin Erlang
Distribucin Desviacin estndar
Constante 0
Erlang, k = 1 media
Erlang, k = 2
Erlang, k = 4 1/2 media
Erlang, k = 8
Erlang, k = 16 1/4 media
Erlang, cualquier k
1/ 2media
1/ 8media
1/ k media
Sistemas de colas: Etiquetas para distintos modelos
Notacin de Kendall: A/B/c
A : Distribucin de tiempos entre
llegadas
B : Distribucin de tiempos de servicio
M : distribucin exponencial
D : distribucin degenerada
E
k
: distribucin Erlang
c : Nmero de servidores
Estado del sistema de colas
En principio el sistema est en un
estado inicial
Se supone que el sistema de colas
llega a una condicin de estado
estable (nivel normal de operacin)
Existen otras condiciones anormales
(horas punta, etc.)
Lo que interesa es el estado estable
Ejemplo: Proceso de Nacimiento y Muerte
General
Ejemplo: Proceso de Poisson Modulado por Markov (MMPP)
Concepto bsico:
Los clientes llegan para ser atendidos. Si todos los servidores estn ocupados, el
cliente espera en la cola y es atendido despus.
Parmetros: tasa de arribos, velocidad de atencin, nmero de servidores,
capacidad de la cola...
Medidas: tiempo de espera, utilizacin de los servidores, tamao de la cola,
probabilidad de rechazo...
Flujo Entrante
(Clientes que
llegan)
Cola
(Lnea de
Espera)
Servidor
(Cabeza de
lnea)
Flujo saliente
(Clientes
atendidos)
Desempeo del sistema de colas
Para evaluar el desempeo se
busca conocer dos factores
principales:
1. El nmero de clientes que
esperan en la cola
2. El tiempo que los clientes esperan
en la cola y en el sistema
Medidas del desempeo del sistema de colas
1. Nmero esperado de clientes en la cola L
q
2. Nmero esperado de clientes en el sistema L
s
3. Tiempo esperado de espera en la cola W
q
4. Tiempo esperado de espera en el sistema W
s
Medidas del desempeo del sistema de colas
Frmulas generales
= +
u
=
=
= + = + p
u
s q
s s
q q
s q q
1
W W
L W
L W
L L L
Tiempo esperado de espera en el sistema
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
Nmero esperado de clientes en el sistema
Medidas del desempeo del sistema de colas: ejemplo
Suponga una estacin de gasolina a la cual llegan en
promedio 45 clientes por hora
Se tiene capacidad para atender en promedio a 60
clientes por hora
Se sabe que los clientes esperan en promedio 3 minutos
en la cola
La tasa media de llegadas es 45 clientes por hora o
45/60 = 0.75 clientes por minuto
La tasa media de servicio u es 60 clientes por hora o
60/60 = 1 cliente por minuto
Medidas del desempeo del sistema de colas:
ejemplo
q
s q
s s
q q
W 3min
1 1
W W 3 4min
1
L W 0.75 4 3clientes
L W 0.75 3 2.25clientes
=
= + = + =
u
= = =
= = =
Tiempo esperado de espera en la cola
Tiempo esperado de espera en el sistema
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
Factor de utilizacin del sistema
Dada la tasa media de llegadas y la tasa media de
servicio u, se define el factor de utilizacin del
sistema p.
Generalmente se requiere que p < 1
Su frmula, con un servidor y con S servidores,
respectivamente, es:
s
p = p =
u u
Factor de utilizacin del sistema - ejemplo
Con base en los datos del ejemplo
anterior, = 0.75, u = 1
El factor de utilizacin del sistema si se
mantuviera un servidor es
p = /u = 0.75/1 = 0.75 = 75%
Con dos servidores (S = 2):
p = /Su = 0.75/(21) = 0.75/2 = 37,5%
Medidas del desempeo del sistema de colas: ejercicio
Suponga un restaurant de comidas
rpidas al cual llegan en promedio
100 clientes por hora
Se tiene capacidad para atender en
promedio a 150 clientes por hora
Se sabe que los clientes esperan en
promedio 2 minutos en la cola
Calcule las medidas de desempeo
del sistema
Medidas del desempeo del sistema de colas:
=
= + = + =
u
= = =
= = = =
q
s q
s s
q q
W 2min
1 1
W W 2 2.4min
5
2
5
L W 2.4 4clientes
3
5
L W 2 2 3.3clientes
3
Tiempo esperado de espera en la cola
Tiempo esperado de espera en el sistema
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
100 / 5/ 3 /
150 / 5/ 2 /
2 / 3
c h c m
c h c m
u
m
=
=
=
Modelos de una cola y un servidor
M/M/1: Un servidor con llegadas de Poisson y
tiempos de servicio exponenciales
M/G/1: Un servidor con tiempos entre llegadas
exponenciales y una distribucin general de
tiempos de servicio
M/D/1: Un servidor con tiempos entre llegadas
exponenciales y una distribucin degenerada de
tiempos de servicio
M/E
k
/1: Un servidor con tiempos entre llegadas
exponenciales y una distribucin Erlang de
tiempos de servicio
Modelo M/M/1
+
u p u p
= =
u u u
= =
u u u
= p p > = p
> = > = p
> p <
2
s q
s q
n n 1
n s
(1 )t (1 )t
s q
L L
( )
1
W W
( )
P (1 ) P(L n)
P(W t) e P(W t) e
t 0, 1
Modelo M/M/1: ejemplo
Una estacin de lavado de autos puede
atender un auto cada 5 minutos y la tasa
media de llegadas es de 9 autos por hora
Obtenga las medidas de desempeo de
acuerdo con el modelo M/M/1
Adems la probabilidad de tener 0 clientes
en el sistema, la probabilidad de tener una
cola de ms de 3 clientes y la probabilidad de
esperar ms de 30 min. en la cola y en el
sistema
Modelo M/M/1: ejemplo
+
= u = p = =
= = =
u
= = =
u u
= = = =
u
= = = =
u u
= p p = =
> = =
> =
s
2 2
q
s
q
0 0
0
3 1
s
s
9
9, 12, 0.75
12
9
L 3clientes
12 9
9
L 2.25clientes
( ) 12(12 9)
1 1
W 0.33hrs 20min
12 9
9
W 0.25hrs 15min
( ) 12(12 9)
P (1 ) (1 0.75)0.75 0.25
P(L 3) 0.75 0.316
P(W 30 / 60)
u p
u p
= =
> = p = =
12(1 0.75) 0.5
(1 )t 12(1 0.75) 0.5
(1 )t
q
e e 0.22
P(W 30 / 60) e 0.75e 0.167
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
Tiempo esperado de espera en el sistema
Tiempo esperado de espera en la cola
Modelo M/M/5: ejercicio
A un supermercado llegan en promedio 80
clientes por hora que son atendidos entre sus
5 cajas.
Cada caja puede atender en promedio a un
cliente cada 3 minutos
Obtenga las medidas de desempeo de
acuerdo con el modelo M/M/5
La probabilidad de tener 2 clientes en el
sistema, la probabilidad de tener una cola de
ms de 4 clientes y la probabilidad de esperar
ms de 10 minutos en la cola
Modelo M/G/1
2 2 2
s q q
q
s q q
0 w
L L L
2(1 )
L
1
W W W
P 1 P
1
o + p
= + p =
p
= + =
u
= p = p
p <
Modelo M/G/1: ejemplo
Una estacin de lavado de autos
puede atender un auto cada 5 min. y
la tasa media de llegadas es de 9
autos/hora, o = 2 min.
Obtenga las medidas de desempeo
de acuerdo con el modelo M/G/1
Adems la probabilidad de tener 0
clientes en el sistema y la
probabilidad de que un cliente tenga
que esperar por el servicio
Modelo M/G/1: ejemplo
s q
2 2 2
q
s q
q
q
0 w
L L 1.31 .75 2.06 clientes
L 1.31 clientes
2(1 )
1
W W 0.228 hrs 13.7 min
L
W 0.145 hrs 8.7 min
P 1 0.25 P 0.75
= + p = + =
o + p
= =
p
= + = =
u
= = =
= p = = p =
Modelo M/D/1
2
s s q
q
s q q
L W L
2(1 )
L
1
W W W
1
p
= =
p
= + =
u
p <
Modelo M/D/1: ejemplo
Una estacin de lavado de autos
puede atender un auto cada 5 min.
La tasa media de llegadas es de 9
autos/hora.
Obtenga las medidas de desempeo
de acuerdo con el modelo M/D/1
Modelo M/D/1: ejemplo
s s
2
q
s q
q
q
L W 1.875clientes
L 1.125clientes
2(1 )
1
W W 0.21hrs 12.5min
L
W 0.125hrs 7.5min
= =
p
= =
p
= + = =
u
= = =
Modelo M/E
k
/5: ejercicio
A un supermercado llegan en promedio 80
clientes por hora que son atendidos entre sus
5 cajas.
Cada caja puede atender en promedio a un
cliente cada 3 minutos. Suponga k= 4
Obtenga las medidas de desempeo de
acuerdo con el modelo M/E
k
/1
Modelos de un servidor: Ejercicio: complete el cuadro
ejemplo estacin de lavado de autos
Modelo
L
s
W
s
L
q
W
q
M/M/1
M/G/1
M/D/1
M/E
k
/1
Modelos de varios servidores
M/M/s: s servidores con llegadas de Poisson
y tiempos de servicio exponenciales
M/D/s: s servidores con tiempos entre
llegadas exponenciales y una distribucin
degenerada de tiempos de servicio
M/E
k
/s: s servidores con tiempos entre
llegadas exponenciales y una distribucin
Erlang de tiempos de servicio
M/M/s, una lnea de espera
0
s n
s 1
n 0
s
q
q 0 s q q
2
n
s q n 0
n
s
n 0 w 0
n s
1
P
s
s! s n!
L
L P L L W
(s 1)!(s )
1
W W P P ,si n k
n!
1 s
P P ,si n k P P
s!s s! s
=
| | p u p
+
|
u
\ .
p u
= = + =
u u
p
= + = s
u
| | p u
= > = p
|
u
\ .
= =
= < = <
k
k
0 k 1
0 k 1
k k k
k
0 0 k 2
2
0 0 1 0 2 0
k
2 k 2 K
k 0 0 0 0 0 k 2
k 0 k 3 k
P ,si k 2
P ,si k 2
2
2
con capacidad k P P
9
P ,si k 2 P ,si k 2
2 3 2 3
P P P P P P ...
2
9
como P 1 entonces P P P P 1 P 1
2 2 3 2 2 3
= =
p
p
s
s
= =
p p | |
> >
|
\ .
p
= = p =
p p p p | |
= + p + + = + p + +
|
\ .
K
3
k 1
k
2 2 2 2 K
0 0
k 0
k 1
2 2
0
1
1
9 9 3
P 1 1 1 P 1 1 1
2 2 3 3 9 2 2 3 9
1
3
3 3
9 3
P 1 1
2 2 3 3 2
=
+
=
+
=
| |
p | |
|
|
| |
p p p p p p p | |
\ .
|
+ p + + = + p + + = |
|
| | p
\ .
\ .
|
\ .
| |
p | |
|
|
p p p
\ .
|
+ p + +
|
p
|
\ .
0
k 1
2 2
1
1 4
P ;
5
3 3
9 3
1 1
2 2 3 3 2
+
=
= p =
| |
p | |
|
|
p p p
\ .
|
+ p + +
|
p
|
\ .
+
=
= <
K 1
K
k
k 0
1 a
a , a 1
1 a
k
0 k 1 2
k k 0 0 1 0 2 0
0
2 k
k 0 0 0 0 k 2
k 0 k 3
k k
2 2
0 0
k 3
P ,si k 2
2
para el problema se tiene P P P P P P P
2
9
P ,si k 2
2 3
como P 1 entonces P P P P 1
2 2 3
9 9
P 1 1 P 1
2 2 3 2 2 3
= =
=
p
s
p
= = = p =
p | |
>
|
\ .
p p
= + p + + =
p p p p | | | |
+ p + + = + p + +
| |
\ . \ .
2
k 0
2 2 2 2
0 0
2 2
0
0 0
1 1
3 9
9 1 9 3
P 1 1 1 P 1 1 1
2 2 3 9 2 2 3 3 9
1
3
27 9 3
P 1 1
2 6 2 2 2 2
1 4 55
P como P
27 9 3
5 12
1
6 2 2 2
=
| |
p p
= |
|
\ .
| |
|
| | p p p p p p
+ p + + = + p + + =
| |
p
p
\ . |
\ .
p p p
+ p + + =
p
= p = = =
p
u
+ p +
p
1 2
1 2 0
0.44715
3
4 4
5 5
P 0.44715 0.35772 ; P 0.44715 0.05589375
2 2
=
| | | |
| |
\ . \ .
= = = =
=
= <
k
k 0
1
a , a 1
1 a
k
0 k 1
k k
0
1 2
1 2
0
k 0 1 2 k k
k 0 k 3 k 3
P ,si k 2
2
P
9
P ,si k 2
2 3
4 4
5 5
P 0.44715 0.35772 ; P 0.44715 0.05589375
2 2
L k P 0 P 1 P 2 P k P 0.35772 0.05589375 k P
9
0.35772 0.05589375 k
2 3
= = =
p
s
=
p | |
>
|
\ .
| | | |
| |
\ . \ .
= = = =
= = + + + = + +
p
= + +
( )
k
0
k 3
k 2
k 0
2
2
P
9
0.35772 0.05589375 0.44715 k 0 2
2 3 3 3
9 4 4 4/15
0.35772 0.05589375 0.44715 9 0.44715 0.44715
2 15 15
1 4/15
9 60 6
0.35772 0.05589375 0.44715
2 121 5
=
| |
|
\ .
| |
p p p | | | |
= + + |
| |
|
\ . \ .
\ .
| |
= + +
|
\ .
= + +
16
0.44715 0.44715
25
0.58886304 cliente en el sistema
~
k
2
k 0
3
k , 1
3 3
1
3
=
p
p p | |
= <
|
\ . p | |
|
\ .
c)
d)
e) P(k > 2 en la cola) = P(k > 6 en el sistema)
= 1 P(k 6)
L 6508/ 6765 personas
W 0.02943152 horas 1.76589 minutos
20 personas/ hora
= = = ~
0
P 0.44715 44.72%de probabilidad que el sistema est vaco = ~
0 1 0 2 3
4 5 6
55 44 88 352
P P P P P
123 123 615 27675
P 0.01 P 0.0027 P 0.0016
P(k 6) 1 0.9753 2.47%
= = p = = =
= = =
> = ~
A una mesa de ayuda de dos ejecutivos, llaman clientes segn un proceso
de exponencial de tasa 20 personas por hora, se sabe adems que los
ejecutivos atienden los llamados segn un proceso de Poisson, con un
tiempo entre llamadas de 2 minutos.
a) Modele este problema como un problema de colas y calcule las
probabilidades conjuntas en estado estacionario que haya k clientes en el
sistema para capacidad limitada e ilimitada de atencin
b) Calcule el nmero medio de clientes en el sistema, L
s
c) Calcule el tiempo medio de estada en el sistema, W
s
d) Bajo este ltimo escenario cul es la probabilidad que el sistema se
encuentre vaco? cul es la probabilidad que un cliente no sea atendido?
e) cul es la probabilidad que hayan ms de dos clientes en la cola?
Nota:
K 1
K
k k
k 0 k 0
1 1 a
a , a 1 a , a 1
1 a 1 a
+
= =
= < = <
0
k
k
k 1
20 2
20 personas / hora , 30 personas / hora
30 3
2 / 3 1
b) L clientes
2 2 2 / 3 2
L 1/ 2 personas
c) W 0.025 horas 1.5 minutos
20 personas / hora
2 2 2 / 3
d) P 0.3333 33.33%
4 4
2
P con k
2
4 1
2
+
= u = p = =
p
= = =
p
= = = ~
p
= = = =
p p
| |
=
|
| |
\ .
p
| |
|
|
|
\ .
\ .
6
6 P 0.015% ~ =
0 1 2 3 4
2 3 4
0 0 0 0 0
0
e) P(k > 4) = 1 - P(k 4)
= 1- (P + P + P + P + P )
= 1- P + P + P + P + P
2 2 2 2
= 1- P 1 + +
2 2
s
| |
p p p p
| | | | | |
|
| | |
|
\ . \ . \ .
\ .
p p
| |
\ .
2 3 4
+ +
2 2
1 1 1 1 1
= 1- 1 + + + +
3 3 9 27 81
= 0.5021 50.21%
| |
p p
| | | |
|
| | |
|
\ . \ .
\ .
| |
|
\ .
~
Para que hayan ms de dos clientes en la cola k debe ser mayor que 4
1.- Debido a un reciente incremento en el negocio una
secretaria de una cierta empresa tiene que mecanografiar 20
cartas por da en promedio (asuma una distribucin de
Poisson). A ella le toma aproximadamente 20 minutos
mecanografiar cada carta (asuma una distribucin
exponencial). Suponiendo que la secretaria trabaja ocho
horas diarias.
= 20 / 8 = 2.5 cartas/hora
= (1/20 min)(60 min/ 1 hora) = 3 cartas/hora
La tasa de utilizacin de la secretaria estar definida por:
2.5
0.84
3
p = = =
u
K
0 0.834
1 0.694
2 0.578
3 0.482
4 0.401
5 0.334
El tiempo promedio de espera antes que la secretaria
mecanografe una carta se deducir de la siguiente manera:
el nmero promedio de cartas que estarn en la lnea de
espera:
Si se desea conocer la probabilidad que a la secretaria tenga
que mecanografiar ms de cinco cartas, se determinara de la
siguiente manera:
q
2.5
W 1.67 horas
( ) 3(3 2.5)
= = =
u u
2 2
q
2.5
L 4.17
( ) 3(3 2.5)
= = =
u u
k 1
k,
P
+
u
= p
2.- Un veterinario maneja una clnica de vacunacin antirrbica
para perros, en un colegio local. El veterinario puede vacunar
un perro cada tres minutos. Se estima que los perros llegarn
en forma independiente y aleatoriamente en el transcurso del
da, en un rango de un perro cada seis minutos, de acuerdo
con una distribucin de Poisson. Tambin, suponga que los
tiempos de vacunacin del veterinario estn distribuidos
exponencialmente. Determinar: La probabilidad que el
veterinario est de ocioso
= 1/6 = 0.167 perros/min
= 1/3 = 0.34 perros/min
La probabilidad que el veterinario est de ocioso est dado por:
0
1/ 6
0.5 P 1 0.5
1/ 3
p = = = = p =
u
La proporcin de tiempo en que el veterinario est ocupado.
El nmero total de perros que estn siendo vacunados y que
esperan a ser vacunados
El nmero promedio de perros que esperan a ser vacunados.
1/ 6
0.5
1/ 3
p = = =
u
1/ 6
L 1
1/ 3 1/ 6
= = =
u
2 2
q
(1/ 6)
L 0.5
( ) 1/ 3(1/ 3 1/ 6)
= = =
u u
3.- Las llamadas llegan al conmutador de una oficina a una tasa de dos por
minuto, el tiempo promedio para manejar cada una de estas es de 20
segundos. Actualmente slo hay un operador del conmutador. Las
distribuciones de Poisson y exponencial parecen ser relevantes en esta
situacin.
= 2 llamadas/minutos
= (1/20 seg)(60 seg) = 3 llamadas/minuto
La probabilidad que el operador este ocupado se definir por:
2
3
p = =
u
El tiempo promedio que debe de esperar una llamada antes de ser tomada
por l operador
El nmero de llamadas que esperan ser contestadas
q
2
W 0.6667
( ) 3(3 2)
= = =
u u
2 2
q
2
L 1.34
( ) 3(3 2)
= = =
u u
4.- Electronics Corporation retiene una brigada de servicio para
reparar descomposturas de mquinas que ocurren con
promedio de tres por da (aproximadamente de naturaleza de
Poisson). La brigada puede servir a un promedio de ocho
mquinas por da, con una distribucin de tiempo de reparacin
que se asemeja la distribucin de exponencial.
= 3 repar./da = 8 repar./da
La tasa de utilizacin de este sistema est dado por:
El tiempo promedio de descompostura para cada mquina que
est descompuesta es:
3
0.375
8
p = = =
u
1 1
W 0.2
8 3
= = =
u
K
0 0.375
1 0.140
2 0.052
3 0.019
4 0.007
5 0.002
Las mquinas que estn esperando a ser reparadas el cualquier
momento dado
La probabilidad de que haya una mquina en el sistema, dos,
tres o ms mquinas en el sistema.
2 2
q
3
L 0.225
( ) 8(8 3)
= = =
u u
k 1
k,
P
+
u
= p
Dado un sistema de colas con un servidor cuyos tiempos entre
llegadas siguen una distribucin exponencial con las siguientes
tasas:
y cuyos tiempos de servicio son exponenciales de tasa:
a) Represente el sistema como una cadena de Markov
b) Obtenga la probabilidad que en el sistema haya k clientes
cuando el sistema alcanza el estado estacionario
c) Obtenga el nmero medio de clientes en el sistema
d) Calcule la tasa global de llegada y el tiempo medio de
estada en el sistema.
Observacin :
k
k 0,1,2,3,....
k 1
= =
+
k
; k 0,1,2,3,.... u = u =
k
k 0
e
k!
p
=
p
=
0 0
1 0 0
2
k
2 k 0 k
2 1 0 0 k 0
3
3
3 2 0 0
k
k
k 0 0 0
k 0 k 0 k 0
k
0 k
P P
P P P
1
P P y P 1 1 1
P P P P
k!
2 2 2
1 1
P P P P
3 6 6
por tanto
1
P 1 P 1 P 1 P e 1
k! k!
1
luego P e y P e
k!
=
p
= = =
p p
=
= = p
u
= p = | |
`
= = = p
|
u u
\ .
| |
= = = p
|
u u
\ .
)
p
= p = = =
= = p
a)
b)
k k 1
k
k
k 0 k 1 k 1 k 1 0
1
L k P 0 k e e e
k! (k 1)! (k 1)!
e e
p p p
= = = =
p p
p p
= = + p = = p
= p = p
c)
5.- A una impresora le llegan trabajos para imprimir con una
tasa de 8 por minuto, siguiendo las llegadas un proceso de
Poisson. El tiempo de impresin es exponencial de media 5
segundos. Esta impresora almacena los trabajos que le llegan
en un buffer con capacidad para tres mensaje. Suponer que la
memoria de la impresora es suficiente como para almacenar en
ella todo el trabajo que est siendo impreso. Calcular:
a) La probabilidad que un mensaje llegue directamente a la
impresora sin tener que esperar cola.
b) La probabilidad que en este sistema de impresin haya
menos de tres trabajos esperando a ser impresos
c) Nmero medio de trabajos en el sistema de impresin
d) Tiempo medio de espera en el buffer de un trabajo hasta que
pasa a la impresora
e) Probabilidad que se pierda un mensaje que llega al sistema
para ser impresos
Sol. =8 t/min ; = 1/5seg = 1/(5 seg/t)60 seg/min = 12 t/min
L
mx
=3
a)
b)
c)
d)
e)
( )
0
2 3 3
1 0 2 0 2 0 2 0
3
2 3
k 0
k 0
0 0
P ?
P P P P P P y P P
por tanto
P 1 P 1 1
2 4 8 27
P 1 1 P 41.538%
3 9 27 65
=
=
= p = p = p = p
= + p + p + p =
| |
+ + + = = =
|
\ .
0 1 2 0
27 2 27 4 27
P P P P 0.87755
65 3 65 9 65
+ + = = + + =
3
k 1 2 3
k 1
2 27 4 27 8 27
L k P 1 P 2 P 3 P 2 3 1.015 t
3 65 9 65 27 65
=
= = + + = + + =
q
L 1.015 t 1
W 0.12692 min 7.61seg W W 7.61 5 2.61seg
8 t / min
= = = ~ = = =
u
3
3
3 0
2 27
P P 12.31%
3 65
| |
= p = =
|
\ .
Considere una cola M/M/1 con tasa de arribos clientes por
segundo. Encuentre la tasa de servicio para que el tamao
medio de la cola sea 5 clientes (es decir, E(Nq)=5)
q q
q q q
2
q
2 2
E(N ) L 5
1
W W / W W L L
L 5
1
5 5 5 5 0 0.85
como 0.85
= =
= + = + = + p
u u
p
= =
p
p = p p + p = p
p = u =
u
Una empresa de servicios tiene cuatro ingenieros para atender
a 20 grandes servidores de una ciudad. Cada servidor necesita
del servicio tcnico cada 5 das (en media), siendo exponencial
la distribucin del tiempo entre dos servicios consecutivos. El
tiempo que cada ingeniero tarda en reparar un servidor sigue
una distribucin exponencial de media 1.5 das.
a) Cul es la probabilidad que haya 2 o ms ingenieros sin
trabajar?
b) Cul es la probabilidad que un ordenador que se estropea
tenga que esperar para ser reparado?
c) La compaa contratara ms ingenieros si los tiempos
medios de espera para cada servicio son superiores a medio
da cuntos ingenieros ms deber contratar la compaa?
M/M/4/20
1servicio 1servicio 2
;
5 das 1.5 das 15
= u = p =
j
0
j 0
j
j j m m k m
0
j m
j 0 j 1
P si 0 j m
1 j!
P y P
P si m j K
j! m! m m m!
= =
p
s s
= =
p p p p
| |
+ s s
|
\ .
M/M/m=4/K=20
luego
0
j 4
j 4 4 16
2 3 4 j
16
j 0 j 1
j 1
0
1 1
P
2
2 1 2 1 2 1 2 1 j! 4! 4 15
1
15 2 15 6 15 24 15 24 50
P 0.8751
= =
=
= =
p p p | | | |
+
| |
| | | | | | | |
\ . \ .
+ + + + +
| | | |
\ . \ . \ . \ .
=
P(2oms ingenieros sin trabajar) P(0 o1servidores enmal estado) P(0) P(1) = = +
Los clientes llegan a una ventanilla bancaria de autoservicio,
segn una distribucin de Poisson con media de 10 por
hora. El tiempo de servicio por cliente es exponencial con
media de 5 minutos. El tiempo de servicio por cliente es
exponencial con media de 5 minutos. El espacio en frente de
la ventanilla , incluyendo al auto al que se le est dando
servicio, puede acomodar un mximo de tres automviles.
Otros vehculos pueden esperar fuera del espacio.
a) Cul es la probabilidad que un cliente pueda manejar
directamente hasta el espacio frente a la ventanilla?
b) Cul es la probabilidad que un cliente que llega tendr
que aguardar fuera del espacio indicado?
c) Cuntos espacios deber proporcionar enfrente de la
ventanilla de manera que todos los clientes que llegan
puedan esperar frente a sta al menos el 20% del
tiempo?
0
k 4
k 4
10 clientes / hora 0.16667 clientes / minuto
5 minutos
0.16667
0.033334
5
a) P 1 0.96667
b) P (1 ) P (1 0.03333) 0.03333 0.000001
como son tres ventanillas de atencin, la probabilidad que
tenga que esperar fu
= =
u =
p = = =
u
= p =
= p p = =
k k
k
era del espacio indicado es del 0%
c) P (1 ) 0.2 (1 0.03333) 0.03333 0.2
k 0.4632 k 1ventanilla
= p p = =
= ~
Se deber proporcionar una ventanilla, de manera que todos
los clientes que llegan puedan esperar frente a sta al menos
el 20% del tiempo