Вы находитесь на странице: 1из 333

UNIVERSIDAD CENTRAL

SIMULACIN
Sistemas, Modelos y Simulacin
Funcionamiento de un Sistema
Modelo y sus hiptesis para estudiar un Sistema
Modelo matemtico para relaciones sencillas (dos variables)
Simulacin, a travs de un modelo para obtener soluciones
INTRODUCCIN
CONCEPTOS BSICOS
EJEMPLO: Un empresario que desea ampliar la
planta productiva de su empresa, pero no sabe si la
ganancia potencial de productividad justifica los
costos.
Sera una error ejecutar la ampliacin y observar los
resultados, y si no son satisfactorios volver atrs.
La alternativa es simular la operacin actual y la de
la planta ampliada y comparar sus productividades.
Estado de un sistema es el conjunto de variables
necesarias para describir el sistema en un instante
determinado, de acuerdo con los objetivos del estudio
EJEMPLO: Para determinar el nmero ptimo de cajeros
de una sucursal de un Banco que atienden clientes que
realizan depsitos y cobros, el sistema se define como la
proporcin de los empleados y los clientes haciendo fila
para ser atendidos.
Variables de Estado para un modelo de ste ejemplo
pueden ser: nmero de empleados ocupados, nmero de
clientes en el Banco, instante de llegada de cada cliente al
Banco, nmero de operaciones que realiza el cliente, entre
otras.
Simulacin: Para estudiar el sistema real es necesario
reemplazarlo por un sistema que en la mayora de los
casos es una versin simplificada (abstraccin), que
implementa un Modelo necesario para realizar las
experiencias necesarias, sin los inconvenientes del
sistema real.
Diseo de un plan de experimentacin con las
variables de Estado
Optimizacin a partir de las diferentes soluciones
obtenidas que permita adoptar la mejor decisin
Entrenamiento o Capacitacin para aprender a
conducir el sistema.
SISTEMA
Conjunto de objetos o ideas que estn interrelacionados
entre s como una unidad para la consecucin de un fin
(Shannon, 1988)
MODELO
Un objeto X es un modelo del objeto Y para el
observador Z, si Z puede emplear X para responder
cuestiones que le interesan acerca de Y (Minsky)
(Constructo Conceptual resultante de un proceso cognitivo,
que mediante la abstraccin logra una representacin de
una realidad).
SIMULACIN
Proceso de diseo de un modelo del sistema real y de
llevar a cabo experiencias con l, con la finalidad de
aprender el comportamiento del sistema o evaluar
diversas estrategias para el funcionamiento del sistema
(Shannon, 1988).
Ejemplos de Sistemas:
Una red de telecomunicacin es un complejo entramado
de recursos fsicos y lgicos (medios y equipos de
transmisin, conmutadores, protocolos de comunicacin,
etc.), cuyo objetivo es encauzar eficientemente el flujo de
informacin entre los usuarios [Pazos-Surez-Daz,
2004].
Sistema predictivo de la calidad del aire en Santiago,
compuesto por una serie de estaciones en distintas
comunas con equipos para medir diversas variables
fsicas y medioambientales
Sistema de Atencin Hospitalaria, compuesto por una
serie de Postas, Consultorios y Hospitales, con distintas
especialidades mdicas, nmero de camas, pabellones
quirrgicos, poblacin objetivo, entre otras
Los modelos de Simulacin se clasifican:
Discretos: Las variables de Estado pueden cambiar de
valor slo un nmero finito de veces por unidad de tiempo.
Ejemplo: Para modelar el flujo de trfico vehicular se usar
un modelo discreto si son relevantes las caractersticas y
movimientos de los vehculos individuales.
Continuo: Las variables de Estado pueden cambiar
continuamente con el tiempo.
Ejemplo: Para modelar el flujo de trfico vehicular se usar un
modelo continuo si son relevantes las caractersticas tiempo
de semforo, tiempo de llegada a destino, distancia recorrida,
etc.
La decisin de uno u otro modelo dependen del objetivo
especfico del estudio y no del sistema en s.
Esttico: Representa al sistema en un determinado
instante, para un valor fijo de las variables estado. Ej.
Modelos de programacin lineal
Dinmico: la evolucin del sistema, su caracterstica es
el cambio que presentan las variables en funcin del
tiempo. Ej. Modelos de series de tiempo, modelos de
pronsticos
Determinista: Se conoce el resultado con exactitud
para un conjunto de variables, dado que los valores de
las ellas no son afectados por variaciones aleatorias.
Los datos de salida son nicos para un conjunto de
entradas dadas
Ej. Ley de enfriamiento de los cuerpos de Newton. Ley de
descarga de un condensador.
Estocstico: Los valores de las variables
experimentan variaciones aleatorias con respecto a un
valor promedio, involucran distribuciones de probabilidad.
Los datos de salida pueden ser a su vez aleatorios
Ej. Modelos de colas. Modelos de epidemias
En el mbito de la Ingeniera, dependiendo del sistema, se
usan principalmente Modelos Discretos, Dinmicos o
Estocsticos.
Cundo usar la Simulacin
Si no existe una formulacin matemtica analticamente
resoluble. Ej, la conducta de un cliente en un Banco
Existe una formulacin matemtica, pero es difcil obtener una
solucin analtica. Ej, modelos matemticos usados para
modelar un reactor nuclear o una planta qumica; imposibles de
resolver analticamente sin realizar serias simplificaciones
No existe el sistema real; disear un nuevo sistema. El diseo
del sistema mejorar notablemente si se cuenta con un modelo
adecuado para realizar experimentos
Los experimentos no son factibles debido a
impedimentos econmicos, de seguridad, de calidad o
ticos (el sistema real est disponible, pero ...). Ej.,
provocar fallas en un avin (real) para evaluar la conducta
del piloto; variar el valor del impuesto para evaluar la
reaccin del mercado. Administrar un medicamento nuevo
a un paciente para ver como reacciona su organismo.
El sistema real evoluciona muy lentamente, Ej. evolucin
de un ecosistema; o muy rpidamente, Ej. Evolucin de
una epidemia. O en la evolucin de un maremoto en que
no se puede esperar a que arrase una localidad para luego
dar la alarma.
Desventajas de la Simulacin
El desarrollo de un modelo puede ser costoso,
laborioso y lento.
Existe la posibilidad de cometer errores; si el modelo
est mal definido o se cometen errores en su manejo,
los resultados sern tambin incorrectos.
No se puede conocer el grado de imprecisin de los
resultados; por lo general, el modelo se utiliza para
experimentar situaciones nunca planteadas en el
sistema real, por lo que no existe informacin previa
para estimar el grado de correspondencia.
Algunas reas de Aplicacin
Proceso de Manufacturas: detectar cuellos de botella,
distribuir personal, determinar polticas de produccin.
Plantas Industriales: condiciones ptimas de operacin,
elaboracin de procedimientos de operaciones y de
emergencias.
Sistemas Pblicos: predecir demanda de energa, de
propagacin de enfermedades, de niveles de contaminacin,
comportamiento del clima.
Sistemas de Transporte: detectar zonas de posible
congestionamiento, zonas con mayor riesgo de accidentes,
prediccin de demanda.
Construccin: predecir efecto de los vientos y temblores,
condiciones de iluminacin y ambientales al interior, detectar
partes estructurales a ser reforzadas.
Diseo: seleccin adecuada de materiales y formas,
anlisis de sensibilidad con respecto de parmetros no
controlables.
Capacitacin: para implementar el mtodo ms natural
para aprender, el de prueba y error, evitando los costos y
riesgos del sistema real.
Objetivos de un Modelo
Permitir la comprensin de lo que puede suceder en un
sistema si cambian los estados de las variables.
Si no refleja el conocimiento que se tiene del sistema, el
modelo no tiene sentido, quizs fue mal diseado.
Si el modelador no tiene un adecuado conocimiento del
sistema a modelar, con seguridad los resultado no tengan
utilidad, o bien las estimaciones sean distintas a lo real.
Algunos sistemas no podrn ser modelados correctamente
o la simulacin no resultar ni econmica ni fcil de aplicar
correctamente.
El tiempo y costo asociado a la recoleccin de datos y de
los ciclos de proceso computacional para obtener resultados
precisos, no debe subestimarse ni subvalorarse.
Suponiendo que un modelo sea vlido, mientras ms
sencillo mejor .
Estrategia: de lo general a lo particular. Gradualmente se
va detallando el modelo, complejizando su desarrollo,
depuracin y ejecucin, como tambin la explicacin e
interpretacin de las salidas.
La alternativa al uso de modelos matemticos es el uso
de Modelos Fsicos o tambin llamados Modelos Icnicos;
implementaciones fsicas a escala del sistema real.
Sistema
Experimentar Experimentar
con el con un modelo
sistema real del sistema
Modelo Fsico Modelo Matemtico
Solucin Analtica Simulacin
REVISIN DE CONCEPTOS REQUERIDOS
Variables Aleatorias
2
3
4
5
6
7
8
9
10
11
12
Se lanzan dos dados normales, sea X : la variable aleatoria suma de las pintas de las
caras superiores
O
9
f(x)

s s

s s

= = =
caso otro
x si
x
x si
x
x X P x f
0
12 8
36
13
7 2
36
1
) ( ) (

>
< s
< s
< s
< s
<
=
12 1
12 11 36 / 35
.
.
5 4 36 / 6
4 3 36 / 3
3 2 36 / 1
2 0
) (
x si
x si
x si
x si
x si
x si
x F
1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
p=1/36 p=2/36 p=3/36 p=4/36 p=5/36 p=6/36 p=5/36 p=4/36 p=3/36 p=2/36 p=1/36
Dr. Pedro Vergara V.
ESPERANZA Sea X una variable aleatoria discreta, la esperanza matemtica
se define por

=
= =
1
) ( ) (
i
i i
x X P x x E
7
36
1
12 ...
36
3
4
36
2
3
36
1
2 ) ( ) (
1
= + + + + = = =

= i
i i
x X P x x E
Para el ejemplo de los dos dados
VARIANZA Sea X una variable aleatoria discreta, la esperanza matemtica se
define por
| |
2
2
) ( ) ( ) ( x E x E x V =
83 . 5 ) 7 (
36
1
12 ...
36
2
3
36
1
2 ) (
2 2 2 2
= + + + = x V
42 . 2 53 . 5 ) ( = = x S
Desviacin estndar
Dr. Pedro Vergara V.
DISTRIBUCIN DE POISSON Una variable aleatoria discreta se
distribuye Poisson si su funcin de probabilidad est dado por :
!
) (
x
e
x X P
x


= =
= ot o: nmero de eventos que ocurren por unidad de tiempo t
valor promedio de eventos durante un intervalo t
De acuerdo a la informacin registrada durante varios aos, se sabe que el nmero de
accidentes con causa de muerte tiene una frecuencia de 30 casos al mes. Calcule la
probabilidad que haya un muerto en un lapso de 2 das. Calcule la probabilidad que
haya dos muertos en un lapso de 5 das.
2707 . 0
! 1
2
) 1 (
1 2
= = =

e
X P 0842 . 0
! 2
5
) 2 (
2 5
= = =

e
X P
Dr. Pedro Vergara V.
E(X)= y V(X)=
DISTRIBUCION UNIFORME Una variable aleatoria continua de recorrido
[a,b] se distribuye uniforme si su funcin de probabilidad es :

s s

=
caso otro en
b x a si
a b
x f
0
1
) (
12
) (
) ( ,
2
) (
2
a b
x V
b a
x E

=
+
=
Una sustancia qumica contaminante se distribuye uniformemente en el
rango de 10 a 20 partes por milln (ppm). No se considera nociva para la
salud si la concentracin es menor que 11 ppm. Cul es la probabilidad que
no sea nociva?

>
s s

<
=
b x si
b x a si
a b
a x
a x si
x F
1
0
) (
10 . 0
10
1
10 20
10 11
) 11 ( F = =

=
Dr. Pedro Vergara V.



=
X
dt
a b
1
) x ( F
DISTRIBUCION NORMAL Sea X una variable aleatoria continua con con
recorrido 9, la variable X tiene distribucin normal de parmetros u y o
2
si su
funcin de probabilidad es
0
2
1
2
2
2
2
2
> o 9 e u 9 e
to
=
o
u

, , x ; e ) x ( f
) x (
u
0.6826
u-3o u-2o u-o u u+o u+2o u+3o
Dr. Pedro Vergara V.
u-3o u-2o u-o u u+o u+2o u+3o
0.6826
0.9544
0.9974
0 0
( )
0
x
e si x
f x
en otro caso
o
o o

> . >
=

Distribucin exponencial
Sea X una variable aleatoria continua con recorrido los reales
positivos, X tiene distribucin exponencial si su funcin de
densidad est dada por:
1 0
( )
0 0
x
e si x
F x
si x
o

>

=

<

1
( ) E x
o
=
2
1
( ) V x
o
=
La funcin de probabilidad acumulativa est dada por:
Dada una variable aleatoria con distribucin exponencial su
esperanza y varianza est dada por:
i) ii)
.
.
( )

>
=

0 00125x
0 00125e si x 0
f x
0 enotro caso
.
( ) ( ) ( ) .

> = < = =
0 00125 20
P t 20 1 P t 20 1 1 e 0 3771
Ejemplo. El tiempo de espera de las personas en el Sernac
para realizar una denuncia tiene una distribucin exponencial
de parmetro =0.00125 (t en minutos). Qu porcentaje de
los denunciantes espera ms de 20 minutos para realizar una
denuncia en el Sernac?
De acuerdo a la informacin se tiene que la funcin de
probabilidad est dada por:
Distribucin de Weibull
Esta distribucin se utiliza para modelar el tiempo entre fallas de
maquinarias o componentes electrnicos.
Una variable aleatoria tiene de Weibull si su funcin de
probabilidad est dada por:
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso
o
| |

|
| o
\ .
o

o | = > o > | >

Esta distribucin es una familia de distribuciones que dependen


de dos parmetros: el de forma y el de escala .
Si =1, sta distribucin es la distribucin exponencial con
1
=
|
La funcin de probabilidad acumulada est dada por:
x
F(x, , ) 1 e
o
| |

|
|
\ .
o | =
En la figura se muestras las distintas curvas resultantes para:
=0.8 ,=1 ; =2 ,=1 ; =2 ,=2 ; =2 ,=3
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso
o
| |

|
| o
\ .
o

o | = > o > | >

Dada la funcin de probabilidad de Weibull:


Distribucin triangular
Una variable aleatoria tiene distribucin triangular si su funcin
de probabilidad est dada por:
x 0 x 1
f(x) 2 x 1 x 2
0 en otro caso
s s

= < s

Esta distribucin se denomina distribucin triangular con extremos


(0, 2) y moda en 1. La funcin de probabilidad acumulada es:
2
2
0 x 0
x
0 x 1
2
F(x)
(2 x)
1 1 x 2
2
1 x 2
s

< s

< s

>

0 0.4 0.8 1.2 1.6 2


0
0.2
0.4
0.6
0.8
1
Distribucin emprica
Cuando no es posible encontrar una distribucin terica para
modelar los datos, entonces se utiliza una distribucin emprica.
Esta puede estar expresada como una tabla de frecuencias o
directamente una tabla de datos sin procesar.
En el primer caso se cuenta con intervalos y la frecuencia de
cada uno de ellos. Se calcula la frecuencia relativa y luego la
acumulada, como se muestra en el siguiente ejemplo:
Identificacin de la distribucin
Cuando los datos ya estn disponibles, el primer paso en su
procesamiento es la construccin de un histograma para cada
variable X. Para ello, se deben determinar:
El tamao de la muestra n.
Valor mnimo Xmn.
Valor mximo Xmx.
El rango R: igual a Xmx - Xmn.
La cantidad de intervalos o clases C: la cantidad aconsejable es
n

, una cantidad menor o mayor puede distorsionar la forma del


histograma.
El ancho de los intervalos B: es igual a R/C.
La frecuencia absoluta de los datos f
k
en cada intervalo k: se
obtiene contando cuntos datos estn dentro del intervalo
considerado.
Determinados estos parmetros, el histograma surge de graficar
columnas con alturas f
k
y ancho B para cada intervalo.
A modo de ejemplo considere la Tabla 1 que fue obtenida con un
generador exponencial con tiempo medio igual a 1.
Ejemplo: A partir de los siguientes datos calcular los
valores para la construccin del histograma
Tabla 1: Datos de un generador exponencial con =1
i Entrada r
i
1 0,684
2 0,408
3 1,568
4 0,633
5 0,328
6 1,199
7 0,014
8 1,433
9 0,343
10 1,183
Los valores del histograma para esos datos son:
X
mn
= 0.014 ; X
mx
= 1.568 ; R = 1.568-0.014 = 1.554 ; C = 3
B = 1.554/3 = 0.518
La Tabla 2 muestra las frecuencias absolutas correspondientes y la
Figura 1 muestra el histograma:
K Intervalo Punto
medio
f
k
1 [0.014 ; 0.532] 0.273 4
2 (0.532 ; 1.050] 0.791 2
3 (1.050 ; 1.568] 1.309 4
El siguiente paso es determinar la familia de distribuciones que se
probar para representar el conjunto de datos en estudio.
Para ello se cuenta con la forma del histograma y tambin se cuenta
con la naturaleza del proceso.
En efecto, se han desarrollado numerosas distribuciones tericas
para procesos determinados, por ejemplo:
1. Binomial
2. Binomial negativa
3. Poisson
4. Normal
5. Lognormal
6. Exponencial
7. Gamma
8. Beta
9. Erlang
10. Weibull
11. Uniforme continua y discreta:
12. Triangular
13. Emprica
Para al ejemplo anterior, como los datos fueron obtenidos con un
generador exponencial, los datos son tiempos entre llegadas de
clientes y la distribucin a probar es la exponencial.
Estimacin de parmetros para una f.d.p
Despus de haber seleccionado una familia de distribuciones, el
prximo paso es la estimacin de los parmetros correspondientes.
El mtodo ms bsico emplea el valor medio (X
m
) y la varianza (S
2
)
de la muestra, valores que son calculados de la siguiente forma:
n n n
2
2 2
i i i
2
i 1 i 1 i 1
x (x x) x nx
x ; S
n n 1 n 1
= = =

= = =


=promedio(inicio:trmino) =var(inicio:trmino)
En Excel:
Sea x
1
, x
2
, x
3
,,x
n
una muestra aleatoria de tamao n,
proveniente de una distribucin, los estimadores sugeridos
para las distribuciones ms empleadas son:
Poisson:
Exponencial:
Uniforme [0, ]: X
mx
(n + 1)/n
Normal: y
n
i
i 1
x
x
n
=
~ =

n
i
i 1
n
1/ x
x
=
~ =

n
i
i 1
x
m x
n
=
= =

n
2
i
2 2
i 1
*
(x x)
S
n 1
=

o ~ =

Ejemplo: A partir de los siguientes datos calcular los valores para


la construccin del histograma
i Entrada r
i
1 0.684
2 0.408
3 1.568
4 0.633
5 0.328
6 1.199
7 0.014
8 1.433
9 0.343
10 1.183
Tabla 1: Datos de un generador exponencial con =1
Luego, se tiene que: X
m
es igual a 0.7793; por lo tanto, 1.2832.
Estimacin de Parmetros por Regresin
Se presenta un mtodo para estimar los parmetros de una
distribucin que requiere un poco ms de esfuerzo, pero la
exactitud del ajuste mejora notablemente.
Primero se debe construir el histograma correspondiente como se
indic anteriormente, y luego se debe proponer una familia de
distribuciones f(x).
Los valores de los parmetros sern determinados a travs de un
ajuste de la distribucin al histograma.
Antes de proceder a realizar el ajuste, es necesario normalizar el
histograma.
En efecto, como la curva f(x) que se utilizar para el ajuste es una
distribucin probabilstica la misma cumple con la condicin de
tener rea unidad por debajo de ella.
Sera una casualidad que el histograma construido cumpla con dicha
condicin; entonces, es necesario calcular las frecuencias
normales f
n
que hacen que el histograma posea rea unitaria.
Se puede demostrar que las frecuencias normales son:
Donde. f
k
es la frecuencia del intervalo k, n es el nmero de
observaciones del intervalo k, y, B es el ancho del intervalo k.
El paso siguiente es transformar el histograma en puntos de ajustes.
Para ello, se determina la marca M de cada intervalo (valor medio =
marca de clase) y se le asocia la f
n
correspondiente.
k
k
n
f
f
n B
=

La Tabla 3 muestra los puntos de ajuste correspondientes al


ejemplo de la Tabla 1.
Tabla 3: Puntos de ajuste
k Intervalo f
k
M
k
f
n
1 [0.014 ; 0.532] 4 0.273 0.7722
2 (0.532 ; 1.050] 2 0.791 0.3861
3 (1.050 ; 1.568] 4 1.309 0.7722
k
k
n
f
f
n B
=

n=10 ; B=0.518
Ahora el problema se reduce a determinar los valores de los
parmetros que hacen mnima la suma de los errores al
cuadrado.
k
c
2
n k
k 1
Mn
(f f(M ))
=


k
k
c
M 2
n
k 1
Mn
(f e )


El problema es minimizar:
como:
k
M
k
y e aplicando ln se tiene
lny ln M

=
=
k
c
2
n k
k 1
Mn
G( ) (lnf ln M )
=
=


luego, la funcin a minimizar:
k
c
n k k
k 1
G( ) 1
0 2 (lnf ln M ) ( M )
=
c
= = +
c

Para minimizar se deriva parcialmente respecto de y se iguala a cero


Se obtiene la siguiente expresin, que debe resolverse numricamente
k k
c c c c c
2
n k k n k k
k 1 k 1 k 1 k 1 k 1
1 ln
lnf c M M lnf ln M M 0
= = = = =

+ + + =


Este problema se resuelve fcilmente con una planilla de clculo, y el
resultado es 0.83; el cual es un valor mucho mejor que el obtenido
por el mtodo bsico.
1.28320287x
y 1.28320287e

=
x
y e

=
0.83x
y 0.83e

=
=1,28320287 =1 =0,83 e=y-y e=y-y
x y y y e=y-y e=y-y
0 1,283202870 1,00000000 0,83 0,283202870 0,17000000
1 0,355637376 0,36787944 0,36192091 -0,012242066 0,00595853
2 0,098564261 0,13533528 0,15781535 -0,036771022 -0,02248007
3 0,027316908 0,04978707 0,06881527 -0,022470160 -0,01902820
4 0,007570832 0,01831564 0,03000685 -0,010744807 -0,01169121
5 0,002098243 0,00673795 0,01308447 -0,004639704 -0,00634652
6 0,000581524 0,00247875 0,00570547 -0,001897228 -0,00322672
7 0,000161168 0,00091188 0,00248787 -0,000750714 -0,00157598
8 0,000044668 0,00033546 0,00108483 -0,000290795 -0,00074937
9 0,000012380 0,00012341 0,00047304 -0,000111030 -0,00034963
10 0,000003431 0,00004540 0,00020627 -0,000041969 -0,00016087
promedio 0,017567580 0,010031814
desvest 0,088857848 0,053746151
Evaluacin del Ajuste
Para evaluar si realmente la distribucin propuesta representa al
conjunto de datos se pueden utilizar mtodos estadsticos como
por ejemplo:
Kolmogorov-Smirnov: Decide en base a la mxima desviacin
entre la distribucin acumulada terica y la experimental.
Chi-cuadrado: Decide en base a la suma de errores al cuadrado
que surgen de comparar el histograma con la distribucin terica.
Estas pruebas son una buena gua para evaluar una distribucin.
Sin embargo, ya que no existe una distribucin terica que ajuste
perfectamente a los datos del mundo real, no se deberan tomar
los resultados de estas pruebas en forma categrica.
Es muy importante comprender el efecto del tamao de la muestra.
Si la muestra es pequea, las pruebas aceptarn cualquier distribucin.
Por el contrario, si la muestra es grande, las pruebas rechazarn a todas las
distribuciones propuestas.
Por lo tanto, estas pruebas son slo un elemento ms a tener en cuenta
durante la evaluacin.
Grfico q-q
Una alternativa al empleo de histogramas para identificar la
distribucin de los datos es el grfico
quantile -quantile.
ste tipo de grfico puede utilizarse an cuando los datos son
escasos (menos que 30), y al no depender de parmetros
arbitrarios, como el nmero de clases y el ancho de los intervalos,
facilita la evaluacin del grado de ajuste de la distribucin
propuesta al conjunto de datos analizados.
Si X es una variable aleatoria con distribucin acumulada F(X), el
q-quantile de X es el valor g tal que
F() = P(X ) = q para 0 < q < 1.
Cuando F(X) tiene inversa, el quantile es igual a = F
-1
(q).
Sea {x
i
, i = 1, 2, ..., n} una muestra de X.
Dicha lista ordenada de menor a mayor origina la
nueva lista {y
j
, j = 1, 2, ..., n} donde y
1
y
2
... y
n
El grfico q-q se basa en que y
j
es una estimacin del
(j-0.5)/n quantile de X, con n tamao de la muestra
Suponga que se est probando una distribucin con funcin de
probabilidad acumulada F(X) para representar los datos en estudio.
Si F(X) es de la familia de distribuciones adecuada; entonces, el
grfico y
j
vs F
-1
((j-0.5)/n) ser aproximadamente una lnea recta.
Si adems, los parmetros de F(X) tienen los valores adecuados;
entonces, la lnea recta tendr pendiente 1.
Si F(X) no es la funcin adecuada, los puntos no estarn alineados.
La verificacin de la distribucin exponencial que se ajust en la
seccin anterior con = 1,2833 se muestra en la Tabla, Figura 6 y
Figura 7.
j
1.2832 y
j
F(y ) 1 e

=
1
j j
1
F (q ) ln(1 q )
1,2832

=
j y
j
q
j
=(j-0,5)/10 F(Y
j
) F
-1
(q
j
)
1 0,014 0,05 0,01780 0,03997
2 0,328 0,15 0,34354 0,12665
3 0,343 0,25 0,35605 0,22419
4 0,408 0,35 0,40758 0,33571
5 0,633 0,45 0,55615 0,46590
6 0,684 0,55 0,58427 0,62228
7 1,183 0,65 0,78086 0,81813
8 1,199 0,75 0,78531 1,08034
9 1,433 0,85 0,84100 1,47843
10 1,568 0,95 0,86629 2,33458
Figura 7: Grfico q-q modificado
Figura 6: Grfico q-q
La verificacin de la distribucin exponencial ajustada para = 0.83
se muestra en la siguiente Tabla
j
0,83 y
j
F(y ) 1 e

=
1
j j
1
F (q ) ln(1 q )
0,83

=
j y
j
q
j
=(j-0,5)/10 F(y
j
) F
-1
q
j
)
1 0,014 0,05 0,01155 0,06180
2 0,328 0,15 0,23833 0,19581
3 0,343 0,25 0,24775 0,34660
4 0,408 0,35 0,28726 0,51902
5 0,633 0,45 0,40868 0,72029
6 0,684 0,55 0,43318 0,96206
7 1,183 0,65 0,62540 1,26485
8 1,199 0,75 0,63034 1,67023
9 1,433 0,85 0,69559 2,28569
10 1,568 0,95 0,72786 3,60932
Es posible determinar un nuevo valor de utilizando el principio
del grfico q-q, para ello se debe resolver uno de los siguientes
problemas:
La solucin de ambos problemas da el mismo resultado: = 1.06.
Este mtodo tiene la ventaja de no depender de un nmero
arbitrario como es el nmero de clases de un histograma.
Ahora consideremos el siguiente ejemplo, datos de la Tabla 4.
El valor medio es 99.99 y la varianza de la muestra es 0.28322.
Estos valores pueden utilizarse como estimaciones de los
correspondientes parmetros de una distribucin normal.
Como puede apreciarse en la Figura 3, no es fcil determinar
grficamente si los datos en realidad poseen distribucin normal.
La Tabla 5 muestra los datos ordenados y los clculos realizados
para comprobar si pueden ser representados por una distribucin
normal.
Los puntos estn alineados a lo largo de una recta con pendiente 1; por
lo tanto, se puede concluir que los datos tienen una distribucin normal
con valor medio 99.99 y varianza 0.28322.
Notar que es posible realizar un grfico equivalente que no emplee la
funcin inversa de la distribucin acumulada, la cual puede no existir;
para ello, se grafica F(y
j
) vs q
j
.
Esta ltima Figura muestra el grfico de q
j
vs F(y
j
), nuevamente los
puntos estn distribuidos a lo largo de una lnea recta con
pendiente 1.
Generalmente los puntos ubicados en los extremos del grfico
pueden alejarse de la lnea recta; Sin embargo, la atencin debe ser
puesta en los puntos centrales para decidir si la distribucin que
est siendo probada es la correcta.
Es posible tambin detectar si una variable X tiene una misma
distribucin que otra Z; Para ello, se grafican los valores ordenados
de la primera variable versus los valores ordenados de la segunda
variable.
Si el grfico resulta en una lnea recta, ambas variables pueden ser
representadas con la misma distribucin.
Seleccin de una Distribucin sin Datos
Cuando el sistema no existe an o el proceso de medicin no
puede realizarse por algn motivo, ser necesario seleccionar una
distribucin sin contar con los datos del sistema.
La informacin necesaria para ello puede obtenerse de distintas
fuentes:
Especificaciones tcnicas: Generalmente se cuenta con datos
tcnicos de un producto o proceso; por ejemplo, tiempo medio
entre fallas, velocidad de impresin, consumo promedio, etc.
Opinin de expertos: Las personas que conocen el sistema pueden
hacer estimaciones acerca de los valores mnimos, mximos y
probables de las variables. Con estos datos es posible construir una
distribucin triangular (Figura 8).
Limitaciones fsicas o de diseo: Dada la naturaleza del sistema,
los valores de las variables estn limitados a ciertos intervalos; por
ejemplo, la luz roja de un semforo no puede durar menos de 10 s.
La naturaleza del proceso: Este es un dato importante debido a
que varias distribuciones tericas fueron desarrolladas para
procesos determinados.
Sea cual fuere la fuente, es necesario evaluar la sensibilidad de los
resultados con respecto a la distribucin propuesta de esta
manera.
Si la sensibilidad es alta, ser necesario refinar las estimaciones.
Modos de Simulacin
Como se ha planteado, cuando se simula se experimenta con un
modelo para obtener ciertos resultados.
De acuerdo al tipo de Variable de Salida, la simulacin pueden ser:
Modo Anlisis
Las variables de salida del modelo representan a las variables de
salida del sistema real. Es el modo ms empleado y se utiliza para
estimar la respuesta del sistema real ante entradas especficas.
Debido a que imita a un sistema que realmente funciona, el
modelo es matemticamente ms estable y se asegura la
existencia de una solucin.
Modo Control
Las variables de salida del modelo representan a las variables de
entrada del sistema real. Es el modo que se utiliza para determinar
los valores que debern adoptar las variables de entrada del
sistema para producir los resultados deseados.
Se utiliza cuando se desea determinar las condiciones de
operacin de un sistema.
Modelado
Modelado es el proceso de construccin de un modelo.
Un Modelo es un constructo conceptual que representa un
objeto, sistema o idea, generado mediante un proceso cognitivo
que hace uso de la abstraccin.
Un modelo se representa a travs de un Diagrama, el que
corresponde a un conjunto de smbolos cuya interpretacin es
previamente acordada.
Los modelos son tiles para:
El Pensamiento: al construir un modelo necesariamente se debe
ordenar, estructurar y completar el conocimiento que se tiene del
sistema real.
La Comunicacin: un modelo reduce y a veces elimina la
ambigedad del lenguaje para comunicarse con expertos.
El Entrenamiento y la Instruccin: un modelo se puede utilizar
para entrenar con costo y riesgo casi nulo. Por ejemplo, los
submarinos a escala (Modelo Fsico o Icnico) usados por la marina
alemana para entrenar en secreto antes de la segunda guerra
mundial.
La Prediccin: un modelo sirve para predecir la conducta del un
sistema real. Por ejemplo, los modelos utilizados mediante la
simulacin para predecir la evolucin del clima mundial. El modelo
de la teora de la relatividad predice, sin hacer una simulacin, que
es posible superar la velocidad de la luz.
La Experimentacin: hecha con un modelo es barata y segura. Se
emplea frecuentemente en el diseo de sistemas. Por ejemplo, el
tnel de viento con un modelo a escala de un avin o automvil.
El modelar consiste en la habilidad para analizar un problema
(proceso cognitivo), resumir sus caractersticas esenciales
(abstraccin), seleccionar y modificar los supuestos bsicos que
caracterizan el sistema (conceptos) y luego, enriquecer y elaborar el
modelo (constructo) hasta obtener una aproximacin til.
Cualquier conjunto de reglas para desarrollar modelos tiene una
utilidad limitada y slo puede servir como una gua sugerida.
Los pasos sugeridos son:
Establecer una definicin clara de los objetivos
Analizar el sistema real
Dividir el problema del sistema en problemas menores y simples
Buscar analogas (Patrones)
Considerar como referencia un ejemplo numrico especfico del
problema
Determinar las variables de inters
Documentar los datos obvios
Documentar las ecuaciones tericas o empricas que describen los
fenmenos presentes y relacionan las variables de inters
Si se logra un modelo manejable, enriquecerlo. De otra manera,
simplificarlo
Simplificar un modelo implica, generalmente:
Convertir variables en constantes
Eliminar o combinar variables
Suponer linealidad
Agregar suposiciones ms fuertes y restricciones
Restringir los lmites del sistema
Enriquecer un modelo implica operar en la forma contraria.
Durante el proceso de modelado se debe lograr un equilibrio
entre el grado de detalle y el riesgo de la falta de exactitud.
El mejor modelo es el modelo ms simple que puede resolver el
problema con el grado de exactitud requerido.
El modelo resultante debe ser:
Fcil de entender por lo expertos y tambin por los usuarios
Dirigido claramente a metas u objetivos
Sensato, en cuanto a no entregar resultado absurdos
Fcil de manipular y controlar por parte del usuario, es decir, de
fcil interaccin
Completo en lo referente a aspectos importantes del sistema
Adaptable en cuanto a su modificacin o actualizacin
(mantenible)
Evolutivo en cuanto a comenzar sencillo y volverse completo en
el tiempo
Ejemplo
Se desea construir un modelo para ({objetivo}) determinar el
tiempo y la velocidad de contacto con el suelo de un paracaidista.
El sistema ser el paracaidista en su descenso.
Las caractersticas esenciales ({variables de inters}) sern la
velocidad de descenso, la fuerza de friccin, la altura inicial, etc.
A fin de mantener el modelo en su forma ms simple posible se
supondr despreciable la variacin de la aceleracin de gravedad
con respecto a la altura, como tambin la elevacin de la
temperatura provocada por la friccin y se considerar un cuerpo
estndar para el paracaidista.
Luego se determinan las variables que representan las
caractersticas esenciales del sistema (F
r
, h
0
, C
r
, etc.), formulando
las ecuaciones que vinculen dichas variables:
donde:
g es la aceleracin de gravedad
h es la altura
mes la masa del paracaidista
t es el tiempo
C
r
es el coeficiente de friccin
F
r
es la fuerza de friccin
El modelo es manejable, pero se puede simplificar ms si es que
se determina que la velocidad terminal (la que equilibra el peso
con la fuerza de friccin) se alcanza pronto; si esto es as, se podr
considerar que la velocidad es constante.
2
r
r r
F dv dh
g v F C v
dt m dt
= + = =
Clasificacin de Modelos
Como se mencion, los modelos son a su vez sistemas, por lo que
se le aplican las mismas clasificaciones vistas:
Determinsticos
Estocsticos
Continuos
Discretos
Adicionalmente se califican como modelos Experimentales o
Tericos.
Modelos Experimentales
Son aquellos modelos que se construyen slo para reproducir las
salidas del sistema real, sin intentar modelar su comportamiento
interno. Tambin se les denomina Modelos de Caja Negra.
Estos modelos requieren una gran cantidad de datos para
calibrarlos o ajustarlos correctamente y su rango de validez est
limitado a este conjunto de datos.
Modelos Tericos
Son aquellos modelos que adems intentan reproducir las relaciones
funcionales del sistema, con base terica matemtica.
Estos modelos requieren una cantidad menor de datos y pueden ser
utilizados fuera del rango de los mismos, ya que la validez est dada
por la teora utilizada y no por los datos.
Modelos de Caja Negra
Ejemplo de modelos experimentales o caja negra
Se desea determinar el espacio recorrido por un cuerpo mvil a
velocidad constante en funcin del tiempo.
Para una velocidad dada se puede construir una grfica de espacio
v/s tiempo a partir de medidas experimentales.
Esta grfica slo se podr emplear para el caso en que la velocidad
del mvil sea idntica a la utilizada en los experimentos y para los
tiempos que pertenezcan al intervalo del experimento.
x v t =
Este problema no se presenta si se utiliza un modelo terico
simple ( ), en donde ni siquiera son necesarios los datos
experimentales.
Si se estudia el comportamiento del enfriamiento de un cuerpo
puesto en un ambiente a una temperatura T
a
, para ello es
necesario medir la temperatura T
c
en N instantes t
i
y luego ajustar
grficamente una curva T
c
v/s t.
O bien, ajustar matemticamente con el criterio de mnimos
cuadrados de los errores de los coeficientes de Regresin Lineal
del polinomio P(a,t), en un sistema semilogartmico, resolviendo el
problema de optimizacin:
Min SS
a
i
N
2
c i i
i 1
SS (T P(a,t ) )
=
=

k t
c a c a
T (t) T (T T ) e

= +
una temperatura especificada estar dada por el polinomio
ajustado, en el sistema semilogartmico:
P(t)=a
1
t + a
2
La incorporacin de ms variables en un modelo se requiere
obtener el modelo a travs de modelos de Regresin Lineal
Mltiple, pudiendo llegar a hacerse necesario reemplazar el
polinomio por un modelo ms potente; ejemplo, una red
neuronal.
Debido a las limitaciones del conocimiento actual (no existe una
teora apropiada) o por la complejidad involucrada
(implementacin demasiado compleja), todo modelo con base
terica siempre posee una parte con base emprica; siempre ser
necesario recurrir a experimentos para determinar el valor de
algn parmetro o definir algunas relaciones entre variables.
Cuando se desarrolla un modelo estadstico, se pueden utilizar
un sin nmero de funciones tericas, pero invariablemente ser
necesario determinar algn parmetro en forma experimental,
como por ejemplo el valor medio y la varianza de la muestra.
El modelo de caja negra ms simple es un polinomio.
Si el orden del polinomio ya est fijado, el problema se reduce a
determinar los valores de los coeficientes que minimicen la
sumatoria de los cuadrados de los errores.
Si el orden del polinomio tambin debe ser determinado,
entonces el orden ptimo surge de minimizar la varianza de los
errores de la muestra, es decir, de resolver el siguiente problema
de optimizacin general:
Min S
2
M,a
donde se desea ajustar los coeficientes a y el orden M del
polinomio P que es funcin de x para que los valores devueltos
minimicen la varianza de los errores de una muestra con N puntos
experimentales (x
i
,y
i
).
N
2
i i
2
i 1
(y P(M,a, x ))
S
N M 1
=

=

Para diferentes polinomios del mismo grado:


a
n
tal que
Min SS
a
SS=
1
2
+
2
2
+
3
2
+
4
2
+
5
2
N
2
i
i 1
SS
=
= c

Una vez fijo los polinomios de diferentes grados:


PG1(X)=a
1
X+a
2
PG2(X)=a
1
X
2
+a
2
X+a
3
PG3(X)=a
1
X
3
+a
2
X
2
+a
3
X+a
4

Para cada uno calcular: S


2
=(
1
2
+
2
2
+
3
2
+
4
2
+
5
2
+)/(N-M-1)
Que corresponde a la varianza, donde:
N: cantidad de las muestras
M: orden del Polinomio
Seleccionar el Polinomio tal que: P
GM
tal que Min S
2
M,a
OBS: Desviacin Estndar = Varianza = S
Ejemplo: dada la siguiente tabla de datos
X
i
Y
i
0 8
1 14
4 80
9 385
10 485
14 945
15 1095
La siguiente tabla muestra los resultados obtenidos cuando se
ajustaron polinomios de orden 1 a 4. El orden 4 se realiz como
verificacin
P(X)=aX+b P(X)=aX
2
+bX+c P(X)=aX
3
+bX
2
+cX+d
71,19 -108,72 5 -2,87 10,1 0,02 4,625 -0,749 8,756
Xi Yi (Yi-P(Xi))
2
(Yi-P(Xi))
2
(Yi-P(Xi))
2
)
0 8 13623,56 4,3681 0,571536
1 14 2655,34 3,1684 1,817104
4 80 9223,68 1,9321 1,0816
9 385 21606,06 18,1476 38,6884
10 485 13966,51 13,0321 1,522756
14 945 3255,84 24,1081 214,6225
15 1095
18460,66
8,7616 113,337316
82790,85
73,518 371,6412
N= 7 7 7
M= 1 2 3
S
2
= 16558,1691 18,3795 123,880404
P(X)=aX
4
+bX
3
+cX
2
+dX+e
0,00 -0,003 5,01 -2,75 9,03
X
i
Y
i
(Y
i
-P(X
i
))
2
)
0
1
4
9
10
14
15
8
14
80
385
485
945
1095
1,061
3,028
0,07381
60,528
504,901
3700,289
7433,888
11703,768
N= 7
M= 4
S
2
= 5851,88
N
2
i i
2
i 1
(y P(M,a, x ))
S
N M 1
=

=

A modo de ejemplo, el clculo para el Polinomio de grado 1 (Regresin Lineal Simple) es


el siguiente:
El clculo del resto de los polinomios se realiza a travs de la tcnica de estimacin
Polinomial basada en la Regresin Lineal Mltiple.
( )
2
2
0 1
1 1
| |
= =
= =

n n
i i i
i i
E e y x
n
i i
i 1
1 n
2
2
i
i 1
x y n x y

x n x
|
=
=

=

0 1

y x | | =
n
i i
i 1
xy
n n
2 2
2 2
i i
i 1 i 1
x y n x y
r 0,9645
x n x y n y
=
= =

= =


X
i
Y
i
X
i
Y
i
X
i
2
Y
i
2
0 8 0 0 64
1 14 14 1 196
4 80 320 16 6400
9 385 3465 81 148225
10 485 4850 100 235225
14 945 13230 196 893025
15 1095 16425 225 1199025
= 53 3012 38304 619 2482160

1
= 71,18897638

0
= -108,716535
r
xy
= 0,96446915
INFERENCIA
Parmetro: es la caracterizacin
numrica de una poblacin, que describe parcialmente
o en forma completa la funcin de densidad (o de
probabilidad) de la caracterstica en estudio
Estadgrafo o Estadstico : es una
funcin de las variables aleatorias que se observan
en una muestra.
Ejemplos :
La distribucin de probabilidad de un
estadstico recibe el nombre de distribucin muestral.
2
*
1
2
2
1
1
1
) (
) ( ) ( s
n
x x
x f x
n
x
x f
n
i
i
n
i
i
=

= = =

= =
Dr. Pedro Vergara V.
Distribucin muestral de un estadstico
Al extraer de una poblacin todas las muestras de un determinado
tamao y calculando en cada una de ellas el parmetro de inters,
se obtendrn muchos valores diferentes de ese estadstico
muestral, lo que se conoce como la variabilidad natural del
muestreo, todos estos valores posibles de un estadstico generan lo
que se denomina su distribucin muestral.
Si se tiene una poblacin de tamao 1000 y se quiere tomar una
muestra aleatoria de tamao 100, existen por tanto 1000 sobre 100
combinaciones posibles de realizar esta eleccin
139
!
6,3850511926305130236698511142022 10
! !
| |
= =
|

\ .
1000
1000
100 900 100
que es el nmero total de muestras distintas de tamao 100 que se
pueden escoger. Si a cada una de estas muestras se le calcula el
estadstico de inters, se tendrn igual nmero de resultados de este
estadstico, con ellos se puede obtener la distribucin muestral del
mismo
Dr. Pedro Vergara V.
Para explicar este concepto, se considera un universo de tamao
N=5, integrado por los elementos en kilos.
luego, , si se toman muestras de tamao 3,
{ }
, , , , P 25 26 27 28 29 =
u o = =
2
27kilos y 2kilos
5
5
10
3 2 3
| |
= =
|

\ .
!
! !
existen muestras distintas
Muestra Valores en la muestra Promedio de la muestra
1 25 26 27 26,000
2 25 26 28 26,333
3 25 26 29 26,667
4 25 27 28 26,667
5 25 27 29 27,000
6 25 28 29 27,333
7 26 27 28 27,000
8 26 27 29 27,333
9 26 28 29 27,667
10 27 28 29 28,000
Dr. Pedro Vergara V.
luego, la distribucin muestral de la media est dada
por:
Promedio de la muestra frecuencia Probabilidad de la media
26 1 0.10
26.333 1 0.10
26.667 2 0.20
27 2 0.20
27.333 2 0.20
27.667 1 0.10
28 1 0.10
se puede verificar que :
( ) . . . .
1 1 2 2 2 1 1
E x 26 26 333 26 667 27 27 333 27 667 28 27kg
10 10 10 10 10 10 10
u = + + + + + + = =
y
. . . . 26 26 333 26 667 2 27 27 333 2 27 667 28
y X 27kg
10
+ + + + + +
= =
Dr. Pedro Vergara V.
( )
m 2
i
i 1
x
X X
m
o
=

=

Error Muestral
Se conoce como error muestral de un estadstico a la
diferencia entre el valor calculado de ste y el parmetro
de la poblacin, para el ejemplo, como =27 se tiene:
Promedio de la muestra Error muestral
26 -1
26.333 -0.667
26.667 -0.333
27 0
27.333 0.333
27.667 0.667
28 1
Error tpico muestral
El error tpico de la distribucin muestral se define por:
m nmero de muestras, mide la variacin de las medias
muestral respecto a la media general. Para el ejemplo, el
error tpico muestral es 0.3333 kg.
Dr. Pedro Vergara V.
DISTRIBUCIN MUESTRAL DE LA MEDIA
Teorema central del lmite : Sean x
1
, x
2
,..., x
n
una
muestra aleatoria de tamao n, con distribucin de probabilidad no
especificada, que tiene media u y varianza finita o
2
.
El promedio muestral
tiene una distribucin con media u y varianza finita o
2
/n,
que tiende a una distribucin normal cuando n tiende a infinito, es
decir la variable aleatoria
n
x x x
x
n
__
+ + +
=
2 1
X ~ ( u , o
2
) ~ ( u , )
__
X
si n es grande, sin importar cual sea la distribucin de probabilidad a
partir de la cual se obtuvo la muestra.
) 1 , 0 ( N
n
x
~

o
u
n
2
o
Dr. Pedro Vergara V.
DISTRIBUCIN MUESTRAL DE p
Sea x una v.a con distribucin de Bernoulli de parmetro
p.
Se toma una muestra aleatoria de tamao n, se estima p,
por
n
x
p

n
i
i
=
=
1
N(0,1) ~
n
q p
p p

=
Dr. Pedro Vergara V.
DISTRIBUCIN MUESTRAL DE (n-1)S
2
/o
2
Si S
2
es la varianza de una muestra
aleatoria de tamao n tomada de una poblacin normal
que tiene varianza o
2
, entonces el estadstico
se distribuye ;
2
con v=n-1 grados de libertad, con
2
2
*
2
1
( 1)
~
n
n S
o
;

2
2
1
*
( )
1
n
i
x x
i
S
n
=

=

Dr. Pedro Vergara V.


La inferencia estadstica consiste en tomar una decisin respecto de
una o ms poblaciones tomando como referencia los datos
proporcionados por una muestra de ella. se deben buscar mtodos
para transferir los resultados de la muestra a la poblacin con el
mnimo de error y la mxima seguridad.
La inferencia estadstica se puede realizar mediante estimacin de
parmetros o por dcimas (pruebas de hiptesis)
Dr. Pedro Vergara V.
ESTIMACIN DE PARMETROS
A partir de una muestra aleatoria de tamao n de una poblacin, la
estimacin de una caracterstica de ella se puede realizar a travs de
Estimacin Puntual o mediante Estimacin por Intervalos de Confianza.
Estimacin Puntual
Un estimador puntual debe tener las siguientes propiedades :
1) Estimador Insesgado
Se dice que un estimador es insesgado si su esperanza matemtica es
igual al parmetro
Un estimador es insesgado, es equivalente a decir que su sesgo es nulo
INFERENCIA ESTADSTICA
u = u)

( E
Proposicin
Dada una muestra aleatoria x
1
, x
2
,...,x
n
proveniente de
una poblacin, la varianza de los x
i
definida por
1 n
) x x (
S
n
1 i
2
i
2
*

=
es un estimador insesgado de
| |
{ }
u u
u u u u
= = =
=
| | | | | |
= = =
| | |

\ . \ . \ .
| |
= +
|

\ .

n n n
2
2 2 2
* i i i
i 1 i 1 i 1
n
2 2
i 1
1 1 1
E( S ) E (x x) E (x x) E (x ) (x )
n 1 n 1 n 1
1
E (x ) 2(x )(x ) (x )
i i
n 1
u u u u
u u u u
u u
u u
o
o
o
= =
=
=
=
| |
= +
|

\ .
| |
= +
|

\ .
| |
=
|

\ .

=

n n
2 2
i 1 i 1
n
2 2
i 1
n
2 2
i 1
n
2 2
i 1
2
2
1
E (x ) 2(x ) (x ) n(x )
i i
n 1
1
E (x ) 2(x )n(x ) n(x )
i
n 1
1
E (x ) n(x )
i
n 1
1
E(x ) nE(x )
i
n 1
1
n n
n 1 n
2
Dr. Pedro Vergara V.
2) Estimador Consistente
Es razonable esperar que un buen estimador de un
parmetro sea cada vez mejor si el tamao de la muestra
aumenta.
0 = u u = u

)

( V lim , )

( E lim
n n
Dr. Pedro Vergara V.

( ) ( ) ( ) ( )
n n n
i i i
n n n n n
i 1 i 1 i 1
n n
1 1 1
lmE lmE x lmE x lm E x lm E x
n n n
1
lm n lm
n
0


= = =

| |
= = = =
|
\ .
= = =

( ) ( ) ( ) ( )
n n n
i i i
2 2
n n n n n
i 1 i 1 i 1
2
n n
1 1 1
lm V lm V x lm V x lm V x lm V x
n n n
1
lm n lm 0
n n
0


= = =

| |
= = = =
|
\ .
= = =

para el ejemplo de la distribucin de Poisson, se tiene :
3) Estimador Eficiente
Un estimador es eficiente si la varianza del estimador es la menor
posible
Dr. Pedro Vergara V.
Un estimador puntual es eficiente si la varianza del estimador es
la menor posible. Si E
1
y E
2
son dos estimadores insesgados con
varianzas V(E
1
) y V(E
2
), respectivamente, con V(E
1
) < V(E
2
), se
dice que el estimador E
1
es ms eficiente que E
2
.
Sea x
1
, x
2
, ..., x
n
una muestra aleatoria de tamao n. Se ha
probado que
y x
1
son estimadores insesgados de .
es ms eficiente que x
1
para estimar puesto que
x
x
x
Pero,
2
1
2
) x ( V
n
) x ( V o = <
o
=
Estimadores de Mxima Verosimilitud
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente
de una poblacin con funcin de densidad f( x , ). La funcin de
densidad conjunta o funcin de verosimilitud est dada por :
Dr. Pedro Vergara V.
1 2 n
L( ) f(x , ) f(x , ) f(x , ) u u u u =
Si se encuentra una funcin de x
1
, x
2
,...,x
n
, definida por g(x
1
,
x
2
,...,x
n
) tal que cuando es reemplazado por g(x
1
, x
2
,...,x
n
) la
funcin de verosimilitud es mxima. Entonces el estadstico
= g(x
1
, x
2
,...,x
n
) se llama Estimador Mximo Verosmil de
u

Ejemplo : Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de
tamao n proveniente de una poblacin con funcin de
Poisson de parmetro , luego la funcin de verosimilitud
est dada por
L f x f x f x
n
( ) ( , ) ( , ) ( , ) =
1 2
=




e
x
x
e
x
x
e
x
n
x
n

1
1
2
2
! ! !
Dr. Pedro Vergara V.
es decir,
n
i
i 1
x
n
n
i
i 1
e
L( )
x !

=
I
aplicando logartmo natural a esta expresin, se tiene :
| |
n
i
i 1
n
ln L( ) n x ln ln x !
i
i 1

=
| |
= +
| I
|
= \ .

derivando respecto de e igualando a cero se tiene:


n n
i i
i 1 i 1
x x

n 0 x
n

= =
+ = = =

por tanto, el estimador mximo verosmil de es x

=
.
A) Intervalo de Confianza para la media u de una poblacin normal
i) Cuando es conocida
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente de
una poblacin con distribucin donde es conocida,
luego
2
o
( )
2
o u, N
o
2
por tanto,
|
|
.
|

\
| o
u ~
n
, N x
2
) , ( N
n
x
z 1 0 ~
o
u
=
Definiendo el Nivel de Confianza por 1-o, y el percentil , se tiene:
z
o
2
( )% 1
2

o
z z
o o
2
1
2

o =
|
|
.
|

\
|
o
< u <
o
o =
|
|
.
|

\
|
<
o
u
<
o

o o

o
1 1
2
1
2 2
1
2
n
z x
n
z P z
n
x
z P

o
+
o

o

n
z x ;
n
z x
2
1
2
1
intervalo de confianza
para u del (1-o)%
2 2
1
o o

= z z
Dr. Pedro Vergara V.
En un municipio se desea estimar cual es el gasto promedio diario en
combustible, para limpiar las calles. Para ello, se selecciona una
muestra aleatoria de 20 das de un mes. Los gastos diarios fueron
:107361, 112055, 111362, 112756, 116055, 101562, 112304, 111795,
112656, 108011, 105062, 112395, 112307, 111976, 112757, 111361,
109422, 111806, 111307, 108100. Supngase que los gastos diarios
se distribuyen aproximadamente normal con desviacin estndar
$3200. Construir un intervalo de confianza estimado del 95% para el
valor promedio del gasto diario.
975 0
2
1 025 0
2
05 0 5 110620 . . . , x = = = =
o o
o
z
0.025
= -1.96 z
0.975
=1.96 z
0.025
= z
0.975
=1.96

+ < u <

o
+ < u <
o

o

20
3200
96 1 5 110620
20
3200
96 1 5 110620
2
1
2
1
. . . .
n
z x
n
z x
| | 96 112022 04 109218 . ; , c u
Dr. Pedro Vergara V.
025 0
2
. =
o
025 0
2
. =
o
ii) Cuando es desconocida
Sea x
1
,x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente de
una poblacin con distribucin
a) b) c)
( )
2
o u, N
) , ( N
n
x
1 0 ~
o
u
1
2
2
2
; ~
o
n
nS
v ;
=
v
2
1 0 ) , ( N
T
Donde son los grados de libertad de un distribucin 1 = n v ;
2
n 1
*
x
T t
S n
luego
El intervalo de confianza del 100(1- o )% para cuando es
desconocida est dado por :
u o
2
* *
(n 1),1 (n 1),1
2 2
S S
x t ; x t
n n
o o


+


o
2
Dr. Pedro Vergara V.
En un proceso de llenado de bolsas de azcar, se desea estimar el valor medio
por bolsa. Se toma una muestra aleatoria de 15 bolsas, obteniendo los
siguientes pesos en gramos: 22.5 , 28.2 , 29.5 , 22.2 , 24.8 , 25.4 , 23.7 , 22.5,
24.3 , 22.9 , 22.4 , 28.7 , 26.5 , 28.2 y 20.5. Si se supone que la cantidad de de
azcar que se envasa en cada bolsa se distribuye aproximadamente normal
Obtener un intervalo de confianza del 95% para el contenido medio real de
cada bolsa.
975 0
2
1 025 0
2
05 0 80718466 2 82 24 . . . . S . x
*
=
o
=
o
= o = =
t
0.025, 14
= -2.145 t
0.975, 14
= 2.145 t
0.025
= t
0.975

+ < <

15
80718466 . 2
145 . 2 82 . 24
n
S
t x
n
S
t x
*
2
1
*
2
1
o o
u
| | 3747 . 26 ; 2652 . 23 c u
Dr. Pedro Vergara V.
B) Intervalo de Confianza para una proporcin
Para construir un intervalo de confianza para el parmetro p desconocido de
una distribucin binomial con n conocido, se considera una muestra aleatoria
x
1
, x
2
,...,x
n
, donde:
Sea el estimador puntual, luego
por tanto
el intervalo aproximadamente del (1- o)% para una muestra grande est dado
por :

=
=
p q ad probabilid con
p ad probabilid con
x
i
1 0
1

p x
n
x
i
i
n
= =
=

1
1
n
) p ( p
) x ( V ) p ( V , p ) x ( E ) p ( E

= = = =
1
) , ( N
n
) p ( p
p p
1 0
1
~

1 1
2 2

p(1 p) p(1 p)

P Z ; P Z
n n
o o



+



Dr. Pedro Vergara V.
Se recibe un gran cargamento de radio transmisores y se sabe que
algunos son defectuosos. Se selecciona una muestra aleatoria de
tamao 1000 de este envo, y se realiza una prueba de
funcionamiento, encontrndose que 5 de ellos eran defectuosos.
Determine un intervalo de confianza aproximado del 95% para la
proporcin de radio transmisores que funcionan correctamente.
975 0
2
1 025 0
2
05 0 995 0 005 0
1000
5
. . . . p , q =
o
=
o
= o = = =
z
0.025
= -1.96 z
0.975
=1.96 z
0.025
= z
0.975
=1.96
2 2

p(1 p) p(1 p)

P Z ; P Z
n n
o o


+



1000
005 0 995 0
96 1 995 0
1000
005 0 995 0
96 1 995 0
, ,
, , ;
, ,
, ,
| | 99937 0 99063 0 , ; ,
La proporcin est entre con una certeza del
95%
Dr. Pedro Vergara V.
C) Intevalo de confianza para o
2
Para u desconocida
Sea x
1
, x
2
,...,x
n
es una muestra aleatoria de tamao n proveniente
de una poblacin con distribucin ,
si u es desconocida se sabe que :
( )
2
o u, N
) n (
nS
1
2
2
2

; ~
o
2 ,
) (
) 1 (
2
2
1
2
> ~

n
x x
n
n
i
i
;
o

luego, el intervalo de confianza del (1-o)% para est dado por


o
o
2
n n
2 2
i i
i 1 i 1
2 2
(n 1) , 1 (n 1) ,
2 2
(x x) (x x)
;
= =
o o





; ;




2 2
* *
2 2
(n 1) , 1 (n 1) ,
2 2
(n 1)S (n 1)S
;
o o





; ;


bien
Dr. Pedro Vergara V.
Para el problema de envasado de bolsas de azcar, determine
el intervalo de confianza del 95% para o
2
975 . 0
2
1 025 . 0
2
05 . 0 80718466 . 2 82 . 24
*
= = = = =
o o
o S x

;

;

o

o

2
1
2
2
2
1 1
2
2
1 1
, ) n (
*
, ) n (
* S ) n (
;
S ) n (
324 . 110 ) 1 ( 880285715 . 7 *
2
*
2
= = S n S

13 26 975 0 14
2
. . , = ; 62 5 025 0 14
2
. . , = ;
| | 6306 . 19 ; 2221 . 4
62 . 5
324 . 110
;
13 . 26
324 . 110
=

| | 6306 . 19 ; 2221 . 4
2
e o
| | 430643 . 4 ; 05477 . 2 e o
Dr. Pedro Vergara V.
PRUEBAS DE BONDAD DE AJUSTE
Se utilizan para determinar si una poblacin tiene una
distribucin terica especfica. La prueba se basa en que tan
buen ajuste se tiene entre la frecuencia de ocurrencia de las
observaciones en una muestra, y las frecuencias esperadas que
se obtienen de la distribucin hipottica. Considere una muestra
aleatoria de tamao n, dividida en k clases exhautivas y
mutuamente excluyentes, sea O
i
, i=1,2,...,k el valor observado
en la muestra para la clase i ; sea E
i
, i=1,2,...,k, el valor
esperado de la distribucin hipottica para la clase i.
El estadstico de la prueba est dado por la expresin :
( ) 1
2
1
2
2

=
; ~

= ;

k
k
i
i
i i
E
) E O (
cal
Dr. Pedro Vergara V.
Ejemplo :
Se desea determinar si el nmero de accidentes fatales
se encuentra distribuido de igual forma para el color de los
automviles involucrados en los accidentes. Para ello, se tom
una muestra aleatoria de 700 accidentes automovilsticos en los
cuales ocurri por lo menos una muerte y se consign el color del
automvil involucrado, obteniendo la siguiente informacin :
Blanco Azul Burdeo Negro Plomo Amarillo Violeta
43 120 125 156 135 54 67
Para un nivel de significacin del 1%, existe evidencia para
afirmar que la distribucin de accidentes segn el color del
automvil es la misma?
Como el total de accidentes es 700, y si se supone que la
distribucin es uniforme, el nmero de accidentes debiera ser el
mismo independiente del color del automvil, por ello, el valor
esperado sera E
i
=100
Dr. Pedro Vergara V.
H
0
: La distribucin de accidentes segn el color es la misma, es decir, la
distribucin de accidentes es uniforme segn el color del automvil
H
1
: La distribucin de los accidentes segn el color del automvil no es
la misma
Blanco Azul Burdeo Negro Plomo Amarillo Violeta
O
i
73 106 110 123 122 79 87
E
i
100 100 100 100 100 100 100
El estadstico a calcular para efectuar esta prueba est dado por :
)
k
(
cal
k
i
i
i i
E
) E O (
1
2
1
2
2

; ~

= ;

=
si las frecuencias observadas son prximas a las correspondientes frecuencias
esperadas, el valor del estadstico ser pequeo, lo que indica un buen ajuste,
de lo contrario si las frecuencias observadas difieren considerablemente de las
frecuencias esperadas, el valor ser grande, y por tanto, no habr un buen
ajuste, el valor calculado caer en la regin de rechazo de H
0
. Para este tipo de
dcima, la hiptesis alternativa es unilateral, la regin crtica se ubicar en la
cola derecha de la distribucin, luego si > se rechaza H
0
;
2
cal
1
2
o ; k ,
Dr. Pedro Vergara V.
81 16
6 99 0
2 2
.
, . crit
= ; = ;
Regin de rechazo de H
0
81 16 88 24
6 99 0
2 2
. .
, . cal
= ; > = ;
como
se rechaza H
0
, es decir, existe evidencia estadstica para afirmar que la
distribucin de los accidentes con causa de muerte dependen del color del
vehculo
o = 0.01
Dr. Pedro Vergara V.
Prueba para una distribucin normal
Si se quiere realizar una prueba de hiptesis para verificar si una
variable aleatoria X tiene distribucin normal, se definen:
H
0
: la variable aleatoria X tiene distribucin normal
H
1
: la variable aleatoria X no tiene distribucin normal
Para realizar esta dcima de bondad de ajuste, se estimarn los
parmetros y
2
de la distribucin normal, mediante los estadsticos x
y S
2
de una muestra aleatoria, agrupando las observaciones continuas en
un nmero k de intervalos, se rechazara Ho si los valores esperados si
fuesen muy diferentes a los valores observados en cada intervalo.
Intervalo O
i
p
i
E
i
= np
i
- y`
1
O
1
p
1
=P(x y`
1
) E
1
= np
1
y`
1
y`
2
O
2
p
2
=P(y`
1
x y`
2
) E
2
= np
2
y`
2
y`
3
O
3
p
2
=P(y`
2
x y`
3
) E
3
= np
3
. . . .
y
k-1
+ O
k
p
2
=P(y`
k-1
x) E
k
= np
k
Total n 1 n
2
;
2
;
Si el valor calculado es mayor al valor
y se puede afirmar que la variable X no tiene distribucin
normal.
crtico, se rechaza H
0
Dr. Pedro Vergara V.
Ejemplo. En una empresa se aplic un test a 100 trabajadores, con
una escala de puntajes de 0 a 100 puntos. Verificar si los puntajes
obtenidos tienen distribucin normal.
24 76 80 84 88 31 52 83 37 74
52 81 72 63 75 67 87 62 59 34
39 83 94 39 55 54 92 58 56 69
65 96 101 58 103 60 69 88 104 51
57 73 48 64 67 43 46 43 40 45
67 33 26 89 32 53 84 55 65 45
75 68 61 76 68 88 63 66 90 84
77 50 72 42 68 68 102 61 77 97
86 44 47 89 59 74 55 93 43 74
55 44 66 61 70 55 82 88 90 34
Los estimadores puntuales de los parmetros de la distribucin normal
obtenidos a partir de esta muestra son
x = 65.52 puntos y = 19.2928 puntos.
Dr. Pedro Vergara V.
Para construir la tabla de distribucin de frecuencias, se tiene que el
puntaje mnimo es 24 y el mximo es 104, luego, el recorrido
R= x
mx
x
min
= 104 - 24 = 80
El nmero k de intervalos, conocido el tamao de la muestra N, se
puede determinar a travs de la frmula de Sturgess:
k 1 3.32 log(N) = +
es decir, k = 1 + 3.32 log(100) = 7.64, que aproximado al entero superior
es 8, la amplitud del intervalo est dada por A = R/k = 80/8 = 10
0 20 40 60 80 100 120
0
4
8
12
16
20
f
r
e
q
u
e
n
c
y
Puntaje f
i
24 - 34 6
34 - 44 10
44 - 54 11
54 - 64 19
64 - 74 20
74 - 84 14
84 - 94 13
94 -104 6
Total 100
Dr. Pedro Vergara V.
la distribucin de frecuencia muestra que los puntajes podran tener una
distribucin aproximadamente normal. Las hiptesis sern:
H
0
: X se distribuye normal con = 65.52 puntos y
2
= (19.2928)
2
(puntos)2
H
1
: X no se distribuye normal con = 65.52 puntos y
2
= (19.2928)
2
(puntos)
2
2 2
0.95, 7
14.073 ; ; = =
crit
1 0.95 o =
0.05 o =
i LI LS O
i
z
i
P(X<x)
Probabilidad
del Intervalo E
i
=np
i
(O
i
-E
i
)
2
/E
i
1 34 7 -1,6338 0,05115 0,05115 5,12 0,694
2 34 44 10 -1,1154 0,13234 0,08118 8,12 0,436
3 44 54 11 -0,5971 0,27522 0,14289 14,29 0,757
4 54 64 19 -0,0788 0,46859 0,19339 19,34 0,006
5 64 74 20 0,4395 0,66985 0,20126 20,13 0,001
6 74 84 14 0,9579 0,83094 0,16107 16,11 0,276
7 84 + 13 1,4762 0,93006 0,09912 9,91 0,962
8 94 104 6 1,9945 0,97695 0,06995 6,99 0,141
Total 100 1 100 3,274
Dr. Pedro Vergara V.
2
;
2
;
El valor calculado = 3,274 es menor que el valor
por tanto, no existe evidencia estadsticamente significativa para
rechazar H
0
, es decir, se acepta que los datos provienen de una
distribucin normal con = 65.52 puntos y = 19.2928 puntos.
crtico = 14.073
) c ( ) f (
cal
f
i
ij
ij ij
c
j
E
) E O (
1 1
2
1
2
1
2

; ~

= ;

= =
n
n x n
E
j i
ij
- -
=
con
DCIMAS ;
2
PARAANLISIS DE TABLAS DE ASOCIACIN
Esta prueba permite determinar si existe alguna relacin entre dos
caractersticas diferentes de una poblacin, en que cada una de ellas ha
sido dividida en un cierto nmero de categoras. Para realizar esta
dcima se supone que las dos clasificaciones son independientes, y se
utiliza el estadstico :
Dr. Pedro Vergara V.
Ejemplo :
En un estudio de preferencias por una marcas se tom una
muestra aleatoria en 300 personas, se clasific la informacin de
acuerdo con el tipo de marca y regin en donde vive el encuestad,
obteniendo la siguiente informacin :
Para un nivel de significacin del 5%, existe asociacin entre el tipo de marca que se elige
y la regin donde vive el encuestado?
H
0
: No hay asociacin entre el tipo de marca que se elige y regin
H
1
: Existe asociacin entre el tipo de marca que se elije y la regin
como 99 5 681 2
133 54
133 54 60
8 38
8 38 42
2 05 0
2
2 2
2
. .
.
) . (
...
.
) . (
, . cal
= ; < =

+ +

= ;
no existe evidencia estadsticamente significativa para rechazar H
0
Regin Regin I Regin II Regin III Total
Marca O
i
E
i
O
i
E
i
O
i
E
i
A 42 38.80 35 32.333 20 25.866 97
B 78 81.20 65 67.666 60 54.133 203
Total 120 100 80 300
Dr. Pedro Vergara V.
Ejercicio.- Se realiza un estudio para determinar si existe asociacin
entre el hbito de fumar respecto de morir por cncer en las vas
respiratorias, para ello, se toma una muestra aleatoria de 650
personas, obteniendo la siguiente informacin
Con causa
de muerte
Sin causa
de muerte
Total
Fumadores 250 50 300
No fumadores 60 220 280
Total 310 270 580
Para un nivel de significacin del 5%, qu puede concluir?
Dr. Pedro Vergara V.
MODELOS DE REGRESIN LINEAL
Grficos de correlacin
Permiten obtener una impresin visual del grado de dependencia lineal
existente entre dos variables
Tiempo(x) Crecimiento(y)
1,8 9,5
2,5 11,2
3,2 12,7
3,9 14,5
4,6 16,1
5,3 17,9
6 19,7
6,7 21,2
7,6 23,4
8,1 24,7
Dr. Pedro Vergara V.
El coeficiente de correlacin permite determinar el grado de asociacin
lineal existente entre dos variables cuantitativas


= =
=


=
n
i
i
n
i
i
n
i
i i
xy
y n y x n x
y x n y x
r
1
2 2
1
2 2
1
( ) ( )
99988 0
09 17 10 03 3162 97 4 10 45 288
09 17 97 4 10 37 949
2 2
,
, , , ,
, , .
r
xy
=


=
Caractersticas
1) -1s r
xy
s 1
2) Valores prximos a cero indican que no existe asociacin lineal entre las variables
3) Valores prximos a uno o menos uno indican que existe asociacin lineal entre las
variables
Coeficiente de
variacin
9997656 0
2
, r xy =
x y x*y x*x y*y
1,8 9,5 17,1 3,24 90,25
2,5 11,2 28 6,25 125,44
3,2 12,7 40,64 10,24 161,29
3,9 14,5 56,55 15,21 210,25
4,6 16,1 74,06 21,16 259,21
5,3 17,9 94,87 28,09 320,41
6 19,7 118,2 36 388,09
6,7 21,2 142,04 44,89 449,44
7,6 23,4 177,84 57,76 547,56
8,1 24,7 200,07 65,61 610,09
49,7 170,9 949,37 288,45 3162,03
09 17 97 4 . y , . x = =
Dr. Pedro Vergara V.
Regresin lineal
Introduccin
El nombre genrico de modelos de regresin, proviene de los
trabajos de Galton en biologa a finales del siglo XIX. Galton estudi
la dependencia de la estatura de los hijos (y) respecto a la de sus
padres (x), encontrando lo que denomin una regresin a la media :
los padres altos tienen, en general, hijos altos, pero, en promedio, no
tan altos como sus padres; los padres bajos tienen hijos bajos, pero,
en promedio, ms altos que sus padres. Desde entonces, los
modelos estadsticos que explican la dependencia de una variable y
respecto de una o varias variables cuantitativas x se denominan
modelos de regresin Daniel Pea 1989.
Segn Daniel Pea, 1989, se debe admitir que todos los factores o
causas que influyen en una variables respuesta (y) pueden dividirse
en dos grupos : el primero contiene una variable (x), conocida al
observar (y), que tiene una influencia lineal en la respuesta; el
segundo incluye un conjunto muy grande de factores, cada uno de
los cuales influye en la respuesta slo en una pequea magnitud,
que se engloba dentro del nombre comn de error aleatorio.
Dr. Pedro Vergara V.
i i i
e x y + | + | =
1 0
La hiptesis bsica del modelo
donde y
i
y e
i
son variables aleatorias, bajo los siguientes supuestos
1. Los errores tiene esperanza cero
2. La varianza de los errores es constante
3. Los errores tiene distribucin normal
4. Los errores e
i
son independientes entre s
| | 0 =
i
e E
c
2
i
) e ( Var o =
) , ( N ~ e
i
2
0 o
j i ) e , e ( E
j i
= = 0
Dr. Pedro Vergara V.
5. La variable respuesta se distribuye normal ) , ( N ~ y
i
2
o u
Test de Normalidad
5.3, 4.6, 1.8, 6.7, 2.5, 3.2, 8.1, 3.9, 7.6, 6.0
valores i Pi
1,8 1 0,05
2,5 2 0,15
3,2 3 0,25
3,9 4 0,35
4,6 5 0,45
5,3 6 0,55
6 7 0,65
6,7 8 0,75
7,6 9 0,85
8,1 10 0,95
datos de numero k ,
k
. i
p
i
5 0
=
120 130 140 150 160 170
valores
Normal Probability Plot
0.1
1
5
20
50
80
95
99
99.9
c
u
m
u
l
a
t
i
v
e

p
e
r
c
e
n
t
Frmula Yates con correccin de continuidad
10
5 0. i
p
i

=
Dr. Pedro Vergara V.
1.8
Model fitting results for: Peso
--------------------------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
--------------------------------------------------------------------------------------------------
Constant 5.097406 0.07015 72.6641 0.0000
Tiempo 2.412997 0.013062 184.7406 0.0000
--------------------------------------------------------------------------------------------------
R-SQ. (ADJ.) = 0.9997 SE= 0.084083 MAE= 0.064989
10 observations fitted, forecast(s) computed for 0 missing val. of dep. var.
Tiempo * 412997 . 2 097406 . 5 o Crecimient + =
Analysis of Variance for the Full Regression
--------------------------------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
--------------------------------------------------------------------------------------------------------
Model 241.292 1 241.292 34129.1 0.0000
Error 0.0565599 8 0.00706999
-------------------------------------------------------------------------------------------------------
Total (Corr.) 241.349 9
R-squared = 0.999766
Dr. Pedro Vergara V.
Crecimiento Fitted Standardized
Number Tiempo Observed Values Residual Residual
1 1,8 9,5 9,4408 0,00592 0.85341
2 2,5 11,2 11,1299 0,0701 0.95570
3 3,2 12,7 12,819 -0,119 -1,74724
4 3,9 14,5 14,5081 -0,00809 -0.09646
5 4,6 16,1 16,1972 -0,09719 -1,26577
6 5,3 17,9 17,8863 0,01371 0.16132
7 6 19,7 19,5754 0,12461 1,78994
8 6,7 21,2 21,2645 -0,06448 -0.82602
9 7,6 23,4 23,4362 -0,03618 -0.47772
10 8,1 24,7 24,6427 0,05732 0.81949

9 13 17 21 25
Predicted
-0.12
-0.07
-0.02
0.03
0.08
0.13
R
e
s
i
d
u
a
l
s
Residual Plot for Peso
-0.12 -0.07 -0.02 0.03 0.08 0.13
Residuals
Normal Probability Plot
0.1
1
5
20
50
80
95
99
99.9
c
u
m
u
l
a
t
i
v
e

p
e
r
c
e
n
t
0 2 4 6 8 10
Edad
9
13
17
21
25
P
e
s
o
Plot of Peso vs Edad
Tiempo * 412997 . 2 097406 . 5 o Crecimient + =
Dr. Pedro Vergara V.
Tiempo
C
r
e
c
i
m
i
e
n
t
o
Linealizacin de modelos
En muchas situaciones experimentales no se conoce el tipo de
modelo que es posible ajustar para relacionar una variable
dependiente con una independiente, slo se dispone de un pequeo
nmero de pares ordenados correspondientes a los resultados del
estudio, que al graficarlos muestran una nube de puntos y se quiere
ajustar un modelo por lo que se necesita obtener los parmetros que
lo determinan, a continuacin se analizan distintos tipos de modelos
y el procedimiento que permite estimar sus parmetros.
Modelo exponencial
Un modelo exponencial es de la forma
=
bx
y a e
Dr. Pedro Vergara V.
Dr. Pedro Vergara V.
= + ln ln y a bx
| | = +
0 1
Y X
se aplica logartmo natural a esta expresin obteniendo
designado por Y a ln y, por
0
= ln a, por
1
=b y X=x, se tiene un modelo
lineal de la forma
que es la ecuacin de una recta en un sistema semilogartmico. Para
obtener los valores estimados de
0
y
1
se utiliza el mtodo de
mnimos cuadrados, donde
=
bx
y a e

1
= m = b y a = antilogaritmo(
0
)
Se puede afirmar que si el coeficiente de correlacin lineal de estos
puntos dibujados en este sistema semilogartmico, en valor absoluto
es prximo a 1, se debera ajustar un modelo exponencial a los
datos obtenidos.
Dr. Pedro Vergara V.
Ejemplo: Se intenta obtener la ecuacin que permita estimar a la
carga que tiene un condensador de un radiotransmisor operando en
forma continua, en un instante dado, para ello, se midi el voltaje
del condensador cada 15 minutos obteniendo:
Tiempo 1 2 3 4 5 6 7 8 9
Voltaje 7,08 5,35 4,26 3,19 2,53 1,98 1,62 1,21 1,00
en la figura, se aprecia que podra existir un modelo exponencial que
ajuste estos valores, luego se aplica logartmo natural a los valores
de voltaje, obteniendo:
Dr. Pedro Vergara V.
0.2449856

8.780084
x
y e

=
Tiempo 1 2 3 4 5 6 7 8 9
ln Voltaje 1,96 1,68 1,45 1,16 0,93 0,68 0,48 0,19 0,00
el coeficiente de correlacin lineal de los datos en
este sistema semilogartmico es r
xy
=-0.999305, por
tanto, la variacin explicada por el modelo es de
un 99.86%, el modelo que permite estimar la carga
en cada instante de tiempo est dado por:
Tiempo 1 2 3 4 5 6 7 8 9
Voltaje 7,08 5,35 4,26 3,19 2,53 1,98 1,62 1,21 1,00
Voltaje estimado 6,87 5,38 4,21 3,30 2,58 2,02 1,58 1,24 0,97
e
i
0,21 -0,03 0,05 -0,11 -0,05 -0,04 0,04 -0,03 0,03
aplicando mnimos cuadrado se obtiene:

1
=m=b=-0.2449856 a = antilogaritmo(2.17248599)=8.780084
Dr. Pedro Vergara V.
Modelo Potencial
Dado un modelo potencial de la forma
b
y a x =
Dr. Pedro Vergara V.
b
y a x =
ln ln ln y a b x = +
| | = +
0 1
Y X
Para obtener los parmetros a y b del modelo
se aplica logartmo natural a esta expresin obteniendo
designado por Y a ln y, por
0
= ln a, por
1
=b y X = ln x, se tiene un
modelo lineal de la forma
que es la ecuacin de una recta en un sistema bilogartmico. Para
obtener los valores estimados de
0
y
1
se utiliza el mtodo de
mnimos cuadrados, donde

1
= m = b y a = antilogaritmo(
0
)
Se puede afirmar que si el coeficiente de correlacin lineal de estos
puntos dibujados en este sistema bilogartmico, en valor absoluto es
prximo a 1, se debera ajustar un modelo potencial a los datos
obtenidos. Dr. Pedro Vergara V.
Ejemplo. Se obtienen los valores del aumento de la presin de una
caldera a medida que aumenta la temperatura
Temperatura 0,1 0,5 0,9 1 1,25 2 2,3 2,8 3,2
Presin 0,58 1,63 2,34 2,5 2,86 3,84 4,15 4,6 5,21
en el grfico de correlaciones se puede apreciar que existe una curvatura
que podra suponer la existencia de un modelo potencial.
ln(Temperatura) -2,3026 -0,6931 -0,1054 0,0000 0,2231 0,6931 0,8329 1,0296 1,1632
ln(presin) 0,6259 0,8329 0,9002 0,9163 0,9478 1,0043 1,0152 1,0473 1,0647

1
= m =0.125744135 = b y a = antilogaritmo(0.916546185) = 2.5006
aplicando logartmo natural a la tabla de observaciones medidas se tiene:
Dr. Pedro Vergara V.
el coeficiente de correlacin lineal de los datos en este sistema
bilogartmico es r
xy
=0.999743553, por tanto, la variacin explicada por
el modelo es de un 99.95%.
El modelo de la presin en funcin de la temperatura est dado
por: 0.125744135

2.5006 y x =
Temperatura 0,1 0,5 0,9 1 1,25 2 2,3 2,8 3,2
Presin 0,58 1,63 2,34 2,5 2,86 3,84 4,15 4,6 5,21
Presin estimada 1,8720 2,2919 2,4677 2,5006 2,5718 2,7283 2,7767 2,8462 2,8944
e
i
-0,0020 0,0081 -0,0077 -0,0006 0,0082 0,0017 -0,0167 0,0038 0,0056
Dr. Pedro Vergara V.
Modelo Hiperblico
ax
y
bx c
=
+
Considerando a, b y c positivos, la curva tiene la siguiente forma:
para linealizar este modelo, se
requiere toma el recproco de
la expresin
1 1 1 ax bx c b c
y
bx c y ax y a a x
+
= = = +
+
que es una recta en un sistema 1/x versus 1/y.
Luego
0 1
b
=
a
c
y
a
| | =
determinados
0
y
1
basta fijar a en 1 y obtener los valores de b y c.
Para un modelo hiperblico de la forma
Dr. Pedro Vergara V.
Ejemplo. En un proceso de reaccin qumica, la velocidad de
reaccin est dada en funcin de la concentracin de sustrato que
intervenga. En la tabla de muestran diferentes velocidades de
reaccin en funcin de las concentraciones que se ocupen.
Concentracin 0,2 0,8 1,2 1,6 2,5 3,1 3,5
Velocidad 0,48 1,075 1,235 1,34 1,458 1,505 1,53
Concentracin 4,2 5,1 6,3 7,2 8,6 10
Velocidad 1,56 1,589 1,613 1,634 1,651 1,665
Dr. Pedro Vergara V.
Los valores de los recprocos se muestran en la tabla:
Rec(Concentracin) 5 1,25 0,833 0,625 0,4 0,323 0,286
Rec(Velocidad) 2,083 0,93 0,81 0,746 0,686 0,664 0,654
Rec(Concentracin) 0,238 0,196 0,159 0,139 0,116 0,1
Rec(Velocidad) 0,641 0,629 0,62 0,612 0,606 0,601
la grfica de estos recprocos esta dada por:
Dr. Pedro Vergara V.
0 1
b
= 0,56610657 0,302408524
a
c
y
a
| | = = =

0.55610657 0.302408524
i
x
y
x
=
+
si a=1, b=0.56610657 y c=0.302408524, luego el modelo es
el coeficiente de correlacin r
xy
=0,999874212, luego la variacin
explicada por el modelo es de un 99.97%.
Concentracin 0,2 0,8 1,2 1,6 2,5 3,1 3,5
Velocidad 0,480 1,075 1,235 1,340 1,458 1,505 1,530
Velocidad
estimada
0,484 1,071 1,237 1,342 1,477 1,530 1,556
e
i
-0,004 0,004 -0,002 -0,002 -0,019 -0,025 -0,026
Concentracin 4,2 5,1 6,3 7,2 8,6 10
Velocidad 1,560 1,589 1,613 1,634 1,651 1,665
Velocidad
estimada
1,592 1,625 1,655 1,672 1,691 1,705
e
i
-0,032 -0,036 -0,042 -0,038 -0,040 -0,040
Dr. Pedro Vergara V.
MTODOS MULTIVARIADOS
Regresin mltiple
Introduccin
El modelo de regresin de regresin mltiple es la extensin para n
variables explicativas del modelo de regresin lineal simple. En
general, una variable respuesta y, depende de muchas otras variables
x
1
, ..., x
n
, aunque algunas de stas pueden ser no observables o,
incluso, desconocidas para el investigador. El modelo de regresin
pretende medir el efecto de las ms importantes, y representa el de
las restantes mediante una variable aleatoria que se denomina error
del modelo. Es decir:
y = f(X
1
, ... ,X
k
) + e(X
k+1
, ... , X
n
)
Suponiendo que, en el rango de valores de inters, la funcin
f(X
1
, ... ,X
k
) admite una aproximacin lineal, con lo que resulta el
modelo de regresin mltiple:
c + | + + | + | + | + | =
k k
X . . . . X X X X y
2 1 12 2 2 1 1 0
Dr. Pedro Vergara V.
Considerando algunos ejemplos :
1) tratar de determinar como influye sobre el rendimiento de un
alumno, la cantidad de horas que estudia, el nmero de horas que
asiste a clases, el nmero de ejercicios que resuelve, etc.;
2) explicar la remuneracin de los cargos directivos de las empresas
chilenas en funcin de las caractersticas del individuo que lo ocupa
(edad, titulo, aos de experiencia, cursos de capacitacin, etc.), del
puesto analizado (nmero de personas que de l dependen, nivel
jerrquico, etc.), y de la empresa (sector tamao, beneficios, etc.)
3) se estudia la calidad de un servicio en funcin del tiempo de
espera en una fila, del tiempo de atencin, del nmero de
certificados exigidos, etc.
Para construir un modelo de regresin mltiple, primero se debe
establecer un conjunto de hiptesis respecto a la distribucin del
error, como la relacin entre la variable dependiente y las
independientes; segundo, tomar una muestra para estimar los
parmetros del modelo, construyendo intervalos de confianza para
describir la incertidumbre presente en su estimacin; tercero, se
debe contrastar la validez de las hiptesis.
Dr. Pedro Vergara V.
Modelo general de regresin
Hiptesis bsicas : Sean X
1
, . . . , X
k
, variables matemticas, e y una
variable aleatoria. Las variables X se llaman variables explicativas,
independientes, o regresores; la variable y, se conoce como variable
explicada, respuesta, o dependiente. Una observacin cualquiera
puede escribirse por :
i k k
X . . . . X X X X y c + | + + | + | + | + | =
2 1 12 2 2 1 1 0
donde cada coeficiente |
i
mide el efecto marginal sobre la respuesta de
un aumento unitario en X
i
cuando todas las otras variables permanecen
constantes; c
i
es el error aleatorio.
Para el error se deben suponer las siguientes hiptesis :
(a) la media de los errores debe ser cero;
(b) la varianza de los errores debe ser constante;
(c) los errores deben ser independientes entre si;
(d) los errores deben tener distribucin normal.
Dr. Pedro Vergara V.
se debe exigir que las variables explicativas son realmente
distintas, para evitar ambigedades:
(e) ninguna de las variables explicativas es una combinacin
lineal exacta de las dems. (Las variables X
i
son linealmente
independientes).
Las hiptesis respecto de los errores pueden escribirse en trminos de la
variable respuesta por :
(a) para cada conjunto fijo de valores de las X, la distribucin de y tiene
media:
| |
k k n
X . . . . X X X , ... , X / y E | + + | + | + | =
2 2 1 1 0 1
(b) la varianza de y es constante y no depende de los valores de las X:
| |
2
1
o =
n
X , ... , X / y Var
Dr. Pedro Vergara V.
(c) las variables X
i
son independientes entre s;
(d) la variable respuesta se distribuye normal.
Clculo de los estimadores
La distribucin de la variable aleatoria y es, por hiptesis, normal,
por lo que el mtodo de mxima verosimilitud equivale a mnimos
cuadrados. La funcin a minimizar es:

| | | = =
2
1 1 0
2
) X . . . . X y ( e Q
ki k i i i
derivando respecto a |
0
, los estimadores deben verificar:
y llamando a los residuos del modelo, la ecuacin
anterior es:

= | | | 0
1 1 0
) X

. . . . X

y (
ki k i i
i i i
y

y e =

= 0
i
e
derivando respecto a |
j
, se obtiene:

= = k ,..., j X e
ji i
1 0
k
k k k k
k k
k k
X

... X X

yX
.
.
X X

... X

yX
X

... X

n y
2
1 1 0
1
1
2
1 1 0 1
1 1 0
| + + | + | =
| + + | + | =
| + + | + | =
y se obtiene el sistema de ecuaciones
Dr. Pedro Vergara V.
matricialmente:
|
|
|
|
|
|
.
|

\
|

|
|
|
|
|
|
|
|
|
.
|

\
|

|
|
|
|
|
|
.
|

\
|
=
|
|
|
|
|
|
|
|
|
.
|

\
|

|
|
|
|
|
|
.
|

\
|
k
kn n
k
k
kn k
n
n
kn k
n
x x
x x
x x
x x
x x
y
y
x x
x x
|
|

.
..
.

... 1
.
.
.
.
.
.
.
.
... 1
... 1
...
.
.
.
.
.
.
...
1 ... 1
.
.
.
.
.
...
.
.
.
.
.
.
...
1 ... 1
0
1
2 12
1 11
1
1 11
1
1
1 11
|
|
|
|
|
|
|
.
|

\
|
|
|
|
= = |

k
T T
.
.
.
Y X ) X X (

1
0
1
Dr. Pedro Vergara V.
Se desea estimar la contaminacin (y) de un terreno, dependiendo
de las variables : ndice de radiacin solar, X
1
, cantidad de agua
lluvia cada en el mes, X
2
, y la porosidad de la tierra, X
3
.
Y X1 X2 X3
31,1 0,43 3,82 0,28
35,6 0,47 5,13 0,32
31,4 0,44 3,98 0,29
37,8 0,48 6,25 0,3
40,2 0,5 7,12 0,25
42,5 0,49 8,52 0,15
47,2 0,68 9,01 0,1
43,6 0,5 8,61 0,16
46,5 0,65 8,71 0,19
43,8 0,51 8,72 0,18
43,7 0,49 8,63 0,17
Dr. Pedro Vergara V.
Model fitting results for: REGREM1.SL

Independent variable coefficient std. error t-value sig.level

CONSTANT 11.762426 1.49242 7.8814 0.0001


REGREM1.SG 17.949181 1.671762 10.7367 0.0000
REGREM1.LOBS 2.498587 0.102533 24.3685 0.0000
REGREM1.PGC 6.962695 2.787357 2.4980 0.0411

R-SQ. (ADJ.) = 0.9970 SE= 0.308689 MAE= 0.206660 DurbWat= 1.721


Previously: 0.0000 0.000000 0.000000 0.000
11 observations fitted, forecast(s) computed for 0 missing val. of dep. var.
Analysis of Variance for the Full Regression

Source Sum of Squares DF Mean Square F-Ratio P-value

Model 317.122 3 105.707 1109.34 0.0000


Error 0.667022 7 0.0952889

Total (Corr.) 317.789 10


R-squared = 0.997901 Stnd. error of est. = 0.308689
R-squared (Adj. for d.f.) = 0.997002
1 2 3
Y 11.762426 17.949181X 2.498587X 6.962695X = + + +
Promedio
X
1
X
2
X
3
Dr. Pedro Vergara V.
30 33 36 39 42 45 48
Predicted
-0.39
-0.19
0.01
0.21
0.41
R
e
s
i
d
u
a
l
s
Residual Plot for REGREM1.SL
Dr. Pedro Vergara V.
Residual Plots for RegreM1
-0.39 -0.19 0.01 0.21 0.41
Residuals
Normal Probability Plot
0.1
1
5
20
50
80
95
99
99.9
c
u
m
u
l
a
t
i
v
e

p
e
r
c
e
n
t
Dr. Pedro Vergara V.
Distancia de Mahalanobis
donde V es la matriz de varianzas y covarianzas de X
Dr. Pedro Vergara V.
La distancia de Mahalanobis es una distancia estadstica que generaliza
la distancia eucldea entre dos vectores, en la que se tiene en cuenta la
dispersin de las variables y su dependencia.
Un valor alto de la distancia de Mahalanobis indica que el punto se aleja
del centro de la nube y, por tanto, es una posible observacin influyente
a priori.
La distancia de Mahalanobis se distribuye
2
p
siendo p el nmero de
variables. Si el valor calculado DM
i
es mayor que el valor crtico para un
determinado nivel de significacin, el punto i es influyente.
2 / 1
i
1
i
T
i
) X X
~
( V ) X X
~
( DM =

Si el valor de Leverage valor absoluto es superior a
si n>30 si n<30
n
p
2
El sistema determina como valores anmalos cuando el residuo estandarizado
es superior a tres en valor absoluto,
o si el valor de DFFITS es superior a , influencia a posteriori
n
p 2
n
p 3
DFFITS es una observacin que tiene el impacto sustancial sobre el
resultado de regresin debido a sus diferencias de otras observaciones
sobre una o ms de las variables independientes.
Dr. Pedro Vergara V.
Donde p es el nmero de coeficientes en el modelo y n es el nmero de
casos completos.
Los Leverage (puntos de apalancamiento) son observaciones que son
distintas a las restantes basados en los valores de las variables
independientes.
Tienen un impacto importante en los coeficientes estimados para una o
ms variables independientes
Generacin de Nmeros Aleatorios
Este captulo trata sobre la generacin de nmeros aleatorios, que
es necesaria para la simulacin de sistemas estocsticos.
En primer lugar se definir qu se entiende por nmero aleatorio.
A continuacin se estudiarn las pruebas a que debe ser sometido
un generador de nmero aleatorios antes de ser aceptado.
Finalmente, se presentarn mtodos para generar variables que
siguen distribuciones de frecuente aplicacin.
Propiedades de nmeros aleatorios
Una secuencia de nmeros aleatorios R
1
, R
2
, ..., debe tener dos
importantes propiedades estadsticas: uniformidad e
independencia.
Cada nmero aleatorio R
i
es una muestra independiente tomada de
una distribucin continua uniforme entre cero y uno.
Una variable aleatoria uniforme de recorrido [0,1] tiene las siguientes
caractersticas:

s s
=
caso otro en 0
1 x 0 si 1
) x ( f
12
1
) x ( V ,
2
1
) x ( E = =
Como consecuencia de las propiedades de uniformidad e independencia se tiene:
1. Si el intervalo (0, 1) es dividido en n clases, o subintervalos de longitudes
iguales, el nmero esperado de observaciones en cada intervalo es N/n,
donde N es el nmero total de observaciones.
2. La probabilidad de observar un valor en un intervalo en particular es
independiente de los valores previamente observados.

>
s s
<
=
1 x si 1
1 x 0 si x
0 x si 0
) x ( F
Generacin de nmeros pseudos aleatorios
La palabra pseudos se refiere a que los nmeros generados por
los mtodos a estudiar no son completamente aleatorios puesto
que se conoce el modo de generarlos, y esta secuencia puede ser
reproducida cuantas veces sea necesaria.
Realizada esta observacin, el objetivo de cualquier generador de
nmeros aleatorios es producir una secuencia de nmeros entre
cero y uno que tenga las propiedades ideales de uniformidad e
independencia.
A esto se agrega la necesidad de contar con una longitud de ciclo
suficientemente grande.
La longitud de ciclo, o perodo, representa la longitud de la
secuencia de nmeros aleatorios que el generador siempre
repite.
1) Mtodo de congruencia lineal: El mtodo de congruencia
lineal es ampliamente utilizado. Este mtodo produce una
secuencia de nmeros enteros, X
1
, X
2
, ... Entre cero y m-1 de
acuerdo a la siguiente relacin recursiva:
El valor inicial X
0
se llama semilla, a es la constante
multiplicativa, c es el incremento, y m es el mdulo.
Si c 0, se tiene el mtodo de congruencia mixta.
Cuando c = 0, se tiene el mtodo de congruencia multiplicativa.
La seleccin de los valores a, c, m, y X
0
afecta fuertemente a las
propiedades estadsticas y la longitud de ciclo del generador.
i 1 i
X (ax c)mod m
+
= +
Como ejemplo del mtodo de congruencia lineal se generar una secuencia para
a = 17, c = 43, m = 100 y X
0
= 27.
En este caso, el entero generado estar entre 0 y 99 debido al valor del mdulo.
Ntese tambin, que si se necesita generar una secuencia de nmeros
aleatorios entre 0 y 1, esta puede ser generada por:
Con esto, las secuencias generadas son:
i 0 1 2 3
X 27 2 77 52
R - 0,02 0,77 0,52
Como puede deducirse de este ejemplo, debido a que X
i
es un entero del
conjunto {0, 1, 2, ..., (m-1)}, los nmeros aleatorios R
i
generados con este
mtodo slo pueden asumir valores del conjunto finito
I = {0, 1/m, 2/m, ..., (m-1)/m}.
i
i
X
R
m
=
Esto significa que se tiene una distribucin discreta en lugar de una continua. sta
ser una buena aproximacin cuando el mdulo sea grande. Cuando esto ocurra,
no existirn grandes huecos (gaps) entre los nmeros generados, y se tendr una
mxima densidad.
Para obtener la mxima densidad y evitar los ciclos (recurrencia de la misma
secuencia de nmeros ya generados) el generador debera tener el perodo ms
grande posible.
El mximo perodo puede lograrse eligiendo apropiadamente los valores de los
parmetros del generador, por ejemplo (Banks et al., 1996):
Para m = 2
b
y c0, el mximo perodo es P = m, y puede lograrse con un valor de c
que sea un nmero primo relativo a m (esto es, que el mximo factor comn entre
ambos sea 1), y a = 1+4k. k y b son enteros.
Para m = 2b y c = 0, el mximo perodo es P = m/4, y puede lograrse con un valor
impar para la semilla X
0
, y a = 3+8k, o a = 5+8k. k y b son enteros.
Para m nmero primo y c = 0, el mximo perodo es P =m-1, y puede lograrse con un
valor de a tal que el menor entero k que hace que ak-1sea divisible por m es k = m-1
La Tabla muestra la determinacin del perodo de un generador
congruencial multiplicativo para a = 13, m = 2
6
= 64, X
0
= 1, 2, 3, 4.
i X
i
X
i
X
i
X
i
0 1 2 3 4
1 13 26 39 52
2 41 18 59 36
3 21 42 63 20
4 17 34 51 4
5 29 58 23
6 57 50 43
7 37 10 47
8 33 2 35
9 45 7
10 9 27
11 53 31
12 49 19
13 61 55
14 25 11
15 5 15
16 1 3
Se puede ver que el mximo perodo, 16, se alcanza para las semillas
impares, y ste es igual al mximo terico P = m/4 ya que a = 5+8k
con k = 1.
Cuando la semilla es 1, la secuencia generada asume valores del
conjunto {1, 5, 9, 13, ..., 53, 57, 61}.
Los huecos entre los nmeros aleatorios R
i
son grandes (5/64-1/64 =
0.0625, densidad insuficiente), el perodo es demasiado corto; por
lo tanto, no se recomienda la utilizacin de este generador.
Un generador bastante utilizado en la prctica tiene los siguientes
parmetros a = 7
5
= 16807, m = 2
31
-1 =2147483647 (un nmero
primo) y c = 0.
Estos valores aseguran un perodo P = m-1. Para una semilla
igual a 123457, los valores generados son:
i 0 1 2 3
X 123457 2074941799 559872160 1645535613
R 0,9662 0,2607 0,7662
Simulacin de nmeros aleatorios con ARENA
Iniciar ARENA
Tools
Input analyzer
Nuevo archivo
File
Data File
Generate new
Seleccionar distribucin y parmetros. OK
Se obtiene histograma.
Para ver los datos: Opcin Windows
Input data
Generacin de nmeros aleatorias con Excel
=ALEATORIO() genera un nmero aleatorio uniforme (0,1)
=ALEATORIO()*(100-75)+75 genera un aleatorio uniforme (75,100)
=ENTERO(ALEATORIO()*(20-10)+10 ) genera un aleatorio entero
uniforme (10,20)
En planilla Excel
Seleccionar datos
Anlisis de datos
Generacin de nmeros aleatorios
(se puede elegir cuantas variables se quieren generar, cantidad
de valores a generar, la distribucin (uniforme, normal,
bernoulli, binomial, poisson, discreta)
Generadores combinados
Cuando la aplicacin requiere de un perodo mayor al que se
puede alcanzar con un generador simple, se recurre a los
generadores combinados de congruencia lineal.
Para generar la secuencia de X
i
y R
i
requerida, este generador
necesita las salidas X
i,j
, j = 1..k, de k diferentes generadores de
congruencia multiplicativa cuyos parmetros tienen los valores
apropiados para asegurar un perodo m
j-1
.
El generador j produce la salida X
i,j
entera uniformemente distribuida
de 1 a m
j-1
. La combinacin se calcula mediante las siguientes
frmulas:
k
j 1
i i,j i
j 1
i
i
i
i 1
i
i
i
X ( 1) X mod(m 1)
X
X 0
R
R
m 1
X 0
m

=
+
| |
=
|
\ .

>

El perodo mximo posible es:


1 2 k
k 1
(m 1)(m 1) (m 1)
P
2


=
Tcnica de la transformada inversa
Hasta aqu se han estudiado los nmeros aleatorios y la
forma de generarlos. Sin embargo, generalmente en las
simulaciones de sistemas estocsticos es necesario
generar variables aleatorias, las cuales tienen una
distribucin distinta de la uniforme. En estos casos se
utiliza la trasformada inversa.
Mtodo Grfico:
Analticamente, el mtodo se representa como:
donde f(x) es la funcin de densidad de probabilidad de la distribucin deseada. Para ver
porqu el X generado con este mtodo en realidad tiene la distribucin deseada, tome un
valor x
0
y compute la probabilidad acumulada:
Puesto que F(x
0
) pertenece al intervalo [0,1], la segunda igualdad plantea que R es un
nmero uniformemente distribuido en dicho intervalo, y como F(x) es la funcin de
probabilidad acumulada de X, se concluye que esta variable tendr la distribucin
deseada.
t
1
F(x) f(t)dt entonces X F (R)

= =

0 0 0
P(X x ) P(R F(x )) F(x ) s = s =
Puesto que F(x
0
) pertenece al intervalo [0,1], la segunda igualdad
plantea que R es un nmero uniformemente distribuido en dicho
intervalo, y como F(x) es la funcin de probabilidad acumulada de
X, se concluye que esta variable tendr la distribucin deseada.
Distribucin exponencial
Utilizando el mtodo de la transformada inversa a continuacin se
desarrolla un generador de variables aleatorias con distribucin
exponencial. La funcin de densidad de probabilidad es:
su funcin de probabilidad acumulada:
0 0
( )
0

> . >
=

x
e si x
f x
en otro caso


1 0
( )
0 0

>

=

<

x
e si x
F x
si x

Esta distribucin generalmente se utiliza para modelar los tiempos


entre llegadas de clientes.
En ese caso, el parmetro puede ser interpretado como el
nmero medio de llegadas por unidad de tiempo, y 1/ sera el
tiempo medio entre llegadas.
Aplicando el mtodo de la transformada inversa, se tiene:
Dado que R est uniformemente distribuido en el intervalo [0,1],
entonces (1-R) tambin lo est; por lo tanto se puede hacer la
siguiente simplificacin:
1
1
( ) 1 ( ) ln(1 )

= = = =
x
F x e R F R R X

1
ln( ) = X R

R X X Lambda=1,25
0,59110451 0,71543654 0,42060996
0,4380435 0,46106466 0,66034966
0,62464297 0,78390209 0,37646004
0,43365688 0,45484414 0,66840132
0,96405124 2,66052846 0,02928867
0,02458119 0,01991068 2,96461911
0,36060334 0,35778422 0,81598136
0,93921887 2,24038078 0,05016539
0,98857798 3,57776991 0,0091902
0,56727619 0,67012449 0,45352719
0,46536478 0,50093647 0,61194697
0,15034968 0,13034432 1,51583321
0,95446638 2,4714434 0,03728229
0,55702591 0,6513952 0,46811482
0,58697314 0,70739412 0,42622097
0,25888422 0,23967874 1,08109947
0,59664542 0,7263514 0,41314583
0,01554062 0,01253011 3,33143861
0,53903864 0,61955285 0,49437441
0,00338389 0,0027117 4,55098415
0,20628634 0,18482601 1,26279207
0,56203945 0,66050114 0,4609466
0,42988517 0,44953398 0,67538972
0,38496843 0,38886534 0,76367517
0,97844583 3,06974873 0,01743188
0,56107296 0,65873767 0,46232346
0,80615288 1,31254836 0,17238551
0,92203962 2,04124364 0,06493367
0,56423119 0,66451474 0,45783296
0,5680745 0,67160173 0,45240217
1
ln(1 ) = X R

1
ln( ) = X R

Distribucin uniforme
Para generar una variable X con distribucin uniforme en el
intervalo [a, b], la funcin de densidad de probabilidad es:

De acuerdo al mtodo de la trasformada inversa:

s s

=
caso otro en 0
b x a si
a b
1
) x ( f

>
s s

<
=
b x si 1
b x a si
a b
a x
a x si 0
) x ( F
R ) a b ( a x R
a b
a x
) x ( F + = =

=
X
38,6729844
28,4201077
47,4092859
48,0310293
30,7926068
21,279972
36,3700607
38,4353661
42,149538
45,8420384
25,357894
20,0202726
27,6878115
29,5517251
25,9290588
39,8169465
29,0013061
47,1359989
25,4047049
42,0880286
36,9083132
45,3504397
41,6561099
20,2509217
23,069311
23,4577998
44,8087374
44,0212941
20,6080279
45,007181
=aleatorio()*(50-20)+20
X a (b a) R obien X R (b a) a = + = +
Distribucin de Weibull
Esta distribucin se utiliza para modelar el tiempo entre fallas de
maquinarias o componentes electrnicos.
Cuando el parmetro de localizacin es nulo ( = 0), la funcin de
densidad de probabilidad es:
El mtodo de la transformada inversa plantea que:
Simplificando se tiene que:
x
1
x e
f(x, , ) x 0, 0, 0
0 en otro caso
o
| |

|
| o
\ .
o

o | = > o > | >

( )
x
1
( )
F(x) 1 e R x ln(1 R)
o

|
o
= = = |
( )
1
x ln(R)
o
= |
Distribucin triangular
Dada una variable aleatoria tiene distribucin triangular con
funcin de probabilidad dada por:
x 0 x 1
f(x) 2 x 1 x 2
0 en otro caso
s s

= < s

Que se denomina distribucin triangular con extremos (0, 2) y moda


en 1, con funcin de probabilidad acumulada:
2
2
0 x 0
x
0 x 1
2
F(x)
(2 x)
1 1 x 2
2
1 x 2
s

< s

< s

>

0 0.4 0.8 1.2 1.6 2


0
0.2
0.4
0.6
0.8
1
Aplicando el mtodo de la transformada inversa y operando se
tiene el generador:
1
2R 0 R
2
X
1
2 2(1 R) R 1
2

s s

< s

La frmula general para una distribucin triangular est dada por:


2(x a)
a x b
(b a)(c a)
2(c x)
f(x) b x c
(c b)(c a)
0 en otro caso

s s

= s s

2(x 5)
x 5
5 x 10
5 x 10
(10 5)(15 5)
25
2(15 x) 15 x
f(x) 10 x 15 10 x 15
(15 10)(15 5) 25
0 en otro caso
0 en otro caso

s s
s s



= s s = s s




Sea a=5 ; b=10 ; c=15, la funcin de densidad est dada por:


10 15
10 15
2 2
5 10
5 10
x 5 15 x (x 5) (15 x)
f(x)dx 1 dx dx
25 25 50 50
25 25
0 0 1
50 50



= + =


= + =

x 5
5 x 10
25
15 x
f(x) 10 x 15
25
0 en otro caso

s s


= s s

x
2
t
5
x
2
10
t 5 (x 5)
dt si 5 x 10
25 50
F(x) P(X x) f(t)dt
1 15 t (15 x)
dt 1 si 10 x 15
2 25 50


= s s

= s =

+ = s s

2
2
(x 5) 1
si 5 x 10 5 50R 0 R
50 2
F(x) X
1
(15 x)
15 50(1 R) R 1
1 si 10 x 15
2
50



s s + s s



= =


< s
s s

b a
a (b a)(c a)R 0 R
c a
X
b a
c (c a)(c b)(1 R) R 1
c a

+ s s

< s


Distribuciones discretas
Las distribuciones discretas se pueden generar utilizando la
transformada inversa de la misma manera que se utiliz para las
distribuciones empricas, slo que esta vez no es necesario la
interpolacin.
Por ejemplo, si se desean generar los nmeros 0, 1 y 2 con las
probabilidades 0.50, 0.30 y 0.20 respectivamente, se construye la
siguiente tabla donde ya se calcul la probabilidad acumulada:
Con esta tabla, el valor de X se calcula de la siguiente forma:
I Entrada r
i
Salida x
i
1 0,50 0,00
2 8,00 1,00
3 1,00 2,00
Con la tabla anterior, el valor de X se calcula de la siguiente forma:
0 R 0,5
X 1 0,5 x 0,8
2 0,8 x 1,0
s

= s s

s s

Cuando la distribucin es uniforme y se desea generar nmeros en


el intervalo [a, b] espaciados por X, se puede utilizar el siguiente
generador:
b a
X Int R 1 x a
x
| |
| |
= + A +
| |
A
\ .
\ .
Para simular un dado se debe hacer a = 1, b = 6 y X =1.
Transformada directa para la distribucin normal
Esta distribucin es ampliamente utilizada. La funcin de
densidad de probabilidad es:
2
2
( x )
2
1
f(x) e
2
u

o
=
o t
Dado que no es posible obtener analticamente la funcin inversa
de la probabilidad acumulada, se recurre a mtodos alternativos.
Uno de los mtodos ms empleados considera dos variables con
distribucin estndar normal Z
1
y Z
2
(media nula y varianza igual a
uno), y las expresa en coordenadas polares como sigue:
1
2
Z Bcos( )
Z Bsin( )
= u
= u
Se sabe que B
2
= Z
1
2
+ Z
2
2
tiene una distribucin chi-cuadrado con 2
grados de libertad, la cual es equivalente a una distribucin
exponencial con media 2. Entonces, el radio B puede ser generado
con:
Debido a la simetra de la distribucin normal, se supone que est
uniformemente distribuido en el intervalo [0, 2]. Entonces, el ngulo
se genera con:
Finalmente, los valores Z
1
y Z
2
con distribucin normal estndar se
obtienen generando B y con las ecuaciones anteriores
respectivamente.
( )
1
2
1
B 2ln(R ) =
2
2 R u = t
El valor de X con una distribucin normal con media y varianza
2
se calcula con:
X Z = u+ o
Cuando, como en este caso, no es posible obtener analticamente la
funcin inversa de la probabilidad acumulada, entonces se puede
aproximar esta funcin ya sea numricamente o con expresiones
simplificadas.
Por ejemplo, se puede utilizar el siguiente generador de Schmeiser
que da una distribucin aproximada a la normal estndar:
Otro generador de distribucin normal utiliza el teorema del lmite
central que plantea: La distribucin del promedio de n variables
aleatorias independientes idnticamente distribuidas con media y
varianza
2
se aproxima a una distribucin normal con media y
varianza
2
/n. El generador est dado por:
0,135 0,135
R (1 R)
Z
0,1975

=
12
i
i 1
X R 6
=
| |
= u + o
|
\ .

= u+o X Z
Este generador utiliza la sumatoria de una serie de nmeros
aleatorios para obtener la distribucin deseada.
En la seccin siguiente se estudian otros generadores que utilizan
este mismo principio.
Mtodo de la convolucin
La distribucin de probabilidad de la suma de dos o ms variables
aleatorias independientes se denomina convolucin de las
distribuciones correspondientes a las variables sumadas.
El mtodo de la convolucin suma dos o ms variables aleatorias
para obtener una nueva variable con la distribucin deseada.
El centro del estudio ya no es la funcin de probabilidad acumulada
de la distribucin deseada, sino su relacin con otras distribuciones
ms fcilmente generables.
Distribucin de Erlang
Una variable aleatoria X con distribucin Erlang con parmetros (K, )
puede ser modelada con la suma de K variables aleatorias
independientes X
i
con distribucin exponencial y media 1/(K ); esto
es:
Utilizando el generador de distribucin exponencial presentado
anteriormente y operando, se obtiene el generador con la istribucin
deseada:
Como ejemplo, suponga que a un depsito llegan camiones cuyos
tiempos entre arribos siguen una distribucin exponencial con media
0.1 h. A la entrada son desviados alternativamente hacia el sur y hacia
el norte. Se desea modelar el arribo de camiones al sector sur.
K
i
i 1
X X
=
=

K K K
i i
i 1 i 1 i 1
1 1
X ln R ln R
K K
= = =

| | | |
| |
= =
| | |
u u
\ .
\ . \ .

I I
Los tiempos de llegada entre los camiones que llegan al sector sur
sern iguales a la suma de dos tiempos de arribos sucesivos al
depsito; es decir, seguirn una distribucin Erlang con K=2 y
1/=0,2 h.
Tcnica de aceptacin y rechazo
En este mtodo se generan valores aleatorios que son sometidos a
una prueba para verificar si cumplen o no con la distribucin
deseada.
El resultado de esta prueba determina si el nuevo valor es aceptado
o rechazado. Un generador eficiente debe mantener el nmero de
rechazos lo ms bajo posible.
Distribucin de Poisson
Una variable N con distribucin Poisson puede ser interpretada
como el nmero de arribos por unidad de tiempo a velocidad en
un proceso Poisson.
En este proceso, los tiempos entre arribos A
1
, A
2
, ... estn
exponencialmente distribuidos con una velocidad (es el nmero
medio de arribos por unidad de tiempo). Por lo tanto, se puede
construir un generador que determine n tal que:
A
1
+A
2
+...+A
n
A
1
+A
2
+...+A
n+1
Utilizando el generador exponencial anteriormente presentado, se
tiene:
n n 1
i i
i 1 i 1
1 1
ln(R ) 1 ln(R )
+
= =

| | | |
s <
| |

\ . \ .


Operando
n n 1
i i
i 1 i 1
n n 1
i i
i 1 i 1
n n 1
i i
i 1 i 1
ln(R ) ln(R )
ln( R ) ln( R )
R e R
+
= =
+
= =
+

= =
> >
> >
> >

I I
I I
Entonces, el procedimiento para generar N con distribucin de
Poisson es:
1. Hacer n 0, P 1.
2. Generar un nmero aleatorio R
n+1
y hacer P P R
n+1
.
3. Si P < e
-a
, aceptar el nuevo valor N n, sino rechazar n, hacer
n n + 1, y retornar al paso 2.
Note que en promedio ser necesario generar +1 nmeros con
distribucin exponencial por cada valor de N. Cuando 15 esta
tcnica se vuelve ineficiente, y conviene utilizar una tcnica
basada en la distribucin normal:
N
Z

=

donde Z tiene una distribucin normal estndar. Entonces, para


cada valor de Z se puede calcular N con:
Distribucin gamma
Si el parmetro de forma tiene un valor entero K, se puede
utilizar el mtodo de la convolucin ya que la distribucin de
Erlang es un caso especial de la distribucin gamma.
Por otra parte, el mtodo aceptacin y rechazo que se describir a
continuacin puede ser utilizado para generar variables con
distribucin Erlang cuando K es grande.
N Round( Z) = +
La rutina siguiente genera variables con distribucin gamma con
parmetro de escala q y parmetro de forma ; esto es, con
media 1/ y varianza 1/(
2
):
1. Hacer a (2 -1)1/2, 2 - ln(4) + 1/a.
2. Generar R
1
y R
2
.
3. Hacer X (R
1
/(1-R
1
))a.
4. Hacer c b - ln(R
1
2
R
2
).
5. Si X > c, rechazar X y retornar al paso 2.
6. Si X c, hacer X X/(), aceptar X como la variable deseada.
Cadenas de Markov y
Teora de Colas
Procesos y Cadenas de Markov
Variable de Poisson.
Procesos puntuales.
Procesos de Markov.
Cadenas de Markov. Clasificacin de estados, clases de
cadenas, estado estacionario.
Cadenas de Markov en tiempo continuo. Ecuaciones de
balance global.
Aplicaciones.
Distribucin Exponencial
Separacin entre puntos: sea X=distancia desde t al primer
punto a la derecha de t
| |
x
X
F (x) P(X x) 1 P(X x) 1 P(0 puntos en t,t x ) 1 e x 0

= s = > = + = >
x
X
x
2
0
f (x) e (x)
1 1
E(X) x e dx ; Var(X)

= u
= = =

Los tiempos entre arribos son independientes y distribuidos


exponencialmente con parmetro
Propiedad sin memoria de la distribucin exponencial
0 0
X 0 0
0 0
0 0
X X 0
X 0
(x x )
0
(x x )
0
0 X X
x x x x
F (x) P(X x ) P(X x / X x )
P(X x , X x ) P(x X x)
P(X x ) P(X x )
F (x) F (x )
1 F (x )
1 e
f (x / X x ) e ( ) f ( )



= > = s >
s > s s
= =
> >

=
> = u =
Lo que ocurre despus de t
0
es independiente de lo que
ocurri antes de t
0
Relacin entre el proceso de Poisson y la
distribucin Exponencial
Ejemplo: Llegadas Aleatorias, el proceso de llegadas es
Poisson.
Los tiempos entre llegadas son independientes y
distribuidos exponencialmente con parmetro
Llegadas
Duracin media de la llamada
N N
i i
i
i i h k k
i i i
i k 1 k 1
L
i j
i j 0
N 1 1

Sea a E(T ) t t
T N T
1
a a jt
T
= =
=
= = =
= =


Tiempo
medio de
ocupaci
n de una
lnea
Promedio de
lneas ocupadas
simultneamente
Nmero de
ocupacione
s
simultnea
s
Tiempo total en el que
exactamente j lneas estn
ocupadas
Cadena de Markov: Proceso de Markov en tiempo discreto con
un conjunto numerable de estados a
i.
Especificado en trminos
de:
p
i
(n)=P(X
n
=a
i
) Probabilidad de estado

ij
(n
1
,n
2
)=P(X
n2
=a
j
/ X
n1
=a
i
) Probabilidad de transicin

ij
(a
i
a
j
) es la probabilidad condicional para que el proceso
que se encuentra en el estado a
i
se mueva al estado a
j
en
un slo paso
ij
(n
1
,n
2
) (probabilidad de transicin de un slo
paso).
Si todas estas probabilidades son conocidas para todos los
pares de estados se ordenan en una matriz cuadrada que
recibe el nombre de matriz de transicin. = [
ij
]
Ejemplo:
Dada una persona sentada en el asiento de en
medio de una fila de cinco asientos [marcados
con A,B,C,D,E] de izquierda a derecha. Esta
persona se mueve por seis veces de una silla a
la otra, estando sus movimientos controlados por
una moneda que se tira al aire.
a) Si no est al final de una fila de asientos se
mueve hacia la derecha si sale CARA y hacia la
izquierda si sale SELLO.
b) Si est al final se quedar donde est salga lo
que salga.
Espacio de Estados: [ A, B, C, D, E ]
P[A A] = P[E E] = 1 ya
que se queda donde est.

AA
= P(X=A/X=A) = 1 =
EE
= P(X=E/X=E)
P[B A] = 1/2 puesto que la
probabilidad de que salga
cara es 1/2.

AB
= P(X =B / X=A) = 1/2

BA
= P(X =A / X=B) = 1/2

DE
= P(X =E / X=D) = 1/2

DC
= P(X =C / X=D) = 1/2
P[C C] = 0 ya que aqu no se
puede quedar.

BB
=
CC
=
DD
= 0
Se tiene que
A B C D E
A 1 0 0 0 0
B 0 0 0
C 0 0 0
D 0 0 0
E 0 0 0 0 1
5
ij
j 1
p 1 j
=
=

Las matrices que tienen elementos no negativos y la suma de los elementos de sus
filas valen la unidad se llaman matrices estocsticas
Vector probabilidad inicial
Existe un vector probabilidad inicial tal que:
a = (a
1
, a
2
,....a
n
) en la que los elementos a
i
son
las probabilidades que el estado inicial del proceso
sea S
i
.
En este ejemplo, el vector de probabilidad inicial es:
a = (0, 0, 1, 0, 0)
puesto que el proceso comienza en la silla C.
Si se considera una secuencia S
i
, S
j
, S
k
de un
experimento cuyo vector y matriz inicial son conocidos,
la secuencia de probabilidad ser:
Se puede ampliar esta regla para cubrir secuencias
de cualquier nmero de pasos. A los procesos a los
cuales se puede aplicar esta regla se dicen que tienen
la propiedad de Markov.
i j k i i j j k i
P(S,S,S ) = P(S ) P(S S ) P(S S ) P(S )
Para tales procesos la probabilidad de la siguiente
direccin depende del estado presente del proceso y no
depende del estado precedente.
Ejemplo:
En el ejemplo calcular la probabilidad de la secuencia.
1 1 1 1 1
P[C,D,C,B,A,A,A] = P[C] P[C D] P[D C] P[C B] P[B A] P[A A] P[A A] =1 1 1 =
2 2 2 2 16

Cadena de Markov finita y estacionara.
Una cadena de Markov estacionara y finita
queda completamente definida cuando se conoce:
a) Espacio de estados finito.
b) Una matriz [Pij] de probabilidades de transicin de
un slo paso estacionara.
c) El vector de probabilidad inicial.
Ejemplo: Cadena de 2 estados
Aplicacin: En un modelo para voz en paquetes.
Estado 0: inactivo (silencio). La probabilidad de que la prxima TS
sea activa es a, y la probabilidad de que permanezca en el estado
inactivo es 1-a.
Estado 1: activo (habla). La probabilidad de que la prxima TS sea
inactiva es b, y la probabilidad de que permanezca en el estado
activo es 1-b. En el estado activo, una TS contiene una celda con
probabilidad p, y se tiene un proceso de Bernoulli.
El ascensor de un edificio con tres pisos realiza viajes de uno a
otro piso. El piso en el que finaliza el viaje n-simo del
ascensor sigue una cadena de Markov.
Se sabe que la mitad de los viajes que parten del primer piso
se dirigen a cada uno de los otros dos, mientras que si un viaje
comienza en el segundo piso, slo el 25% de las veces finaliza
en el tercero. Por ltimo, si un trayecto comienza en el tercer
piso, siempre finaliza en el primero. Se pide:
a) Calcular la matriz de probabilidades de transicin de la
cadena
b) Dibujar el grafo asociado
c) Cul es la probabilidad que, a largo plazo, el ascensor se
encuentre en cada uno de los tres pisos
SOLUCIN: Los estados de la cadena se denotan por {1, 2, 3}
haciendo corresponder el 1 al primer piso, 2 y 3 a los otros.
Las probabilidades de transicin son:
p
11
= P(R
n
=0 / R
n-1
=0)
esto es la probabilidad de que el ascensor se encuentre en el
primer piso si en la etapa anterior estaba en el primero, es 0,
se supone que de etapa a etapa el ascensor se mueve.
p
12
= P(R
n
=2 / R
n-1
=1)
esto es la probabilidad que el ascensor se encuentre en el
segundo piso si en la etapa anterior estaba en el primero es .
As sucesivamente se obtienen las distintas probabilidades de
transicin cuya matriz es:
11 12 13
21 22 23
31 32 33
p p p 0 1/ 2 1/ 2
a) P= p p p 3/ 4 0 1/ 4
p p p 1 0 0
| | | |
| |
=
| |
| |
\ . \ .
c) q P q, siendo q (x,y,z) los valores de las probabilidades pedidas, y como x y z 1 = = + + =
0 1/ 2 1/ 2
(x, y,z) 3/ 4 0 1/ 4 (x, y,z) aadiendo x y z 1se tiene:
1 0 0
| |
|
= + + =
|
|
\ .
4x 3y 4z 0
x 2y 0
x 8/17 ; y 4/17 ; z 5/17
2x y 4z 0
x y z 1
=

= = =

+ =

+ + =

Un 47.06% en el primer piso, un 23.53% en el segundo y un


29.41% en el tercero
Un agente comercial realiza su trabajo en tres ciudades A, B y C.
Para evitar desplazamientos innecesarios est todo el da en la
misma ciudad y all pernocta, desplazndose a otra ciudad al da
siguiente, si no tiene suficiente trabajo. Despus de estar
trabajando un da en C, la probabilidad de tener que seguir
trabajando en ella al da siguiente es 0,4, la de tener que viajar a B
es 0,4 y la de tener que ir a A es 0,2. Si el viajante duerme un da
en B, con probabilidad de un 20% tendr que seguir trabajando en
la misma ciudad al da siguiente, en el 60% de los casos viajar a
C, mientras que ir a A con probabilidad 0,2. Por ltimo si el agente
comercial trabaja todo un da en A, permanecer en esa misma
ciudad, al da siguiente, con una probabilidad 0,1, ir a B con una
probabilidad de 0,3 y a C con una probabilidad de 0,6.
a) Si hoy el viajante est en C, cul es la probabilidad de que
tambin tenga que trabajar en C al cabo de cuatro das?
b) Cuales son los porcentajes de das en los que el agente
comercial est en cada una de las tres ciudades?
4
0.1 0.3 0.6 0.1819 0.3189 0.312
P= 0.2 0.2 0.6 P 0.1818 0.319 0.4992
0.2 0.4 0.4 0.1818 0.3174 0.5008
| | | |
| |
=
| |
| |
\ . \ .
b) q P q, siendo q (x, y,z) los valores de las probabilidades pedidas, y como x y z 1 = = + + =
0.1 0.3 0.6
(x, y,z) 0.2 0.2 0.6 (x, y,z) aadiendo x y z 1se tiene :
0.2 0.4 0.4
| |
|
= + + =
|
|
\ .
9x 2y 2z 0
3x 8y 4z 0
x 2/11; y 7/ 22; z 1/ 2
6x 6y 6z 0
x y z 1
+ + =

+ =

= = =

+ =

+ + =

La matriz de transicin P para el orden A, B, C est dada por:


a) Corresponde a determinar el trmino p
4
33
=313/625=0.5008
Ejercicios
1) Suponga que toda la industria de refresco produce dos colas: Coca
Cola y Pepsi Cola. Cuando una persona ha comprado Coca Cola hay
una probabilidad de 90% que siga comprndola la vez siguiente. Si una
persona compr Pepsi, hay 80% de que repita la vez siguiente. Se pide:
a) Si una persona actualmente es comprador de Pepsi. Cul es la
probabilidad que compre Coca Cola pasadas dos compras a partir de
hoy?
b) Si en la actualidad una persona es comprador de Coca Cola. Cul
es la probabilidad que compre Coca Cola pasadas tres compras a partir
de ahora?
c) Supongamos que el 60% de toda la gente toma hoy Coca Cola y el
40% Pepsi. A tres compras a partir de ahora, Qu fraccin de los
compradores estar tomando Coca Cola.
d) Determinar el estado estable.
La matriz de transicin para el orden C,P, es:
0.9 0.1
P
0.2 0.8
| |
=
|
\ .
2
0.9 0.1 0.9 0.1 0.83 0.17
P
0.2 0.8 0.2 0.8 0.34 0.66
| || | | |
= =
| | |
\ .\ . \ .
a) Se pide la probabilidad de transicin en dos pasos, es decir que se pide el
valor en fila 2, columna 1 para la matriz P
2
, obtenindose que este es:
0,2.0,9 + 0,8.0,2 = 0,34
b) Se pide el valor de probabilidad de transicin en fila 1 y columna 1
para la matriz P
3
. La matriz es
la solucin es 0,781
| |
=
|
\ .
3
0.781 0.219
P
0.438 0.562
c) El vector de probabilidad inicial es (0.6 , 0.4), por tanto la probabilidad
de consumir ambos estados a partir de tres etapas es:
| |
= =
|
\ .
3
0.781 0.219
(0.6 0.4) P (0.6 0.4) (0.6438 0.3562)
0.438 0.562
luego, al cabo de tres compras el 64.38% comprar Coca Cola y el 35.62%
comprar Pepsi Cola.
| |
= + =
|
\ .
0.9 0.1
(x, y) (x, y) con x y 1
0.2 0.8
x 2y 0
x 2y 0 x 2/ 3 ; y 1/ 3
x y 1
+ =

= = =

+ =

d) El estado estable se determina resolviendo el sistema de ecuaciones:


siendo x la probabilidad que una persona compre Coca Cola a largo plazo; y
representa lo mismo lo mismo que compre Pepsi Cola.
El sistema resultante es:
2.- La cervecera ms importante del mundo (Guiness) ha contratado a un
analista de investigacin de operaciones para analizar su posicin en el
mercado. Estn preocupados en especial por su mayor competidor
(Heineken). El analista piensa que el cambio de marca se puede modelar
como una cadena de Markov incluyendo tres estados, los estados G y H
representan a los clientes que beben cerveza producida por las
mencionadas cerveceras y el estado I representa todas las dems
marcas. Los datos se toman cada mes y el analista ha construido la
siguiente matriz de transicin de los datos histricos.
G H I
G 0.7 0.2 0.1
H 0.2 0.75 0.05
I 0.1 0.1 0.8
| |
|
|
|
|
\ .
Cules son los porcentajes de clientes leales despus de tres perodos?
Cules son los porcentajes de mercado en el estado estable para las dos
grandes cerveceras?
El problema consiste en resolver el sistema formado por las ecuaciones:
(x, y, z).P = (x, y, z) ; x + y + z = 1,
siendo x la probabilidad de que el consumidor compre G, y que el
consumidor compre H, z la del que consumidor compre I. De ambas
expresiones se obtiene el siguiente sistema:
( )
0.7 0.2 0.1
x, y,z 0.2 0.75 0.05 (x, y,z)
0.1 0.1 0.8
| |
|
=
|
|
\ .
3x 2y z 0
20x 25y 10z 0
x 9/ 26 ; y 10/ 26 ;z 7/ 26
10x 5y 20z 0
x y z 1
+ + =

+ =

= = =

+ =

+ + =

3.- En una comunidad hay 3 supermercados (S1, S2, S3) existe la


movilidad de un cliente de uno a otro. El 1 de septiembre, 1/4 de los
clientes va al S1, 1/3 al S2 y 5/12 al S3 de un total de 10.000 personas.
Cada mes el S1 retiene el 90% de sus clientes y pierde el 10% que se va
al S2. Se averigu que el S2 slo retiene el 5% y pierde el 85% que va a
S1 y el resto se va a S3, el S3 retiene slo el 40%, pierde el 50% que va
al S1 y el 10% va al S2.
a) Establecer la matriz de transicin
b) Cul es la proporcin de clientes para los supermercados el 1 de
noviembre?
c) Hallar el vector de probabilidad estable.
3.- En una comunidad hay 3 supermercados (S1, S2, S3) existe la
movilidad de un cliente de uno a otro. El 1 de septiembre, 1/4 de los
clientes va al S1, 1/3 al S2 y 5/12 al S3 de un total de 10.000 personas.
Cada mes el S1 retiene el 90% de sus clientes y pierde el 10% que se va
al S2. Se averigu que el S2 slo retiene el 5% y pierde el 85% que va a
S1 y el resto se va a S3, el S3 retiene slo el 40%, pierde el 50% que va
al S1 y el 10% va al S2.
a) Establecer la matriz de transicin
S1 S2 S3
S1 0.9 0.1 0
S2 0.85 0.05 0.1
S3 0.5 0.1 0.4
| |
|
|
|
|
\ .
b) Para el mes de noviembre (han transcurrido 2 meses desde el 1 de
septiembre), la proporcin de clientes es
( ) ( ) ( )
2
0.895 0.095 0.01
1/ 4 1/ 3 5/12 P 1/ 4 1/ 3 5/12 0.8575 0.0975 0.045 0.8158 0.0958 0.0883
0.735 0.095 0.17
| |
|
= =
|
|
\ .
La proporcin es del 81,58% para S1; 9,58% para S2 y 8,83% para S3
c) El vector de probabilidad estable se obtiene resolviendo:
(x, y, z).P = (x, y, z) ; x + y + z = 1
El sistema resultante es:
10x 85y 50z 0
10x 95y 10z 0
x 8 / 9 ; y 2 / 21;z 1/ 63
y 6z 0
x y z 1
+ + =

+ =

= = =

+ + =

4.- Los consumidores de caf en una localidad usan tres marcas A, B, C.


En febrero de 1995 se hizo una encuesta en lo que entrevist a las 8450
personas que compran caf y los resultados fueron:
Compra en el siguiente mes
Compra actual Marca A Marca B Marca C Total
Marca A = 1690 507 845 338 1690
Marca B = 3380 676 2028 676 3380
Marca C = 3380 845 845 1690 3380
Total 2028 3718 2704 8450
a) Si las compras se hacen mensualmente, cul ser la distribucin del
mercado de caf en esa localidad en el mes de junio?
b) A la larga, cmo se distribuirn los clientes de caf?
c) En junio, cual es la proporcin de clientes leales a sus marcas de caf?
Compra en el siguiente mes
Compra actual Marca A Marca B Marca C Total
Marca A = 1690 507 845 338 1690
Marca B = 3380 676 2028 676 3380
Marca C = 3380 845 845 1690 3380
Total 2028 3718 2704 8450
A B C
A 0.3 0.5 0.2
B 0.2 0.6 0.2
C 0.25 0.25 0.5
| |
|
|
|
|
\ .
2 4
0.24 0.50 0.26 0.2376 0.4790 0.2834
P 0.23 0.51 0.26 P 0.2375 0.4791 0.2834
0.25 0.40 0.35 0.2395 0.4690 0.2915
| | | |
| |
= =
| |
| |
\ . \ .
a) De acuerdo a las frecuencias de la tabla, las probabilidades de transicin,
conservando estn dadas por:
De marzo a Junio hay 4 etapas por lo que nos piden las probabilidades
de transicin al cabo de 4 meses, las que vendrn dada por los
coeficientes de P
4
b) A la larga se trata de la situacin estable:
0.3 0.5 0.2
(x y z) 0.2 0.6 0.2 (x y z) ; x y z 1
0.25 0.25 0.5
| |
|
= + + =
|
|
\ .
7x 2y 2.5z 0
5x 4y 2.5z 0
x 5/ 21; y 10/ 21;z 2/ 7
2x 2y 5z 0
x y z 1
+ + =

+ =

= = =

+ =

+ + =

c) En Marzo la proporcin de clientes de A es: 2028/8450=0,24; para B es


3718/8450=0,44 y para C es 2704/8450=0,32.
En el mes de junio la proporcin es:
( ) ( )
| |
|
=
|
|
\ .
4
0.3 0.5 0.2
0.24 0.44 0.32 0.2 0.6 0.2 0.2381 0.4758 0.2859
0.25 0.25 0.5
es decir 24% para A, 46,4% para B y 29,6% para C.
Las colas
Las colas son frecuentes en nuestra
vida cotidiana:
En un banco
En un restaurante de comidas
rpidas
Al matricular en la universidad
Los autos en un estacin de lavado
Las colas
En general, a nadie le gusta esperar
Cuando la paciencia llega a su lmite,
la gente se va a otro lugar
Sin embargo, un servicio muy rpido
tendra un costo muy elevado
Es necesario encontrar un balance
adecuado
Teora de colas
Una cola es una lnea de espera
La teora de colas es un conjunto de
modelos matemticos que describen
sistemas de lneas de espera
particulares
El objetivo es encontrar el estado
estable del sistema y determinar una
capacidad de servicio apropiada
Teora de colas
Existen muchos sistemas de colas
distintos
Algunos modelos son muy especiales
Otros se ajustan a modelos ms
generales
Se estudiarn ahora algunos modelos
comunes
Otros se pueden tratar a travs de la
simulacin
Sistemas de colas: modelo bsico
Un sistema de colas puede dividirse
en dos componentes principales:
La cola
La instalacin del servicio
Los clientes o llegadas vienen en
forma individual para recibir el
servicio
Sistemas de colas: modelo bsico
Los clientes o llegadas pueden ser:
Personas
Automviles
Mquinas que requieren reparacin
Documentos
Entre muchos otros tipos de artculos
Sistemas de colas: modelo bsico
Si cuando el cliente llega no hay
nadie en la cola, pasa de una vez a
recibir el servicio
Si no, se une a la cola
Es importante sealar que la cola no
incluye a quien est recibiendo el
servicio
Sistemas de colas: modelo bsico
Las llegadas van a la instalacin del
servicio de acuerdo con la disciplina
de la cola
Generalmente esta es primero en
llegar, primero en ser servido
Pero pueden haber otras reglas o
colas con prioridades
Sistemas de colas: modelo bsico
Llegadas
Sistema de colas
Cola
Instalacin
del
servicio
Disciplina
de la cola
Salidas
Estructuras tpicas de sistemas de colas: una
lnea, un servidor
Llegadas
Sistema de colas
Cola Servidor
Salidas
Estructuras tpicas de sistemas de colas: una lnea,
mltiples servidores
Llegadas
Sistema de colas
Cola
Servidor
Salidas
Servidor
Servidor
Salidas
Salidas
Estructuras tpicas de colas: varias lneas,
mltiples servidores
Llegadas
Sistema de colas
Cola
Servidor
Salidas
Servidor
Servidor
Salidas
Salidas
Cola
Cola
Estructuras tpicas de colas: una lnea, servidores
secuenciales
Llegadas
Sistema de colas
Cola
Servidor
Salidas
Cola
Servidor
Costos de un sistema de colas
1. Costo de espera: Es el costo para el
cliente al esperar
Representa el costo de
oportunidad del tiempo perdido
Un sistema con un bajo costo de
espera es una fuente importante
de competitividad
Costos de un sistema de colas
2. Costo de servicio: Es el costo de
operacin del servicio brindado
Es ms fcil de estimar
El objetivo de un sistema de colas
es encontrar el sistema del costo
total mnimo
Sistemas de colas: Las llegadas
El tiempo que transcurre entre dos
llegadas sucesivas en el sistema de
colas se llama tiempo entre llegadas
El tiempo entre llegadas tiende a ser
muy variable
El nmero esperado de llegadas por
unidad de tiempo se llama tasa
media de llegadas ()
Sistemas de colas: Las llegadas
El tiempo esperado entre llegadas es
1/
Por ejemplo, si la tasa media de
llegadas es = 20 clientes por hora
Entonces el tiempo esperado entre
llegadas es 1/ = 1/20 = 0.05 horas o
3 minutos
Sistemas de colas: Las llegadas
Adems es necesario estimar la
distribucin de probabilidad de los
tiempos entre llegadas
Generalmente se supone una
distribucin exponencial
Esto depende del comportamiento
de las llegadas
Sistemas de colas:
Las llegadas Distribucin exponencial
La forma algebraica de la distribucin
exponencial es: f(x)=e
-
Donde t representa una cantidad
expresada en de tiempo unidades de
tiempo (horas, minutos, etc.)

s =
t
P(tiempodeservicio t) 1 e
Sistemas de colas:
Las llegadas Distribucin exponencial
Media Tiempo
0
P(t)
Sistemas de colas:
Las llegadas Distribucin exponencial
La distribucin exponencial supone
una mayor probabilidad para tiempos
entre llegadas pequeos
En general, se considera que las
llegadas son aleatorias
La ltima llegada no influye en la
probabilidad de llegada de la siguiente
Sistemas de colas:
Las llegadas - Distribucin de Poisson
Es una distribucin discreta
empleada con mucha frecuencia
para describir el patrn de las
llegadas a un sistema de colas
Para tasas medias de llegadas
pequeas es asimtrica y se hace
ms simtrica y se aproxima a la
binomial para tasas de llegadas altas
Sistemas de colas:
Las llegadas - Distribucin de Poisson
Su forma algebraica es:
Donde:
P(k) : probabilidad de k llegadas por
unidad de tiempo
: tasa media de llegadas
k
e
P(k)
k!

=
Sistemas de colas:
Las llegadas - Distribucin de Poisson
Llegadas por unidad de tiempo 0
P
Sistemas de colas: La cola
El nmero de clientes en la cola es el
nmero de clientes que esperan el
servicio
El nmero de clientes en el sistema
es el nmero de clientes que
esperan en la cola ms el nmero de
clientes que actualmente reciben el
servicio
Sistemas de colas: La cola
La capacidad de la cola es el nmero
mximo de clientes que pueden
estar en la cola
Generalmente se supone que la cola
es infinita
Aunque tambin la cola puede ser
finita
Sistemas de colas: La cola
La disciplina de la cola se refiere al
orden en que se seleccionan los
miembros de la cola para comenzar
el servicio
La ms comn es PEPS: primero en
llegar, primero en servicio (FIFO)
Puede darse: seleccin aleatoria,
prioridades, UEPS, entre otras.
Sistemas de colas: El servicio
El servicio puede ser brindado por un
servidor o por servidores mltiples
El tiempo de servicio vara de cliente a
cliente
El tiempo esperado de servicio
depende de la tasa media de servicio
(u)
Sistemas de colas: El servicio
El tiempo esperado de servicio
equivale a 1/u
Por ejemplo, si la tasa media de
servicio es de 25 clientes por hora
Entonces el tiempo esperado de
servicio es 1/u = 1/25 = 0.04 horas,
o 2.4 minutos
Sistemas de colas: El servicio
Es necesario seleccionar una
distribucin de probabilidad para los
tiempos de servicio
Hay dos distribuciones que
representaran puntos extremos:
La distribucin exponencial
(o=media)
Tiempos de servicio constantes
(o=0)
Sistemas de colas: El servicio
Una distribucin intermedia es la
distribucin Erlang
Esta distribucin posee un parmetro
de forma k que determina su
desviacin estndar:
1
media
k
o =
Sistemas de colas: El servicio
Si k = 1, entonces la distribucin
Erlang es igual a la exponencial
Si k = , entonces la distribucin
Erlang es igual a la distribucin
degenerada con tiempos constantes
La forma de la distribucin Erlang
vara de acuerdo con k
Sistemas de colas: El servicio
Media Tiempo
0
P(t)
k =
k = 1
k = 2
k = 8
Sistemas de colas:
Distribucin Erlang
Distribucin Desviacin estndar
Constante 0
Erlang, k = 1 media
Erlang, k = 2
Erlang, k = 4 1/2 media
Erlang, k = 8
Erlang, k = 16 1/4 media
Erlang, cualquier k
1/ 2media
1/ 8media
1/ k media
Sistemas de colas: Etiquetas para distintos modelos
Notacin de Kendall: A/B/c
A : Distribucin de tiempos entre
llegadas
B : Distribucin de tiempos de servicio
M : distribucin exponencial
D : distribucin degenerada
E
k
: distribucin Erlang
c : Nmero de servidores
Estado del sistema de colas
En principio el sistema est en un
estado inicial
Se supone que el sistema de colas
llega a una condicin de estado
estable (nivel normal de operacin)
Existen otras condiciones anormales
(horas punta, etc.)
Lo que interesa es el estado estable
Ejemplo: Proceso de Nacimiento y Muerte
General
Ejemplo: Proceso de Poisson Modulado por Markov (MMPP)
Concepto bsico:
Los clientes llegan para ser atendidos. Si todos los servidores estn ocupados, el
cliente espera en la cola y es atendido despus.
Parmetros: tasa de arribos, velocidad de atencin, nmero de servidores,
capacidad de la cola...
Medidas: tiempo de espera, utilizacin de los servidores, tamao de la cola,
probabilidad de rechazo...
Flujo Entrante
(Clientes que
llegan)
Cola
(Lnea de
Espera)
Servidor
(Cabeza de
lnea)
Flujo saliente
(Clientes
atendidos)
Desempeo del sistema de colas
Para evaluar el desempeo se
busca conocer dos factores
principales:
1. El nmero de clientes que
esperan en la cola
2. El tiempo que los clientes esperan
en la cola y en el sistema
Medidas del desempeo del sistema de colas
1. Nmero esperado de clientes en la cola L
q
2. Nmero esperado de clientes en el sistema L
s
3. Tiempo esperado de espera en la cola W
q
4. Tiempo esperado de espera en el sistema W
s
Medidas del desempeo del sistema de colas
Frmulas generales
= +
u
=
=

= + = + p
u
s q
s s
q q
s q q
1
W W
L W
L W
L L L
Tiempo esperado de espera en el sistema
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
Nmero esperado de clientes en el sistema
Medidas del desempeo del sistema de colas: ejemplo
Suponga una estacin de gasolina a la cual llegan en
promedio 45 clientes por hora
Se tiene capacidad para atender en promedio a 60
clientes por hora
Se sabe que los clientes esperan en promedio 3 minutos
en la cola
La tasa media de llegadas es 45 clientes por hora o
45/60 = 0.75 clientes por minuto
La tasa media de servicio u es 60 clientes por hora o
60/60 = 1 cliente por minuto
Medidas del desempeo del sistema de colas:
ejemplo
q
s q
s s
q q
W 3min
1 1
W W 3 4min
1
L W 0.75 4 3clientes
L W 0.75 3 2.25clientes
=
= + = + =
u
= = =
= = =
Tiempo esperado de espera en la cola
Tiempo esperado de espera en el sistema
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
Factor de utilizacin del sistema
Dada la tasa media de llegadas y la tasa media de
servicio u, se define el factor de utilizacin del
sistema p.
Generalmente se requiere que p < 1
Su frmula, con un servidor y con S servidores,
respectivamente, es:
s

p = p =
u u
Factor de utilizacin del sistema - ejemplo
Con base en los datos del ejemplo
anterior, = 0.75, u = 1
El factor de utilizacin del sistema si se
mantuviera un servidor es
p = /u = 0.75/1 = 0.75 = 75%
Con dos servidores (S = 2):
p = /Su = 0.75/(21) = 0.75/2 = 37,5%
Medidas del desempeo del sistema de colas: ejercicio
Suponga un restaurant de comidas
rpidas al cual llegan en promedio
100 clientes por hora
Se tiene capacidad para atender en
promedio a 150 clientes por hora
Se sabe que los clientes esperan en
promedio 2 minutos en la cola
Calcule las medidas de desempeo
del sistema
Medidas del desempeo del sistema de colas:
=
= + = + =
u
= = =
= = = =
q
s q
s s
q q
W 2min
1 1
W W 2 2.4min
5
2
5
L W 2.4 4clientes
3
5
L W 2 2 3.3clientes
3
Tiempo esperado de espera en la cola
Tiempo esperado de espera en el sistema
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
100 / 5/ 3 /
150 / 5/ 2 /
2 / 3
c h c m
c h c m

u
m
=
=
=
Modelos de una cola y un servidor
M/M/1: Un servidor con llegadas de Poisson y
tiempos de servicio exponenciales
M/G/1: Un servidor con tiempos entre llegadas
exponenciales y una distribucin general de
tiempos de servicio
M/D/1: Un servidor con tiempos entre llegadas
exponenciales y una distribucin degenerada de
tiempos de servicio
M/E
k
/1: Un servidor con tiempos entre llegadas
exponenciales y una distribucin Erlang de
tiempos de servicio
Modelo M/M/1
+
u p u p

= =
u u u

= =
u u u
= p p > = p
> = > = p
> p <
2
s q
s q
n n 1
n s
(1 )t (1 )t
s q
L L
( )
1
W W
( )
P (1 ) P(L n)
P(W t) e P(W t) e
t 0, 1
Modelo M/M/1: ejemplo
Una estacin de lavado de autos puede
atender un auto cada 5 minutos y la tasa
media de llegadas es de 9 autos por hora
Obtenga las medidas de desempeo de
acuerdo con el modelo M/M/1
Adems la probabilidad de tener 0 clientes
en el sistema, la probabilidad de tener una
cola de ms de 3 clientes y la probabilidad de
esperar ms de 30 min. en la cola y en el
sistema
Modelo M/M/1: ejemplo
+
= u = p = =

= = =
u

= = =
u u
= = = =
u

= = = =
u u
= p p = =
> = =
> =
s
2 2
q
s
q
0 0
0
3 1
s
s
9
9, 12, 0.75
12
9
L 3clientes
12 9
9
L 2.25clientes
( ) 12(12 9)
1 1
W 0.33hrs 20min
12 9
9
W 0.25hrs 15min
( ) 12(12 9)
P (1 ) (1 0.75)0.75 0.25
P(L 3) 0.75 0.316
P(W 30 / 60)

u p
u p
= =
> = p = =
12(1 0.75) 0.5
(1 )t 12(1 0.75) 0.5
(1 )t
q
e e 0.22
P(W 30 / 60) e 0.75e 0.167
Nmero esperado de clientes en el sistema
Nmero esperado de clientes en la cola
Tiempo esperado de espera en el sistema
Tiempo esperado de espera en la cola
Modelo M/M/5: ejercicio
A un supermercado llegan en promedio 80
clientes por hora que son atendidos entre sus
5 cajas.
Cada caja puede atender en promedio a un
cliente cada 3 minutos
Obtenga las medidas de desempeo de
acuerdo con el modelo M/M/5
La probabilidad de tener 2 clientes en el
sistema, la probabilidad de tener una cola de
ms de 4 clientes y la probabilidad de esperar
ms de 10 minutos en la cola
Modelo M/G/1
2 2 2
s q q
q
s q q
0 w
L L L
2(1 )
L
1
W W W
P 1 P
1
o + p
= + p =
p
= + =
u
= p = p
p <
Modelo M/G/1: ejemplo
Una estacin de lavado de autos
puede atender un auto cada 5 min. y
la tasa media de llegadas es de 9
autos/hora, o = 2 min.
Obtenga las medidas de desempeo
de acuerdo con el modelo M/G/1
Adems la probabilidad de tener 0
clientes en el sistema y la
probabilidad de que un cliente tenga
que esperar por el servicio
Modelo M/G/1: ejemplo
s q
2 2 2
q
s q
q
q
0 w
L L 1.31 .75 2.06 clientes
L 1.31 clientes
2(1 )
1
W W 0.228 hrs 13.7 min
L
W 0.145 hrs 8.7 min
P 1 0.25 P 0.75
= + p = + =
o + p
= =
p
= + = =
u
= = =

= p = = p =
Modelo M/D/1
2
s s q
q
s q q
L W L
2(1 )
L
1
W W W
1
p
= =
p
= + =
u
p <
Modelo M/D/1: ejemplo
Una estacin de lavado de autos
puede atender un auto cada 5 min.
La tasa media de llegadas es de 9
autos/hora.
Obtenga las medidas de desempeo
de acuerdo con el modelo M/D/1
Modelo M/D/1: ejemplo
s s
2
q
s q
q
q
L W 1.875clientes
L 1.125clientes
2(1 )
1
W W 0.21hrs 12.5min
L
W 0.125hrs 7.5min
= =
p
= =
p
= + = =
u
= = =

Modelo M/D/5: ejercicio


A un supermercado llegan en
promedio 80 clientes por hora que son
atendidos entre sus 5 cajas.
Cada caja puede atender en promedio
a un cliente cada 3 minutos.
Obtenga las medidas de desempeo
de acuerdo con el modelo M/D/1
Modelo M/E
k
/1
2
s s q
q
s q q
(k 1)
L W L
2k(1 )
L
1
W W W
1
p +
= =
p
= + =
u
p <
Modelo M/E
k
/1: ejemplo
Una estacin de lavado de autos
puede atender un auto cada 5 min.
La tasa media de llegadas es de 9
autos/hora. Suponga o = 3.5 min
(aprox.)
Obtenga las medidas de desempeo
de acuerdo con el modelo M/E
k
/1
Modelo M/E
k
/1: ejemplo
s s
2
q
s q
q
q
L W 2.437clientes
(k 1)
L 1.6875clientes
2k(1 )
1
W W 0.2708hrs 16.25min
L
W 0.1875hrs 11.25min
= =
p +
= =
p
= + = =
u
= = =

Modelo M/E
k
/5: ejercicio
A un supermercado llegan en promedio 80
clientes por hora que son atendidos entre sus
5 cajas.
Cada caja puede atender en promedio a un
cliente cada 3 minutos. Suponga k= 4
Obtenga las medidas de desempeo de
acuerdo con el modelo M/E
k
/1
Modelos de un servidor: Ejercicio: complete el cuadro
ejemplo estacin de lavado de autos
Modelo
L
s
W
s
L
q
W
q
M/M/1
M/G/1
M/D/1
M/E
k
/1
Modelos de varios servidores
M/M/s: s servidores con llegadas de Poisson
y tiempos de servicio exponenciales
M/D/s: s servidores con tiempos entre
llegadas exponenciales y una distribucin
degenerada de tiempos de servicio
M/E
k
/s: s servidores con tiempos entre
llegadas exponenciales y una distribucin
Erlang de tiempos de servicio
M/M/s, una lnea de espera
0
s n
s 1
n 0
s
q
q 0 s q q
2
n
s q n 0
n
s
n 0 w 0
n s
1
P
s
s! s n!
L
L P L L W
(s 1)!(s )
1
W W P P ,si n k
n!
1 s
P P ,si n k P P
s!s s! s

=
| | p u p
+
|
u
\ .
p u
= = + =
u u
p
= + = s
u
| | p u
= > = p
|
u
\ .

M/M/s, una lnea de espera


3
q
2
4
q
2
Si s 2
L
4
Si s 3
L
(3 )(6 4 )
=
p
=
p
=
p
=
p p + p
A un sistema de atencin que posee tres ejecutivos, llegan personas segn
un proceso de Poisson a una tasa de 20 personas por hora, se sabe
adems que los ejecutivos atienden a personas de forma exponencial a
una tasa de 25 personas por hora.
a) Modele este problema como un problema de colas y calcule las
probabilidades conjuntas en estado estacionario que haya k clientes en el
sistema para capacidad limitada e ilimitada de atencin
b) Calcule el nmero promedio de clientes en el sistema, L
s
c) Calcule el tiempo medio de estada en el sistema, W
s
d) Bajo este ltimo escenario cul es la probabilidad que el sistema se
encuentre vaco?
e) cul es la probabilidad que hayan ms de dos clientes en la cola?
Nota:
K 1
K
k k
k 0 k 0
1 1 a
a , a 1 a , a 1
1 a 1 a
+

= =

= < = <


k
k
0 k 1
0 k 1
k k k
k
0 0 k 2
2
0 0 1 0 2 0
k
2 k 2 K
k 0 0 0 0 0 k 2
k 0 k 3 k
P ,si k 2
P ,si k 2
2
2
con capacidad k P P
9
P ,si k 2 P ,si k 2
2 3 2 3
P P P P P P ...
2
9
como P 1 entonces P P P P 1 P 1
2 2 3 2 2 3

= =
p
p
s
s


= =

p p | |

> >
|


\ .
p
= = p =
p p p p | |
= + p + + = + p + +
|

\ .

K
3
k 1
k
2 2 2 2 K
0 0
k 0
k 1
2 2
0
1
1
9 9 3
P 1 1 1 P 1 1 1
2 2 3 3 9 2 2 3 9
1
3
3 3
9 3
P 1 1
2 2 3 3 2
=
+
=
+

=



| |
p | |
|
|
| |
p p p p p p p | |
\ .
|
+ p + + = + p + + = |
|
| | p
\ .
\ .
|

\ .
| |
p | |
|
|
p p p
\ .
|
+ p + +
|
p
|

\ .

0
k 1
2 2
1
1 4
P ;
5
3 3
9 3
1 1
2 2 3 3 2
+
=
= p =
| |
p | |
|
|
p p p
\ .
|
+ p + +
|
p
|
\ .
+
=

= <

K 1
K
k
k 0
1 a
a , a 1
1 a
k
0 k 1 2
k k 0 0 1 0 2 0
0
2 k
k 0 0 0 0 k 2
k 0 k 3
k k
2 2
0 0
k 3
P ,si k 2
2
para el problema se tiene P P P P P P P
2
9
P ,si k 2
2 3
como P 1 entonces P P P P 1
2 2 3
9 9
P 1 1 P 1
2 2 3 2 2 3

= =

=
p
s

p
= = = p =

p | |

>
|

\ .

p p
= + p + + =


p p p p | | | |
+ p + + = + p + +

| |
\ . \ .


2
k 0
2 2 2 2
0 0
2 2
0
0 0
1 1
3 9
9 1 9 3
P 1 1 1 P 1 1 1
2 2 3 9 2 2 3 3 9
1
3
27 9 3
P 1 1
2 6 2 2 2 2
1 4 55
P como P
27 9 3
5 12
1
6 2 2 2

=

| |
p p
= |
|

\ .


| |
|
| | p p p p p p
+ p + + = + p + + =
| |
p
p
\ . |


\ .

p p p
+ p + + =

p

= p = = =
p
u
+ p +
p

1 2
1 2 0
0.44715
3
4 4
5 5
P 0.44715 0.35772 ; P 0.44715 0.05589375
2 2
=
| | | |
| |
\ . \ .
= = = =

=
= <

k
k 0
1
a , a 1
1 a
k
0 k 1
k k
0
1 2
1 2
0
k 0 1 2 k k
k 0 k 3 k 3
P ,si k 2
2
P
9
P ,si k 2
2 3
4 4
5 5
P 0.44715 0.35772 ; P 0.44715 0.05589375
2 2
L k P 0 P 1 P 2 P k P 0.35772 0.05589375 k P
9
0.35772 0.05589375 k
2 3


= = =
p
s

=

p | |

>
|

\ .

| | | |
| |
\ . \ .
= = = =
= = + + + = + +
p
= + +

( )
k
0
k 3
k 2
k 0
2
2
P
9
0.35772 0.05589375 0.44715 k 0 2
2 3 3 3
9 4 4 4/15
0.35772 0.05589375 0.44715 9 0.44715 0.44715
2 15 15
1 4/15
9 60 6
0.35772 0.05589375 0.44715
2 121 5

=
| |
|
\ .
| |
p p p | | | |
= + + |
| |
|
\ . \ .
\ .
| |
= + +
|
\ .
= + +

16
0.44715 0.44715
25
0.58886304 cliente en el sistema

~
k
2
k 0
3
k , 1
3 3
1
3

=
p
p p | |
= <
|
\ . p | |

|
\ .

c)
d)
e) P(k > 2 en la cola) = P(k > 6 en el sistema)
= 1 P(k 6)
L 6508/ 6765 personas
W 0.02943152 horas 1.76589 minutos
20 personas/ hora
= = = ~

0
P 0.44715 44.72%de probabilidad que el sistema est vaco = ~
0 1 0 2 3
4 5 6
55 44 88 352
P P P P P
123 123 615 27675
P 0.01 P 0.0027 P 0.0016
P(k 6) 1 0.9753 2.47%
= = p = = =
= = =
> = ~
A una mesa de ayuda de dos ejecutivos, llaman clientes segn un proceso
de exponencial de tasa 20 personas por hora, se sabe adems que los
ejecutivos atienden los llamados segn un proceso de Poisson, con un
tiempo entre llamadas de 2 minutos.
a) Modele este problema como un problema de colas y calcule las
probabilidades conjuntas en estado estacionario que haya k clientes en el
sistema para capacidad limitada e ilimitada de atencin
b) Calcule el nmero medio de clientes en el sistema, L
s
c) Calcule el tiempo medio de estada en el sistema, W
s
d) Bajo este ltimo escenario cul es la probabilidad que el sistema se
encuentre vaco? cul es la probabilidad que un cliente no sea atendido?
e) cul es la probabilidad que hayan ms de dos clientes en la cola?
Nota:
K 1
K
k k
k 0 k 0
1 1 a
a , a 1 a , a 1
1 a 1 a
+

= =

= < = <


0
k
k
k 1
20 2
20 personas / hora , 30 personas / hora
30 3
2 / 3 1
b) L clientes
2 2 2 / 3 2
L 1/ 2 personas
c) W 0.025 horas 1.5 minutos
20 personas / hora
2 2 2 / 3
d) P 0.3333 33.33%
4 4
2
P con k
2
4 1
2
+
= u = p = =
p
= = =
p
= = = ~

p
= = = =
p p
| |
=
|
| |
\ .
p
| |

|
|
|
\ .
\ .
6
6 P 0.015% ~ =
0 1 2 3 4
2 3 4
0 0 0 0 0
0
e) P(k > 4) = 1 - P(k 4)
= 1- (P + P + P + P + P )
= 1- P + P + P + P + P
2 2 2 2
= 1- P 1 + +
2 2
s
| |
p p p p
| | | | | |

|
| | |
|
\ . \ . \ .
\ .
p p
| |


\ .
2 3 4
+ +
2 2
1 1 1 1 1
= 1- 1 + + + +
3 3 9 27 81
= 0.5021 50.21%
| |
p p
| | | |
|
| | |
|
\ . \ .
\ .
| |

|
\ .
~
Para que hayan ms de dos clientes en la cola k debe ser mayor que 4
1.- Debido a un reciente incremento en el negocio una
secretaria de una cierta empresa tiene que mecanografiar 20
cartas por da en promedio (asuma una distribucin de
Poisson). A ella le toma aproximadamente 20 minutos
mecanografiar cada carta (asuma una distribucin
exponencial). Suponiendo que la secretaria trabaja ocho
horas diarias.
= 20 / 8 = 2.5 cartas/hora
= (1/20 min)(60 min/ 1 hora) = 3 cartas/hora
La tasa de utilizacin de la secretaria estar definida por:
2.5
0.84
3

p = = =
u
K
0 0.834
1 0.694
2 0.578
3 0.482
4 0.401
5 0.334
El tiempo promedio de espera antes que la secretaria
mecanografe una carta se deducir de la siguiente manera:
el nmero promedio de cartas que estarn en la lnea de
espera:
Si se desea conocer la probabilidad que a la secretaria tenga
que mecanografiar ms de cinco cartas, se determinara de la
siguiente manera:
q
2.5
W 1.67 horas
( ) 3(3 2.5)

= = =
u u
2 2
q
2.5
L 4.17
( ) 3(3 2.5)

= = =
u u
k 1
k,
P
+
u
= p
2.- Un veterinario maneja una clnica de vacunacin antirrbica
para perros, en un colegio local. El veterinario puede vacunar
un perro cada tres minutos. Se estima que los perros llegarn
en forma independiente y aleatoriamente en el transcurso del
da, en un rango de un perro cada seis minutos, de acuerdo
con una distribucin de Poisson. Tambin, suponga que los
tiempos de vacunacin del veterinario estn distribuidos
exponencialmente. Determinar: La probabilidad que el
veterinario est de ocioso
= 1/6 = 0.167 perros/min
= 1/3 = 0.34 perros/min
La probabilidad que el veterinario est de ocioso est dado por:
0
1/ 6
0.5 P 1 0.5
1/ 3

p = = = = p =
u
La proporcin de tiempo en que el veterinario est ocupado.
El nmero total de perros que estn siendo vacunados y que
esperan a ser vacunados
El nmero promedio de perros que esperan a ser vacunados.
1/ 6
0.5
1/ 3

p = = =
u
1/ 6
L 1
1/ 3 1/ 6

= = =
u
2 2
q
(1/ 6)
L 0.5
( ) 1/ 3(1/ 3 1/ 6)

= = =
u u
3.- Las llamadas llegan al conmutador de una oficina a una tasa de dos por
minuto, el tiempo promedio para manejar cada una de estas es de 20
segundos. Actualmente slo hay un operador del conmutador. Las
distribuciones de Poisson y exponencial parecen ser relevantes en esta
situacin.
= 2 llamadas/minutos
= (1/20 seg)(60 seg) = 3 llamadas/minuto
La probabilidad que el operador este ocupado se definir por:
2
3

p = =
u
El tiempo promedio que debe de esperar una llamada antes de ser tomada
por l operador
El nmero de llamadas que esperan ser contestadas
q
2
W 0.6667
( ) 3(3 2)

= = =
u u
2 2
q
2
L 1.34
( ) 3(3 2)

= = =
u u
4.- Electronics Corporation retiene una brigada de servicio para
reparar descomposturas de mquinas que ocurren con
promedio de tres por da (aproximadamente de naturaleza de
Poisson). La brigada puede servir a un promedio de ocho
mquinas por da, con una distribucin de tiempo de reparacin
que se asemeja la distribucin de exponencial.
= 3 repar./da = 8 repar./da
La tasa de utilizacin de este sistema est dado por:
El tiempo promedio de descompostura para cada mquina que
est descompuesta es:
3
0.375
8

p = = =
u
1 1
W 0.2
8 3
= = =
u
K
0 0.375
1 0.140
2 0.052
3 0.019
4 0.007
5 0.002
Las mquinas que estn esperando a ser reparadas el cualquier
momento dado
La probabilidad de que haya una mquina en el sistema, dos,
tres o ms mquinas en el sistema.
2 2
q
3
L 0.225
( ) 8(8 3)

= = =
u u
k 1
k,
P
+
u
= p
Dado un sistema de colas con un servidor cuyos tiempos entre
llegadas siguen una distribucin exponencial con las siguientes
tasas:
y cuyos tiempos de servicio son exponenciales de tasa:
a) Represente el sistema como una cadena de Markov
b) Obtenga la probabilidad que en el sistema haya k clientes
cuando el sistema alcanza el estado estacionario
c) Obtenga el nmero medio de clientes en el sistema
d) Calcule la tasa global de llegada y el tiempo medio de
estada en el sistema.
Observacin :
k
k 0,1,2,3,....
k 1

= =
+
k
; k 0,1,2,3,.... u = u =
k
k 0
e
k!

p
=
p
=

0 0
1 0 0
2
k
2 k 0 k
2 1 0 0 k 0
3
3
3 2 0 0
k
k
k 0 0 0
k 0 k 0 k 0
k
0 k
P P
P P P
1
P P y P 1 1 1
P P P P
k!
2 2 2
1 1
P P P P
3 6 6
por tanto
1
P 1 P 1 P 1 P e 1
k! k!
1
luego P e y P e
k!

=

p
= = =
p p
=


= = p
u

= p = | |
`
= = = p
|

u u
\ .

| |
= = = p
|
u u

\ .
)
p
= p = = =
= = p


a)
b)
k k 1
k
k
k 0 k 1 k 1 k 1 0
1
L k P 0 k e e e
k! (k 1)! (k 1)!
e e

p p p
= = = =
p p
p p
= = + p = = p

= p = p

c)
5.- A una impresora le llegan trabajos para imprimir con una
tasa de 8 por minuto, siguiendo las llegadas un proceso de
Poisson. El tiempo de impresin es exponencial de media 5
segundos. Esta impresora almacena los trabajos que le llegan
en un buffer con capacidad para tres mensaje. Suponer que la
memoria de la impresora es suficiente como para almacenar en
ella todo el trabajo que est siendo impreso. Calcular:
a) La probabilidad que un mensaje llegue directamente a la
impresora sin tener que esperar cola.
b) La probabilidad que en este sistema de impresin haya
menos de tres trabajos esperando a ser impresos
c) Nmero medio de trabajos en el sistema de impresin
d) Tiempo medio de espera en el buffer de un trabajo hasta que
pasa a la impresora
e) Probabilidad que se pierda un mensaje que llega al sistema
para ser impresos
Sol. =8 t/min ; = 1/5seg = 1/(5 seg/t)60 seg/min = 12 t/min
L
mx
=3
a)
b)
c)
d)
e)
( )
0
2 3 3
1 0 2 0 2 0 2 0
3
2 3
k 0
k 0
0 0
P ?
P P P P P P y P P
por tanto
P 1 P 1 1
2 4 8 27
P 1 1 P 41.538%
3 9 27 65
=
=
= p = p = p = p
= + p + p + p =
| |
+ + + = = =
|
\ .

0 1 2 0
27 2 27 4 27
P P P P 0.87755
65 3 65 9 65
+ + = = + + =
3
k 1 2 3
k 1
2 27 4 27 8 27
L k P 1 P 2 P 3 P 2 3 1.015 t
3 65 9 65 27 65
=
= = + + = + + =

q
L 1.015 t 1
W 0.12692 min 7.61seg W W 7.61 5 2.61seg
8 t / min
= = = ~ = = =
u
3
3
3 0
2 27
P P 12.31%
3 65
| |
= p = =
|
\ .
Considere una cola M/M/1 con tasa de arribos clientes por
segundo. Encuentre la tasa de servicio para que el tamao
medio de la cola sea 5 clientes (es decir, E(Nq)=5)
q q
q q q
2
q
2 2
E(N ) L 5
1
W W / W W L L
L 5
1
5 5 5 5 0 0.85
como 0.85
= =

= + = + = + p
u u
p
= =
p
p = p p + p = p

p = u =
u
Una empresa de servicios tiene cuatro ingenieros para atender
a 20 grandes servidores de una ciudad. Cada servidor necesita
del servicio tcnico cada 5 das (en media), siendo exponencial
la distribucin del tiempo entre dos servicios consecutivos. El
tiempo que cada ingeniero tarda en reparar un servidor sigue
una distribucin exponencial de media 1.5 das.
a) Cul es la probabilidad que haya 2 o ms ingenieros sin
trabajar?
b) Cul es la probabilidad que un ordenador que se estropea
tenga que esperar para ser reparado?
c) La compaa contratara ms ingenieros si los tiempos
medios de espera para cada servicio son superiores a medio
da cuntos ingenieros ms deber contratar la compaa?
M/M/4/20
1servicio 1servicio 2
;
5 das 1.5 das 15
= u = p =
j
0
j 0
j
j j m m k m
0
j m
j 0 j 1
P si 0 j m
1 j!
P y P
P si m j K
j! m! m m m!

= =

p
s s

= =


p p p p
| |
+ s s

|


\ .



M/M/m=4/K=20
luego
0
j 4
j 4 4 16
2 3 4 j
16
j 0 j 1
j 1
0
1 1
P
2
2 1 2 1 2 1 2 1 j! 4! 4 15
1
15 2 15 6 15 24 15 24 50
P 0.8751
= =
=
= =

p p p | | | |
+

| |
| | | | | | | |
\ . \ .


+ + + + +
| | | |

\ . \ . \ . \ .


=

P(2oms ingenieros sin trabajar) P(0 o1servidores enmal estado) P(0) P(1) = = +
Los clientes llegan a una ventanilla bancaria de autoservicio,
segn una distribucin de Poisson con media de 10 por
hora. El tiempo de servicio por cliente es exponencial con
media de 5 minutos. El tiempo de servicio por cliente es
exponencial con media de 5 minutos. El espacio en frente de
la ventanilla , incluyendo al auto al que se le est dando
servicio, puede acomodar un mximo de tres automviles.
Otros vehculos pueden esperar fuera del espacio.
a) Cul es la probabilidad que un cliente pueda manejar
directamente hasta el espacio frente a la ventanilla?
b) Cul es la probabilidad que un cliente que llega tendr
que aguardar fuera del espacio indicado?
c) Cuntos espacios deber proporcionar enfrente de la
ventanilla de manera que todos los clientes que llegan
puedan esperar frente a sta al menos el 20% del
tiempo?
0
k 4
k 4
10 clientes / hora 0.16667 clientes / minuto
5 minutos
0.16667
0.033334
5
a) P 1 0.96667
b) P (1 ) P (1 0.03333) 0.03333 0.000001
como son tres ventanillas de atencin, la probabilidad que
tenga que esperar fu
= =
u =

p = = =
u
= p =
= p p = =
k k
k
era del espacio indicado es del 0%
c) P (1 ) 0.2 (1 0.03333) 0.03333 0.2
k 0.4632 k 1ventanilla
= p p = =
= ~
Se deber proporcionar una ventanilla, de manera que todos
los clientes que llegan puedan esperar frente a sta al menos
el 20% del tiempo

Вам также может понравиться