Вы находитесь на странице: 1из 23

CAPITULO 6

SELECCION DEL TAMAO DE LA

MUESTRA

6.1

Anlisis de resultados de la simulacin

La mayora de los sistemas estudiados a travs de la simulacin tienen un comportamiento


estocstico en sus datos iniciales (ejemplo: el proceso de arribo de la entidades) y en algunos de
sus componentes internos (ejemplo: tiempos de servicio en las instalaciones). La relacin entre los
varios componentes internos de un sistema pueden estar tambin sujeto a cambio (ejemplo: la
probabilidad de que una entidad siga una cierta ruta) Los modelos de simulacin convierten las
influencia estadsticas que ellos reciben en la forma de insumos y procesos internos, en datos
estadsticos lo cual constituye sus resultados. Desde el punto de vista del anlisis de los
resultados, la simulacin es simplemente otro mtodo de muestreo y anlisis estadstico. El
objetivo de este captulo es la de proveer conceptos rudimentarios relacionados con el papel del
anlisis estadstico en la simulacin y demostrar las aplicaciones de esos conceptos a travs de
ejemplos numricos.

6.2

La importancia del Anlisis de resultados de la simulacin

Los estudios de simulacin pueden realizarse por alguno de los siguientes propsitos:
1. Para determinar las caractersticas (media, varianza, mnimo, mximo, etc.) de ciertas
variables para condiciones iniciales dadas., valor de los parmetros, y configuraciones del
modelo para analizar y comprender el comportamiento de un sistema existente o para
predecir el comportamiento de un sistema futuro en la etapa de diseo del sistema.
2. Para comparar las caractersticas (media, varianza, mnimo, mximo, etc.) de ciertas
variables bajo varias condiciones de datos iniciales, valor de los parmetros, y
configuracin del modelo. La manipulacin de estos factores y la comparacin de sus
efectos para cada escenario simulado puede resultar en determinar las condiciones bajo
las cuales el sistema opera satisfactoriamente. El ltimo intento del analista puede ser
mejorar el desempeo de un sistema existente o disear un sistema futuro.

La mayora de los sistemas estudiados con la simulacin son estocsticos. La simulacin por
naturaleza es, por lo tanto, un proceso de muestreo estadstico, un proceso de estimacin y un
proceso de anlisis. Como en el caso de un estudio analtico, la eleccin del tiempo de muestreo y
el tamao de la muestra afectan a la calidad de las estimaciones de los parmetros de la poblacin
para la cual la muestra es tomada. Contradictoriamente, para decidir sobre el tamao de la
muestra, es necesario tener algn conocimiento acerca de los parmetros.

Un anlisis sistemtico de los resultados de la simulacin es un componente esencial para


cualquier estudio de simulacin. Es por los resultados, despus de todo, que son construidos los
modelos de simulacin. Muchos usuarios de la simulacin, sin embargo, tienden a ignorar la
importancia de analizar apropiadamente el resultado de los programas de simulacin. De hecho,
muchos usuarios de la simulacin sacan conclusiones de sus estudios de simulacin basado en el
resultado nicamente de una sola corrida de simulacin con una longitud de tiempo de corrida
arbitraria.

6.3

Tipos de simulacin con respecto al anlisis de los resultados

Sistemas que no terminan: Son aquellos que su operacin no tienen un fin durante un horizonte
de tiempo razonable. Algunos ejemplo de sistemas que no terminan son; una red de comunicacin,
el cuarto de emergencias de un hospital, un centro de computo, una interseccin vial, etc. Adems,
algunos sistemas que aparentemente si terminan actualmente no los son. Una fabrica, por ejemplo,
que cierra al final de cada da y abre el prximo da puede ser correctamente visto como un
sistema que no termina, siempre que se considere el flujo y la posicin de las partes de los
diversos inventarios implicados, ya que la condicin inicial cada da, es la condicin final del da
anterior.
La mayora de los sistemas que no terminan no siempre alcanzan el estado estacionario. El
comportamiento del estado estacionario es tpicamente el inters de la mayora de los estudios de
los sistemas que no terminan.

Sistemas que terminan: Son aquellos que tpicamente inician de un estado inactivo o vaci y
terminan con algunas de estas dos condiciones. La terminacin de tales sistemas ocurre ya sea
despus de cierto lapso de tiempo o en el tiempo de ocurrencia de cierto evento. Un banco que
inicia sus operaciones en la maana con un estado vaci cierra despus de 8 horas es un ejemplo
de un sistema que termina que es controlado por el tiempo Algunos ejemplos de sistemas que
terminan cuya operacin termina cuando un evento acontece son;:una compaa constructora que
ha ganado un contrato para construir un hospital, una armadora de camiones que ha recibido una
orden para construir 5 autobuses, la falla de un instrumento complicado, una batalla entre dos
grupos, etc. Los sistemas que terminan pueden o no alcanzar el estado estacionario (si tienen
alguno) antes de que su operacin termine. Si tienen estado estacionario, entonces en ciertas
situaciones deben ser tratados como sistemas que no terminan. Por ejemplo, si estamos
interesados en encontrar el nmero de asientos que se requieren en un rea de espera de una
esttica, estaremos interesados en conocer si el sistema tiene estado estacionario para basar
nuestra decisin del estado del sistema. Es probable que ocurra que la esttica no alcance el
estado estacionario antes de que llegue la hora de cerrar. En este caso se puede extender la
simulacin ms all del fin natural de la operacin del sistema con el fin de obtener datos
suficientes para propsitos de estimacin
En muchas ocasiones, especialmente cuando su terminacin es controlada por un evento, los
sistemas que terminan no alcanzan el estado estacionario antes de su terminacin. En tales casos

se deben de realizar varias corridas independientes. El mtodo de replicas independientes, puede


ser aplicado para analizar estadsticamente este tipo de sistemas que terminan.

6.4

Intervalos de Confianza

La exactitud de una estimacin estadstica es siempre expresada sobre un intervalo en lugar de un


valor fijo. Estos intervalos son nicamente estimaciones; ellos pueden o no contener el valor
verdadero del parmetro que esta siendo estimado. El grado de confianza en el intervalo que
actualmente contiene el parmetro esta representado por una probabilidad, generalmente referida
como nivel de confianza, y el intervalo en si mismo es llamado intervalo de confianza. Para un nivel
dado de confianza, un intervalo de confianza menor es considerado que sea mejor que uno mas
grande. De igual forma, para un dado intervalo, un alto nivel de confianza indica una mejor
estimacin. Consecuentemente, usando una muestra de datos dada, un analista puede crear
muchos intervalos de confianza con diversos niveles de confianza (ejemplo: entre mayor sea el
nivel de confianza, mas ancho es el intervalo de confianza correspondiente). En la practica, sin
embargo, el analista a priori acepta un nivel de significancia y se adhiere a el.
La eleccin del tamao de la muestra tambin afecta el intervalo y el nivel de confianza.
Generalmente, para un dado nivel de confianza, entre mayor sea el tamao de la muestra, menor
ser en intervalo de confianza. En otras palabras, para especificar el tamao de la muestra es
necesario conocer el intervalo y nivel de confianza de los parmetros que van a ser estimados.

6.4.1 Estimacin de la media de la poblacin


Los valores promedios de las variables en los modelos de simulacin son medidas frecuentemente
importantes, y en la mayora de los estudios es el foco del anlisis. El tiempo promedio de espera
en la cola, el tiempo promedio en el sistema, la longitud promedio de la cola, y el tiempo promedio
entre salidas son algunos ejemplos de estimaciones de promedios frecuentemente usadas.
Generalmente, los dos valores mas importantes reportados en un resultado de simulacin para un
__

variable son la media x y la desviacin estndar . Si una observacin individual de una variable
aleatoria son denotadas por X1,X2,X3,......Xn para n observaciones ( ejemplo: el tiempo de espera
en el sistema para n entidades), la media y la varianza de la muestra son calculadas usando las
siguientes ecuaciones:
__

X=

x1 + x2 + ..... + xn
n

__
1 n

i x
n 1 i =1

Considerando que las variables aleatorias con independientes una de otra y estn idnticamente
__

distribuidas, la distribucin de la media de las variables anteriores x , es normal ( para una


muestra suficientemente grande, ejemplo: superior a 30). Esto se cumple debido al teorema del
Lmite Central, el cual estipula que para una muestra de tamao suficientemente grande (sin
importar la distribucin de las muestras individuales), la distribucin de la media muestral es normal
si las muestras individuales son independientes de las otras y estn idnticamente distribuidas. Por
lo tanto, la variable aleatoria Z esta distribuida normalmente con media cero y una desviacin
estndar de uno (distribucin normal estndar), donde Z esta definida como
__

Z=

x
__
x

__ =
x

donde es la media de la poblacin que se intenta estimar, y es la desviacin estndar de la


poblacin de las variables aleatorias. As mismo, con una probabilidad de 1- , el intervalo entre dos
valores simtricos dados por la tabla de la distribucin normal estndar para el valor
correspondiente de contendr a Z. La relacin del intervalo de confianza puede ser escrita como:

P Z Z Z = 1
2
2

Sustituyendo el valor de Z en la expresin anterior y haciendo algunos arreglos, se deriva para los
intervalos de confianza de la poblacin la siguiente expresin:

Z
__ Z
__

2
P x
x + 2 = 1
n
n

Debido a que la desviacin estndar de la poblacin generalmente no es conocida, y debido como


la desviacin estndar de la muestra ,S, sirve como un estimador razonable para , S ser usado
en adelante en lugar de .
Debe mencionarse que tpicamente no menos de 30 muestras independientes deben ser usadas
para la distribucin normal para justificar el uso de la distribucin normal para los clculos de los

intervalos de confianza y otras aplicaciones relacionadas que usan la anterior relacin estadstica.
Cuando una muestra es menor de que 30, la distribucin t-student deber ser usada.

Mitad del ancho del int ervalo = ma =

(t

n 1, / 2

)s

donde tn 1, / 2 es un factor que puede ser obtenido de la tabla de la distribucin t-student

Ejemplo #1 Adems de proveer un ejemplo numrico para los intervalos de confianza, este
ejemplo tambin sirve para demostrar que la independencia de los datos no esta limitada a la
terminacin del sistema. Suponga que una gasolinera esta localizada a un costado de carretera
que conecta las ciudades A y B. El administrador de la gasolinera ordena va telefnica la gasolina
de ambas ciudades. El tiempo entre rdenes para la ciudad A esta uniformemente distribuido entre
5 y 9 horas, y el tiempo entre ordenes para la ciudad B esta uniformemente distribuido entre 10 y
14 horas. El tiempo de traslado de las pipas de gasolina de la ciudad A a la gasolinera esta
normalmente distribuida con media de 7 horas y una desviacin estndar de 0.5 horas, y el tiempo
de traslado de las pipas de gasolina de la ciudad B a la gasolinera esta normalmente distribuida
con media de 12 horas y una desviacin estndar de 2 horas. Considere que inmediatamente
despus de realizar la orden, una pipa es enviada a la gasolinera. Simulando el sistema para el
arribo de 100 pipas a la gasolinera, nos gustara determinar un de intervalo de confianza del 95%
para la media del tiempo entre el arribo de las pipas a la gasolinera. Recuerde que 30 o mas
observaciones independientes son suficientes para justificar el uso de la distribucin normal. Por lo
que una muestra de 100 observaciones es suficiente. El valor de Z de la tabla de la distribucin
normal para 1- /2=1.0.95=0.05. Por lo que un valor de Z de 1.96 que corresponde a 10.05/2=0.975 se obtiene de la tabla para este ejemplo. As, usando los valores de generados
__

simulando el sistema de una media x de 4.37 y una desviacin estndar S de 2.39, tenemos;

4.37

(1.96)(2.39)
(1.96)(2.39)
4.37 +
100
100

3.9 4.83
El intervalo de [3.9, 4.83] es un intervalo de confianza del 95% para el tiempo entre arribos
promedio de las pipas a la gasolinera. Simulando este modelo para un a muestra de tamao
grande demuestra que el hecho de que una muestra de 100 es suficientemente grande, como
resultado de corridas con tamao de muestra mas grandes no existen indicios de variaciones
mayores de los valores de la media y de la desviacin estndar en relacin con los valores
obtenidos con la muestra de tamao 100. No obstante, incrementar el tamao de la muestra
incrementar el valor del denominador en la relacin del intervalo de confianza, y an si la
desviacin estndar permanece sin cambio, un intervalo de confianza menor resultar. Esto

simplemente indica que para un dado nivel de confianza, una muestra de tamao mas grande
provee estimaciones mas ajustadas de los parmetros de la poblacin.
Note en este ejemplo que puede argumentarse que a largo plazo el tiempo entre arribos de las
pipas a la gasolinera es la suma de las tasas promedio de salida de las pipas de las ciudades, y es
independiente del tiempo de viaje de las pipas.( ejemplo, eventualmente cada pipa que abandona
las ciudades llega a la gasolinera independientemente del tiempo de viaje). Este es definitivamente
un argumento legtimo. La siguiente relacin provee el tiempo promedio entre arribos de las pipas a
la gasolinera:

1
= 0.226 Pipas / hora
Tiempo promedio entre arribo a la gasolinera =
+
5 + 9 10 + 14
2 2
Por lo que el tiempo promedio entre arribos a la gasolinera es de

1
= 4.42 Horas
0.226

Ntese que la estimacin de la simulacin para la media anterior basada en una muestra de 100
horas ha sido 4.37 horas, lo cual sustenta el argumento anterior.

Ejemplo #2 Se desea determinar la media o el nmero promedio de clientes que llegan a cortarse
el pelo a una esttica el sbado por la maana. Maric dueo de la esttica, la abre a las 8:00
a.m. y la cierra a las 12:00 p.m. del mismo da. Para determinar el valor exacto para el verdadero
promedio de clientes a los que se les corta el pelo el sbado por la maana, se desea calcular el
promedio basado en el numero de cortes realizados todas las maanas de los sbados en la
esttica. No deseando trabajar mucho, se decide realizar una estimacin de verdadera media ,
trabajando los prximos 12 sbados por la maana registrando el numero de clientes que se cortan
el pelo entre las 8:00 a.m. y las 12:00 p.m.

Numero de cortes observados en 12 sbados


Observacin

Numero
cortes

21

16

11

17

de

16

14

15

10

16

11

14

12

10

Media

de

13.67

la

__

muestra x
4.21

Desviacin
estndar de la
muestra s

Considere ahora que los datos del ejemplo de la esttica son independientes y estn normalmente
distribuidos, y 95% de nivel de confianza.
Dado que:

P= nivel de confianza =0.95


= nivel de significancia =0.05
n= tamao de la muestra
__

x =13.67 cortes
S= 4.21 cortes
De la tabla de la distribucin t-student, se tiene que tn 1, / 2 = t11,0.025 =2.201. El mitad del ancho es
calculado de la manera siguiente:

ma =

(t11,0.025 ) S
n

(2.201)4.21
= 2.67 cortes
12

Los lmites inferior y superior con un intervalo de confianza del 95% son calculados como sigue:
__

Lmite inferior = x ma =13.67-2.67=11.00 cortes


__

Lmite superior = x + ma =13.67+2.67=16.34 cortes

Se puede asegurar con un 95% de confianza que la verdadera pero desconocida media se
encuentra entre 11 y 16.34 cortes (11.00 cortes 16.34).

El ancho del intervalo indica le exactitud del punto estimado. Es deseable tener un intervalo
pequeo con alta confianza (generalmente 90% o mayor). El ancho de intervalo de confianza es
afectado por la variabilidad del sistema y el nmero de observaciones realizadas (tamao de la
muestra). Se puede observar de la ecuacin de la mitad del ancho que, para un dado nivel de
confianza, la mitad del ancho se encoger si (1) el tamao de la muestra n se incrementa o (2) la
variabilidad en el resultado del sistema (desviacin estndar S) es reducida. Dado que se tiene
poco control sobre la variabilidad del sistema, nos resignamos a incrementar el tamao de la
muestra (mas rplicas) para incrementar la exactitud de nuestras estimaciones.

6.4.2 Estimacin de la proporcin


La proporcin es otra figura de inters en la mayora de los estudios de simulacin. Algunos
ejemplos de proporciones son los valores fraccionales tales como el porcentaje de las partes que
no pasan una prueba de control de calidad, el porcentaje de carros que dan vuelta a la izquierda en
una interseccin, y las ventas perdidas como porcentaje del numero total de negociaciones
demandadas.
Una proporcin puede representar el porcentaje de uno de los posibles tipos de resultados en un
nmero de pruebas. Refirindose a los resultados como el xito y fracaso como probabilidades de
p y 1-p, respectivamente, puede ser definida una variable aleatoria la cual toma los valores de 0
(falla) o 1 (xito). Esta variable aleatoria binaria tiene una distribucin Bernoulli para la cual la
media es p y la varianza p(1-p). Para una muestra de tamao n la relacin del numero de xitos a
__

el total del numero de pruebas, p , es el estimador para p y esta normalmente distribuido si n es


mayor que 10, np>5, y n(1-p)>5. La siguiente ecuacin puede expresarse como:

P Z
2

p p
Z = 1
p(1 p)
2

n
__

A diferencia del intervalo de confianza para la media, el intervalo de confianza p puede no ser
__

encontrado por un simple reordenamiento de la ecuacin anterior. Si se sustituye p por p en el


denominador (una buena aproximacin para cuando n es grande), se obtiene el siguiente intervalo
de confianza:

__

P p Z
2

__

__

__
p(1 p)
p p+ Z
n
2

__
p (1 p )
= 1
n

__

Debido a que el tamao de la muestra en una simulacin es generalmente grande para cumplir
con los requerimientos de la distribucin normal usado para llegar a la anterior ecuacin, el nicos
factores limitantes en el uso de la ecuacin anterior son las condiciones que np>5 y que n(1-p)>5.
Si estas condiciones no son reunidas en un cierto experimento, entonces un intervalo de confianza
mas preciso puede ser construido sobre el numero promedio de xitos (en lugar de la proporcin e
xitos) usando la distribucin Binomial. La proporcin puede ser entonces estimada dividiendo el
estimado del numero total de xitos entre el numero total de pruebas. Muchos libros de estadstica
presentan el proceso para elaborar los intervalos de confianza para variables aleatorias distribuidas
binomialmente.

Ejemplo #3 Suponga que la red de actividades de un proyecto, representa las actividades


requeridas para elaborar una unidad de un producto. Considrese que el fabricante esta interesado
en encontrar un intervalo de confianza con un 96% para la proporcin de productos que toman 15
das o menos para ser producidos, basado en la produccin de 500 unidades. La simulacin arroja
como resultado que en promedio 38 unidades de 500 les tomo producirlas 15 das o menos. En
otras palabras, la proporcin es de 38/500=0.076, o 7.6% de la produccin total (adems note que
esta proporcin es relativamente cercana al valor del 7% que se obtiene de la tabla de la
distribucin normal).
Usando la relacin correspondiente para el intervalo de confianza y la proporcin anterior,
tenemos:

1 = p(.076 1.96

.076(1 0.76)
.076(1 0.76)
p 0.76 + 1.96
500
500

lo cual produce

0.053 p 0.099
Este intervalo se puede interpretar de la manera siguiente: Se tiene un 95% de confianza de que el
tiempo de produccin para aproximadamente del 5 al 10 por ciento de los productos en 15 menos
das.

6.4.3 Estimacin de la Diferencia entre Medias


Frecuentemente es til simular un sistema bajo dos diferentes escenarios (ejemplo, un sistema de
un solo servidor y otro de dos servidores) y comparar sus medias de alguna medida de efectividad
(ejemplo, el tiempo de espera del cliente) en cada escenario. Si la diferencia entre las dos medias
es significativa, se recomienda la alternativa que indica la medida mas deseable de desempeo.

De acuerdo a la teora estadstica clsica, si dos variables aleatorias independientes estn


normalmente distribuidas, entonces la variable aleatoria que representa su suma o sus diferencias
tambin esta distribuida de forma normal. Considere que las medias de las muestras de cada
__

__

escenario simulado (dgase, x y y ) estn normalmente distribuidas (ejemplo, considerando que


aplica el teorema del lmite central), entonces la diferencia entre medias tambin estar
normalmente distribuido con la siguiente media y varianza de la poblacin:
__

__

E[ x y ] = x y
__

__

Var[ x y ] = S

2
x

+S

2
y

2
S 2x S y
=
+
nx
ny

La consideracin de la normalidad conduce a la siguiente ecuacin:

__ __

( x y) ( x y )

P Z
Z = 1
2
2
S 2x S y
2
+

nx
ny

Una simple transformacin de la anterior ecuacin da como resultado el siguiente intervalo de


confianza:
2
2
__ __
__ __
S 2x S y
S 2 x S y
P ( x y ) Z
+
x y ( x y ) + Z
+
= 1
nx
ny
nx
ny
2
2

Ejemplo #4 Problema de confiabilidad, considere un instrumento en el cual cuatro componentes


principales son usados. Los componentes A y B estn en serie y los componentes C y D trabajan
en paralelo. El sistema falla cuando cualquiera de los componentes A o B fallan, o cuando ambos
componentes C y D fallan. Dado que los aos de operacin antes de falla para cada componente
estn exponencialmente distribuidos con una media de 10 aos, se desea simular el instrumento
para encontrar la longitud de tiempo esperada antes de la falla.
Suponga que el ingeniero de diseo esta considerando una alternativa de diseo en la cual el
componente D( el cual sirve como de unidad de respaldo para el componente C)) es eliminado,
pero un nuevo componente C es usado, el cual tiene una vida de operacin exponencialmente
distribuida con media de 30 aos( 3 veces el promedio de vida del otro componente). Aunque el
nuevo componente cuesta mas que el costo total de los dos componentes que reemplaza, el
diseo simplificado reduce los costos de ensamble y otros costos relacionados. El ingeniero, esta,
sin embargo, preocupado sobre la confiabilidad del componente bajo la nueva configuracin de
diseo. Por consecuencia, el diseador esta interesado en simular el componente bajo ambos
escenarios para encontrar un intervalo de confianza del 95% para la diferencia entre la vida

esperada del componente bajo la configuracin de diseo sobre la base de 100 replicas para cada
escenario.
La vida del componente bajo el diseo original y el nuevo diseo se denotan por x y y
respectivamente, entonces la siguiente informacin es obtenida para las dos salidas de la
simulacin:
__

x =4.9 Sx=3.47

__

, y y =4.04

Sy=4.18

Note que el tamao de la muestra para ambos escenarios es de 100. Sustituyendo estos valores
en la ecuacin para los intervalos de confianza entre las medias, produce el siguiente intervalo de
confianza:
-0.21 x-y 1.93
este intervalo indica que el diseo original puede tener una mejor confiabilidad.

6.5

Seleccin del tamao de la muestra

La eleccin del tamao de la muestra depende del grado de precisin que se espere del resultado.
Este grado de precisin esta representado por el intervalo de confianza, esto es, la caracterstica
de un intervalo de confianza deseado puede conducir a la determinacin del propio tamao.
Paradjicamente, para encontrar los parmetros de la poblacin necesarios para el tamao de la
muestra, el modelo debe ser primero simulado. En otras palabras, para encontrar el tamao de la
muestra (que afecta la longitud de la simulacin) dados el deseado intervalo y nivel de confianza,
primero se debe simular el modelo para una longitud de corrida arbitraria para estimar la desviacin
estndar de la variable aleatoria. El valor de la desviacin estndar es requerido en la relacin del
intervalo de confianza. El valor del tamao de la muestra es entonces calculado usando estas
estimaciones iniciales de la desviacin estndar y la amplitud deseada del intervalo de confianza.

6.5.1 Tamao de la muestra basado en la media de la poblacin


Dado un intervalo de confianza para la media de una cierta variable en el sistema que esta siendo
simulada, un analista pudiera desear encontrar el tamao apropiado del tamao de la muestra para
realizar un experimento de simulacin que produce las caractersticas de los intervalos de
confianza. Si se denota a d como la mitad del ancho del tamao del intervalo de confianza
(ejemplo; la mitad del ancho de la diferencia entre los lmites inferior y superior), entonces de
acuerdo a la definicin de los intervalos de confianza tenemos

P [ x - d x + d ]= 1 -

La anterior ecuacin asume que el intervalo de confianza es simtrico alrededor de la media.


Comparando esta ecuacin con la ecuacin de los intervalos de confianza para la media, la
siguiente relacin es obtenida:

d = Z /2

S
n

Ahora podemos derivar el tamao de la muestra de la ecuacin anterior

n=

( S Z /2 )2
d

Note que la desviacin estndar de la poblacin debe de ser conocida para determinar el tamao
de la muestra: En raros ocasiones y para ciertas variables en el modelo la informacin sobre la
desviacin estndar puede ser obtenida usando datos histricos. En la mayora de las ocasiones,
sin embargo, no hay datos histricos aplicables disponibles. Como se menciono previamente, la
alternativa es correr el modelo para una muestra de tamao arbitrario elegida. El producto de esta
simulacin piloto puede proveer un estimado (tal ves uno burdo) de el valor de la desviacin
estndar para la variable en cuestin. Este estimado puede entonces ser usado en la ecuacin
anterior para l calculo del tamao de la muestra

Debe ser notado que el tamao de la muestra puede ser estimado independientemente de la
desviacin estndar de la poblacin si el tamao del intervalo de confianza es expresado en
trminos del nmero de la desviacin estndar de la poblacin de la variable aleatoria. Por
ejemplo, si se desea que d sea 2/10 de la desviacin estndar de la poblacin, entonces
substituyendo el valor de d en la ecuacin del tamao de la muestra produce lo siguiente;

n=

( S Z /2 )2
(2S /10 )2

n = 25Z 2 / 2

Note que los clculos del tamao de la muestra anterior requieren nicamente el valor de la
variable estndar normal para un dado nivel de confianza. Sin embargo, debido a que d esta
expresado en trminos de una desviacin estndar desconocida, el tamao actual del intervalo de
confianza no es conocido en este caso.

Ejemplo #5 Basado en el problema #1, suponga que una estacin de gasolina esta localizada en
la autopista que conecta dos ciudades A y B. El administrador de la estacin ordena de gasolina
desde las dos ciudades. El intervalo de tiempo entre las rdenes a la ciudad A se distribuye
uniformemente entre 5 y 9 horas. El intervalo entre rdenes a la ciudad B esta uniformemente
distribuido entre 10 y 14 horas. El tiempo del viaje de los camiones de gasolina desde la ciudad A
se distribuye normalmente con media de 7 horas y una desviacin estndar de .5 de hora. El
tiempo del viaje de los camiones de gasolina desde la cuidad B se distribuye normalmente con
media de 12 horas y una desviacin estndar de 2 horas.

Asuma que inmediatamente despus de que se realiza la orden de gasolina, un camin es enviado
a la estacin de gasolina. Se desea estimar el tiempo promedio entre arribos de los camiones a la
estacin de gasolina tal que la probabilidad sea 0.95 de que nuestras estimaciones este dentro de
.1 hora de la media de la poblacin. Para obtener una estimacin para la desviacin estndar de la
poblacin usada en la formula del tamao de la muestra, se tomar el resultado de una simulacin
realizada como una prueba piloto con una muestra de 100, como se especific es este ejemplo.

De acuerdo al resultado de la simulacin piloto, se obtuvo un a desviacin estndar del tiempo del
sistema de 2.39 horas.
2
(2.39) (1.96)]
[
n=
= 2194

(0.1 ) 2

Ejemplo #6 Tomando como base el ejemplo #2 de la esttica de Maric, se desea estimar el


numero de replicas n necesarias para ser capaz de acertar con un 95% de confianza de que la
__

media de la muestra x que se calcule este fuera por a lo mximo 2.0 cortes de pelo (d=2.0) de la
verdadera media . Basado en muestra inicial de 12 observaciones, se sabe que S=4.21 cortes.
Ahora se calcula n como sigue:
Dado que:

P= nivel de confianza =0.95


= nivel de significancia =0.05
d= 2.0

S= 4.21 cortes
De la ltima fila de la tabla t-student, se encuentra que Z 0.025 = t ,0.025 =1.96. Usando la ecuacin
previa para n se obtiene que;

( t ) s (1.96 ) 4.21
n = 0.025 =
= 17.02 observaciones
2.0
d

'

Dado que ya se tienen 12 observaciones, el experimento requiere 6 corridas adicionales para


obtener las observaciones necesarias.
__

Se ha expresado la cantidad de error objetivo e en el punto de estimacin x como un valor


absoluto (d=ma). En el ejemplo de la esttica, se selecciono un valor absoluto de d=2.0 cortes
como el valor objetivo. Sin embargo, algunas veces en mas conveniente trabajar en trminos de la
desviacin relativa (error relativo dr) donde ma = dr ||. Esto permite hablar del porcentaje de error
en nuestro punto de estimacin en lugar del error absoluto. El porcentaje de error es la desviacin
relativa (el error relativo) multiplicada por 100 (esto es, 100*dr por ciento). Para aproximar el
__

numero de repeticiones necesarias para obtener un punto de estimacin x con cierto porcentaje
de error, se requiere nicamente cambiar el denominador de la ecuacin usada anteriormente.
Obtenindose la siguiente ecuacin

(Z ) s
n = / 2 __
dr x
(1 + dr )

donde dr denota la desviacin relativa (error relativo). La parte dr/(1+dr) del denominador es un
__

ajuste requerido para obtener el valor deseado dr debido que se usa x para estimar . ( ver el
captulo 6 de Law y Kelton para detalles). Lo interesante de este enfoque es que podemos
seleccionar un porcentaje deseado sin tener conocimiento previo de la magnitud del valor de .
Como un ejemplo, digamos que despus de registrar el numero de cortes de pelo en la esttica en
12 sbados (n=12 repeticiones del experimento), se desea determinar el numero aproximado
requerido para estimar el numero promedio de cortes de pelo realizados por da con un porcentaje
de desviacin (error) de 17.24 por ciento y un nivel de confianza del 95%. Se aplica la ecuacin
usando una la media y la desviacin estndar de la muestra de la tabla dada
Dado que:

P= nivel de confianza =0.95


= nivel de significancia =0.05
Z

2/n =

Z0.025 =1.96 de la tabla de la distribucin normal

dr = 0.1714

__

x =13.67 cortes
S= 4.21 cortes
2

(Z ) s
(1.96 ) 4.21 = 17.02 observaciones
n = / 2 __ =

dr x 0.1714 13.67
(1 + dr ) (1 + 0.1714)

Por esto n

18 observaciones

La nica ventaje real de estimar el nmero de repeticiones por adelantado es que puede ahorrar
tiempo con respecto al enfoque de prueba y error de verificar de forma repetida el mitad del ancho
y volver a realizar repeticiones hasta que el nivel de confianza requerido es alcanzado.

6.5.2 Tamao de la muestra basado en la proporcin


Dado un intervalo de confianza deseado para la proporcin de una cierta ocurrencia en el sistema
que esta siendo simulado, un analista puede desear encontrar un tamao de muestra apropiado
para realizar un experimento de simulacin que produzca las caractersticas de ese intervalo de
confianza. Considerando que el intervalo de confianza es simtrico alrededor de la proporcin de la
poblacin, y denotando un medio del tamao del intervalo de confianza por d, entonces de
acuerdo a la definicin de los intervalos de confianza tenemos;

P [ p - d p p + d ]= 1 -

d = Z /2

p( 1- p )
n

Resolviendo la ecuacin anterior para n produce la siguiente formula para el tamao de muestra;

n= Z

/2

p ( 1- p )
d

Note que en la anterior ecuacin debe ser conocida p promedio para calcular el tamao de la
muestra. Una corrida de simulacin piloto de una longitud arbitraria puede proveer de nueva cuenta
una estimacin para este parmetro. Un enfoque ms confiable, sin embargo, es tomar ventaja del
hecho de que valor mximo posible de este termino en el tamao de:

p ( 1- p )

es 0.25, cuando p promedio es igual a 0.5. Sustituyendo el mximo valor de este trmino en el
tamao de la muestra provee la siguiente ecuacin, la cual generalmente produce un tamao de
muestra que es mayor de lo necesario;
2

n = Z 2/2
4d

La ventaja principal de la ecuacin anterior es que es independiente de los parmetros de la


poblacin; por lo que libera al usuario de realizar la corrida de simulacin piloto.

Ejemplo #7 Basado en el ejemplo #1 para una red de actividades la cual representa las
actividades
requeridas para hacer una unidad de un producto, considere que se desea
determinar la proporcin de productos que son producidos en 15 das o menos tal que la
probabilidad es 0.95 que la estimacin este dentro de 0.03 de la actual proporcin de las unidades
del producto.
2

n = Z 2/2
4d

( 1.96 )
n=
= 1067
4( 0.03 ) 2

Este calculo indica que al menos 1067 entidades deben ser especificadas para reunir las
especificaciones para los intervalos de confianza sobre la proporcin de las unidades de los
productos.

6.5.3 Tamao de la muestra basado en la diferencia de las Medias


Dados los intervalos de confianza deseados y un nivel de significancia para las diferencias entre
las dos medias de cierta variable, donde cada media esta asociada con una diferente condicin del
modelo, se desea encontrar el tamao de muestra apropiado para realizar un experimento de
simulacin que produzca las caractersticas deseadas de los intervalos de confianza. Considere
que los intervalos de confianza son simtricos alrededor de las diferencias en las medias de la
poblacin, y denote un medio del intervalo de confianza por d, tenemos;

P ( x - y ) - d x - y ( x + y )+ d = 1 -

Comparando la anterior relacin con la de la de los intervalos de confianza para la diferencia entre
medias, se obtiene la ecuacin siguiente;

n = Z /2

S x+S y
nx
ny

Usando el mismo tamao en ambas muestras, se obtiene la siguiente ecuacin para la simulacin
del tamao de muestra;

n=

/2

(S
d

2
x
2

+S

2
y

Por lo anterior, la simulacin para uno de los dos escenarios de modelacin debera generar
estimaciones de las medias basados en el anterior tamao de muestra que resulta de las
caractersticas deseadas del intervalo de confianza.

Como se discuti en el caso del intervalo de confianza para diferencias entre medias, usar la
misma corriente de nmeros aleatorios y el mismo tamao de muestra para las corridas de la
simulacin piloto de los dos escenarios (se intenta proveer estimaciones para las desviaciones
estndar) es preferible en el anterior proceso.

Ejemplo #8 Basado en el ejemplo #3, suponga que se desea determinar el tamao de la muestra
para los dos escenarios de simulacin para el problema que a continuacin se describe.
Asmase que el tamao de la muestra ser tan grande que permita un intervalo de confianza de un
95% con una amplitud de 0.5 de ao (d=0.25) para la diferencia entre las dos medias de la vida del
instrumento. Dados los valores de la desviacin estndar para una corrida piloto, la cual se baso
en 100 observaciones para cada uno de los dos escenarios, as;

La desviacin estndar de la primer media es igual a 3.74 y La desviacin estndar de la segunda


media es igual a 4.18 y fueron obtenidas en una simulacin piloto.

(1.96 ) [( 3.74 ) + (4.18 ) ]


n=
= 503
(0.25 )2

Esto significa que cada escenario debe ser al menos simulado 503 repeticiones para proveer la
amplitud deseada para el intervalo de confianza sobre la diferencia entre la vida de las medias.

6.6

Tcnicas de reduccin de varianza

Generalmente, conforme el tamao de la muestra estadstica crece, la varianza de la muestra


decrece. Como se mostr en las formulas del intervalo de confianza, la precisin de la estimacin
depende de la varianza de la muestra (el cuadrado de la desviacin estndar). No es muy
deseable tomar tamaos de muestra grandes en la simulacin de sistemas de gran escala, sin
embargo, debido a que puede tomar muchas horas para su ejecucin en el estudio de varios
escenarios del modelo. Las tcnicas de reduccin de varianza son recomendadas para reducir el
tamao requerido de muestra y an lograr una varianza relativamente pequea. Estas tcnicas
fueron especialmente populares cuando las computadoras eran lentas y caras.
Para un dado tamao de muestra, el uso de los resultados de las tcnicas de reduccin de
varianza es lograr una mejor precisin en la estimacin. Dicho de otra manera, dada una requerida
precisin en la estimacin, los analistas requieren un tamao de muestra menor si ellos usan una
tcnica de reduccin de varianza en sus estudios de simulacin. Mtodos como muestreo

estratificado, muestreo correlacionado, variantes anti-ticas, y la ruleta Rusa han sido


desarrollados para la reduccin de varianza.
Debe de ser mencionado que las tcnicas de reduccin de varianza, cuando se usan de forma
incorrecta, pueden generar resultados con efectos adversos (ejemplo: pudieran incrementar la
varianza). Estas tcnicas no tienen mucha utilidad para modelos pequeos y sencillos para los
cuales el tamao de muestra grande generalmente no toma mucho tiempo para ser ejecutados, y
para modelos de gran escala es difcil usarlos apropiadamente. Debido a estos inconvenientes, y
debido al incremento en la velocidad y disponibilidad de las computadoras, en la actualidad las
tcnicas de reduccin de varianza no son muy usadas. (Para lecturas futuras sobre este tema de la
reduccin de varianza en la simulacin ver Law and Kelton, 1991; Moy, 1971, Pristker, 1986;
Wilson, 1984.)

Problemas Propuestos
Problema 1
Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en
una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable
aleatoria con distribucin normal. Si se supone que la desviacin tpica del peso es de 0,5 kg.
Determine el tamao de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95
de que el estimado y el parmetro se diferencien modularmente en menos de 0,1 kg.
Problema 2
De una poblacin de 1 176 adolescentes de una ciudad X se desea conocer la aceptacin por los
programas humorsticos televisivos y para ello se desea tomar una muestra por lo que se necesita
saber la cantidad de adolescentes que deben entrevistar para tener una informacin adecuada con
error estndar menor de 0.015 al 90 % de confiabilidad.
Problema 3
La altura de los jvenes andaluces se distribuye segn una ley normal de media desconocida y
varianza 25 cm2. Se ha seleccionado una muestra aleatoria y con una confianza del 95% se ha
construido un intervalo para la media poblacional cuya amplitud es de 2.45 cm.
a. Cul ha sido el tamao de la muestra seleccionada?
b. Determine el lmite superior y el inferior del intervalo de confianza si la muestra tomada dio
una altura media de 170 cm.
Problema 4
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para
evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos deben
pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene
como resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza de 90%
para la proporcin de los reproductores de discos compactos de la poblacin que no pasan todas
las pruebas.

Problema 5

En una muestra de 400 pilas tipo B fabricadas por la Compaa Dura por Siempre, se
encontraron 20 defectuosas. Si la proporcin p de pilas defectuosas en esa muestra se usa para
estimar P, que vendr a ser la proporcin verdadera de todas las pilas defectuosas tipo B
fabricadas por la Dura por Siempre, encuentre el mximo error de estimacin tal que se pueda
tener un 95% de confianza en que P dista menos de de p.
Problema 6
En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron
consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza
para aproximar la proporcin de todos los accidentes automovilsticos que en esa ciudad tienen
consecuencias fatales.

Problema 7
Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el
rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor tipo A y 75
con el motor tipo B. La gasolina que se utiliza y las dems condiciones se mantienen constantes. El
rendimiento promedio de gasolina para el motor A es de 36 millas por galn y el promedio para el
motor B es 24 millas por galn. Encuentre un intervalo de confianza de 96% sobre la diferencia
promedio real para los motores A y B. Suponga que las desviaciones estndar poblacionales son 6
y 8 para los motores A y B respectivamente.
Problema 8
Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de la B para su
flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumticos se utilizan hasta que se desgastan, dando como
resultado promedio para la marca A 36,300 kilmetros y para la marca B 38,100 kilmetros.
Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se
sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviacin
estndar de 5000 kilmetros para la marca A y 6100 kilmetros para la marca B.
Problema 9
En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canad,
se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si
se quiere tener 95% de confianza de que la estimacin de P est dentro de 0.02?

Problema 10
Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin
del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos.
Qu tamao de muestra se necesita si se requiere un confianza del 95% y un error mximo de
estimacin de 0.10?
Problema 11

El director de personal quiere comparar la efectividad de dos mtodos de entrenamiento para


trabajadores industriales a fin de efectuar cierta operacin de montaje. Se divide un nmero de
operarios en dos grupos iguales: el primero recibe el mtodo de entrenamiento 1, y el segundo, el
mtodo 2. Cada uno realizar la operacin de montaje y se registrar el tiempo de trabajo. Se
espera que las mediciones para ambos grupos tengan una desviacin estndar aproximadamente
de 2 minutos. Si se desea que la estimacin de la diferencia en tiempo medio de montaje sea
correcta hasta por un minuto, con una probabilidad igual a 0.95, cuntos trabajadores se tienen
que incluir en cada grupo de entrenamiento?
Problema 12
Determinar un lmite de confianza con 95% de confianza para la media de una distribucin normal
con varianza de 9 y usando una media de 100 valores con media igual a 5. Qu tan grande debe
ser n si deseamos obtener un intervalo de confianza cercano al 100%, de longitud d=0.4?

Problema 13
El fabricante de una patente mdica sostiene que la misma tiene un 90% de efectividad en el alivio
de una alergia, por un periodo de 8 hrs. En una muestra de 300 individuos que tenan alergia, la
medicina suministrada alivi a 240 personas. Determinar si la aseveracin del fabricante es
correcta.

Investigaciones:
Obtenga al menos 2 documentos de las referencias bibliogrficas listadas que tratan con la
validacin y la verificacin y escriba un ensayo corto comparando y contrastando las diversas
filosofas y enfoques al tpico de validacin y verificacin.

Compare y contraste los diferentes lenguajes de simulacin en sus capacidades para ayudar al
modelador el la siempre ardua tarea de depuracin y verificacin..

Referencias Bibliogrficas

A. M. Law and D. W. Kelton. Simulation Modeling and Analysis. Industrial Engineering and
Management Science. McGraw-Hill Inc., 2nd edition, 1991.
B. Concebs, Discrete Systems Simulation, Mc Graw-Hill, 1994
Banks, J., Carson, J.S., II, and Goldsman, D., "Discrete-Event Computer Simulation," Handbook of
Statistical Methods for Engineers and Physical Scientists, 2nd ed., (H.M. Wadsworth, Ed.),
McGraw-Hill, New York, 1998.

J. Banks, J. S. Carson, and B. L. Nelson. Discrete-event system simulation.


Prentice-Hall, Inc., Upper Saddle River, New Jersey 07458, 2nd edition, 1996.
Christos Alexopoulos, Andrew F. Seila, Advanced Methods for Simulation Output Analysis,
Proceedings of the 1998 Winter Simulation Conference,D.J. Medeiros, E.F. Watson, J.S. Carson
and M.S. Manivannan, eds
Ch. Harrel,B. Ghosh, yR. Borden, Simulation using ProModel ,Mc Graw-Hill, 2003 Second edition
Law, A.M., y W.D. Kelton [1991], Simulation Modeling & Anlisis, 2nd ed., McGraw-hill, New York.
Lawrence Leemis, Simulation Input Modeling,Proceedings of the 1999 Winter Simulation
ConferenceP. A. Farrington, H. B. Nembhard, D. T. Sturrock, and G. W. Evans, eds.
S. Ross, Simulacin, Pearson, 1999 segunda edicin.

Вам также может понравиться