Вы находитесь на странице: 1из 8

Sesión Adquisición de datos y

5 tamaño de muestra.

OBJETIVOS
Al culminar la presente práctica, el alumno estará capacitado para:
 Analizar los datos de las variables aleatorias (exógenas) e identificar el tipo
de distribución de probabilidad que las representa.
 Determinar el tamaño de muestra para una variable aleatoria.

 RECURSOS

Uso del Excel y del complemento Input Analyzer del software ARENA

 DURACIÓN DE LA PRÁCTICA

Una sesión (2 horas).

 MARCO TEÓRICO

1. Simulación de Sistemas Discretos, Jaime Barceló. ISDEFE, Madrid 1996

2. Simulación con software Arena, W. David Kelton/Randall P. Sadowski/David


T. Sturrock. McGrawHill, México 2008.

TAMAÑOS DE MUESTRA

Tomado de:
http://thales.cica.es/rd/Recursos/rd99/ed99-0018-04/MTAMANO.html. Abril 2016.

DEFINICIÓN
El tamaño de muestra es el número de elementos extraídos de una población, que
obtiene información representativa, válida y confiable al mismo costo.
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en
cuenta varios factores:
- El tipo de muestreo
- El parámetro a estimar
- El error muestral admisible
- La varianza poblacional y
- El nivel de confianza

TAMAÑO DE MUESTRA PARA MEDIA Y PROPORCIÓN


Existen diferentes factores que determinan la fórmula que se utilizará para saber el
tamaño de la muestra, uno de ellos son la media y la proporción.
Para estimar una proporción debemos conocer:
Z = Nivel de confianza
p = probabilidad de éxito, o proporción esperada
q = probabilidad de fracaso
e = precisión (error máximo admisible en términos de proporción)

2
𝑍1−  ∗𝑝∗𝑞

2
𝑛=
𝑒2

Para estimar la media, utilizamos los siguientes datos:


Z = Nivel de confianza
p = probabilidad de éxito, o proporción esperada
2 = varianza poblacional
e = precisión (error máximo admisible en términos de proporción)

 ∗
2 2
𝑍1− ∗
2
𝑛=
𝑒2

TAMAÑOS DE MUESTRA PARA POBLACIONES FINITAS E INFINITAS


Los datos que utilizaremos son los siguientes:
Z1-/2 : Z correspondiente al nivel de confianza elegido
2 : varianza poblacional
e: error máximo permitido
N: Población
p: probabilidad de éxito, o proporción esperada
q: probabilidad de fracaso
POBLACIONES FINITAS:
Se conoce el tamaño de la población de donde se obtendrá la muestra a estudiar. La
población es representada por la letra N y se aplica de la siguiente manera.
Para la media:

 ∗
2 2
𝑁 ∗ 𝑍1− ∗
2
𝑛=
 ∗ 2
2
(𝑁 − 1)𝑒 2 + 𝑍1− ∗ 2

Para la proporción:
2
𝑁 ∗ 𝑍1−  ∗𝑝∗𝑞

2
𝑛=
(𝑁 − 1)𝑒 2 + 𝑍 2  ∗𝑝∗𝑞
1−2 ∗

POBLACIONES INFINITAS:
Si por el contrario el tamaño de la población es desconocido o infinito usaremos otra
alternativa.
Para la media:

 ∗
2 2
𝑍1− ∗
2
𝑛=
𝑒2
Para la proporción:

2
𝑍1−  ∗𝑝∗𝑞

2
𝑛=
𝑒2

COMPROBACIÓN:
Una vez obtenido el tamaño de la muestra, se realiza la siguiente comprobación.
N> no(no-1)
Donde no es el tamaño de muestra inicial obtenido.

Si esta condición se cumple el proceso se termina aquí, y ese es el tamaño adecuado


que debemos muestrear.
Si no se cumple pasamos a otra fase:
Obtener el tamaño de la muestra según la siguiente fórmula:
𝑛0
𝑛= 𝑛
1+ 0
𝑁
Ejercicios:
La desviación típica de la altura de los habitantes de un país es de 8 cm. Calcular el
tamaño mínimo de la muestra de habitantes de dicho país para que el error cometido al
estimar la altura media sea inferior a 1 cm con un nivel de confianza del 90%.
Datos:
e: 1 cm.
Z1-/2: 1.645
: 8 cm.
 ∗
2 2
𝑍1− ∗
2
𝑛=
𝑒2

(1.645)2 ∗82
𝑛= = 173.18
12
Tamaño de muestra n=174

Una agencia de mercadotecnia desea encuestar a los residentes de su municipio para


conocer qué proporción de la población conoce cierto producto de limpieza respecto de
su efectividad. Que tamaño de la muestra se necesita si requiere de confianza de 95%
un error máximo de estimación de 0.15.
Datos:
e: 0.15
Z1-/2: 1.96
p: 0.5
q:0.5
2
𝑍1−  ∗𝑝∗𝑞

2
𝑛=
𝑒2

(1.96)2 ∗0.5∗0.5
𝑛= = 42.7
0.152

Tamaño de muestra n=48

¿Cuál es el promedio de horas semanales trabajadas por policías en los registros de


inspección?, si existe una población de 20000 policías donde se sabe que su desviación
típica es de 8.35. Trabajando con un nivel de confianza de 90% y estando dispuestos a
admitir un error máximo de 0.20. ¿Cuál es el tamaño de la muestra?
Datos:
e: 0.20
Z1-/2: 1.64
2: 8.35
N: 20000
 ∗
2 2
𝑁 ∗ 𝑍1− ∗
2
𝑛=
 ∗ 2
2
(𝑁 − 1)𝑒 2 + 𝑍1− ∗ 2
20000 ∗ 1.642 ∗ 8.35
𝑛= = 546.14
(20000 − 1)0.22 + 1.642 ∗ 8.35
Tamaño de muestra n=547

FLUJOGRAMA PARA OBTENER UN TAMAÑO DE MUESTRA:


 ACTIVIDADES DE LA PRÁCTICA

 Utilizar una metodología para analizar los datos e identificar el tipo de


distribución de probabilidad que más se ajusta a la información y
determinar tamaños de muestra.

CASO ESTUDIO:

Una empresa de telecomunicaciones quiere implementar un modelo de simulación


integrado que permita replicar los niveles esperados de ventas de equipos en todos los
centros de venta que tiene en la ciudad. Quiere empezar simulando los 9 principales
centros de venta, que en la actualidad cuentan con un sistema integrado de reportes
que registran la siguiente información por cada persona atendida:

 Tiempo de llegada de cada cliente


 Tipo de cliente
 Motivo de visita
 Tiempo de inicio y finalización de servicio en módulo

La lógica de atención se describe a continuación:


Las personas llegan al centro y solicitan en un segmentador un código de atención. Los
códigos de atención se componen de una letra y un número. Los clientes regulares
tienen código R y los clientes nuevos código N. El código permite la asignación de
ventanillas a los diferentes clientes. Cada agencia tiene un perfil diferente de atención
en función de la composición de la cartera de clientes regulares / clientes nuevos en
cada zona. Internamente el sistema de gestor de colas Q-MATIC genera dos colas
internas independientes, una para clientes regulares y otra para clientes nuevos. La
cola de clientes nuevos se administra con una lista de procesamiento FIFO, y la cola de
clientes regulares con prioridades de atención con prioridades en función de los planes
tarifarios.

Tras obtener su ticket esperan a ser llamados a diferentes ventanillas. Los clientes
nuevos usualmente realizan una consulta de precio o la compra de un equipo. En el
segundo caso claramente el tiempo de atención es mayor puesto que la compra
involucra la revisión del equipo, firma de contrato del plan tarifario y verificación de
entrega del equipo, por ende, se asume que tiene una distribución de tiempo diferente
al de la consulta de precios.

En el caso de los clientes regulares, se tienen dos principales razones de visita al centro.
La primera es la compra de accesorios para sus equipos. En este caso los clientes ya
vienen revisando el catalogo web y directamente hacen el pedido del accesorio
requerido al llegar a las ventanillas de atención lo cual hace que los tiempos
generalmente sean cortos. La segunda razón principal de visita es el cambio de plan
tarifario. Si bien los clientes tienen una referencia del plan al cual quieren migrar, por lo
general el trámite resulta ser más lento pues los asesores de plataforma realizan primero
una revisión del tiempo en el plan vigente para poder validar la viabilidad de la migración,
y dada ésta, tratan de ofrecen beneficios adicionales cuando se trata de migraciones a
planes de menor costo, por lo que usualmente este tiempo es bastante mayor que el
anterior. Fuera de estos dos casos existen otras razones de consulta de los clientes
frecuentes (alrededor de un 20%), pero son altamente diversas tanto en naturaleza
como en tiempo por lo que se tiene una alta variabilidad en la agrupación y media de
estos tiempos, razón por la cual simplemente se manejan como Otros casos

 EJERCICIOS PROPUESTOS

En el archivo AnexoDatos.xls se encuentran los tiempos registrados


mencionados en el enunciado del problema. Únicamente para el centro que le
designe el profesor responda las siguientes preguntas:
a) Determine cuál es la distribución de mejor ajuste para los tiempos entre llegadas
de clientes. Subdivida los casos de acuerdo a como el caso descrito lo
amerite. Para ello siga los pasos siguientes:
I. Encuentre el/los tamaño(s) de muestra para los tiempos entre llegadas al
95% de confianza, para un error máximo porcentual de 0.05.
II. Conocido el/los tamaño(s) de muestra, analícelos con el Input Analyzer y
determine cuál es la distribución de probabilidad que se ajusta mejor a sus
datos. Presente los resultados del fit all, fit all summary, y data summary
generados en el Input Analyzer (Emplee la tecla PRT SC para tomar un
screenshot en el input analyzer y luego simplemente pegarlo en el
documento en MS Excel).
b) Determine cuál es la distribución de mejor ajuste para los tiempos de servicio.
Subdivida los casos de acuerdo a como el caso descrito lo amerite. Para
ello siga los pasos siguientes:
I. Encuentre el/los tamaño(s) de muestra para tiempos de servicio al 95% de
confianza, para un error máximo porcentual de 0.05.
II. Conocido el/los tamaños de muestra, analícelos con el Input Analyzer y
determine cuál es la distribución de probabilidad que se ajusta mejor a sus
datos. Presente los resultados del fit all, fit all summary, y data summary
generados en el Input Analyzer (Emplee la tecla PRT SC para tomar un
screenshot en el input analyzer y luego simplemente pegarlo en el
documento en MS Excel).

Anexo Input Analyzer


(Consultar Guía: Análisis de Datos)

 GLOSARIO

Ninguno.


 REFERENCIAS BIBLIOGRÁFICAS

1. TORRES, P. (2da. Edición). (2013). Simulación de sistemas con el software


Arena. Lima: Editorial Universidad de Lima.
2. KELTON, W. D., Sadowski, R. P. & Sturrock, D. T. (4ta. Edición). (2008).
Simulación con software Arena. México: Editorial McGrawHill.

Вам также может понравиться