Академический Документы
Профессиональный Документы
Культура Документы
Técnicas de muestreo
Nota para el profesor: se sugiere que los temas contengan: (Contenido, objetos y materiales
multimedia, actividades y por último, algún examen o quiz)
Introducción al tema
CONTENIDO:
El principal objetivo de la mayoría de los estudios, análisis o investigaciones, es hacer generalizaciones acertadas
con base en muestras de poblaciones de las que se derivan tales muestras. Obsérvese la palabra “acertadas”
porque no es fácil responder cuándo y en qué condiciones las muestras permiten tales generalizaciones. Por
ejemplo, si queremos calcular la cantidad de dinero promedio que una persona gasta en unas vacaciones,
¿tomaríamos como una muestra las cantidades que gastan los pasajeros de primera clase de un crucero de cuatro
días; o trataríamos de estimar o pronosticar el precio al mayoreo de todos los productos agrícolas únicamente con
base en el precio de los espárragos frescos? Es obvio que no, pero saber a qué vacacionistas y qué productos
agrícolas debemos incluir en las muestras no es algo intuitivo ni evidente.
CONTENIDO:
Población:
Conjunto completo de sujetos, objetos o datos que comparten una característica. En un
experimento, la población es el grupo más grande de individuos del cual se pueden tomar los
sujetos que participarán en dicho estudio.
Muestra:
Subconjunto extraído de la población y que idealmente debe ser representativa de la población
a la que representa.
1
Poblaciones finitas e infinitas:
Una población es finita si consta de un número finito o fijo de elementos, medidas u
observaciones. Como ejemplos, son los gastos realizados por un turista en un destino. A
diferencia de las poblaciones finitas, una población infinita, al menos hipotéticamente,
contienen una infinidad de elementos. Este es el caso, por ejemplo, cuando observamos un
valor de una variable aleatoria continua y hay una infinidad de resultados distintos.
Muestreo probabilístico:
Las técnicas de muestreo probabilístico son aquellas en las que se determina al azar los individuos que
constituirán la muestra.
Estas técnicas nos sirven cuando se desean generalizar los resultados que se obtienen a partir de la
muestra hacia toda la población.
Lo anterior se dice dado que se supone que el proceso aleatorio permitirá la obtención de una muestra
representativa de la población.
Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la
probabilidad de extracción de cualquiera de las muestras posibles.
Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar
por él.
En este caso se habla de muestras probabilísticas, pues no es en rigor correcto hablar de muestras
2
representativas dado que, al no conocer las características de la población, no es posible tener certeza
de que tal característica se haya conseguido.
Sin reemplazo:
Son los que una vez que se ha tomado en cuenta un individuo para formar parte de la muestra, no se le
vuelve a tomar en cuenta nuevamente.
En este caso, y hablando específicamente para el caso de poblaciones pequeñas, las observaciones son
dependientes entre sí, pues al no tomar en cuenta nuevamente el individuo se altera la probabilidad
para la selección de otro individuo de la población.
Para el caso de las poblaciones grandes (por ejemplo la población de un país) dicha probabilidad para la
selección de un individuo se mantiene prácticamente igual, por lo que se puede decir que existe
independencia en las observaciones.
Ejemplo:
Si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25
elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A
continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4,
y a partir de él obtenemos los restantes elementos de la muestra.
2, 6, 10, 14, ... , 98
3
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de
cada estrato proporcional al número de componentes de cada estrato. Dentro de cada estrato se suele
usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica.
Adicionalmente, se debe mencionar que en el muestreo estratificado, con frecuencia los resultados se
requieren para ciertos estratos de la población y las cotas de error deseados se establecen para cada
uno de ellos; en este caso, se debe calcular por separado el tamaño en cada grupo y el tamaño de
muestra final será la suma de las establecidas para cada estrato.
Ejemplo:
En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay
200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.
Se estiman las proporciones y se multiplica por el número de la muestra:
(200/600)*20 = 6.66 aproximado a 7
(150/600)*20 = 5
(150/600)*20 = 5
(100/600)*20 = 3.33 aproximado a 3.
La distribución proporcional implica que los tamaños de las muestras de estratos diferentes son
proporcionales a los tamaños de los estratos. En general, si dividimos una población de tamaño N en k
estratos de tamaño y tomamos una muestra de tamaño n1 del primer estrato, una muestra de tamaño
n2 del segundo estrato,…, y una muestra de tamaño nk del k estrato, decimos que la población es
proporcional si estas muestras cumplen con la proporción que cada estrato representa de la población
N.
Tamaños de muestra para la distribución proporcional:
Ni
ni .n para i= 1,2, …, y k
N
Donde n= n1+n2+…n es el tamaño total de la muestra. Cuando es necesario, usamos los números
enteros más próximos a los valores obtenidos por medio de esta fórmula.
Ejemplo:
Se debe tomar una muestra estratificada de tamaño n= 60 de una muestra de tamaño N=4000, que
consta de tres estratos de tamaño N1=2000, N2=1200 y N3=800.
¿Si la distribución debe ser proporcional, cuán grande debe ser la muestra tomada de cada estrato?
4
Solución:
Sustituyendo en la formula obtenemos:
2000 1200 800
n1 .60 30 n2 .60 18 n3 .60 12
4000 4000 4000
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la
muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas.
El primer método funciona mejor cuanto más homogénea es la población respecto del estrato,
aunque más diferentes son éstos entre sí.
En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad,
aunque deben ser muy parecidos entre sí.
Observaciones:
4.1 Actividad
CONTENIDO:
En cada uno de los siguientes casos define qué tipo de muestreo sería el adecuado a utilizar.
1) Un periódico obtiene una muestra de la opinión (a favor o en contra) sobre un tema de actualidad de
3000 internautas que quisieron responder a una encuesta publicada en su página web.
5
2) Se dispone de un directorio o lista de los 2000 bares y restaurantes de una gran ciudad, se elige uno
al azar y a partir de este primer seleccionado y contando de 25 en 25 se ha ido seleccionando una
muestra de 80 bares y restaurantes.
3) Para investigar el impacto de la crisis en las empresas valencianas, tenemos una lista numerada con
los nombres de las 169.000 empresas de la provincia de Valencia. El ordenador elige de forma aleatoria
una muestra de 100 de esas empresas.
4) Para seleccionar una muestra 100 de hogares que residen en municipios de menos de 1000
habitantes en la provincia de Valencia, se eligen al azar 10 municipos con menos de 1000 habitantes de
la provincia de Valencia y en cada municipio seleccionado se selecciona una muestra aleatoria de 10
hogares.
5) En una encuesta durante las elecciones, se elige al azar 2 mesas electorales y se analizan todos los
votos emitidos de las mesas seleccionadas.
6) En la Encuesta Nacional de Ocupación y Empleo se entrevistan durante 4 trimestres seguidos a un
individuo para después ser sustituido en el quinto trimestre.
7) Para analizar los hábitos de lectura de los estudiantes de la Universidad Anáhuac, un equipo de
sociólogos dispone de una muestra de estudiantes seleccionados aleatoriamente en cada uno de sus 3
campus (Burjassot, Blasco Ibáñez y Tarongers) de forma que, en cada campus el número de estudiantes
seleccionados al azar para la muestra es proporcional al total de alumnos matriculados en dicho
campus.
¿Qué debo hacer? Lee los conceptos de los diferentes tipos de muestreo y asigna uno a cada situación
que se presenta.
Recomendaciones:
¿Cuándo lo entrego?
Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante
cuestionarse sobre la función pedagógica de cada herramienta, sus lineamientos, retroalimentación y
calificación
Observaciones:
6
4.2 Parámetros y estimadores
CONTENIDO:
Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos
calcular un estadístico (media, desviación típica, proporción, ...) que variará de una a otra.
Así obtenemos una distribución del estadístico que se llama distribución de probabilidad muestral.
En una población cuya distribución es conocida pero desconocemos algún parámetro, podemos estimar
dicho parámetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona
información sobre el valor del parámetro. Estadístico: Son los datos o medidas que se obtienen sobre
una muestra y por lo tanto un estimador de los parámetros.
Ejemplo:
Por ejemplo la media muestral es un estimador de la media poblacional, la proporción observada en la
muestra es un estimador de la proporción en la población.
7
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero
valor del parámetro.
Se indica por 1- y habitualmente se da en porcentaje (1-)100%.
Hablamos de nivel de confianza y no de probabilidad ya que una vez extraída la muestra, el
intervalo de confianza contendrá al verdadero valor del parámetro o no, lo que sabemos es que
si repitiésemos el proceso con muchas muestras podríamos afirmar que el (1-) porciento de
los intervalos así construidos contendría al verdadero valor del parámetro.
Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto
de estudio y sólo tenemos que estimar los parámetros que la determinan, estamos en un problema de
inferencia estadística paramétrica; por el contrario, cuando no se conoce la forma funcional de la
distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia
estadística no paramétrica. El curso se limita a problemas de inferencia estadística paramétrica, donde
la variable aleatoria objeto de estudio sigue una distribución normal, y sólo se estimarán los
parámetros que la determinan, la media y la desviación típica.
Observaciones:
CONTENIDO:
Para presentar la idea de cómo se toma una muestra de un población finita, primero se identifican
cuántas muestras diferentes de tamaño n podemos tomar de una población finita de tamaño N.
Refiriéndonos a la regla para el número de combinaciones de n objetos tomando
æ N ö
ç ÷
è n ø
8
Una muestra de tamaño de n de una población finita de tamaño de N es una variable aleatoria si se
æ ö
selecciona de manera tal que cada una de las ç N ÷ muestras posibles tiene la misma probabilidad, de
è n ø
1 ser seleccionada.
N
n
Ejemplo 1
¿Cuántas muestras distintas de n podemos tomar de una población finita de tamaño N, cuando
a) n= 2 y N=12;
b) n=3 y N=100?
Solución
12 12 11
(a) Hay 66 muestras distintas.
2 2!
100 100 99 98
(b) Hay 161,700 muestras distintas.
3 3!
Ejemplo 2:
Si la población consiste en los N=5 elementos a,b,c,d y e (que podrían ser los ingresos anuales de cinco
æ ö
turistas, los pesos de cinco viajes o los precios de cinco artículos), hay ç 5 ÷ = 10 muestras posibles
è 3 ø
de tamaño n=3. Estas constan de los elementos abc, abd, abe, acd, ace, ade, bcd, bce, bde y cde. Si
1
seleccionamos estas muestras de tal forma que cada muestra tenga una probabilidad de de ser
10
seleccionada, decimos que ésta es una muestra aleatoria.
Tamaño de la muestra
Una muestra es la colección de elementos extraídos de un universo, y que contienen las características
más relevantes de este.
9
muestra para realizar el proceso; en cambio, si el universo es heterogéneo (o universo delimitado
heterogéneo) se empleara un numero de muestras que mínimo deben ser 5 y máximo 20 (5≤ n, ≤20).
En cualquiera de los casos que se presente, y por considerarse adecuada para su uso en la
administración turística, se empleara la siguiente formula probabilística de aproximación a la
distribución normal para determinar el tamaño adecuado de la(s) muestra(s):
z 2 pq
n E2
1 z 2 pq
1 2 1
N E
z 2 pq
n
E2
Donde:
p= parte proporcional del universo o población que cumple con la característica principal, base,
de la investigación por muestreo.
q= parte proporcional del universo o población que no cumple con la característica principal,
base, de la investigación por muestreo.
E= máximo error proporcional absoluto permitido a los resultados del muestreo, respecto a los
que arrojaría el análisis de todo el universo (o universo delimitado).
10
En este tipo de muestreo, y contrario a la creencia de que el tamaño de muestra debe guardar
cierta proporción con el tamaño de la población, los aspectos que se involucran en el cálculo
están relacionados con la característica a estudiar, el nivel de precisión y confianza que se
desea lograr, el esquema de muestreo que se sigue para obtener la información, así como el
dominio de estudio o área a la que se desea brindar la información.
Ejemplo 1:
El gerente de un restaurante desea conocer el ingreso promedio por comanda emitida a la hora de la
comida. Cuenta con 850 comandas anteriores. Desea conocerlo a partir del análisis de una muestra.
De qué tamaño debe ser la muestra de comandas si desea confiabilidad del 90% y un máximo error
proporcional absoluto del 5%
Solución:
Como no se indica alguna particularidad en el contenido de las comandas (por ejemplo con aperitivo, o
con postre, o con otros elementos adicionales) se fijan los valores de p y q en 50% cada uno (p = q =
50% = 0.5), lo que traerá como consecuencia obtener el máximo tamaño de muestra para este
ejercicio.
11
Así, si £=90%, por áreas bajo la curva normal (Anexo), se sabe que z= 1.645 (el valor de £ dividido entre
dos se encuentra en el cuerpo de la tabla entre 1.64 y 1.65 de z, si se toma la media da 1.645)
Al sustituir se tiene:
Por lo que, si redondea a la decena inmediata superior para facilitar el muestreo, deberá seleccionar
210 comandas al azar.
Ejemplo 2:
El administrador de un hotel desea conocer las características típicas del turista que visita el destino
donde se encuentra ubicado el hotel. De qué tamaño debe ser la muestra si el 10% de los turistas se
hospedan en el hotel, y desea una confiabilidad del 95% y un máximo error del 10%, al aplicar el
cuestionario.
Solución:
Con la fórmula para el tamaño muestra adecuado para universo infinito se tiene:
12
Se aplicaran 40 cuestionarios (se redondeó ala decena inmediata superior para facilitar el análisis y
reducir el error proporcional.)
Observaciones:
4.2 Actividad
CONTENIDO:
En un a hoja en excel captura los datos de los dos ejemplos para estimar el tamaño de la muestra finita
y muestra infinita. Cambia el error muestral y ve la relación que tiene con el tamaño de la muestra sí
como el nivel de significancia Z utilizado.
13
¿Qué debo hacer? Desarrolla una fórmula en excel que te permita estimar el tamaño de la muestra de
los ejemplos anteriores.
Recomendaciones:
¿Cuándo lo entrego?
Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante
cuestionarse sobre la función pedagógica de cada herramienta, sus lineamientos, retroalimentación y
calificación
CONTENIDO:
Muchas veces es imposible tener los datos de toda una población por lo que se debe realizar un
muestreo, el cual responde a dos cuestiones, de qué tamaño debe ser la muestra es decir el número de
elementos seleccionados y por otro lado cómo debo seleccionar los elementos. Para la primer cuestión
es importante definir si la población es finita o infinita y se escoge la fórmula adecuada, mientras que
para la segunda cuestión, existen los diversos tipos de muestreo probabilísticos.
Observaciones:
14
CONTENIDO:
Ibarra, Mario. (1998). Estadística para la Administración Turística. México: Editorial Diana.
Freunn, John y Simon, Gary. (1994). Estadística Elemental. México: Prentice Hall Hispanoamaericana,
S.A.
Pliego, Javier. (2004). Estadística Económica y Empresarial. Madrid: International Thomson Editores
Spain, S.A.
Anderson, David, Sweeney, Dennis y Williams, Thomas. (2003). Essentials of Statistics for Business and
Economics. United States of America: Thomson.
Observaciones:
15