Вы находитесь на странице: 1из 37

Estadística para la investigación

TEORIA DEL MUESTREO


Diseños Muéstrales y Tamaño de muestra

Enzo Aldo Bravo Burgos


INTRODUCCION

Una parte fundamental para realizar un estudio estadístico de cualquier tipo es


obtener unos resultados confiables y que puedan ser aplicables. Resulta casi
imposible llevar a cabo algunos estudios sobre toda una población, por lo que la
solución es llevar a cabo el estudio en un subconjunto de ésta denominada
muestra.

Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es
necesario que tal subconjunto de datos, o muestra, posea algunas características
específicas que permitan, al final, generalizar los resultados hacia la
población objetivo. Esas características tienen que ver principalmente con la
técnica de selección para obtenerla y con el tamaño de la muestra; ambas
materia de la esta presentación.
Nacimiento de una
INVESTIGACIÓN
1. ¿Que debe de existir previamente para hacer una investigación?

REALIDAD
PROBLEMÁTICA
¿Problema?

MUESTRA

UNIDAD •Tiempo.
DE POBLACION •Costos
ESTUDIO

¿Quién genera esa realidad problemática?


DEFINICIONES
PRELIMINARES
Unidad de estudio:
Población:
• Es el animal, persona o
cosa de quien se dice algo.
• Es el conjunto de todas las
• Es quien nos va a dar la
unidades de estudio que
información.
cumplen con ciertas
• Es el objeto o elemento
características de interés
indivisible que será
(criterios de inclusión).
estudiado.
• Clasificación:
Extensión – Naturaleza

Muestra:
• Es un subconjunto de la población en estudio.
• Una muestra tiene 3 características principales:
a. Representativa.
b. Adecuada.
c. Homogénea
¿Por qué trabajar con una muestra?

•Recursos limitados.

•Escasez.

•Pruebas destructivas.

•El muestreo puede ser más exacto.


POBLACIÓN (N) MUESTRA (n)

CARACTERISTICAS:
• Representativa: Se
toma u.e. de todos los
Extensión: Naturaleza:
sectores de la
• Finita • Población Objeto;
Constituida por las u.e. población.
• Infinita • Adecuada: Utiliza las
• Población objetivo:
Información que genera fórmulas de la teoría
la población objeto del muestreo.
• Homogénea.
MUESTREO
• Es una técnica estadística por la cual se realizan inferencias a la población
examinando solo una muestra.
• Es una técnica empleada para seleccionar elementos de una población.
• Por su gran importancia los investigadores lo utilizan en los diferentes
campos de saber y también lo usamos en la vida diaria.

POBLACIÓN (N) MUESTRA (n)


Proceso de muestreo

Población

Muestra
 muestreo X

2 S2
p

n
inferencia

N
CONCEPTOS
Población: Es todo conjunto de objetos, situaciones o sujetos con un rasgo
común. Es un conjunto de casos que satisface una serie predeterminada de
criterios.

Muestra: es un subconjunto de individuos extraídos de una población

Unidad de análisis: es un sujeto u objeto el cual es objeto de investigación


y aquel que se le toma las mediciones

Elemento o Unidad de muestreo: Son colecciones no traslapadas de


elementos de la población que la cubre completamente. En algunos estudios
puede coincidir con la unidad de análisis.

Marco muestral: Es una lista completa y detallada de las unidades de


muestreo.
TIPOS DE MUESTREO
A) No Probabilístico: si la muestra es escogida por medio de un
proceso subjetivo o arbitrario de modo que la probabilidad de selección
de cada unidad de la población no es conocida (se utiliza con
frecuencia cuando no se conoce el marco muestral).

B) Probabilístico: cuando el método de selección de la muestra


permite conocer para todos los elementos de la población la
probabilidad de ser seleccionados en la muestra. Utiliza
procedimientos de selección aleatoria para asegurar que cada unidad
de la muestra se seleccione por probabilidad. Permite estimar los
parámetros de la población.
TÉCNICAS DE MUESTREO

Técnicas de Muestreo

No Probabilístico Probabilístico

Simple Estratificado Sistemático Conglomerados

Conveniencia Por Juicio Por Cuota


TIPOS DE MUESTREO
NO PROBABILÍSTICO
•Por conveniencia (a criterio): Se seleccionan a las unidades de estudio que se
encuentren disponibles al momento de la recolección de datos
•Por casos consecutivos: Consiste en elegir a cada unidad de analisis que
cumpla con los criterios de selección dentro de un intervalo de tiempo específico o
hasta alcanzar un número definido de elementos.
•Por cuota: Se seleccionan unidades de estudio de cada uno de los subgrupos
que componen la población en una cuota predeterminada
•Por Bola de Nieve: Se selecciona un grupo inicial de entrevistados por lo
general en forma aleatoria, después de la entrevista se pide a los participantes
que identifiquen a otros que pertenecen a la población objetivo
TIPOS DE MUESTREO
PROBABILÍSTICO

•Aleatorio simple

•Sistemático

•Estratificado

•Por conglomerados
MUESTREO ALEATORIO SIMPLE
Cada individuo tiene la misma probabilidad de ser seleccionado para el
estudio. Requiere tener una lista numerada de todas las unidades del marco
muestral, Tener el tamaño de la muestra, se seleccionará la muestra al azar
mediante tablas de números aleatorios, calculadora o algún programa
estadístico.
Generalmente la selección se hace “sin reemplazo” esto es, que el individuo
seleccionado no vuelve a ser tomado en cuenta para la selección.

Ventajas : Desventajas :

•Todos los elementos tienen igual •Se requiere un marco muestral


probabilidad, 1/(Nn). completo y detallado
•Los cálculos matemáticos son •La muestra puede quedar muy
sencillos dispersa
MUESTREO SISTEMATICO
Es aquél tipo de muestreo que nos permite obtener la muestra deseada al
seleccionar aleatoriamente un elemento de los primeros k elementos en el
marco muestral y después cada k-ésimo elemento hasta completar los n
necesarios. Se incorpora un criterio importante al muestreo anterior, que es,
el ORDEN establecido previamente por el investigador ganando con ello
representatividad.

Ventajas : Desventajas :
•Más fácil de extraer una muestra •El riesgo de sesgo es mayor.
•Se ahorra tiempo •No debe utilizarse cuando existe
•La probabilidad de selección es 1/k repetición cíclica o comportamiento
•La tabla de números aleatorios sólo se cíclico inherente al marco de muestreo.
usa una vez.
Ejemplo:
Necesitamos elegir una muestra sistemática de tamaño 30 de los
120 centros de salud pertenecientes a la DISA.
Nº CENTRO DE SALUD
1 C.S. BREÑA
1. Elaboración del Marco muestral en
2 C.S. CHACRA COLORADA
función de un ORDEN, numerados. 3 C.S. JESUS MARIA
2. Calcular el fracción de muestreo: 4 C.S. EL PINO
n/N = 1/k; el inverso, k es llamado 5 C.S. EL PORVENIR
intervalo de muestreo. 6 C.S. MAX ARIAS SCHREIBER
7 C.S. SAN COSME
3. Seleccionar el arranque aleatorio
8 C.S. CONDE DE LA VEGA BAJA
entre 1 y k. En nuestro ejemplo resulto 9 C.S. CONTROL DE ZOONOSIS (ANTIRRÁBICO)
3 10 C.S. JUAN PEREZ CARRANZA
4. Seleccionar las unidades a partir del 11 C.S. MIRONES
arranque aleatorio, y cada k - ésimo 12 C.S. MIRONES BAJO
13 C.S. RAUL PATRUCCO PUIG (ANTIVENEREO)
lugar, hasta completar el tamaño de la
14 C.S. SAN SEBASTIAN
muestra requerido. 15 C.S. UNIDAD VECINAL No 3
16 C.S. VILLA MARIA PERPETUO SOCORRO

n 30 1 k 4
17 C.S. LINCE

  18
19
C.S. MAGDALENA
C.S. SANTA CRUZ DE MIRAFLORES
N 120 4 20 C.S. SAN ISIDRO
MUESTREO ESTRATIFICADO
Consiste en identificar o clasificar a los elementos de la población en subgrupos
(estratos) y seleccionar luego, en cada grupo, una muestra aleatoria simple,
tomando al menos un elemento de cada grupo.
Las subpoblaciones deben ser mutuamente excluyentes y en su conjunto
corresponden a toda la población.
Los estratos pueden reflejar distintos grupos de edad, regiones geográficas, sexo,
diferente grado de exposición, etc.

Ventajas :
Desventajas :
•La estimación final del parámetro puede
tener un error mucho menor que el •Mayor complejidad en los cálculos
obtenido para una muestra aleatoria simple •Se necesita un marco muestral detallado
de similar tamaño.
para cada estrato
•Permite estimar los parámetros para cada
•Criterio muy especializado para conformar
estrato y para la población total
•Asegura la participación de todos los los estratos.
estratos.
La distribución de la muestra en función de los diferentes estratos se
denomina AFIJACIÓN y puede ser de diferentes tipos:

Afijación simple: A cada estrato le corresponde


igual número de elementos muestrales.
Afijación Proporcional: A cada estrato le
corresponde un número proporcional al tamaño del
peso de la población en cada estrato.
Afijación Optima: En cada estrato se toma en
cuenta además de la proporcionalidad, la dispersión
de la variable.
Ejemplo:
Supongamos una población de 10000 , que tiene 3 estratos de
tamaño 5000, 3000 y 2000, necesitamos seleccionar una muestra de
400 mediante la afijación proporcional.

Población Ni % ni
Estrato I 5000 50 200
Estrato II 3000 30 120
Estrato III 2000 20 80
Total 10000 100 400

El porcentaje con el que contribuye cada estrato al total del


universo, se aplica al tamaño de muestra calculado n y ese es el
número de elementos que debe tomarse en cada estrato, mediante
muestreo aleatorio simple.
MUESTREO POR CONGLOMERADOS

Es la selección de grupos de unidades de estudio, o colecciones de


elementos llamados conglomerados, en lugar de unidades de
estudio individuales (generalmente son unidades geográficas u
organizacionales).

Desventajas :
Ventajas :
•Complicación de los cálculos matemáticos
•Disminución en los costos de trabajo de para la estimación de los parámetros.
campo • Si no se incluyen en el estudio a todos los
•Poder trabajar en ausencia de listados individuos de cada conglomerado se puede
muy complejos, pues no se necesita generar sesgo.
contar con un marco muestral. •Es un método menos preciso y requiere
muestras de mayor tamaño.
MUESTREO ESTRATIFICADO MUESTREO POR CONGLOMERADOS
ERROR ESTANDAR
La desviación estándar de la distribución de los estimadores muestrales se
conoce como ERROR ESTANDAR, nos permite conocer la probabilidad de que
una muestra se desvíe del verdadero valor del parámetro, es decir la
desviación de la media de una muestra de la verdadera media de la
población, dentro de ciertos límites de confiabilidad fijados por el investigador.



N

X1 X2 X k 1 Xk

n1 n2 Nk-1 nk x 

n
FORMULAS DEL TAMAÑO DE MUESTRA

Cuantitativa
Cualitativa
VARIABLE (Promedio
(Proporción Poblacional)
Poblacional)

POBLACION
INFINITA Z P(1  P)
2 Z 2S 2
(Cuando no se n0  n0 
conoce N) E2 E2

Z 2 P(1  P) N Z 2S 2N
POBLACION n 2 n 2
FINITA E ( N  1)  Z 2 P(1  P) E ( N  1)  Z 2 S 2
(Cuando se
conoce N)
Muestreo Aleatorio Simple (MAS) –
Fórmulas
Variable Cualitativa: (Proporción Poblacional)

P: Valor del la proporción estimado mediante:


2 Revisión bibliográfica.
Z PQ
n0  2
Estudio piloto
Asumiendo P=0.5
E Z: Valor normal a un nivel de confianza dado.
E: Precisión (Error máximo tolerable en la
estimación del parámetro.

Variable Cuantitativa: Promedio Poblacional

S 2: Valor de la desviación estándar estimado


Z 2S 2 mediante:
n0  Revisión bibliográfica,
Estudio piloto
E2 Experiencia del investigador
Z: Valor normal a un nivel de confianza dado.
E: Precisión (Error máximo tolerable en la
estimación del parámetro.
PASOS A SEGUIR PARA DETERMINAR LA MUESTRA:

1. Identificar el tipo de variable a analizar.


2. Asumir que la población es infinita y aplicar la formula respectiva.
3. Esta muestra obtenida preliminarmente se llama muestra previa (no)

4. Luego si se conoce el tamaño de la población N, obtener la fracción de


muestreo n0
N
n
 Si N0  5%, entonces la muestra definitiva es n0 (muestra previa)

 Si n0
 5% , entonces se ajusta la muestra.
N

4° Para ajustar la muestra se tiene que aplicar la siguiente formula:


n0
n , n es la muestra final.
n
1 0
N
DISEÑO DE UNA MUESTRA:
 Para determinar el tamaño, primeramente hay que identificar la variable a estudiar
(Cuantitativa o cualitativa).
 Luego depende de cuatro factores o elementos que son los siguientes:
PARA UNA VARIABLE PARA UNA VARIABLE
CUANTITATIVA CUALITATIVA
a. Un nivel de confianza: Que es a. Un nivel de confianza: Que es
adoptado por el investigador, el cual adoptado por el investigador, el
puede ser 90%, 95% o 99% y que cual puede ser 90%, 95% o 99% y
origina el valor de Z. que origina el valor de Z.
b. El error de estimación (E): Que b. El error de estimación (E): Que
también es fijado por el investigador también es fijado por el investigador
c. La desviación estándar ó varianza: c. La proporción poblacional (P): que
que son valores que se obtienen por son valores que se obtienen por
estudios anteriores, por la muestra estudios anteriores, por la muestra
piloto o por la distribución de la piloto y si no se conoce asumir
población. p=0.5.
d. El Tamaño de la población (N): Que d. El Tamaño de la población (N): Que
generalmente no se conoce generalmente no se conoce.
Parámetros

VALORES DE LA DISTRIBUCIÓN NORMAL


ESTANDARIZADA(Z)

Valor Z Nivel de confianza


(1-)
Nivel de significancia
()
Valor Zα/2
Bilateral
90% = 0.90 10% = 0.10 1.64
95% = 0.95 5% = 0.05 1.96
99% = 0.99 1% = 0.01 2.58

P
COMPORTAMIENTO DE P y Q
Q=1-P PQ
Valor P
0.05 0.95 0.0475
0.10 0.90 0.090
0.20 0.80 0.160
0.30 0.70 0.210
0.40 0.60 0.240
0.50 0.50 0.250
0.60 0.40 0.240
0.70 0.30 0.210
0.80 0.20 0.160
0.90 0.10 0.090
0.95 0.05 0.0475
APLICACIÓN:
Variable Cualitativa: (Proporción Poblacional)

CASO: EXPLOTACION DEL CERRO QUILISH-CAJAMARCA

Z 2 PQ
Se desea estimar la n0 
proporción de que esta en E2
desacuerdo con la explotación
del Cerro Quilish. Se desea 1.962 * (0.80)(0.20)
n0  2
 246
considerar un 95% de (0.05)
confianza, un error de 5%.De 246
estudios anteriores se sabe n   219
246
que esta proporción es de 1
2000
p=80% (estimada).
Si N = 2000. Calcular n
APLICACIÓN:
Variable Cuantitativa: Promedio Poblacional

CASO: TIEMPO EN REALIZAR UNA TAREA

Se desea estimar el tiempo Z S 2 2

promedio que demora el personal n0  2


al efectuar la techado de una E
vivienda. En un estudio anterior se
encontró que el promedio=3.5
horas teniendo en cuenta 1.962 * (2.2) 2
n  152
información anterior y S=2.2. (0.35) 2

horas. Considerando un error de


E=±0.35 horas. a) Calcular n 152
n   142
152
b) Si N = 2000. Calcular n 1
2000
Tamaño de muestra para estimar 

Ejemplo: Se quiere empezar una investigación para


estimar el tiempo promedio que demoran los proyectos
desarrollados por Enigma Project S.A. La estimación
debe realizarse a un nivel de confianza del 90% y un
error máximo permisible de 20 días. Considerando que
la desviación estándar de los tiempos de finalización de
los proyectos es 100 días, ¿cuántos de los proyectos
terminados por la empresa deberían constituir la
muestra?
Tamaño de muestra para estimar 

Ejemplo: Se lleva a cabo un estudio para estimar el


porcentaje de ciudadanos de una ciudad que están a
favor de tener su agua fluorada. ¿Qué tan grande se
necesita que sea la muestra si se desea tener una
confianza del 95% de que la estimación esté dentro del
4% del porcentaje real?
Tamaño de muestra para estimar 

Ejemplo: En un artículo de un periódico


norteamericano el 32% de los adultos encuestados
dijeron que el programa espacial estadounidense debe
enfatizar la exploración científica. ¿Qué tan grande se
necesita que sea la muestra de adultos en una nueva
encuesta si se desea tener una confianza del 95% de que
el porcentaje estimado esté dentro del 2% del porcentaje
real?
Muestreo Aleatorio Estratificado (MAE) - Fórmulas

Variable cuantitativa
Criterio 1: Afijación Proporcional

n 
 W h S h2  Wh=Nh/N: ponderación en cada estrato
Sh: Desviación estándar en cada estrato
2
 E  Z: Valor normal a un nivel de confianza dado.
  E: Precisión (Error máximo tolerable en la estimación del
 Z  parámetro.

Criterio 2: Afijación óptima

n
W S
h h Ch W S h h / Ch  Wh=Nh/N: ponderación en cada estrato
Sh: Desviación estándar en cada estrato
2
E Z: Valor normal a un nivel de confianza dado.
  E: Precisión (Error máximo tolerable en la estimación del
Z parámetro. Ch: Costo de aplicar una encuesta en cada
estrato.

Criterio 3: Afijación Neyman

n 
W h Sh  2 Wh=Nh/N: ponderación en cada estrato
Sh: Desviación estándar en cada estrato
 E 
2
Z: Valor normal a un nivel de confianza dado.
  E: Precisión (Error máximo tolerable en la estimación del
 Z  parámetro.
Muestreo Aleatorio Estratificado (MAE)-Fórmulas

Variable cuantitativa
Criterio 1: Afijación Proporcional

Cuando ud va a distribuir la muestra según Nh


el tamaño de la población. nh  (n )
N
Criterio 2: Afijación Óptima

Cuando ud. va a distribuir la muestra N h S h / Ch


según la variabilidad y los costos que existe nh  (n)
dentro de los estratos.  N h Sh / Ch
Criterio 3: Afijación Neyman

Cuando ud. va a distribuir la muestra N h Sh


según la variabilidad, y asume que los nh  (n)
costos en cada uno de los estratos son
iguales.
 N h Sh
Muestreo Aleatorio Estratificado (MAE)
Variable cualitativa
Criterio 1: Afijación Proporcional

n 
 W h Ph Qh  Wh=Nh/N: ponderación en cada estrato
Ph: Proporción de interés en el estrato h
2 Z: Valor normal a un nivel de confianza dado.
 E  E: Precisión (Error máximo tolerable en la estimación del
  parámetro.
 Z 

Criterio 2: Afijación óptima

n
W h PhQh Ch W h PhQh / Ch  Wh=Nh/N: ponderación en cada estrato
Ph: Proporción de interés en el estrato h
2 Z: Valor normal a un nivel de confianza dado.
E
  E: Precisión (Error máximo tolerable en la estimación
Z del parámetro. Ch: Costo de aplicar una encuesta
en cada estrato.

Criterio 3: Afijación Neyman

n 
 W h Ph Qh  2 Wh=Nh/N: ponderación en cada estrato
Ph: Proporción de interés en el estrato h
 E 
2
Z: Valor normal a un nivel de confianza dado.
  E: Precisión (Error máximo tolerable en la estimación del
 Z  parámetro.
APLICACIÓN:
Muestreo Aleatorio Estratificado (MAE)

CASO: GESTION MUNICIPAL

Se esta realizando un estudio de evaluación de la


Gestión Municipal en el distrito de Chocope. Se desea
determinar una muestra para estimar la proporción que
está de acuerdo con la gestión municipal. Se decidió
utilizar Afijación Proporcional En la actualidad se
desconoce la proporción que esta de acuerdo con la
gestión en cada estrato (p=0.5). Se asume un error de
E=0.03. Calcular n y distribuirla a cada estrato
APLICACIÓN:
Muestreo Aleatorio Estratificado (MAE)

CASO: GESTION MUNICIPAL

Nº Centro Poblado Nº viviendas Ph Qh Wh = Nh / N Ph.Qh.Wh no


1 Chocope 1397 0.5 0.5 0.5252 0.1313 400
2 Sintuco 289 0.5 0.5 0.1086 0.0272 83
3 Molino Cajanleque 207 0.5 0.5 0.0778 0.0195 59
4 Farias 139 0.5 0.5 0.0523 0.0131 40
5 Careaga 98 0.5 0.5 0.0368 0.0092 28
6 Mariposa Leyva 14 0.5 0.5 0.0053 0.0013 4
7 Mocollope 72 0.5 0.5 0.0271 0.0068 21
8 Molino Cajanleque 151 0.5 0.5 0.0568 0.0142 43
9 Molino Chocope 95 0.5 0.5 0.0357 0.0089 27
10 Molino Larco 125 0.5 0.5 0.0470 0.0117 36
11 La Constancia 73 0.5 0.5 0.0274 0.0069 21
TOTAL (N) = 2660 ΣPhQhWh = 0.2500 762

n
W P Q  h h h 0.25
 1067 1067
2
0.03 2 n   762
E 1067
  (
1.96
) 1
Z 2660

Вам также может понравиться