Вы находитесь на странице: 1из 19

02/06/2011

MUESTREO

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)

N1 n1
N2 n3
n2

N3 Muestra: n = n1+ n2 + n3

Población: N = N1+ N2 + N3

 Se agrupan las unidades en clases (Estratos).


 Se busca prioritariamente homogeneidad entre los elementos del
mismo estrato y alta heterogeneidad entre elementos de diferente
estrato.

Requiere información auxiliar de una o varias variables o


atributos para estratificar las unidades poblacionales (Genero).

1
02/06/2011

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)

Características:
 Es eficiente para poblaciones heterogéneas.
 Reduce el costo del muestreo al reducir los tamaños de la
muestra sin que ello haga perder precisión.
 Forma parte de los diseños muestrales más complejos.
 Existe independencia en la selección de la muestra en cada
estrato.
 Es más costoso que el MAS.
 Bien usado éste método produce errores de muestreo más
bajos.

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)
 Procedimiento para seleccionar una muestra
aleatoria estratificada:

• Seleccionar un marco de muestreo adecuado.


• Seleccionar las variables de estratificación.
• Definir el numero de estratos (L) de acuerdo con los objetivos
del estudio.
• Dividir la población en L estratos, basándose en la variable
de estratificación.
“Cada unidad poblacional debe pertenecer a uno y solo uno de los
estratos”
• Determinar el tamaño de muestra global y realizar la
afijación (repartición) para cada estrato de acuerdo con la
regla que se haya escogido para tal efecto previamente.
• “ No olvide que: n= n1 + n2 +……+ nL”

2
02/06/2011

CALCULO DEL TAMAÑO DE MUESTRA EN EL


MAE
Estimación del Promedio Poblacional

∑W h .S h2
n0 Wh =
Nh
n0 = h =1
; n= N
V0 n
1+ 0
N
Varianza deseada
Estimación de la Proporción Poblacional 2
 
δ
L
V0 =  
∑W h .Ph Qh
n0
 Zα
 2


n0 = h =1
; n=
V0 n
1+ 0
N

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)

Como dividir el tamaño de la muestra en los estratos?

a. Asignación Uniforme: Todos los estratos tiene el mismo


tamaño de muestra

1
n h = n. , ∀h
L
 Da la misma importancia a todos los estratos, en cuanto al
tamaño de la muestra.
 Favorece a los estratos de menor tamaño y perjudica a los
grandes, en cuanto a precisión.

3
02/06/2011

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)

Como dividir el tamaño de la muestra en los estratos?

b. Asignación Proporcional: El tamaño del estrato en la


muestra debe ser proporcional al tamaño del estrato en la
población.
N 
nh = n.  h  = n.W h , ∀ h
 N 
 Estrato más grande muestra más grande, estrato más
pequeño muestra más pequeña.
 Es la división indicada cuando no tenemos información sobre
la distribución de la característica en estudio.

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)

Como dividir el tamaño de la muestra en los estratos?

c. Asignación de mínima varianza (Neyman): : El tamaño


de cada estrato depende de su nivel de variabilidad

   N h .Ph .Qh 
 W .S   Wh . 
Nh −1
n h = n.  L h h  n h = n.  L 
 W .S   
∑ h h
N h .Ph .Qh
  ∑ W h . 
 h =1   h =1 Nh −1 
 Cuanto mayor sea la variabilidad del estrato, más elementos
se seleccionan en la muestra de tal forma que la varianza
global sea mínima.

4
02/06/2011

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)
Ejemplo.

Una empresa publicitaria está interesada en determinar que tanto


debe enfatizar la publicidad televisiva en un determinado municipio,
y decide realizar una encuesta por muestreo para estimar el número
promedio de horas por semana que se ve la televisión en los hogares
del municipio. Este comprende dos pueblos, pueblo A y pueblo B, y
un área rural. El pueblo A circunda una fábrica, y la mayoría de los
hogares son de trabajadores con niños en edad escolar. El pueblo B
es un suburbio exclusivo de una ciudad vecina y consta de habitantes
más viejos con pocos niños en casa. Existen 155 hogares en el pueblo
A, 62 en el pueblo B y 93 en el área rural.

Encuentre el tamaño de muestra para realizar dicha investigación y


asígnela a cada estrato con los 3 métodos.

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)
Ejemplo.
Suponga que se va a llevar a cabo la encuesta planeada en el ejemplo
anterior. La empresa publicitaria tiene tiempo y dinero suficiente
para entrevistar n=40 hogares y decide seleccionar muestras
aleatoria de tamaño n1=20 del pueblo A, n2 = 8 del pueblo B y n3 = 12
del área rural. Se seleccionan las muestras aleatorias y se realizan
las entrevistas. Los resultados, con mediciones del tiempo que se ve
la televisión en horas por semana se muestran en la siguiente tabla.

Estrato 1 Pueblo A Estrato 2 Pueblo B Estrato 3 Área Rural


35 28 26 41 27 4 49 10 8 15 21 7
43 29 32 37 15 41 25 30 14 30 20 11
36 25 29 31 12 32 34 24
39 38 40 45
28 27 35 34

Estime el tiempo medio que se ve televisión para toda la población


estudiada y encuentre la varianza del estimador.

5
02/06/2011

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)
Estimador de la Media
L L
1
Xˆ MAE =
N

h =1
Xˆ h . N h = ∑ Wh . Xˆ h
h =1
Peso del
estrato h

Factor de corrección
para el estrato h
Varianza del Estimador

( ) ( ) Sˆ 2
L L Varianza en el
V Xˆ MAE = ∑ W h2 .V Xˆ h = ∑ W h2 . (1 − f h ) h , estrato h

h =1 h =1 nh

( x − Xˆ ) , Xˆ
nh 2 nh
1 1
Sˆh2 =
n −1
∑ i =1
hi h h =
nh
∑x
i =1
hi
h
Tamaño de
muestra en el
estrato h

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)

6
02/06/2011

MUESTREO ALEATORIO ESTRATIFICADO


(MAE)
Ejemplo.
El transporte urbano destinado al servicio público en una gran
ciudad está compuesto por 3000 taxis y 2000 buses. La secretaría de
Tránsito y Transporte de dicha ciudad desea estimar la proporción de
vehículos de servicio público que son conducidos por sus dueños
exclusivamente. Se cree que el porcentaje puede ser del 20% para
buses y del 40% para taxis.

Determine el número de buses y de taxis que se deben revisar para


encontrar tal estimación con un nivel de confianza del 95% y un
margen de error máximo tolerable del 6%. Use un tipo de asignación
proporcional.

Estime la proporción de vehículos de transporte publico que es


conducido por su dueño en toda la población estudiada y encuentre la
varianza del estimador.

MUESTREO ALEATORIO ESTRATIFICADO


PARA ATRIBUTOS

7
02/06/2011

MUESTREO ALEATORIO ESTRATIFICADO


PARA ATRIBUTOS

Estimador de la Proporción
L
a
PˆMAE = ∑ W h .Pˆh , Pˆh = h , ∀ h
h =1 nh

Varianza del Estimador

2 ( N h − n h ) Ph .Q h
ˆ ˆ
( )
L
V PMAE = v ( p ) = ∑ W h .
ˆ .
h =1 ( N h − 1 ) nh

MUESTREO ALEATORIO DE CONGLOMERADOS


(MCON)

Puede verse como un muestreo aleatorio simple, en donde las


unidades muestrales son colecciones o grupos:

“Los conglomerados está conformados generalmente por


unidades que se encuentran cercanas geográficamente”

“La conformación de conglomerados debe ser tal que se espera


poca variabilidad entre conglomerados y la diferente
variabilidad dentro de los conglomerados”.

Conglomerados

8
02/06/2011

MUESTREO ALEATORIO DE CONGLOMERADOS


(MCON)

Algunas Consideraciones en la Conformación de Conglomerados

 Los conglomerados deben estar bien definidos de manera que todos


los elementos de la población pertenezcan solamente a un
conglomerado. (No deben haber traslapes).
 El número de elementos que conforman cada conglomerado debe
ser conocido o fácilmente estimable.
 Por razones de costos, los conglomerados deben ser lo
suficientemente pequeños.
 Se debe lograr un equilibrio entre el número de conglomerados y el
tamaño de los mismos, ya que muchos conglomerados pequeños
permiten controlar la variabilidad, pero pocos conglomerados
grandes son económicamente recomendables.

MUESTREO ALEATORIO DE CONGLOMERADOS


(MCON)
Ventajas

 No necesita de un estricto marco de muestreo.


 En muchas ocasiones los conglomerados se conforman por
delimitaciones geográficas.
 Metodología rápida y económica.
 Es eficiente cuando la población es muy grande y dispersa.

Inconvenientes

 Menor precisión en las estimaciones, debido a que en la mayoría de


los casos existe un cierto grado de homogeneidad dentro de los
conglomerados
 La eficiencia de este tipo de muestreo disminuye al aumentar el
tamaño de los conglomerados. Este tipo de muestreo es mas útil
cuando la población es numerosa y permite la conformación de
conglomerados grandes.

9
02/06/2011

MUESTREO ALEATORIO DE CONGLOMERADOS


(MCON)
Procedimiento para la selección de la muestra por
Conglomerados

 Dividir la población en conglomerados no excesivamente grandes.


Esta división se realiza habitualmente atendiendo a divisiones
geográficas, administrativas, o de otro tipo.
 Considerar el conjunto de conglomerados como una nueva
población, procediendo a la selección de m conglomerados
mediante un MAS.
 Se realizan las mediciones de la variable bajo estudio en todos los
individuos de los conglomerados seleccionados

El muestreo bietápico es un caso particular del muestreo por


conglomerados en el que en la segunda etapa no se seleccionan todos
los elementos del conglomerado, sino que se seleccionan un
determinado número de elementos de cada conglomerado de manera
aleatoria

MUESTREO ALEATORIO DE CONGLOMERADOS


(MCON)
Ejemplo:

En una fábrica de refrescos se desea medir el contenido


promedio de líquido por botella para mantener el
estándar de calidad. El producto se empaca en canastas
de 30 unidades cada una.
Para tal propósito se toma una muestra aleatoria de 5
cajas de refrescos y se determina en cada una de las
botellas de cada caja el contenido exacto de líquido.

10
02/06/2011

MUESTREO ALEATORIO SISTEMÁTICO (MSIS)

Frecuentemente empleado, dado su facilidad en la selección de


la muestra, generalmente se aplica en muestreo de archivos.

Su aplicación requiere de un ordenamiento natural de las


unidades muestrales, o en su defecto de ordenar las unidades
en una secuencia aleatoria.

Una muestra sistemática puede dar la misma precisión de


estimación acerca de la población que una muestra aleatoria
simple cuando los elementos en la población están ordenados
al azar.

MUESTREO ALEATORIO SISTEMÁTICO (MSIS)

Procedimiento para la selección de la muestra


Sistemática

 Ubicar los elementos de la población.


 Listar los elementos de la población de 1 a N.
 Dividir el tamaño de la población N entre el tamaño de la
muestra n y de esta manera se determina el intervalo
muestral k (k es el entero más próximo a N/n).
 Se genera un número aleatorio entre 1 y k, el cual se
denominara L y corresponderá al primer elemento de la
muestra.
 Los (n-1) elementos restantes deben seguir la secuencia:
L+k; L+2k;………..;L+(n-1)k.

11
02/06/2011

MUESTREO ALEATORIO SISTEMÁTICO (MSIS)

Ventajas

 Extiende la muestra a toda la población.


 Recoge el posible efecto de estratificación debido al orden en
que figuran las unidades en la población.
 Permite la consideración de conglomerados en la población.
 Su procedimiento de aplicación presenta facilidad de
aplicación y comprobación.
 Si la disposición de los elementos en la población es
aleatoria, la selección sistemática equivale a un Muestreo
Aleatorio Simple.
 El error de Muestreo suele ser inferior en un Muestreo
Aleatorio Simple e incluso que en un Muestreo Aleatorio
Estratificado.

MUESTREO ALEATORIO SISTEMÁTICO (MSIS)

Inconvenientes

 Cuando existe periodicidad en el ordenamiento de la


población con respecto a la característica de interés aumenta
la varianza del estimador.
 No existe independencia entre la selección de unidades en
las distintas zonas, ya que las unidades extraídas en cada
zona dependen de la seleccionada en la primera zona.
 En general solo hay selección aleatoria para la primera
unidad de la muestra.

12
02/06/2011

MUESTREO ALEATORIO SISTEMÁTICO (MSIS)

El riesgo de este tipo de muestreo está en los casos en que


se dan periodicidades en la población, ya que al elegir a
los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad no
existente en la población.

MUESTREO ALEATORIO SISTEMÁTICO (MSIS)


Ejemplo:
Con el objetivo de medir el nivel de contaminación de metales pesados en un
terreno aledaño a una empresa industrial la cual deposita en él sus desechos
industriales, se ha levantado un plano del terreno y en él se ha construido
una rejilla que permite dividirlo en 40 unidades muestrales. Se selecciona
una muestra de tamaño 8 de cinco en cinco partiendo de la unidad #3 y
siguiendo la ruta estipulada. Finalmente las 8 muestras de lodo son
enviadas al laboratorio para su respectivo análisis.

13
02/06/2011

ANALISIS DE LA RELACIÓN
ENTRE VARIABLES

ANÁLISIS DE CORRELACIÓN

Qué es el análisis de Como se relacionan?


correlación?
X Y

Es una herramienta estadística que podemos usar para describir el


grado de relación entre un par de variables cuantitativas. Entre
sus herramientas se encuentran:
1. Gráficos de Dispersión:
Representación grafica simultanea del par de variables estudiadas.
2. Indicadores de Asociación: Coeficiente de Correlación (r)
Indicador que mide la fuerza de la relación entre un par de variables.

3. Análisis de Regresión: Y= a+ bX
Búsqueda de una expresión que permita predecir el valor de Y a
través del conocimiento del valor de X.

14
02/06/2011

ANÁLISIS DE CORRELACIÓN
Variable Variable
Independiente Dependiente
(X) Tipos de Variables
(Y)
(determinística, es
aleatoria
decir no aleatoria.)

Ejemplos
X: Temperatura
Y: Precipitación
A mayor temperatura menor precipitación
X: Gastos anuales de una empresa en publicidad
Y: Ingresos anuales por ventas de la empresa
A mas gastos en publicidad mayor ingreso (hasta cierto punto)
X: Tasa de desempleo
Y: Tasa de Homicidios
A mayor desempleo mas homicidios

COMO VALORAR LA ASOCIACIÓN?


1. Grafico de Dispersión:
Es un grafico en el cual se representan las parejas ordenadas (X,Y)
de las variables observadas. La forma que toma ilustra acerca de la
posible asociación existente.

No existe
Relación ? Relación
Directa

Relación Relación
Inversa No Lineal

15
02/06/2011

COMO VALORAR LA ASOCIACIÓN?


Los aspectos que se observan en el diagrama de dispersión son:

Forma:
Relaciones lineales, cuando los puntos del diagrama de dispersión se
sitúan aproximadamente a lo largo de una recta.

Dirección:
Si la relación entre las dos variables tiene una dirección clara, puede
ser una asociación positiva o una asociación negativa.

Fuerza:
La fuerza de la relación entre variables viene determinada por la
proximidad de los puntos del diagrama a alguna forma simple como
una recta.

COMO VALORAR LA ASOCIACIÓN?


2. Coeficiente de Correlación (r):
Medida de magnitud de la asociación lineal entre dos variables
1
S xy Cov ( x, y ) n
∑ ( xi − x )( yi − y )
r= = =
Sx S y V ( x )V ( y ) SxS y

n ( ∑ xy ) − ( ∑ x )( ∑ y )
r=
n ( )   ( )
 ∑ x − ( ∑ x )   n ∑ y − ( ∑ y ) 

2 2 2 2

El coeficiente de correlación lineal de Pearson de dos variables, r, nos


indica si los puntos tienen una tendencia a disponerse linealmente.

r es útil para determinar si hay relación lineal entre dos variables,


pero no servirá para otro tipo de relaciones (cuadrática,
logarítmica,...)

16
02/06/2011

PROPIEDADES DEL COEFICIENTE DE PEARSON


• Es adimensional, no se deja afectar por las unidades de medida
de las variables de análisis.
• Sólo toma valores entre -1 y 1.
• Las variables están incorrelacionadas si r = 0.
• Relación lineal perfecta entre dos variables si r = +1 o r = -1.
• Cuanto más cerca esté r de +1 o -1 mejor será el grado de
relación lineal.
Siempre que no existan observaciones anómalas.

Correlación Correlación
No hay
negativa positiva
correlación
perfecta Correlación Correlación perfecta
negativa positiva
moderada moderada

Correlación Correlación Correlación Correlación


negativa negativa positiva positiva
intensa débil débil intensa

-1 -0.5 0 0.5 1

CORRELACIONES

r = -0.047

r = 0.889

r = -0.889

No es adecuado calcular
el coeficiente de Pearson

17
02/06/2011

PRECAUCIÓN CON LA CORRELACIÓN


Asociación no implica causalidad:
Que exista fuerte relación entre las dos variables no es suficiente
para sacar conclusiones sobre la relación causa-efecto.

¿Una solución para disminuir el número de accidentes puede


ser tener menos agentes de transito en la ciudad?

PRECAUCIÓN CON LA CORRELACIÓN

¿Puede decirse que el consumo de


vino disminuye el riesgo de
muerte por enfermedades
cardiacas?

18
02/06/2011

COMO VALORAR LA ASOCIACIÓN LINEAL?

3. Coeficiente de Determinación (r2): La interpretación del


coeficiente de correlación no es muy precisa, por está razón se usa
con mayor frecuencia el coeficiente de determinación:

“Indica la proporción de la variación total de la variable aleatoria Y,


que puede ser explicada a través del conocimiento de la variable X
mediante una ecuación lineal”.

4. Prueba de Hipótesis para el Coeficiente de Correlación


Poblacional (ρ):
Ho: ρ=0 vs. Ha: ρ ≠ 0 , ρ > 0, ρ < 0

r−ρ
Estadístico de Prueba: t =
(1 − r )
2

(n − 2)
Región de Contraste: Distribución t-Student con GL = n-2

COMO VALORAR LA ASOCIACIÓN LINEAL?

Ejemplo: El propietario de una empresa está interesado en conocer


el tipo de relación que existe entre sus inversiones mensuales en
publicidad y el nivel de ventas que obtiene su empresa; para ello ha
tomado datos de los últimos seis meses y los registra en la siguiente
tabla:
Mes Gastos publicidad Ingresos por ventas
Julio 2 7
Agosto 1 3
Septiembre 3 8
Octubre 4 10
Noviembre 5 12
Diciembre 6 15

1. Evalué el nivel de asociación entre este par de variables.


2. Efectué una prueba de Hipótesis sobre el coeficiente de correlación.
3. Cual es el valor-p asociado?

19

Вам также может понравиться