Вы находитесь на странице: 1из 41

MUESTREO

ELEMENTOS DEL PROBLEMA DE


MUESTREO
Población Obtener información sobre una
concreta característica X
Mediante 2 estrategias:
xxxxxxx
* Examinar todas y cada una de las unidades que la
xxxx xxx x
componen, es decir, realizar un censo que
x x x x x xx x x
proporciona un conocimiento total de la
xxxxxxxx
característica de estudio sobre la población de
xxxx
interés.
* Examinar sólo una parte de la población que recibe el
Muestra nombre de muestra. A partir de ella se realizarán
inferencias sobre la característica de estudio en toda la
población

El conjunto de unidades de entre las que se seleccionará la muestra recibe el nombre


de marco.
DEFINICIONES BÁSICAS
POBLACIÓN: Todo conjunto de elementos
finito o infinito, definido por uno o mas
características que tienen todos los
elementos que la componen. Debe estar
definido en el tiempo y el espacio.
MUESTRA. Es una parte representativa de la
población , significa que debe reflejar las
similitudes y diferencias encontradas en la
población
MUESTREO: Técnicas para determinar que
parte de una realidad en estudio (Población)
debe examinarse, con la finalidad de hacer
inferencias sobre la población en referencia.
UNIDAD DE ANALISIS: Objeto o individuo
del que hay que obtener la información
(Persona, familia, vivienda, etc.)

ESTIMADOR: Valor que se obtiene a partir


de los datos de la muestra y que proporciona
información sobre el valor del parámetro

ERROR DE MUESTREO: es el que surge al


considerar una muestra y no examinar toda
la población. El error de muestreo puede ser
controlado y medido mediante un diseño
cuidadoso de la muestra.
ERRORES DE NO MUESTREO:
• Otro tipo de errores, más difícil de
controlar, pueden ocurrir en la encuesta.
En muchas encuestas, el error de
muestreo cometido para esa encuesta
puede ser despreciable en comparación
con los errores que no son de muestreo.
ERRORES DE NO MUESTREO MAS
COMUNES:

• Sesgo de selección. Este error ocurre


cuando alguna parte de la población
objetivo no está en la población
muestreada. Una muestra así obtenida no
es representativa de la población objetivo.
• Sesgo de medición. Ocurre cuando los
datos observados difieren del valor
verdadero. La obtención de respuestas
precisas en las encuestas es fundamental
pero esto a veces no se consigue por
diversos motivos: las personas no dicen
la verdad. Las personas no siempre
comprenden las preguntas. Un
entrevistador puede leer mal las
preguntas o anotar las respuestas de
manera equivocada. La formulación y el
orden de las preguntas tiene un gran
efecto sobre las respuestas obtenidas
No respuesta. La no respuesta de un
individuo seleccionado para formar parte de
la muestra puede causar un sesgo en los
datos muestrales similar al sesgo de
selección. Puede ocurrir que las personas
que respondan no representen a la
población bajo estudio.

Los errores de no muestreo pueden


controlarse con las siguientes acciones:
1. Re entrevistas.
2.Recompensas e incentivos.
3. Entrevistadores adiestrados.
4. Verificación de datos.
Razones para el uso del muestreo
• MAYOR RAPIDEZ: Un numero reducido de observaciones se puede
recolectarse , procesarse con mayor rapidez, que la información
proporcionada por un censo y dar resultados mas oportunos.
• COSTO REDUCIDO: El costo total del estudio por muestreo es
mucho menor que el censo, cubriendo .os mismos objetivos y por
pocitos que los ejecutados por un censo
• MAYOR ALCANCE: dado a su flexibilidad y adaptabilidad el
muestreo tiene mayor alcance frente al censo, respecto a la
variedad de la información.
• MAYOR EXACTITUD: los datos obtenidos por un censo o una
muestra están sujetos a diferentes tipos de errores y sesgos, un
estudio muestral posibilita mayor exactitud por practicarse un
mejor control sobre la recolección y el procesamiento de los datos.
• EVITAR LA DESTRUCCIÓN DE LA POBLACIÓN: En algunos casos,
una unidad de observación debe ser destruida para ser observada.
En ese caso, un censo destruiría a toda la población. Por ejemplo
el muestreo en el control de calidad.
MÉTODOS DE MUESTREO
• MUESTREO NO PROBABILISTICO: Proceso por el cual no
se puede asignar objetivamente probabilidades a los
elementos seleccionados. Las unidades muestrales se
seleccionan siguiendo determinado criterio. Este tipo de
garantiza la representatividad de la muestra por lo tanto
no permiten realizar inferencias. Pueden ser: Muestreo a
juicio o criterio, por cuotas, por correo, bola de nieve,
etc.
• MUESTREO PROBABILISTICO: Proceso muestral donde
cada elemento de la población tiene una probabilidad
perfectamente conocida de ser incluida en la muestra
solo este tipo de muestreo nos asegura la
representatividad de la muestra y nos proporciona
estimaciones e inferencias con cierta medida de
precisión. Por lo tanto es mas recomendable
• MUESTREO PROBABILISTICO:
• Proceso muestral donde cada elemento
de la población tiene una probabilidad
perfectamente conocida de ser incluida
en la muestra solo este tipo de muestreo
nos asegura la representatividad de la
muestra y nos proporciona estimaciones e
inferencias con cierta medida de
precisión. Por lo tanto es mas
recomendable. Entre los tenemos:

- Muestreo aleatorio simple


Métodos de
- Muestreo aleatorio estratificado
muestreo
probabilístico
- Muestreo aleatorio sistemático
- Muestreos aleatorio por conglomerados.
MUETREO ALEATORIO SIMPLE
Es un método de selección de “n” unidades de un conjunto de N, de
forma tal que cada elemento tiene la misma posibilidad de ser elegido
para integrar la muestra

MUETREO SIN REEMPLAZO MUESTREO CON REEMPLAZO


Los elementos de la población no Los elementos de la población se
se repiten en la muestra, significa repiten en la muestra , ello debido
que una unidad seleccionada para a que la unidad seleccionada es
integrar la muestra no es devuelta devuelta a la población antes de
a la población extraer otro elemento muestral.
ESTIMADORES PARA VARIABLES
CUANTITATIVAS
• Estimador de la media muestral

• Estimador del total poblacional

• Estimador de la varianza poblacional

෌ 𝑦𝑖2 − 𝑛 ∗ 𝑦ത 2
𝑠2 =
𝑛−1
• Estimador de la varianza de la media muestral
- Para muestreo sin reemplazo (Poblaciones finitas)

Factor de corrección para


poblaciones finitas
Factor de elevación Factor de Muestreo

= ( 1-n/N )= (1-f) N/n f = n/N

Si (1- f) ≥ 0.95 ó “n “ ≤ 5% de la población , suele despreciarse.


Si N es desconocido se supone que es suficientemente grande, luego (1-f) ≈ 1

- Para muestreo con reemplazo (poblaciones infinitas)


• Estimador de la varianza del estimador del
total poblacional
• Muestreo sin reemplazo

• Muestreo con reemplazo


INTERVALO DE CONFIANZA

A. Para la media poblacional

Muestreo sin reemplazo Muestreo con reemplazo

Error de estimación

B. Para el total poblacional


Muestreo sin reemplazo Muestreo con reemplazo
ESTIMADORES PARA VARIABLES CUALITATIVAS
• Estimador de la proporción poblacional
a: # de unidades muestrales que poseen
Donde:
el atributo o característica estudiada

• Estimador de la varianza del estimador de P poblacional

Muestreo sin reemplazo

Muestreo con reemplazo

• Estimador del total de unidades que poseen el atributo


• Estimador de la varianza del estimador del total

Muestreo sin reemplazo

Muestreo con reemplazo

• Estimación por intervalos: Intervalo de confianza para la


proporción poblacional

Error de estimación
• Sea una población formada por 6 establos
lecheros cada uno de los cuales cuenta con el
ganado siguiente:
Número de
Establo
cabezas
X1 300
X2 400
X3 500
X4 600
X5 900
X6 1.200
• Los parámetros de esta población son:
• Promedio: 𝜇 = 650 vacunos
• Varianza: 𝑆 2 = 115.000
• Construir la distribución de frecuencias de los
posibles estimadores de obtener para el promedio
poblacional que se puede construir a través de la
selección de muestras simples aleatorias de tamaño
n: 1, 2, 3, 4 y 5. Evalúe su comportamiento.
Respuesta
• a.- con 𝑛 = 2 existirán 6!/ 4! ∗ 2! = 15 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
J M.S.A.j. ′
𝝁𝒋 𝒔𝟐 𝒋 𝒔𝟐 𝝁 𝒋Ƹ
1 X1,X2 350 5,000 1,666.67
2 X1,X3 400 20.000 6,666,67
3 X1,X4 450 45.000 15.000
4 X1,X5 600 180.000 60,000
5 X1,X6 750 405.000 135,000
6 X2,X3 450 5.000 1,666,67
7 X2,X4 500 20.000 6,666,67
8 X2,X5 650 125.000 41,666,67
9 X2,X6 800 320.000 106,666,67
10 X3, X4 550 5.000 1,666,67
11 X3,X5 700 80.000 26,666,67
12 X3,X6 850 245.000 81,666,67
13 X4,X5 750 45.000 15,000
14 X4,X6 900 180.000 60,000
15 X5,X6 1,05 45.000 15,000
valor esperado 650 115.000 38,333,33
• b.- con n=3 existirán 6!/ 3! ∗ 3! = 20 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

j M.S.A.j.
𝜇𝑗
1 X1,X2,X3 400 10.000 1,666.67
2 X1,X2,X4 433,33 23,333,33 3,888,89
3 X1,X2,X5 533,33 103,333,33 17,222,22
4 X1,X2,X6 633,33 243,333,33 40,555,56
5 X1,X3,X4 466,67 23,333,33 3,888,89
6 X1,X3,X5 566,67 93,333,33 15,555,56
7 X1,X3,X6 666,67 223,333,33 37,222,22
8 X1,X4,X5 600 90.000 15,000
9 X1,X4,X6 700 210,000 35,000
10 X1,X5,X6 800 210,000 35,000
11 X2,X3,X4 500 10,000 1,666,61
12 X2,X3,X5 600 70,000 11,666,67
13 X2,X3,X6 700 190,000 31,666,67
14 X2,X4,X5 633,33 63,333,33 10,555,56
15 X2,X4,X6 733,33 173,333,33 28,888,89
16 X2,X5,X6 833,33 163,333,33 27,222,22
17 X3,X4,X5 666,67 43,333,33 7,222,22
18 X3,X4,X6 766,67 143,33,33 23,888,89
19 X3,X5,X6 866,67 123,33,33 20,555,56
20 X4,X5,X6 900 90,000 15,000
valor esperado 650 115,000 19,166,67
• a fin de estimar el valor real del inventario de objetos de
una tienda es seleccionada una muestra de objetos
anotándose, para cada uno de los objetos observados, su
valor real y el valor que registra en libros .
• Como resultado del muestreo efectuado resulto que la
proporción entre el valor real y el valor registrado en
libros fue de 1.021; aproximadamente, esta proporción
tiene distribución normal con una desviación estándar de
0.0002.
• Si el valor total del inventario que registran los libros
contables es de $80.000, estimar los límites de confianza
que tendría el valor real de los objetos considerando un
nivel de seguridad de 95%.
• 𝑦𝑖 = Valor real del objeto i-ésimo.
• 𝑥𝑖 =Valor en libros del objeto i-ésimo
• 𝑟 = σ 𝑦𝑖 / σ 𝑥𝑖 = 0.121 con distribución normal (R ;
0.0082)
• σ𝑁𝑖=1 80.000 ; luego el valor real estimado sería

• 𝑌෠ = 𝑟 σ𝑁
𝑖=1 𝑥𝑖 = 1.021 80.000 = $81.680
• La varianza del estimador será:
2
• 𝑣 𝑌෠ = 𝑟 σ𝑁
𝑖=1 𝑥𝑖 =
𝑁
σ𝑖=1 𝑥𝑖 𝑣 𝑟 =
2
80.000 ∗ 0.00822
• Si el error estándar del estimado será:

• 𝑆 𝑌෠ = 𝑉 𝑌෠ = 80.000 ∗ 0.0082 = 656


• Los límites de confianza resultantes son:
• 𝐿. 𝐶. 𝑌 = 𝑌෠ ± 𝑧 𝑆 𝑌෠ = 81.680 ± 1.95 ∗ (656)
• 𝐿. 𝐶. 𝑌 = (82,960 ; 80,400)
TAMAÑO DE MUESTRA
En ocasiones se fija de antemano el máximo error de estimación que estamos dispuestos a
σ
aceptar en una estimación 𝑍1−αΤ2 = e
𝑛
Luego la cantidad de información necesario para conseguir lo anterior depende del tamaño
de muestra según:

Poblaciones Poblaciones
Infinitas Finitas
Variables 2 2
2
𝑧1− 2
𝛼ൗ 𝜎 𝑁
cuantitativas 𝑧1−𝛼ൗ 𝜎 2
𝑛= 2 𝑛= 2 2
𝑒2 𝑧1−𝛼ൗ 𝜎 + 𝑒 2 (𝑁 − 1)
2
2
Variables 𝑧1−𝛼ൗ 𝑝𝑞 𝑁
2
2
𝑧1−𝛼ൗ 𝑝𝑞
𝑛= 2
cualitativas
2
2
𝑧1− 𝛼ൗ 𝑝𝑞𝑧1−
2
𝑝𝑞 𝑁
+ 𝛼𝑒ൗ2 (𝑁 − 1)
𝑛= 𝑛 = 2
2
𝑒2 𝑧1− 2
𝛼ൗ 𝑝𝑞 + 𝑒 (𝑁 − 1)
2
• En muchas situaciones por facilidad de calculo se usa en la
𝝈
expresión: 𝒛𝟐𝟏−𝜶Τ𝟐 = e=B , z = 2 para un nivel de confianza
𝒏
de: (1-α ) = 0.95

• Luego el tamaño de muestra es:


𝜎2 Variables cuantitativas
𝑛=
𝜎2 𝐷
𝑛 = 𝐵2 / 2 𝑝𝑞
𝑧1− 𝛼Τ Variables cualitativas
2 𝑛=
𝐷
D

Tamaño de muestra para estimar el total:


𝐵2
Donde : D = 2 2
𝑧1− 𝛼ൗ 𝑁
2

𝑁 𝜎2
Variables cuantitativas 𝑛= 2
𝜎 +(𝑁 − 1)𝐷
𝑁𝑝𝑞
Variables cualitativas 𝑛=
𝑝𝑞 + (𝑁 − 1)𝐷
• Importante:
*

𝑅 𝑅 2
𝜎 ≅ ↔ 𝜎2 ≅
4 16

*
• un petitorio realizado es apoyado por cierto número de
firmas las que estén contenidas en 676 hojas. Una
muestra simple aleatoria de 50 hojas es tomada con el
fin de estimar al total de firmas que apoyan la petición
con un margen de error de 1,000 firmas y una
probabilidad de 1/20.
• Los resultados que se registran en las 50hojas fueron:
• No firma:
42,41,36,32,29,27,23,19,16,15,14,11,10,9,7,6, 5,4,3.
• Frecuencia (𝑓1 ):23,4,1,1,1,2,1,1,2,2,1,1,1,1,1,3,2,1,1
• ¿Cuál será el tamaño de muestra requerido?
• Respuesta:
• 𝑁 = 676
• 𝑆 2 = σ 𝑓𝑖 𝑦𝑖 2 − σ 𝑓𝑖 𝑦𝑖 2 /2 /(𝑛 − 1) = [54,497 −
(1,471)2 /50]/49 = 229
• 𝑠 = 229 = 15.13
• 𝑑 = 1,000 Firmas
• ∞ = 1/20 = 0.05; Luego 𝑧 = 2 aproximadamente
• 𝑛0 = (𝑁𝑧𝑠/𝑑)2
• = (676 ∗ 2 ∗ 15.13/1,000)2
• 𝑛0 = 419
• 𝑛 = [𝑛0 /(1 + 𝑛0 /𝑁)]
• = [419/(1 + 419/676)]
• 𝑛 = 260 Páginas del petitorio deberán ser muestras
requeridas.
• Se desea estimar el número total de gusanos por acre
en cualquier campo donde la cantidad de gusanos
excede a los 200,00 por acre en la capa superior del
suelo límite de error de30% al nivel de probabilidad de
95%. La barrena para muestrear es un cubo de 9*9
pulgadas de área por 5 pulgadas de altura. Si en
número de gusanos en una muestra se supone tiene
una distribución ligeramente más variable que la
distribución Poisson (tomamos 𝑆 2 = 1.2𝑦).ത
• ¿Qué tamaño de muestra simple será requerido? (un
acre =43,560 𝑝𝑖𝑒𝑠 2 )
Área de la barrena =9*9 =81𝑝𝑢𝑙 2
Área de un pie =12*12 =144𝑝𝑢𝑙 2
Área de la barrera =81/144 =0.5625𝑝𝑖𝑒𝑠 2
n° de unidades de
muestreo(acre) =43,560/0.5625 =77,400 bar

𝑁 = 77,400
𝑑 = 0.3 ∗ 200,000 = 60,00 Gusanos por acre
∞ = 0.05 Luego 𝑡 = 2 aproximadamente
𝑆 2 = 1.2 ∗ 𝑦ത = 1.2(200,000/77,400) = 3.096
𝑆 = 3.096 = 1.76
• 𝑛0 = (𝑁𝑧𝑠/𝑑)2
• = (77,400 ∗ 2 ∗ 1.76/60,000)2
• 𝑛0 = 21
• 𝑛 = [𝑛0 /(1 + 𝑛0 /𝑁)
• = [21/(1 + 21/77,400)]
• 𝑛 = 21
• Luego una muestra simple aleatoria de21
barrenadas son necesarias.
EJERCICIOS
• Con el propósito de seleccionar una muestra representativa
de los habitantes de una ciudad, una muestra de nombres es
extraída de la guía telefónica de esta ciudad procediendo a
visitar y entrevistar a las familias de las personas cuyo nombre
resulto seleccionado.
• ¿Satisface la muestra seleccionada con los criterios de
representatividad?
• Para estimar la población total de una ciudad en la que todos
los niños en edad escolar asisten a la escuela, una muestra de
niños en edad escolar asisten a la escuela, una muestra de
niños es seleccionada en las escuelas y se entrevista a sus
respectivas familias.
• ¿Será representativa la muestra así seleccionada?
• En una ciudad que contienen 24.000 viviendas y que dispone una exacta
lista de ellas, las viviendas están listadas según orden alfabético del
nombre de la familia que las ocupan; así mismo aparecen, las respectivas
direcciones de las viviendas.
• Se desea efectuar una encuesta por muestreo de viviendas alquiladas para
fines de estimar la distribución de los alquileres mensuales. Se ha decidido
que para obtener estimadores con exactitud aceptable son requeridas
entrevistar a 400 viviendas ocupadas por inquilinos.
• El listado de viviendas que se dispone no especifica si se trata de viviendas
ocupadas por sus propietarios o por inquilinos pero se sabe que alrededor
de 2/3 del total de viviendas en la ciudad sean alquiladas.
• Describa como extraería la muestra indicando:
• Método de selección
• Tasa de muestreo
• Tratamiento que se daría a las viviendas ocupadas por sus propietarios.
• a fin de estimar el valor real del inventario de objetos de una
tienda es seleccionada una muestra de objetos anotándose,
para cada uno de los objetos observados, su valor real y el
valor que registra en libros .
• Como resultado del muestreo efectuado resulto que la
proporción entre el valor real y el valor registrado en libros
fue de 1.021; aproximadamente, esta proporción tiene
distribución normal con una desviación estándar de 0.0002.
• Si el valor total del inventario que registran los libros
contables es de $80.000, estimar los límites de confianza que
tendría el valor real de los objetos considerando un nivel de
seguridad de 95%.
• El propietario de una playa de estacionamiento después de
observar 26 días de trabajo encontró que su ingreso promedio
por día es de $10 con un error estándar de $1.20; si el costo
de guardianía es de $7 por día ¿Cuál es la probabilidad que la
utilidad del propietario a largo plazo sea cuando menos $5
por día?.
• ¿Qué supuesto habría de hacerse para responder a esta
pregunta?
• Sea la población
• 𝑌𝑖 : 8, 3, 1, 11, 4,7 / 𝑌ത = 5.67 ; 𝑆 2 = 13.47
• Calcular el promedio para todas las muestras simples
aleatorias de tamaño n=2 y verificar que dicho promedio es
un estimador insesgado y que su varianza cumple con la
relación
• 𝑉 𝑌ത = 1 − 𝑓 ∗ 𝑆 2 / 𝑛 = 1 − 2 / 6 ∗ 13.47 / 2 = 4.49
• Asimismo calcular 𝑆 2 para todas las muestras y verifique que
𝐸 𝑠 2 = 𝑆 2 = 13.47
• Sea la población ሼ𝑌1 = 8, 3, 1, 11, 4, 7 / 𝑌ത =
5.67 ; 𝑆 2 = 13.47ሽ
• Calcular el promedio para todas la muestras
aleatorias con reemplazo de tamaño n=2 y
verificar dicho promedio es un estimador
insesgado y que su varianza cumple con la
relación
• 𝑉 𝑌ത = 𝜎 2 / 𝑛 = σ 𝑌ത − 𝑦 2 / 𝑁𝑛 = 𝑆 2 (𝑁 −
1)/ 𝑁𝑛 = 13.47 6 − 1 / 6 ∗ 2 = 5.61
• una bodega posee 26 estantes y desea usar el muestreo para
reducir su trabajo de inventario, con el fin de estudiar el uso
del muestreo hizo el inventario total de sus estantes y
resultaron los valores
29,38,42,44,45,47,51,53,53,54,56,56,56,58,58,59,60,60,60,60,
61,61,62,64,65,65,67,67,68,69,71,74,77,82 y 85
• Se considera correcto el estimador del valor total del
inventario si proporciona un intervalo menor a 200 con
probabilidad 1 en 20. Un consultado sugiere que la muestra
simple aleatoria de 12 estantes es suficiente para lograr la
estimación. ¿Esta Ud. De acuerdo?
Dos agrónomos A y B hicieron una encuesta para investigar el estado
de los frutos de 200 árboles de una plantación de manzano. El
agrónomo A selecciono una muestra simple aleatoria de 20 árboles y
conto el número de frutos malogrados por cada árbol y obtuvo los
resultados:
El agrónomo B usando las mismas técnicas examino a los 200 árboles
de la plantación registrando solo aquellos árboles que tenían todos los
frutos sanos; encontró que 60 árboles de manzano no tenían frutos
malogrados.
Estimar el número total de frutos malogrados en la plantación de
manzanos.
•Usando solo los resultados del agrónomo A.
•Usando los resultados de ambos agrónomos A y B.
•¿Los estimadores serán insesgados?
•¿Cuál estimador espera sea más preciso?
N° de frutos malogrados

Árbol (yi) 0,1,2,3,4,5,6,7,8,9,10

N° de árboles (fi) 8,4,2,2,1,1,0,0,0,1,1

Вам также может понравиться