Академический Документы
Профессиональный Документы
Культура Документы
MUESTREO Y ESTIMACIONES
4.1 Definicin de muestreo
Es un procedimiento empleado para obtener una o ms muestras de una
poblacin. Por ejemplo: religin y sexo de los estudiantes de educacin del ncleo
San Carlos de la UNESR.
Muestra: Es la parte de la poblacin a estudiar que sirve para representarla.
4.1.1 Tipos de
conglomerados
muestreo
aleatorio,
sistematizado,
estratificado
Despus de formar los estratos se toma una muestra aleatoria simple de cada
uno. Se dispone de formulas para combinar los resultados para la muestra de
estrato individual en un estimado del parmetro poblacional de inters. El valor del
muestreo aleatorio estratificado depende de cun homogneos sean los
elementos dentro de los estratos. Si son similares, los estratos tendrn bajas
varianzas. Si los estratos son homogneos, el procedimiento de muestreo
aleatorio estratificado producir resultados tan precisos como el muestreo
aleatorio simple, pero con menor tamao total de muestra.
Muestreo sistemtico
Mtodo para elegir una muestra seleccionando al a los primeros k elementos y a
continuacin cada k-simo elemento.
EJEMPLO
Si se desea una muestra de tamao de 50 de una poblacin con 5,000 elementos,
podramos muestrear un elemento de cada 5,000/50 = 100 en la poblacin. Una
muestra sistemtica en este caso implica seleccionar al azar uno de los primeros
100 elementos de la lista de la poblacin. Se identifican los dems elementos de la
muestra comenzando por el primero obtenido al azar y a continuacin
seleccionando cada 100. elementos. En efecto, se identifica la muestra de 50
recorriendo la poblacin en forma sistemtica, e identificando cada 100. elemento
despus del primero que se selecciono al azar.
Muestreo por conglomerados
Mtodo probabilstico de muestreo en el cual primero se divide la poblacin en
conglomerados y despus se selecciona uno o mas conglomerados para
muestrearlos.
EJEMPLO
Cuando se realiza el muestreo de reas, en los que los conglomerados son
manzanas urbanas, u otras reas, bien definida. Por lo general, el muestreo de
conglomerados requiere un tamao de muestra total mayor que el muestreo
aleatorio simple o el muestreo aleatorio estratificado. Sin embargo, puede originar
ahorros porque cuando se manda a un entrevistador a aplicar un cuestionario a un
conglomerado muestreado (por ejemplo, una manzana urbana), se puede obtener
muchas observaciones mustrales en un tiempo relativamente corto. En
consecuencia, se puede obtener un mayor tamao de muestra con un costo
bastante menor por elemento, y por ende, probablemente un costo total menor.
x 1x 2
S 21 S22
+
n 1 n2
EJEMPLO 1:
En un estudio de una tienda de departamentos diseado para probar el saldo
promedio en las cuentas de 30 das es el mismo en sus dos sucursales
suburbanas, muestras tomadas al azar arrojaron los siguientes resultados:
n1=80,n 2=100, x 1=$ 64.20, x 2=$ 71.41, S 1=$ 16.00, S2=$ 22.13
z=
z=
x 1x 2
S 21 S22
+
n 1 n2
64.2071.40
( 16.00 ) ( 22.13 )
+
80
100
=2.53
Y como este valor es menor que -1.96, se deduce que la diferencia observada de
$7.21 entre los saldos promedio de las dos sucursales es significativa. El valor de
z= -2.53 es de 0.0057.
Estadstico de la prueba de muestra pequea.
Formula:
t=
x 1x 2
( x 1 x 1 )2+ ( x 2 x 2) 2
n1 +n22
( n1 + n1 )
1
EJEMPLO 2:
Las siguientes son mediciones de la capacidad de produccin (en millones de
caloras por tonelada) de muestras aleatorias ejemplares cada una de carbn
proviene de dos minas:
Mina 1: 8380 8210 8360 7840 7910
Mina 2: 7540 7720 7750 8100 7690
Utilice un nivel de significacin de 0.05 para probar si es importante la diferencia
entre las medias de estas dos muestras.
x 1=8140 y x 2=7760
y para calcular t de
( x 1x 1 ) =( 83808140 )
( x 2x 2 ) =( 75407760 )
en
la frmula de t, se obtiene:
t=
81407760
=2.61
( )
Xn
Entonces, si
es suficientemente grande,
x = y x = /n
tiene
y T0 tiene
=n , 2 =n 2 .
x 5250
P ( Z 4 )=0
1.5
n
9
x
z 2 P(z 1 z z 2)=( z)
P(x 52) =
P
x 5250
P ( Z 8,4327 ) =0
5
n
40
EJEMPLO 2:
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en
cada clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura.
Cul es la probabilidad de tener que salir a la pizarra ms de 15 veces? Se
vuelve a aplicar el Teorema Central del Lmite.
Salir a la pizarra es una variable independiente que sigue el modelo de distribucin
de Bernoulli:
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
=0,10
2=0,10 0,90=0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya
media y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el
valor equivalente de la variable normal tipificada:
Y=
1510
=1,67
3,0
Luego:
P ( X >15 )=P ( Y >1,67 ) =10,9525=0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo
del curso es tan slo del 4,75%.
z 2 pq
B2
Donde:
n= Tamao de la muestra,
z= 1.96 para el 95% de confianza, 2.56 para el 99%
p= Frecuencia esperada del factor a estudiar
q= 1- p
B= Precisin o error admitido
El valor de n obtenido por esta frmula indica el tamao de la muestra para una
poblacin infinita, a efectos prcticos se considera poblacin infinita cuando la
muestra supone menos del 5% de la poblacin total.
EJEMPLO 1:
Supongamos que se desea realizar una encuesta sobre la brucelosis ovina. Se
estima una prevalencia del 15% y se requiere un 5% de precisin sobre una
poblacin de 2.000.000 de cabezas. El nivel de confianza se fija en el 95%.
Formula:
n=
z 2 pq
B2
Datos:
Z= 1.96, p=0.15, q=0.85, B=0.05
1.962 0.15 0.85
n=
0.052
n=
.489804
=196
.0025
EJEMPLO 2:
En un proyecto realizado en una determinada comunidad se ha calculado que
cerca del 30% (0,3) de los nios de la zona del proyecto padecen de malnutricin
crnica. Este dato se basa en estadsticas nacionales sobre malnutricin en las
zonas rurales. Si el nivel de confianza se fija en el 95%.
Formula:
z 2 pq
n= 2
B
Datos:
Z= 1.96, p=0.30, q=0.70, B=0.05
n=
n=
.806736
=323
.0025
Formula:
z
=x
n
=2.6
(1.96 )( .3 )
=2.50 y 2.70
36
EJEMPLO 2:
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una distribucin estndar de 40 horas. Si una
muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos
que produce esta empresa.
Datos:
x=780
n=30
Z = .96/2=.48=2.06
=40
FORMULA:
z
=x
n
=780
( 2.06 )( 40 )
=765 y 795
30
t student.
EJEMPLO 1:
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas para recorrer 50000 millas revelo una media muestral de .
32 pulgadas de cuerda restante con una desviacin estndar de .09 pulgadas.
Constituya un intervalo de confianza de 95% para la media poblacional.
Datos:
n=10
x=.32
S=.09
=95
Formula:
=x t 1/2, n1
S
n
.09
10
.09
10
.09
10
=.32 .064
=( .256 , .384 )
EJEMPLO 2:
El dueo de una tienda de abarrotes desea estimar la cantidad madia que gastan
los clientes que le consumen sus productos. Una muestra de 20 clientes revelo
que gastan $50, con una desviacin estndar de 9.01. Determine un intervalo de
95% de confianza para la media poblacional.
Datos:
n=20
x=50
S=9.01
=95
Formula:
=x t 1/2, n1
S
n
9.01
20
9.01
20
=50 t 2.093
=50
9.01
20
4.22
=( 45.78 ,54.22 )
Z = .90/2=.475=1.96
=.3
Formula:
IC=
z
n
IC=2.6
( 1.96 ) ( .3 )
=2.50 y 2.70
36
Z = .96/2=.48=2.06
=40
Formula:
IC=
z
n
IC=780
( 2.06 ) ( 40 )
=765 y 795
30
2
2
2
1
y =
2
2
12
con
student
x 1
Si
tamao
1
x 2
y la varianza
2 , entonces
x 1x 2
es una variable
Y la varianza.
2
2
1 2
2
x x = +
n1 n2
1
Se deduce que
z=
( x1 x2 ) ( 12 )
1 2
+
n1 n2
Tiene una distribucin normal estndar. Sustituyendo esta expresin por z en:
P z a < z < z a =1a
21 22
21 22
P ( x 1x 2) z a /2
+ < < ( x 1x 2 ) + z a/ 2
+ =1a
n1 n2 1 2
n1 n 2
12
1 y 2
12 :
conocidas). Si
x 1 y x2
x 1 x 2 + z a /2
2
1
12
son
n1 y n 2
21 y 22 , un
21 22
+
n1 n2
22
( x 1x 2 )z a /2 n + n < 12 <
1
2
As mismo, en virtud del teorema del lmite central, este resultado puede usarse
con muestras aleatorias independientes de poblaciones no normales con las
2
2
n1 y n 2
varianzas conocidas 1 y 2 , siempre que
sean lo suficientemente
grandes, esto es, cuando
n1 y n 2 30
EJEMPLO 1:
Construya un intervalo de confianza del 94% de la diferencia real entre las
duraciones en promedio de dos tipos de focos elctricos, dado que una muestra
tomada al azar de 40 focos de un tipo duro en promedio 418 horas de uso
continuo y 50 focos de otra clase duraron en promedio 402 horas. Las
1=26 y 2=22
desviaciones estndar de las poblaciones, segn se sabe, son
.
Solucin
Para =0.06, tenemos a partir de la tabla III que
intervalo de confianza del 94% de
12 es
z .03=1.88 .
por lo tanto, el
262 222
418402+1.88
+
40 50
26 2 222
+
< <
40 50 1 2
( 418402 )1.88
Que se reduce a
6.3< 1 2<25.7
Por lo tanto, tenemos el 94% de confianza en que el intervalo de 6.3 a 25.7
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos
de focos elctricos. El hecho que ambos limites de confianza sean positivos
sugiere que, en promedio, el primes tipo de focos es superior al del segundo tipo.
EJEMPLO 2.
Construya un intervalo de confianza de 94% de la diferencia real entre las
duraciones en promedio de dos tipos de pilas, dado que una muestra tomada al
azar de 50 focos de un tipo duro en promedio 518 horas de uso continuo y 60
pilas de otra clase duraron en promedio 502. Las desviaciones estndar de las
1=36 y 2=32
poblaciones, segn se sabe
Solucin:
Para = 0.06, tenemos a partir de la tabla z=1.88. Por lo tanto, el intervalo de
12
confianza del 94 % de
es:
36 2 322
36 2 322
( 518502 ) 1.88
+
< 12 < ( 518502 )+ 1.88
+
50 60
50 60
Que se reduce a
Por lo tanto, tenemos el 94% de confianza en que el intervalo de 7.1 a 64.5 a
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos
de pilas. El hecho de que ambos lmites de confianza sean positivos sugiere que,
en promedio la primera pila es superior al segundo tipo.
Con el fin de sustituir un intervalo de confianza del (1-) 100% para
cuando se desconoce
1 y 2
pero
n1 y n 2 30
, sustituimos
1 y 2
12
por los
s 1 y s2
y continuamos como
( x1 x2 ) ( 1 2)
z=
1 1
+
n1 n2
puede
2
p
( n 11 ) s 21+(n2 1)s 22
n1 +n 22
n11 y n21
(n11)s 22
2
grados de libertad, y su
sumas
y=
n1 +n22
z
y
n1 +n22
2
1
( x 1x 2)
n1 +n22
P
2
22
np ( 1 p ) .
Si dividimos ambas
np (1 p) =
n
p(1 p)
n
al sustituir
x
z / 2
n
por p en
np(1 p)
. Esto produce
x
x
x
x
(1 )
( 1 )
n
n
x
n
n
< p< + z / 2
n
n
n
0.36196
x 36
=
=0.36 y z /2=1.96
n 100
( 0.36 ) ( 0.64)
100
<p<
0.36+196
( 0.36 ) (0.64)
100
O bien
0.266< p<0.454
x
n
|nx p| z
/ 2
p(1p)
n
z/ 2
p(1 p)
. Con
n
x
n
E=Z / 2
x
x
(1 )
n
n
n
Ejemplo 2:
En una encuesta en una gran ciudad, 136 de 400 personas respondieron
afirmativamente a la pregunta de si el servicio de transporte pblico es adecuado.
Con una confianza del 99%, qu se puede decir acerca del error mximo, si
x 139
=
=0.34
n 400
proporcional real?
Solucin
Sustituyendo
x 136
=
=0.34
n 400
z / 2=2.575
el error es a lo sumo
E=2.575
( 0.34 ) (0.66)
=0.061
400
[ ]
Z / 2
n=p (1 p)
E
correspondiente a
1
p= ,
2
p (1p )
es a lo sumo
1
,
4
[ ]
1 Z/ 2
n=
4 E
x
n
que el error al
que el error no
sobrepasa E.
4.8 Tamao de la muestra con una estimacin de P y un grado de confianza
( 1 ) 100
Donde
z a/ 2
pq
n
EJEMPLO 1:
Una muestra aleatoria de 985 votantes probables aquellos que votaran en las
prximas eleccionesfue encuestada un fonatn o encuesta telefnica dirigido
por el partido republicano. De los encuestados, 592 indicaron que piensan votar
por el candidato republicano en la prxima eleccin. Construya un intervalo de
confianza de 90% para p , la proporcin de votantes probables en la poblacin,
que piensa votar por el candidato republicano. Con base en esta informacin,
concluir que el candidato ganara la eleccin?
p es entonces
x 592
^p= =
=.601
n 985
Y el error estndar es:
( .601 ) (.399)
^p q^
=
=.016
n
985
El valor de
^p q^
2
.601 .026
O
^p=
659
=.659
999
1-.659= .341
( .659 )( .341 )
^p q^
=
=.015
n
999
^p q^
n
1.645 .015=.025
.659 .025
.659+.025=.684
.659.025=.634
.634< p<.684 .
jefa de carrera est entre 63.4 y 68.4% la jefa de carrera actual ser la ganadora.
BIBLIOGRAFIA
Estadstica para administracin y economa
David R. Anderson, Dennis J. Sweeney y Thomas A. Williams
Editorial International Thomson Learning
225-227 pginas
Mtodo estadstico aplicado a las ciencias sociales
Gene V. Glas, Julin C. Stanley
Editorial Pretice Hall
Pgina 243
Estadsticas matemticas con aplicaciones
John E. Freund, Ronald E. Walpole
Editorial Prendicehall Hispoamericana S.A
380-385 pginas
Tcnicas de muestreo
William G. Cochran
Editorial continental S.A
Pgina 149
Probabilidades y aprobaciones y estadsticas
Paul L. Meyer
Editorial: Addison Wesley Iberoamericana
Pgina 316
Mtodos estadsticos
Said Infante G.I Guillermo P. Zarate de Lara
Editorial Trillas
335-337 pginas
Probabilidad y estadsticas para ingenieros
Irwin R. Miller/ John E. Freund
Editorial Prentice-Hall Hispoamericana S.A
273-277 pginas
Introduccin a la probabilidad y estadsticas
William Mendenhall, Robert J.Beaver, Barbara M. Beaver
Editorial Thomson
308-311 Pginas