Unidad 4 Estadistica

UNIDAD 4.
MUESTREO Y ESTIMACIONES
4.1 Definicin de muestreo
Es un procedimiento empleado para obtener una o ms muestras de una
poblacin. Por ejemplo: religin y sexo de los estudiantes de educacin del ncleo
San Carlos de la UNESR.
Muestra: Es la parte de la poblacin a estudiar que sirve para representarla.
4.1.1 Tipos de
conglomerados
muestreo
aleatorio,
sistematizado,
estratificado
Muestreo aleatorio simple

Para poblacin finita: Una muestra seleccionada de tal manera que cada muestra
posible de tamao n tiene la misma probabilidad de ser seleccionada.
Para poblacin infinita: Una muestra seleccionada de tal manera que cada
elemento proviene de la misma poblacin y los elementos sucesivos se
seleccionan en forma independiente.
EJEMPLO
Un muestreo aleatorio de todos los profesores de secundaria de California puede
resultar en la seleccin (altamente improbable, por cierto) de 20 profesoras de
francs. De hecho, nunca se puede tener la seguridad de que tal muestreo sea
representativo o no de la poblacin y lo nico que se puede afirmar es que, bajo
todo aspecto, es aleatoriamente representativo de ella.
Una caracterstica mas importante del muestreo al azar es que puede
determinarse el tipo de no representatividad que, a la larga, cabe esperar de
numerosos muestreos similares, cosa que no es posible con otros tipos de
seleccin.
Muestreo aleatorio simple estratificado
Mtodo para seleccionar una muestra en el que primero se divide a la poblacin
en estratos y a continuacin se toma una muestra aleatoria simple de cada
estrato.
EJEMPLO
Una base de formacin de los estratos puede ser por departamentos, ubicacin,
edad, giro industrial, etc., queda a discrecin de quien disea la muestra, sin
embargo los mejores resultados se obtienen cuando los elementos dentro de cada
estrato son tan semejantes como sea posible.
Despus de formar los estratos se toma una muestra aleatoria simple de cada
uno. Se dispone de formulas para combinar los resultados para la muestra de
estrato individual en un estimado del parmetro poblacional de inters. El valor del
muestreo aleatorio estratificado depende de cun homogneos sean los
elementos dentro de los estratos. Si son similares, los estratos tendrn bajas
varianzas. Si los estratos son homogneos, el procedimiento de muestreo
aleatorio estratificado producir resultados tan precisos como el muestreo
aleatorio simple, pero con menor tamao total de muestra.
Muestreo sistemtico
Mtodo para elegir una muestra seleccionando al a los primeros k elementos y a
continuacin cada k-simo elemento.
EJEMPLO
Si se desea una muestra de tamao de 50 de una poblacin con 5,000 elementos,
podramos muestrear un elemento de cada 5,000/50 = 100 en la poblacin. Una
muestra sistemtica en este caso implica seleccionar al azar uno de los primeros
100 elementos de la lista de la poblacin. Se identifican los dems elementos de la
muestra comenzando por el primero obtenido al azar y a continuacin
seleccionando cada 100. elementos. En efecto, se identifica la muestra de 50
recorriendo la poblacin en forma sistemtica, e identificando cada 100. elemento
despus del primero que se selecciono al azar.
Muestreo por conglomerados
Mtodo probabilstico de muestreo en el cual primero se divide la poblacin en
conglomerados y despus se selecciona uno o mas conglomerados para
muestrearlos.
EJEMPLO
Cuando se realiza el muestreo de reas, en los que los conglomerados son
manzanas urbanas, u otras reas, bien definida. Por lo general, el muestreo de
conglomerados requiere un tamao de muestra total mayor que el muestreo
aleatorio simple o el muestreo aleatorio estratificado. Sin embargo, puede originar
ahorros porque cuando se manda a un entrevistador a aplicar un cuestionario a un
conglomerado muestreado (por ejemplo, una manzana urbana), se puede obtener
muchas observaciones mustrales en un tiempo relativamente corto. En
consecuencia, se puede obtener un mayor tamao de muestra con un costo
bastante menor por elemento, y por ende, probablemente un costo total menor.
4.2 Concepto de distribucin de muestreo de la media

Una distribucin muestral de medias o una distribucin en el muestreo de la media
se define como el conjunto de todas las medias que se pueden calcular en todas
las muestras posibles que se pueden extraer, con o sin reemplazo, de una
determinada poblacin. Para detectar las relaciones a que nos hemos referido,
partiremos de un ejemplo con una poblacin pequea.
4.2.1 Distribucin muestral de la diferencia entre dos medias
Estadstico de la prueba de la diferencia entre dos medias con muestras grandes.
Formula:
z=
x 1x 2
S 21 S22
+
n 1 n2
EJEMPLO 1:
En un estudio de una tienda de departamentos diseado para probar el saldo
promedio en las cuentas de 30 das es el mismo en sus dos sucursales
suburbanas, muestras tomadas al azar arrojaron los siguientes resultados:
n1=80,n 2=100, x 1=$ 64.20, x 2=$ 71.41, S 1=$ 16.00, S2=$ 22.13
z=
z=
x 1x 2
S 21 S22
+
n 1 n2
64.2071.40
( 16.00 ) ( 22.13 )
+
80
100
=2.53
Y como este valor es menor que -1.96, se deduce que la diferencia observada de
$7.21 entre los saldos promedio de las dos sucursales es significativa. El valor de
z= -2.53 es de 0.0057.
Estadstico de la prueba de muestra pequea.
Formula:
t=
x 1x 2
( x 1 x 1 )2+ ( x 2 x 2) 2
n1 +n22
( n1 + n1 )
1
EJEMPLO 2:
Las siguientes son mediciones de la capacidad de produccin (en millones de
caloras por tonelada) de muestras aleatorias ejemplares cada una de carbn
proviene de dos minas:
Mina 1: 8380 8210 8360 7840 7910
Mina 2: 7540 7720 7750 8100 7690
Utilice un nivel de significacin de 0.05 para probar si es importante la diferencia
entre las medias de estas dos muestras.
Las medias de las muestras son
x 1=8140 y x 2=7760
y para calcular t de
acuerdo a la formula anterior, primero se determina.

2
( x 1x 1 ) =( 83808140 )
+ +( 79108140 )2=253 800

Y
2
( x 2x 2 ) =( 75407760 )
+ + ( 76907760 )2 =170 600

Ahora bien, al sustituir estas sumas junto con
n1=5, n2=5, x 1=8140, x 2=7760
en
la frmula de t, se obtiene:
t=
81407760
253 800+170 600 1 1

+
5+52
5 5
=2.61
( )
4.3 Teorema del lmite central

Sea X1, X2,...,
varianza
Xn
una muestra aleatoria de una distribucin con media
Entonces, si
es suficientemente grande,
aproximadamente una distribucin normal con,
x = y x = /n
tambin aproximadamente una distribucin normal con
tiene
y T0 tiene
=n , 2 =n 2 .
Cuanto mas grande sea el valor de n, mejor ser la aproximacin.

El Teorema del Lmite Central garantiza una distribucin normal cuando n es
suficientemente grande.
Si n > 30, se puede usar el Teorema de Limite Central.
Si la distribucin madre es normal, la distribucin de la media muestral tambin es
normal, independientemente del tamao.
x N ( X ; X ) x ( X ; X )
Ejemplo 1:
Si se sabe que la dureza Rockwell de pernos de cierto tipo tiene un valor medio de
50 y desviacin estndar de 1,5.
a) Si la distribucin es normal, cul es la probabilidad de que la dureza muestral

media para una muestra aleatoria de 9 pernos sea por lo menos 52?
b) Cul es la probabilidad (aproximada) de que la dureza muestral media para
una muestra aleatoria de 40 pernos sea al menos 52?
x = 50
= 1,5
x N(50; 1,5)
a)
n=9
x = 52
x N(50; 1,5.9)
z = (x)/( / n)
La probabilidad de que la media muestral sea superior a 52 es:
P(x 52) =
P
x 5250
P ( Z 4 )=0
1.5
n
9
Con el valor de z obtenido de y tablas:

P(x1 x x2) =
P ( z1
x
z 2 P(z 1 z z 2)=( z)
Tener en cuenta que los valores para:

(z) = P (z z1)
b)
n = 40
Con el valor de z obtenido de tablas:
P(x 52) =
P
x 5250
P ( Z 8,4327 ) =0
5
n
40
EJEMPLO 2:
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en
cada clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura.
Cul es la probabilidad de tener que salir a la pizarra ms de 15 veces? Se
vuelve a aplicar el Teorema Central del Lmite.
Salir a la pizarra es una variable independiente que sigue el modelo de distribucin
de Bernoulli:
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
=0,10
2=0,10 0,90=0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya
media y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el
valor equivalente de la variable normal tipificada:
Y=
1510
=1,67
3,0
Luego:
P ( X >15 )=P ( Y >1,67 ) =10,9525=0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo
del curso es tan slo del 4,75%.
4.4 Determinacin del tamao de la muestra de una poblacin

El tamao de la muestra para un diseo de encuesta basado en una muestra
aleatoria simple, puede calcularse mediante la siguiente frmula:
n=
z 2 pq
B2
Donde:
n= Tamao de la muestra,
z= 1.96 para el 95% de confianza, 2.56 para el 99%
p= Frecuencia esperada del factor a estudiar
q= 1- p
B= Precisin o error admitido
El valor de n obtenido por esta frmula indica el tamao de la muestra para una
poblacin infinita, a efectos prcticos se considera poblacin infinita cuando la
muestra supone menos del 5% de la poblacin total.
EJEMPLO 1:
Supongamos que se desea realizar una encuesta sobre la brucelosis ovina. Se
estima una prevalencia del 15% y se requiere un 5% de precisin sobre una
poblacin de 2.000.000 de cabezas. El nivel de confianza se fija en el 95%.
Formula:
n=
z 2 pq
B2
Datos:
Z= 1.96, p=0.15, q=0.85, B=0.05
1.962 0.15 0.85
n=
0.052
n=
.489804
=196
.0025
n=196 animales seleccionados
EJEMPLO 2:
En un proyecto realizado en una determinada comunidad se ha calculado que
cerca del 30% (0,3) de los nios de la zona del proyecto padecen de malnutricin
crnica. Este dato se basa en estadsticas nacionales sobre malnutricin en las
zonas rurales. Si el nivel de confianza se fija en el 95%.
Formula:
z 2 pq
n= 2
B
Datos:
Z= 1.96, p=0.30, q=0.70, B=0.05
n=
1.962 0.30 0.70

0.052
n=
.806736
=323
.0025
n=323 nios seleccionados

4.5 Intervalos de confianza para la media, con el uso de la distribucin
Normal y la t student
Distribucin normal
EJEMPLO 1:
Se encuentra que la concentracin promedio de zinc que se saca del agua a partir
de la muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre el intervalo de confianza de 95% para la concentracin media
de zinc en el rio. Suponga que la desviacin estndar de la poblacin es de 0.3
Datos:
x=2.6
n=36
Z = .90/2=.475=1.96
=.3
Formula:
z
=x
n
=2.6
(1.96 )( .3 )
=2.50 y 2.70
36
EJEMPLO 2:
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente
distribuida de forma normal con una distribucin estndar de 40 horas. Si una
muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un
intervalo de confianza de 96% para la media de la poblacin de todos los focos
que produce esta empresa.
Datos:
x=780
n=30
Z = .96/2=.48=2.06
=40
FORMULA:
z
=x
n
=780
( 2.06 )( 40 )
=765 y 795
30
t student.
EJEMPLO 1:
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una
muestra de 10 llantas para recorrer 50000 millas revelo una media muestral de .
32 pulgadas de cuerda restante con una desviacin estndar de .09 pulgadas.
Constituya un intervalo de confianza de 95% para la media poblacional.
Datos:
n=10
x=.32
S=.09
=95
Formula:
=x t 1/2, n1
S
n
=.32 t 1.95/2 , 101

=.32 t .025,9
=.32 t 2.262
.09
10
.09
10
.09
10
=.32 .064
=( .256 , .384 )
EJEMPLO 2:
El dueo de una tienda de abarrotes desea estimar la cantidad madia que gastan
los clientes que le consumen sus productos. Una muestra de 20 clientes revelo
que gastan $50, con una desviacin estndar de 9.01. Determine un intervalo de
95% de confianza para la media poblacional.
Datos:
n=20
x=50
S=9.01
=95
Formula:
=x t 1/2, n1
S
n
=50 t 1.95 /2 , 201

=50 t .025,19
9.01
20
9.01
20
=50 t 2.093
=50
9.01
20
4.22
=( 45.78 ,54.22 )
4.5.1 Determinacin de la muestra con grado de confianza y estimacin de
Partiendo del primer ejemplo dado con la distribucin z tenemos:

Datos:
=2.6
n=36
Z = .90/2=.475=1.96
=.3
Formula:
IC=
z
n
IC=2.6
( 1.96 ) ( .3 )
=2.50 y 2.70
36
Para nuestro segundo ejemplo tomaremos los datos del ejemplo N2 z:

Datos:
=780
n=30
Z = .96/2=.48=2.06
=40
Formula:
IC=
z
n
IC=780
( 2.06 ) ( 40 )
=765 y 795
30
4.6 Intervalo de confianza para la diferencia entre dos medias

2
1
2
2
2
1
y =
2
2
12
con
pero conocidas, con el uso de la distribucin normal y la t
student
x 1
Si
tamao
1
x 2
son las medidas de muestras aleatorias independientes de

2
tomadas de poblaciones normales que tienen las medidas
y la varianza
2 , entonces
x 1x 2
es una variable
aleatoria que tiene una distribucin normal con la media

x x = 12
1
Y la varianza.
2
2
1 2
2
x x = +
n1 n2
1
Se deduce que
z=
( x1 x2 ) ( 12 )
1 2
+
n1 n2
Tiene una distribucin normal estndar. Sustituyendo esta expresin por z en:
P z a < z < z a =1a
El mtodo de pivotes nos lleva a
21 22
21 22
P ( x 1x 2) z a /2
+ < < ( x 1x 2 ) + z a/ 2
+ =1a
n1 n2 1 2
n1 n 2
Y, por consiguiente, al siguiente intervalo de confianza de

(Intervalo de confianza para
12
1 y 2
12 :
conocidas). Si
x 1 y x2
valores de las medias de muestra aleatorias independientes de tamao

tomadas de poblaciones normales con las varianzas conocidas
intervalo de confianza del (1-) 100% para
x 1 x 2 + z a /2
2
1
12
son
n1 y n 2
21 y 22 , un
esta dado por
21 22
+
n1 n2
22
( x 1x 2 )z a /2 n + n < 12 <
1
2
As mismo, en virtud del teorema del lmite central, este resultado puede usarse
con muestras aleatorias independientes de poblaciones no normales con las
2
2
n1 y n 2
varianzas conocidas 1 y 2 , siempre que
sean lo suficientemente
grandes, esto es, cuando
n1 y n 2 30
EJEMPLO 1:
Construya un intervalo de confianza del 94% de la diferencia real entre las
duraciones en promedio de dos tipos de focos elctricos, dado que una muestra
tomada al azar de 40 focos de un tipo duro en promedio 418 horas de uso
continuo y 50 focos de otra clase duraron en promedio 402 horas. Las
1=26 y 2=22
desviaciones estndar de las poblaciones, segn se sabe, son
.
Solucin
Para =0.06, tenemos a partir de la tabla III que
intervalo de confianza del 94% de
12 es
z .03=1.88 .
por lo tanto, el
262 222
418402+1.88
+
40 50
26 2 222
+
< <
40 50 1 2
( 418402 )1.88
Que se reduce a
6.3< 1 2<25.7
Por lo tanto, tenemos el 94% de confianza en que el intervalo de 6.3 a 25.7
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos
de focos elctricos. El hecho que ambos limites de confianza sean positivos
sugiere que, en promedio, el primes tipo de focos es superior al del segundo tipo.
EJEMPLO 2.
Construya un intervalo de confianza de 94% de la diferencia real entre las
duraciones en promedio de dos tipos de pilas, dado que una muestra tomada al
azar de 50 focos de un tipo duro en promedio 518 horas de uso continuo y 60
pilas de otra clase duraron en promedio 502. Las desviaciones estndar de las
1=36 y 2=32
poblaciones, segn se sabe
Solucin:
Para = 0.06, tenemos a partir de la tabla z=1.88. Por lo tanto, el intervalo de
12
confianza del 94 % de
es:
36 2 322
36 2 322
( 518502 ) 1.88
+
< 12 < ( 518502 )+ 1.88
+
50 60
50 60
Que se reduce a
Por lo tanto, tenemos el 94% de confianza en que el intervalo de 7.1 a 64.5 a
contiene la diferencia verdadera entre las duraciones en promedio de los dos tipos
de pilas. El hecho de que ambos lmites de confianza sean positivos sugiere que,
en promedio la primera pila es superior al segundo tipo.
Con el fin de sustituir un intervalo de confianza del (1-) 100% para
cuando se desconoce
1 y 2
pero
n1 y n 2 30
, sustituimos
1 y 2
12
por los
s 1 y s2
valores de las desviaciones estndar de la muestra
y continuamos como
antes. El procedimiento de estimaciones de la diferencia entre dos medias, cuando

1 y 2
se desconoce
y los tamaos de la muestra son pequeos, no es directo
a monos que las desviaciones estndar desconocidas de las dos poblaciones
1= 2
normales sean iguales. Si
, entonces.
( x1 x2 ) ( 1 2)
z=
1 1
+
n1 n2
Es una variable aleatoria que tiene una distribucin normal estndar y
puede
obtenerse ponderando las desviaciones cuadradas (o elevadas al cuadrado) de

las medias de las dos muestras.
s
2
p
( n 11 ) s 21+(n2 1)s 22
n1 +n 22
Es en realidad un estimador insesgado de
2 . Ahora bien, por los teoremas

(n11)s 21
2
8.10 y 8.8, las variables aleatorias independientes

tiene distribuciones ji cuadradas con
n11 y n21
(n11)s 22
2
grados de libertad, y su
sumas
y=
( n11 ) s21 (n21)s 22 (n1+ n229)s 2p

2
Tienen una distribucin ji cuadrada con
n1 +n22
grados de libertad. Como se
puede demostrar que las variables aleatorias anteriores z y y son

independientes, se deduce del teorema 8.11 que:
t=
z
y
n1 +n22
2
1
( x 1x 2)
Tiene una distribucin t con
n1 +n22
grados de libertad. Al sustituir esta
expresin por t en:

a
,n
< t<t a
2 1 +n 2
2 ,n +n
t
P
2
22
Y simplificndolo algebraicamente el resultado. Llegamos al siguiente intervalo de

12 :
confianza del (1-) 100% para
4.7 Una sola muestra: estimacin de la proporcin
La informacin de que suele disponerse al estimar una proporcin es el nmero de
veces, x, que un evento considerado ocurre en n ensayos, ocasiones y
observaciones. La intimacin puntual misma suele ser la proporcin muestral
x
,
n es decir, la proporcin de las veces que el evento ocurri en realidad. Si los
n ensayos satisfacen las condiciones fundamentales de la distribucin binomial
citadas en la pgina 94, sabemos que la media y la desviacin estndar del
nmero de xitos estn dadas por np y por
np ( 1 p ) .
Si dividimos ambas
cantidades entre n, encontraremos que la media y la desviacin estndar de la

proporcin de xitos (es decir, de la proporcin muestral) estn dadas por.
np
=p
n
np (1 p) =
n
p(1 p)
n
El primero de estos resultados seala que la proporcin muestral es un estimador

insesgado del parmetro binomial p, es decir, de la proporcin real que deseamos
estimar a partir de una muestra.
Dado que los clculos necesarios de complican, haremos una aproximacin ms

x
n
al sustituir
x
z / 2
n
por p en
np(1 p)
. Esto produce
x
x
x
x
(1 )
( 1 )
n
n
x
n
n
< p< + z / 2
n
n
n
Donde el nivel de confianza es de (1 - a) 100%.

Ejemplo 1:
Si x = 36 de n = 100 entrevistados estn familiarizados con los incentivos en los
impuestos que se ofrecen por instalar ciertos dispositivos para ahorrar energa,
constryase un intervalo con un nivel de confianza del 95% para la
correspondiente proporcin real.
Solucin:
Sustituyendo
0.36196
x 36
=
=0.36 y z /2=1.96
n 100
( 0.36 ) ( 0.64)
100
<p<
en la frmula anterior, se obtiene
0.36+196
( 0.36 ) (0.64)
100
O bien
0.266< p<0.454
Tenemos el 95% de confianza de que p puede en el intervalo de 0.266 o 0.454.

Ntese que, de habernos valido de la tabla 9), habramos obtenido
0.27< p< 0.46
La magnitud de error cometido cuando usamos
est dada por
x
n
como una estimacin de p
|nx p| . Empleando nuevamente la distribucin normal, podemos
asegurar con una probabilidad de 1 a que la desigualdad.
|nx p| z
/ 2
p(1p)
n
Se cumplir, es decir, que el error ser lo mismo de
z/ 2
p(1 p)
. Con
n
x
n
sustituido por p, esto produce
Error mximo de Estimacin
E=Z / 2
x
x
(1 )
n
n
n
Ejemplo 2:
En una encuesta en una gran ciudad, 136 de 400 personas respondieron
afirmativamente a la pregunta de si el servicio de transporte pblico es adecuado.
Con una confianza del 99%, qu se puede decir acerca del error mximo, si
x 139
=
=0.34
n 400
se emplea como una estimacin de la correspondiente
proporcional real?
Solucin
Sustituyendo
x 136
=
=0.34
n 400
z / 2=2.575
en la frmula anterior, se tiene que
el error es a lo sumo
E=2.575
( 0.34 ) (0.66)
=0.061
400
La frmula anterior de R puede utilizarse tambin para determinar el tamao

muestral que es necesario para alcanzar un grado deseado de precisin.
Despejando n, obtenemos
2
[ ]
Z / 2
n=p (1 p)
E
Pero esta frmula no puede utilizarse como se estableci, a menos de que

tengamos alguna informacin acerca de la posible magnitud de p (con base en
datos auxiliares; digamos, una muestra previa). Si no se dispone de tal
informacin, podemos valernos del hecho de que
correspondiente a
1
p= ,
2
p (1p )
es a lo sumo
1
,
4
como puede mostrarse con mtodos de clculo
elemental. Por tanto, si

2
[ ]
1 Z/ 2
n=
4 E
Podemos asegurar con una probabilidad al menos de

servirnos de
x
n
que el error al
como una estimacin de p no excede a E; una vez obtenidos los
datos, podremos asegurar con una confianza al menos de
que el error no
sobrepasa E.
4.8 Tamao de la muestra con una estimacin de P y un grado de confianza
( 1 ) 100
Donde
z a/ 2
es el valor z que corresponde a un rea /2 en el extremo derecho
de una distribucin normal estndar z. puesto que se desconocen los valores de p

y q, se estiman por medio de los mejores estimadores puntuales: ^p y q^ .se
considera que el tamao de la muestra es grande cuando es adecuada la
aproximacin normal a la distribucin binomial; a saber, cuando n ^p >5 y n q^ >5 .
^p z a /2
pq
n
EJEMPLO 1:
Una muestra aleatoria de 985 votantes probables aquellos que votaran en las
prximas eleccionesfue encuestada un fonatn o encuesta telefnica dirigido
por el partido republicano. De los encuestados, 592 indicaron que piensan votar
por el candidato republicano en la prxima eleccin. Construya un intervalo de
confianza de 90% para p , la proporcin de votantes probables en la poblacin,
que piensa votar por el candidato republicano. Con base en esta informacin,
concluir que el candidato ganara la eleccin?
Solucin: la estimacin puntual para
p es entonces
x 592
^p= =
=.601
n 985
Y el error estndar es:
( .601 ) (.399)
^p q^
=
=.016
n
985
El valor de
para un intervalo de confianza de 90% es el valor que tiene el rea

z o bien z .05
/2 =.05 en el extremo superior de la distribucin de
= 1.645 de la
tabla. El intervalo de confianza de 90% para p es entonces.
^p 1.645
^p q^
2
.601 .026
O
.575< p<.627 . Usted estima que el porcentaje de votantes probables del
candidato republicano est entre 57.5 y 62.7%. El candidato ganara la eleccin?

Si se supone que necesita ms de 50% de los votas para ganar, y puesto que los
limites de confianza superior e inferior excede este valor mnimo podra decir que
tiene 90% de confianza de que ganara el candidato.
EJEMPLO 2:
Una muestra aleatoria de 999 votantes probables aquellos que votaran en
prximas elecciones que se van a realizar en el Tecnolgico de Estudios
Superiores del Oriente del Estado de Mxico de la Licenciatura en Contadura
Pblica con motivo del da del contador para elegir a su nueva jefa de carrera
fueron encuestadas durante dos das por el grupo 4C11. De los encuestados, 659
indicaron que piensan votar por la jefa de carrera actual en las prximas
elecciones. Construya un intervalo de confianza de 90% para p, la proporcin de
votantes probables en la poblacin, que piensa votar por la jefa de carrera actual.
Con base en esta informacin. Concluir que la jefa de carrera ganar la
eleccin?
Solucin: La estimacin para p es:
^p=
659
=.659
999
1-.659= .341
Y el error estndar es:
( .659 )( .341 )
^p q^
=
=.015
n
999
El valor z para un intervalo de confianza de 90% es el valor que tiene el ares

z .05=1.645
/2=.05 en el extremo superior de la distribucin de z, o bien
de la
tabla. El intervalo de confianza para p es entonces.
^p 1.645
^p q^
n
1.645 .015=.025
.659 .025
.659+.025=.684
.659.025=.634
.634< p<.684 .
usted estima que el porcentaje de votantes probables del la
jefa de carrera est entre 63.4 y 68.4% la jefa de carrera actual ser la ganadora.
BIBLIOGRAFIA
Estadstica para administracin y economa
David R. Anderson, Dennis J. Sweeney y Thomas A. Williams
Editorial International Thomson Learning
225-227 pginas
Mtodo estadstico aplicado a las ciencias sociales
Gene V. Glas, Julin C. Stanley
Editorial Pretice Hall
Pgina 243
Estadsticas matemticas con aplicaciones
John E. Freund, Ronald E. Walpole
Editorial Prendicehall Hispoamericana S.A
380-385 pginas
Tcnicas de muestreo
William G. Cochran
Editorial continental S.A
Pgina 149
Probabilidades y aprobaciones y estadsticas
Paul L. Meyer
Editorial: Addison Wesley Iberoamericana
Pgina 316
Mtodos estadsticos
Said Infante G.I Guillermo P. Zarate de Lara
Editorial Trillas
335-337 pginas
Probabilidad y estadsticas para ingenieros
Irwin R. Miller/ John E. Freund
Editorial Prentice-Hall Hispoamericana S.A
273-277 pginas
Introduccin a la probabilidad y estadsticas
William Mendenhall, Robert J.Beaver, Barbara M. Beaver
Editorial Thomson
308-311 Pginas

Unidad 4 Estadistica

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Unidad 4 Estadistica

Загружено:

Авторское право:

Доступные форматы

UNIDAD 4.

Muestreo aleatorio simple

4.2 Concepto de distribucin de muestreo de la media

Las medias de las muestras son

acuerdo a la formula anterior, primero se determina.

+ +( 79108140 )2=253 800

+ + ( 76907760 )2 =170 600

n1=5, n2=5, x 1=8140, x 2=7760

253 800+170 600 1 1

4.3 Teorema del lmite central

una muestra aleatoria de una distribucin con media

aproximadamente una distribucin normal con,

tambin aproximadamente una distribucin normal con

Cuanto mas grande sea el valor de n, mejor ser la aproximacin.

a) Si la distribucin es normal, cul es la probabilidad de que la dureza muestral

Con el valor de z obtenido de y tablas:

Tener en cuenta que los valores para:

Con el valor de z obtenido de tablas:

4.4 Determinacin del tamao de la muestra de una poblacin

n=196 animales seleccionados

1.962 0.30 0.70

n=323 nios seleccionados

=.32 t 1.95/2 , 101

=50 t 1.95 /2 , 201

4.5.1 Determinacin de la muestra con grado de confianza y estimacin de

Partiendo del primer ejemplo dado con la distribucin z tenemos:

Para nuestro segundo ejemplo tomaremos los datos del ejemplo N2 z:

4.6 Intervalo de confianza para la diferencia entre dos medias

pero conocidas, con el uso de la distribucin normal y la t

son las medidas de muestras aleatorias independientes de

tomadas de poblaciones normales que tienen las medidas

aleatoria que tiene una distribucin normal con la media

El mtodo de pivotes nos lleva a

Y, por consiguiente, al siguiente intervalo de confianza de

valores de las medias de muestra aleatorias independientes de tamao

esta dado por

valores de las desviaciones estndar de la muestra

antes. El procedimiento de estimaciones de la diferencia entre dos medias, cuando

Es una variable aleatoria que tiene una distribucin normal estndar y

obtenerse ponderando las desviaciones cuadradas (o elevadas al cuadrado) de

Es en realidad un estimador insesgado de

2 . Ahora bien, por los teoremas

8.10 y 8.8, las variables aleatorias independientes

( n11 ) s21 (n21)s 22 (n1+ n229)s 2p

Tienen una distribucin ji cuadrada con

grados de libertad. Como se

puede demostrar que las variables aleatorias anteriores z y y son

Tiene una distribucin t con

grados de libertad. Al sustituir esta

expresin por t en:

Y simplificndolo algebraicamente el resultado. Llegamos al siguiente intervalo de

cantidades entre n, encontraremos que la media y la desviacin estndar de la

El primero de estos resultados seala que la proporcin muestral es un estimador

Dado que los clculos necesarios de complican, haremos una aproximacin ms

Donde el nivel de confianza es de (1 - a) 100%.

en la frmula anterior, se obtiene

Tenemos el 95% de confianza de que p puede en el intervalo de 0.266 o 0.454.

La magnitud de error cometido cuando usamos

est dada por

como una estimacin de p

|nx p| . Empleando nuevamente la distribucin normal, podemos

asegurar con una probabilidad de 1 a que la desigualdad.

Se cumplir, es decir, que el error ser lo mismo de