Академический Документы
Профессиональный Документы
Культура Документы
CAPITULO No.3
(Pg. # 189 Mendenhall)
Pg. #1
TIPOS DE ESTIMADORES.
Estimacin puntual.-
Indica como calcular los rangos del intervalo (lmite superior y lmite inferior en base a
los datos muestrales.
20 x 30
El nmero mayor, que indica el extremo superior del intervalo se denomina Lmite
Superior de Confianza (LSC), similarmente el nmero extremo inferior, se denomina
Lmite Inferior de Confianza (LIC).
Pg. #2
Pg. #3
Observaciones de la figura.
En una situacin real, es posible que se sepa que la distribucin muestral del estimador se
centra en el parmetro que se desea estimar, pero no se conoce el valor del parmetro.
Lo nico con lo que se cuenta es con la estimacin calculada a partir de las n
observaciones de la muestra.Qu tan lejos estar la particular estimacin del parmetro
estimado? Puesto que el parmetro usualmente se encuentra en el centro de la
distribucin muestral (que es usualmente la media de la distribucin), la distancia entre la
estimacin y el parmetro, a la que se llama error de estimacin, es menor o igual a la
distancia entre el centro y las colas de la distribucin.
De hecho el error de estimacin debe ser menor que dos desviaciones estndar de la
distribucin muestral, con una probabilidad de al menos .75 (Teorema de Tchebysheft)
Tema Auxiliar ** Teorema de Tchebysheff **
Dados un numero k mayor o igual que uno, y un conjunto de observaciones
y1 , y 2 , y 3 ,... y n al menos (1 - 1 / k 2 ) de las observaciones caen dentro de k desviaciones
estndar de la media.
El teorema de Tchebysheff se refiere a cualquier conjunto de observaciones; por lo tanto se
puede aplicar tanto a una muestra como a la poblacin. Con fines de ilustracin se usar
la notacin correspondiente a la poblacin pero tenga presente que lo discutido en este
caso se aplica de manera idntica a la muestra.
Pg. #4
Para entender mejor el resultado del teorema, se calculan algunos valores de la fraccin
1 1 / k
2
-1/(2)2
3 a 3
Cuando se aplica el teorema de Tchebysheff a datos de una muestra es posible usar s'
(definido en la seccin 3.7) en lugar de s para construir los intervalos centrados en la
media. s' es una cantidad un poco menor que s y da
intervalos algo ms cortos pero el
asunto es de poca importancia prctica.
Tabla 3.5 Algunos valores de
1 1 / k
2
1 1 / k
3/4
8/9
Puesto que el teorema es tambin cierto cuando se usa s en lugar de s. Adems, para n
grande, s y s son casi iguales.
Pg. #5
Pg. #6
de la poblacin, es
posible que los intervalos que se obtengan ocurran de manera similar a los que se
muestran en la figura 8,5, Las lneas horizontales representan los 10 intervalos y la
lnea vertical representa el verdadero valor de la utilidad semanal media, Ntese
que, salvo uno, todos los Intervalos contienen a
particulares
Pg. #7
Pg. #8
Pg. #9
Definiendo frmulas.
N = Poblacin
y =Media muestral
n = Tamao de la muestra
=Media poblacional
n > = 30
y=
=s
La
probabilidad
de que el
error de
estimacin
sea
menor que
esta
cota
Pg. #10
es
Pg. #11
Debido a la escasez de agua producida por el calor severo del verano en una
comunidad. el gobierno de la ciudad selecciona al azar n = 100 viviendas para observar
el medidor de agua durante un da y estimar el consumo diario promedio por vivienda
durante un da caluroso. Se obtiene de esta muestra una media y una desviacin
estndar de 117.5 galones y 16.8 galones respectivamente. Estime
el consumo diario
promedio por vivienda en esta comunidad y determine una cota para el error de
estimacin.
Pg. #12
Pg. #13
Pg. #14
Pg. #15
)100% para
y z / 2
El valor z,
.05 .
S toma la mitad de
z .025 es el valor z
de la tabla 3 del apndice que corresponde a una rea de .475 a la derecha de la media.
Es decir
z .025 = 1.96
Pg. #16
Pg. #17
y 1.645
se tiene
871
(1.645)
21
871 4.89
50
cae en el
y $7750
s $900
y 1.96
se tiene
Pg. #18
$7750 (1.96)
$900
$7750 $176.40
100
para el gasto promedio anual en este tipo de combustible en las viviendas de esa
ciudad.
Pg. #19
y 8.71% y s 2.1% .
Estime el verdadero rendimiento anual promedio para esa clase de valores usando un
intervalo de confianza del 90%.
Pg. #20
Pg. #21
Pg. #22
n1 del
Pg. #23
Cota para el error de estimacin para un estimador puntual con una muestra grande
Cota del error = 2 desviaciones estndar de la distribucin muestral del estimador puntual.
Cota = 2y
Similarmente los intervalos de confianza con muestras grandes para lo<. cuatro parmetros
se presentan en el cuadro siguiente:
)100%
1 100%
Z / 2 se
Z /2 y
Pg. #24
2 , 22 .
1 ,
12 ,
muestral.
Pg. #25
1 2
1 2 .
en donde
12
22 son
Pg. #26
Estime
1 2 , la
estimacin.
Se esperar que el error de estimacin sea menor que 2(184) = 368 km-vida. Si el
estimador de la diferencia en km-vida medios es 1,300 y el error de estimacin es menor
que 368 (con una alta probabilidad), parece razonable concluir que hay una diferencia
sustancial entre las medias de km-vida de los dos tipos de neumticos. De hecho, el
neumtico 1 es el que se muestra superior al 2 en cuanto a desgaste por rodamiento.
Un intervalo de confianza de ( 1 - ) 100% para (1 - 2)
+-
z /2
Nota.- Si n1 y n2 son mayores o iguales que 30, se puede utilizar s12 s22 en lugar de 12 y 22.
Pg. #27
( y1 y 2 ) 2.58
12
n1
22
n2
1,300 2.58(184)
en otras palabras, LIC 825,
que se encuentra entre estos dos lmites con una confiabilidad del .99
Note que este intervalo es ms grande que el de
Pg. #28
Pg. #29
escuela l:
y1 = 525
escuela 2:
y2 = 564
S1 = 52
S2 = 0,10
Estime la diferencia entre la calificacin media de los estudiantes de cada una de las
escuelas y d la cota para el error de estimacin.
Pg. #30
y
n
pq
n
Pg. #31
que
Cuando n es grande, el error que se comete por esta substitucin es bastante pequeo.
En realidad la desviacin estndar
pq
Pg. #32
pq para diversos valores de p. Ntese que pq cambia muy poco cuando p cambia,
especialmente cuando p es cercano a .5.
Ejemplo 8.6 Pg.212
Una muestra aleatoria de n = 100 electores en una comunidad produjo y = 59 electores en
favor del candidato A. Estime la fraccin de electores a favor del candidato A y
determine una cota para el error de estimacin.
Solucin:
Interpretacin de la curva.
Pg. #33
Pg. #34
Pg. #35
y n2 ensayos respectivamente y se
calculan estimaciones p 1 y p 2
Como consecuencia del teorema central de lmite entonces, al igual que en el caso
de la diferencia de dos medias muestrales, la diferencia en las proporciones
muestrales p 1 p 2
sigue una distribucin muestral que es aproximadamente normal cuando am bos p1 y
p2
Pg. #36
Estimacin puntual de ( pi -- p2 )
Estimador:
( p 1 p 2 )
2 ( p1 p 2 ) 2
p 1
y p 2
p1 q1 p 2 q 2
n1
n2
p1 y
p2
para obtener la
( p 1 p 2 ) z / 2
)100% para ( p1 p 2 )
p1 q1 p 2 q 2
n1
n2
Pg. #37
Pg. #38
Pg. #39
al repetir el procedimiento
2 y = 4 (ver figura 8.9)
2 y
Pg. #40
Entonces
2 y = 4
2
4
n
2
4
Este es el tamao de muestra mnimo tal que el error de estimacin ser menor que
2 y ,
y depende de la
variabilidad de la poblacin de la cual la muestra fue tomada. A falta del valor exacto
de , se deber usar la mejor aproximacin disponible. Este puede ser el estimador s
obtenido de una encuesta previa o puede usarse el conocimiento de la amplitud en la
cual las observaciones caen. Puesto que la amplitud es aproximadamente de 4 (la
regla emprica), un cuarto de la amplitud proporciona un valor aproximado para .
Ejemplo, se usan los resultados del ejemplo 8.1 que proporcionan una estimacin bastante
precisa de = s =21 Entonces:
2
4
Si en este caso se usa una muestra de tamao n = 111 se estar razonablemente seguro (
con probabilidad aproximada de .95) de que el estimador caer dentro de 2y = 4 tons de
distancia de , el verdadero rendimiento promedio diario.
De hecho se espera que el error de estimacin sea menor que 4 tons. De acuerdo a la
regla emprica se tiene una probabilidad aproximada de .68 de que el error de estimacin
se a menor que y = 2 tons. Debe notarse que la probabilidad de .98 y .95 son aproximadas
puesto que fue sustituido por s. Aunque es mtodo para seleccionar el tamao dela
muestra es solo aproximado para una precisin deseada en la estimacin, es el mejor
disponible, y resuelta por supuesto mejor que seleccionar el tamao de la muestra
basndose solamente en la intuicin.
Pg. #41
Pg. #42
Pg. #43
Pg. #44
Pg. #45
Pg. #46
FASE II
PRUEBA ESTADSTICA DE UNA HIPTESIS
Partes de una prueba estadstica.
El objetivo de una prueba estadstica es probar una hiptesis acerca de uno ms
parmetros de una poblacin. En una prueba estadstica se encuentran involucrados los
siguientes cuatro elementos:
1. Hiptesis nula.
2. Hiptesis alternativa.
3. Estadstica de prueba.
4. Regin de rechazo.
Al especificar estos cuatro elementos queda definida una prueba en particular; y al
cambiar una o ms de estas partes se produce una prueba diferente. La relacin entre las
hiptesis nula y alternativa se discuti en la seccin 6.9. La hiptesis alternativa o hiptesis
de investigacin es aquella que el investigador desea apoyar. La hiptesis nula es la
contradiccin de la hiptesis alternativa; esto es, si la hiptesis nula es falsa, la hiptesis de
investigacin (alternativa) debe ser cierta. Por las razones que se vern adelante, es ms
fcil mostrar apoyo de la hiptesis de investigacin al presentar evidencia (datos
muestrales) indicando que la hiptesis nula es falsa. Esto es, se busca evidencia en favor de
la hiptesis de investigacin mediante el uso de un mtodo que resulta similar a una
demostracin por contradiccin.
Aunque se desea obtener evidencia que apoye a la hiptesis alternativa (que se denotar
por el smbolo
Pg. #47
O puede estarse interesado en probar la hiptesis nula de que las medias de dos
poblaciones, 1 y 2, son iguales, esperando demostrar que en realidad, por ejemplo, 1, es
mayor que 2 .
La decisin de aceptar o rechazar la hiptesis nula se basa en la informacin contenida en
la muestra tomada de la poblacin de inters. Los valores muestrales se usan para calcular
un nmero que corresponde a un punto en la lnea, el cual funciona como variable de
decisin. A esta variable de decisin se le llama estadstica de prueba. El conjunto de
todos los posibles valores que la estadstica de prueba puede tomar se divide en dos
conjuntos, o regiones, uno que corresponde a la regin de rechazo y el otro que
corresponde a la regin de aceptacin. Si la estadstica de prueba, al ser calculada a
partir de una muestra en particular, toma un valor que se encuentra en la regin de
rechazo, entonces se rechaza la hiptesis nula y la hiptesis alternativa o de investigacin
es aceptada. Si la estadstica de prueba toma un valor en la regin de aceptacin,
entonces se acepta la hiptesis nula o bien se considera que no hubo evidencia para
rechazarla. Adelante se explican las circunstancias que conducen a esta ltima decisin.
El procedimiento de decisin antes descrito est sujeto a dos tipos de error. Estos errores son
inherentes a todo problema de decisin en donde se tengan dos selecciones posibles.
Puede rechazarse la hiptesis nula Ho cuando en realidad es verdadera o puede
aceptarse H0 cuando es falsa y alguna alternativa cierta. Estos errores se conocen con el
nombre de error tipo I y error tipo II respectivamente.
Definicin
Un error tipo I en una prueba estadstica es el error que se comete al rechazar la hiptesis
nula cuando sta es cierta. La probabilidad de cometer el error tipo I se denota por el
smbolo .
Un error tipo II en una prueba estadstica es el error que se comete al no rechazar la
hiptesis nula cuando sta es falsa. La probabilidad de cometer el error tipo II se denota
por el smbolo
Pg. #48
Las dos posibilidades para la hiptesis nula, esto es ser falsa o verdadera, junto con las dos
posibles decisiones del experimentador se presentan en la tabla de doble entrada, tabla
8.3. La ocurrencia de los errores tipo 1 y tipo II se seala en la tabla.
La
bondad
de
una
prueba
estadstica
de
hiptesis
se
evala
mediante
las
,probabilidades de cometer los errores tipo I y tipo II, que se denotan por los !smbolos
y
decrecern.
La probabilidad
del parmetro de la poblacin. Por ejemplo suponga que se desea probar la hiptesis
nula de que el parmetro binomial p es igual a p o = .4 (se usa un subndice 0 para indicar
el valor del parmetro especificado por Ho).
Pg. #49
detectar pa a menos de que se tenga una muestra muy grande. En otras palabras, la
probabilidad
La grfica de la probabilidad
Pg. #50
. Finalmente se selecciona
un tamao de muestra n
desea detectar. Esto puede hacerse rnediante el uso de las curvas caractersticas de
operacin para distintos tamaos de muestra para la prueba seleccionada.
de tomar la decisin
, la
probabilidad
es a menudo
conocida,
Se ver en el texto como la hiptesis alternativa
rechazo.
Pg. #51
pruebas
de
hiptesis
, p, (1 2 ), y ( p1 p 2 )
usando
muestras
grandes,
acerca
de
los
parmetros
normal y por esta razn pueden considerarse como una misma prueba. el razonamiento
involucrado, se presentar en forma muy general, haciendo referencia al parmetro de inters
Puede pensarse que
representa a
, ( 1 2 ) , p
( p1 p 2 )
el
Si la hiptesis
nula
H 0 : 0
es cierta, entonces la distribucin muestral de
figura 8.10.
H a : 0,
es
alejado de
0 .
mayor que
0 ,
la
La regin de rechazo
Pg. #52
El valor de
aparece sombreada en la figura 8.10. Si se desea =.05, se rechaza la hiptesis nula cuando
0 .
Definicin
Una prueba estadstica de una sola cola es aquella en la que la regin de rechazo se localiza en
solamente un extremo de la distribucin muestral de la estadstica de prueba. Para detectar
detectar
< 0
es mayor que
es meno que
>
. Para
0 .
0 , la hiptesis
alternativa es
distribucin normal, obtenindose como resultado una prueba estadstica de dos colas.
Definicin
Una prueba estadstica de dos colas es aquella que sita la regin crtica en ambas colas de la
distribucin muestral de la estadstica de prueba. Las pruebas de dos colas se usan para detectar
ya sea cuando
El clculo de
0 .
para pruebas estadsticas de una sola cola ha sido descrito anteriormente y puede
Pg. #53
Cuando
H 0 es falsa y a
en lugar de
0 .
la estadstica de prueba
La distribucin de
suponiendo a ,
a , es
. Puesto que
y desviacin estndar
y desviacin estndar
2.
Pg. #54
, p, (1 2 ),
( p1 p 2 )
= .05, se debe rechazar Ho cuando z > -1.96 z < -1.96, puesto que P(z < -1.96 z > 1.96)= .05
cuando Ho es cierta, el mtodo de inferencia usado en una situacin dada depende a menudo de
la preferencia del experimentador. Algunas personas desean expresar su inferencia como un
estimador,
otras
prefieren
probar
una
hiptesis
acerca
del
parmetro
de
inters.
Pg. #55
y = 871 y s
= 21 tons.
Pg. #56
Pg. #57
y =
6.70 centavos por milla con una varianza de s 2 = .36 mientras que para las vagonetas
elctricas se observ una media y una varianza del costo de operacin por milla de
y =
6.54 y sz = .40 respectivamente. Muestran estos datos evidencia suficiente para indicar
una diferencia significativa en el costo promedio de operacin entre los vehculos
convencionales de gasolina y las vagonetas elctricas?
Pg. #58
De estas
.10
Pg. #59
= .05
Pg. #60
Pg. #61
8.38 (Pg. # 235) Los fabricantes de equipo fotogrfico han introducido muchos productos novedosos
en los aos recientes. Un nuevo tipo de bombilla para flash fue sometida a prueba para estimar la
probabilidad p de que produzca la salida de luz requerida durante el tiempo apropiado. Una
muestra de 1000 bombillas fue probada y se observ que 920 de ellas funcionaron de acuerdo a las
especificaciones. Estime p y determine una cota para el error de estimacin.
8.39. (Pg. # 235) Calcule un intervalo de confianza al 99% para el parmetro p del ejercicio 8.38.
D una interpretacin de este intervalo.
Pg. #62
8.41. (Pg. # 235) La media y la desviacin estndar de 49 compras a crdito de los clientes
de una cadena de almacenes resultaron $6.50 y $2.10 respectivamente. Encuentre un
intervalo de confianza del 98%, para la media de las compras a crdito de todos los clientes
que usan crdito en el almacn.
Pg. #63
8.42. (Pg. # 235) Se registr el porcentaje de pginas que tienen al menos un error de
mecanografa escritas por una secretaria que us una mquina de escribir estndar y luego una
mquina elctrica. Para la mquina estndar, 64 de 200 pginas tenan al menos un error de
mecanografa; en cambio para la elctrica 36 de 180 tenan errores. Estime la diferencia del
porcentaje de pginas que contienen al menos un error cuando se usa la mquina estndar y
cuando se usa la mquina elctrica. Determine la cota para el error de estimacin.
Pg. #64
8.44. (Pg. # 235) Un auditor, al examinar una muestra aleatoria de 64 cuentas de crdito, encontr un
error promedio por cuenta de -$42 con desviacin estndar de 16. Construya un intervalo de confianza
para el error promedio por cuenta usando un coeficiente de confianza del .95.
Pg. #65
Pg. #66
8.47.(Pg. # 236) Los fabricantes de pelotas de golf usan un concepto cientfico llamado
coeficiente de restitucin que se define como el cociente de la velocidad rela tiva de la pelota y
el palo despus del impacto sobre la velocidad relativa antes del impacto. Un fabricante que ha
desarrollado un nuevo tipo de pelota de golf desea compararla con la estndar de su
compaa. Cincuenta pelotas del nuevo tipo y 50 de las pelotas estndar se someten a la
prueba. Los resultados se presentan en la siguiente tabla.
=.01.
Pg. #67
8.51.(Pg. # 236) De la experiencia previa se sabe que la desviacin estndar del salario anual
de los trabajares de la industria textil en cierto estado de los Es tados Unidos es de $400. De
qu tamao necesita ser una muestra de trabajadores textiles de ese estado si se desea
estimar la media de la poblacin con un error de no ms de $50.00 con una probabilidad
aproximada del .95 de estar en lo correcto? Dado que la media de la muestra en este
problema es de $4800, determine un intervalo de confianza del 95% para la media de la
poblacin.
Pg. #68
8.52.(Pg. # 236)Cuntos votantes deben incluirse en una muestra para determinar la proporcin
de votos populares a favor de un candidato a la presidencia en las elecciones nacionales si se
desea una estimacin correcta dentro de .005? Suponga que el porcentaje real est en la
vecindad de .5.
Pg. #69
Pg. #70
8.56. (Pg. # 236) Se desea estimar la diferencia en el tiempo promedio de armado de una
componente electrnica para dos obreros de una compaa. Se quiere que la estimacin sea
correcta dentro de un rango de 2 minutos con probabilidad de .95. Si la desviacin estndar del
tiempo de armado es aproximadamente igual a 6 minutos, cuntos tiempos de armado de la
componente deben registrarse para cada trabajador si se observara cada uno el mismo nmero de
veces?
Pg. #71
8.57. (Pg. # 236) La Comisin de Carreteras del Estado de Florida en los Estados Unidos ha
instituido recientemente una campaa de inspeccin a fin de reducir los accidentes en carreteras
ocasionados por fallas mecnicas. Se selecciona para su inspeccin una muestra aleatoria de 100
automviles. De estos 20 se encuentran con fallas en el sistema de frenos. Construya un intervalo
de confianza del 95% para el porcentaje de automviles en la carretera de Florida que tienen
fallas en el sistema de frenos. Suponga que se requiere una estimacin ms precisa que la ya
obtenida. De qu tamao ser necesaria una muestra para reducir la cota del error de
estimacin a .04?
Pg. #72
8.59. (Pg. # 237) Los salarios diarios de una industria se distribuyen normalmente con media $43.20 y
desviacin estndar $2.50. Si se toma una muestra de 40 obreros seleccionados al azar de una
compaa de esa industria y se encuentra un salario promedio de $42.20, puede acusarse a esa
compaa de pagar salarios inferiores al 1% de nivel de significancia? Interprete sus resultados.
Pg. #73
8.60. (Pg. # 237) Un fabricante de lavadoras de ropa automticas produce un modelo en tres
colores diferentes A, B y C. De las primeras 1000 lavadoras vendidas se observa que 400 fueron del
color A. Concluira usted que ms de 1/3 de todos los clientes tienen preferencia por el color A? Use
= .01.
Pg. #74
8.69. (Pg. # 237) Una encuesta de hbitos de consumo se llev a cabo en las ciudades de
Boston y Seattle en los Estados Unidos. En Boston fueron entrevistadas 200 amas de casa y se
encontr que en promedio gastan al mes $190 en alimentos, con una desviacin estndar de
$25. En Seattle se entrevistaron 175 amas de casa y se obtuvo un promedio de $180 con una
desviacin estndar de $35. Use un nivel de significancia de .05 para probar la hiptesis de que
no hay diferencia en la cantidad promedio gastada en alimentos por las amas de casa de
Boston y Seattle. Interprete sus resultados.
Pg. #75
8.71(Pg. # 238) La vida promedio de una muestra de 100 tubos fluorescentes producidos por
una compaa se encontr igual a 1570 horas con una desviacin estndar de 120 horas. Si
es la vida media de todos los tubos producidos por la compaa, pruebe la hiptesis
horas contra la alternativa
= 1600
Pg. #76