Вы находитесь на странице: 1из 21

Estimacin

SEPTIEMBRE, 2012
2.1 Introduccin
2.2 Caractersticas de un estimador
2.3 Estimacin puntual
2.4 Estimacin por intervalos

2.4.1 Intervalo de confianza para la media
2.4.2 Intervalo de confianza para la diferencia de medias
2.4.3 Intervalos de confianza para la proporcin
2.4.4 Intervalos de confianza para la diferencia de
proporciones
2.4.5 Intervalos de confianza para la varianza
2.4.6 Intervalos de confianza para la relacin de varianzas

2.5 Determinacin del tamao de muestra

2.5.1 Basado en la media de la Poblacin
2.5.2 Basado en la proporcin de la Poblacin
2.5.3 Basado en la diferencia entre las medias de la Poblacin
estimacin
concepto
Estimacin
puntual
Estimacin por
intervalo
- Medias
- Diferencia de medias
- Proporciones
- Diferencia de proporciones
Para:
muestras grandes y
muestras pequeas
Tamao de muestra
- Media
- proporciones
Los estimadores tienen una serie de caractersticas cuyo conocimiento permite
seleccionar entre varios estimadores posibles el que estime de manera mas eficaz
los valores del correspondiente parmetro poblacional. Las principales
caractersticas de los estimadores son las siguientes:
Sesgo
Precisin
Consistencia
Robustez

Sesgo: se denomina sesgo de un estimador a la diferencia entre el valor del
parmetro que se desea estimar y el valor esperado del estimador.

Precisin: la precisin de un estimador depende de su varianza, si la varianza es
grande el valor del estimador puede tener grandes variaciones y, por tanto, en
ocasiones su valor puede alejarse mucho del parmetro que se desea estimar; por
el contrario si la varianza de un estimador es pequea la probabilidad de obtener
valores del estimador alejados del valor del parmetro que se desea estimar es
pequea.
Consistencia: un estimador es consistente si al aumentar el tamao de la muestra
el valor del estimador w tiende al del parmetro que se desea estimar w. y la
varianza de w tiende a cero.

Robustez: un estimador es robusto si sus valores varan poco por valores atpicos.





En estimacin puntual lo que se desea es estimar ciertas caractersticas de una
poblacin, mediante los datos obtenidos en una muestra aleatoria de esa
poblacin.
conceptos bsicos:
Parmetro. Es una constante correspondiente a una distribucin de probabilidad o
a una poblacin. Ejemplo. Para la distribucin binomial; sus parmetros son: n, p..
Para la distribucin poisson, su parmetro es . Para la distribucin normal, sus
parmetros son y .

Ahora, los parmetros tpicos que se desean conocer de una poblacin son; la
media, la varianza o una proporcin. El problema de la estadstica inferencial es
estimar el valor de estos parmetros mediante la informacin que hay en una
muestra aleatoria.

Estadstico. Es una funcin de una muestra, o una frmula matemtica calculada
en los valores de una muestra aleatoria. Por ejemplo; X , X~ , S2, S, Rango, etc.

Estimador Puntual. Es un estadstico utilizado para estimar el valor de un
parmetro desconocido a partir de una muestra aleatoria.
Estimacin de la media aritmtica poblacional

El mejor estimador de la media aritmtica poblacional, aunque no es el nico, es
el de la media aritmtica muestral.


Estimacin de la varianza poblacional



Estimacin de la varianza muestral



Estimacin de una proporcin







Se tom una muestra aleatoria del tiempo (en minutos) en que se realiza un
trabajo artesanal. Los datos aparecen en la siguiente tabla.

T I E M P O E N M I N
91.228 92.221 92.635 93.486 94.659 94.931 95.168 97.145 98.669 99.884
99.989 100.985 101.103 101.601 102.437 102.727 103.505 104.288 104.429 104.993
105.971 105.991 105.998 106.378 106.920 107.542 107.991 108.563 108.739 109.041
109.102 109.302 110.154 110.646 110.946 111.072 111.380 111.949 112.707 113.248
113.373 113.411 113.580 113.700 114.116 114.848 114.985 115.141 115.192 116.302
116.302 116.346 116.858 116.982 117.685 118.158 118.280 118.422 118.534 119.638
119.868 120.199 120.464 122.278 123.027 123.378 123.682 123.888 124.153 124.332
125.016 125.396 125.424 126.812 127.614 127.911 129.479 130.147 130.493 131.069
131.813 132.018 132.180 132.182 133.045 133.088 133.581 135.173 135.351 135.546
137.021 138.687 138.787 140.052 140.911 141.320 141.472 147.406 152.191 155.512
a. Obtener una estimacin puntual del tiempo promedio para hacer este trabajo.
b. Obtener una estimacin puntual de la varianza del tiempo para hacer el trabajo.
54 . 117 = X
60 . 201
2
= S
c. Obtener una estimacin puntual de la proporcin de trabajos que son realizados
en menos de 100 minutos
110 . = p

Aunque la teora de los estimadores puntuales es muy completa y se pueden


tener estimadores puntuales muy buenos, no es suficiente quedarse solo con
estimaciones puntuales, ya que no tendramos informacin acerca de que tan
cerca o tan lejos podra estar el valor del parmetro de su estimacin puntual.

Por ejemplo, si tenemos que X = 80.52, entonces se espera que el valor real de
la media poblacional debe ser un valor cercano a 80.52. pero no tenemos idea
de que tan cerca de 80.52 puede estar el valor de .. la estimacin por
intervalo de confianza nos puede dar informacin sobre que tan cerca o que tan
lejos de una estimacin puntual esta el valor del parmetro poblacional

Una estimacin por intervalo de un parmetro poblacional , consiste en
construir un intervalo de la forma 1< <2 , donde los extremos del intervalo
se obtienen de acuerdo a la distribucin del estimador del parmetro y de 1 ,
donde 1 es la probabilidad de que el intervalo contenga al valor del
parmetro (0 < < 1) y se le llama nivel de confianza. A un intervalo obtenido
de esta manera se le llama intervalo de confianza (IC) de , con un nivel de
confianza de 1 .
Suponer una muestra aleatoria de una v.a. X con distribucin
normal y varianza conocida. El IC para la media con un nivel de
confianza de 1- est dado por:



donde z / 2 es el valor de z tal que P(z > z / 2 ) = / 2 .

NOTA: Si es una muestra grande (n 30), se puede sustituir por
S sin importar la distribucin de probabilidad que tenga X.


|
.
|

\
|
+ ( (
|
.
|

\
|

n
z X
n
z X
o

o
o o
2 2
Se tom un muestra aleatoria de 40 focos anotando el tiempo en horas
que funcion cada foco. Se tiene que el promedio de la muestra es
604.79 horas con una desviacin estndar muestral de 510.52 horas.
Construir un IC para el tiempo promedio de vida del foco con un nivel de
confianza del 95%.

Entonces /2 = 0.025 y z0.025 = 1.96 obteniendo:

604.79 1.96(510.52 /rcua40) < < 604.79 +1.96(510.52/rcua40)

quedando;

446.58 < < 763.00, es decir, la media del tiempo de vida de los focos
esta entre 446.58 y 763.00 horas con una probabilidad de 95%.
Suponer una muestra aleatoria de una v.a. X con distribucin normal y varianza
desconocida. El IC para la media con un nivel de confianza de 1 est dado
por:




donde t / 2, n1 es el valor de la variable aleatoria con distribucin t de
Student con n1 grados de libertad tal que, P(t > t / 2, n1) = / 2 .




Se desea estimar la media del dimetro de un engrane, que es fabricado
para un nuevo modelo de motor de lavadora. Se tom una muestra de
engranes cuyo dimetro (en cm) se presenta a continuacin:

14.1869, 13.8059, 13.9689, 13.0019, 13.7221, 14.3237, 14.1774, 13.5206,
13.7024, 14.2418, 14.2179, 13.9400, 14.4668, 13.9928, 14.1241

si se desea un intervalo de confianza del 90% para la media.

De los datos tenemos que x = 13.9595 y S = 0.3702, se tiene que /2 = 0.05
y t0.05,14 = 1.761,

luego los lmites del intervalo de confianza son: 13.9595+1.761(0.3702
/rcuad15)

obteniendo: 13.7912 < <14.1278 . Se puede interpretar el resultado
diciendo que hay una probabilidad de 0.90 de que el valor de la media del
dimetro de los engranes esta entre 13.7912 y 14.1278 cm.
Suponer una muestra aleatoria de una poblacin normal de tamao n.
Luego, el IC para la varianza de la poblacin con nivel de confianza 1
est dado por:




donde X
2
/ 2, n1 es el valor de la variable aleatoria con distribucin X
2

con n-1 grados de libertad tal que P(X
2
> X
2
/ 2, n1) = /2, y X
2

1/2, n1 es el valor de la variable aleatoria con distribucin X
2
con n-1
grados de libertad tal que P(X
2
> X
2
1 / 2, n1 ) = 1 - /2.

NOTA: Para valores grandes de n, el valor de X
2
, se puede aproximar
mediante la frmula;

Se desea estimar la media del dimetro de un engrane, que es fabricado para un
nuevo modelo de motor de lavadora. Se tom una muestra de engranes cuyo
dimetro (en cm) se presenta a continuacin:
14.1869, 13.8059, 13.9689, 13.0019, 13.7221, 14.3237, 14.1774, 13.5206, 13.7024,
14.2418, 14.2179, 13.9400, 14.4668, 13.9928, 14.1241
estime la varianza del dimetro del engrane, con un intervalo de confianza del
95%.

Se tiene que S
2
= 0.3702
2
y n = 15. Luego, /2 = 0.025 de donde X
2
0.025,14 =
26.119 y X
2
0.975,14 = 5.629 entonces:

14(.3702
2
)
26.119
<
2
<
14(.3702
2
)
5.629
obteniendo 0.07346 < 2 < 0.34085 lo cual se puede
interpretar diciendo que hay una probabilidad de 09.5 de que la varianza de los
dimetros del engrane esta entre 0.07346 y 0.34085 cm2.

Adems, de aqu se puede obtener un intervalo de confianza para la desviacin
estndar aplicando la raz cuadrada, obteniendo0.2710 < s < 0.5838, lo cual se
puede interpretar diciendo que hay una probabilidad de 0.95 de que la
desviacin estndar del dimetro del engrana esta entre 0.2710 y 0.5838 cm.

Suponer una muestra aleatoria de tamao n donde se observaron X
xitos. El IC para la proporcin de xitos en la poblacin con un
nivel de confianza de 1- est dado por;






donde

Se desea estimar la proporcin de clientes de cierta tarjeta de
crdito que no pagan a tiempo sus abonos mensuales. De los
registros de los pagos del mes pasado, se tom una muestra
aleatoria de 3000 clientes de los cuales 153 no pagaron a tiempo
su pago mensual. Se estimara la proporcin de clientes que no
pagan a tiempo su pago mensual con un intervalo del 96%.

Si X = nmero de clientes que no hacen su pago mensual a
tiempo, entonces X = 153 con n= 3000 de donde p = 0.051.
Adems, /2 = 0.02 y z0.02 = 2.054, y aplicando:

0.0512.054rcuad((0.051)(0.949)/3000)<p<0.051+2.054rcuad((0.05
1)(0.949)/3000)

0.0427 < p < 0.0593, podemos interpretar el resultado, diciendo
que hay una probabilidad de 0.96 de que la proporcin de clientes
que no pagan a tiempo su tarjeta de crdito esta entre 0.0427 y
0.0593.
Ahora abordamos el problema de determinar el tamao de
muestra adecuado. Para ello debemos definir el concepto de
error mximo de estimacin. Sea el parmetro que se estima
con su estimador . El error de estimacin es | | , es
decir es el valor absoluto de la diferencia entre el valor
estimado y el valor real.



aqu el valor de 1 y de error son definidos por el investigador.
Adems, la frmula tiene la desventaja de que es necesario
conocer , algo que no se cumple generalmente, entonces se
sustituye por un valor estimado.




Se desea estimar la media del dimetro de un engrane, que
es fabricado para un nuevo modelo de motor de lavadora. Se
tom una muestra de engranes cuyo dimetro (en cm) se
presenta a continuacin:
14.1869, 13.8059, 13.9689, 13.0019, 13.7221, 14.3237,
14.1774, 13.5206, 13.7024, 14.2418, 14.2179, 13.9400,
14.4668, 13.9928, 14.1241

Determinar el tamao de muestra necesario para estimar la
media con un intervalo de confianza del 95% y un error
mximo de 0.1 cm. Usar un valor estimado para de 0.37 .

Luego, se tiene que a/2 = 0.025, z0.025 = 1.96, error = 0.1

se tiene que n = [1.96(0.37) / 0.1]
2
= 52.59 y se necesita una
muestra de tamao mnimo de 53.
pero la desventaja de la frmula es que se necesita el valor de p, valor
que no conocemos porque es lo que se desea estimar. Sin embargo, se
tiene que el valor de p que maximiza la expresin del lado derecho de la
frmula es p =1/2 (ver figura ). Observe que maximizar el lado derecho
de la frmula es lo mismo que maximizar f(p) = p(1 p).
Luego, la expresin del lado derecho obtiene su valor mximo cuando p
= 1/2, de donde, se tiene que:
Se desea estimar la proporcin de clientes de cierta tarjeta
de crdito que no pagan a tiempo sus abonos mensuales. De
los registros de los pagos del mes pasado, se tom una
muestra aleatoria de 3000 clientes de los cuales 153 no
pagaron a tiempo su pago mensual.

obtener el tamao de muestra conveniente para estimar p
(proporcin de clientes que no pagan a tiempo) con un
intervalo de confianza del 95%, con un error mximo de 0.004
y sin un valor estimado de p.

se tiene que z0.025 = 1.96, error = 0.004 y tenemos que

n =(1/4)(1.96/0.004)
2
= 60025 y es necesario una muestra de
60025 clientes

Вам также может понравиться