Академический Документы
Профессиональный Документы
Культура Документы
10
ICM ESPOL
ESTADSTICA INFERENCIAL
(Valor desconocido)
(Variable aleatoria)
(Un valor del estimador)
Distribucin muestral
del estimador
El estimador es una
variable aleatoria
La intuicin sugiere que el estimador debe tener una distribucin muestral concentrada alrededor
del parmetro y que la varianza del estimador debe ser la menor posible. De esta manera, el
valor que se obtiene en la muestra ser cercano al valor del parmetro y ser til para estimarlo.
(Valor desconocido)
(Variable aleatoria)
(Un valor del estimador)
y el valor del
parmetro
188
ICM ESPOL
Li Ls
En donde Li y Ls son los lmites inferior y superior del intervalo
189
1 n 1
1
n
E( X ) = E xi = E [ xi ] = = n =
n
n
n
i=1
ni=1
i=1
Definicin 2: Estimador ms eficiente
Se dice que un estimador 1 es ms eficiente que otro estimador 2 si
ambos son insesgados y adems V(1) < V(2)
Un estimador es ms eficiente si tiene menor varianza.
Demostracin:
V( X ) =
=0
n n
lim
Esta definicin resume las caractersticas deseables de un estimador: su varianza debe ser
mnima y su distribucin de muestreo debe estar concentrada alrededor del parmetro que es
estimado, es decir el sesgo debe ser mnimo.
Ejemplo
Pruebe que la varianza muestral es un estimador insesgado de la varianza poblacional si se
2
toma una muestra de tamao n de una poblacin normal con media y varianza
Sea
S =
1 n
2
2
2
(xi x) . Se tiene que probar que E(S ) =
n 1 i=1
S =
x)
(x
i
n 1i=1
n
n
2
2
1 n 2
1
2 2x
2x
x
+
x
)
=
(
xi + x )
i
= n 1 (x i
n1
xi
i=1
i=1
i=1
i=1
n
1
2
2
2
2
1
1
2
( 2i nx2 )
= n 1( x i 2x(nx) + nx ) =
2nx
(
+
nx
)
=
i=1
x n i=1
1
x n 1i=1
2
1 n
2
2
nX )] =
) nE(X )]
[ E(X
n1
i=1
2
2
2
2
2
= E(X
i ) E (X i ) = E(X i )
E(Xi2 ) = 2 + 2
E(X ) =
1 n
1
2
2
2
2
2
2
E(S ) =
( ( + ) n(
+ )) =
(n
+ n
1)
=n)
=
(n
n 1 i=1
n1
2
=
2
n1
Ejemplo
Se tiene una poblacin de tamao N = 6 definida por:
{1, 2, 3, 3, 4, 5}
= 32/3 32 = 5/3
c) Especifique cuales son todas las muestras de tamao n = 3 que se pueden obtener
Cantidad de muestras de tamao 3
N 6
6!
=
=
(Las muestras son combinaciones)
= 20
n 3 3! 3!
Muestras
(1, 2, 3)
(1, 2, 4)
(1, 2, 5)
(1, 3, 3)
(1, 3, 4)
(1, 3, 5)
(1, 4, 5)
(2, 3, 3)
(2, 3, 4)
(2, 3, 5)
(2, 4, 5)
(3, 3, 4)
(3, 3, 5)
(3, 4, 5)
Total
Cantidad
2 (1)
1
1
1
2
2
1
1
2
2
1
1
1
2
20
Media muestral
x
6/3
7/3
8/3
7/3
8/3
9/3
10/3
8/3
9/3
10/3
11/3
10/3
11/3
12/3
Mediana muestral
x
2
2
2
3
3
3
4
3
3
3
4
3
3
4
f( x ) = P(X = x)
2/20
2/20
4/20
4/20
4/20
2/20
2/20
1
f( x ) = P(Xi = x
)
4/20
12/20
4/20
1
X es un estimador insesgado de
E(Xi ) = 3 =
Xi
es un estimador insesgado de
Xi
E(X ) =
2
2Xi = V(Xi ) = E(Xi ) E 2 (Xi )
2
E(Xi ) =
x
2
V(Xi ) = 47/5 3 = 0.4
EJERCICIOS
1) Suponga que se tiene una poblacin cuyos elementos son: { 3, 4, 4, 6} de la cual se toman
muestras de tamao 2.
a) Escriba el conjunto de todas las muestras de tamao 2 que se pueden obtener con los
elementos de la poblacin dada.
b) Grafique el histograma de frecuencias de la media muestral
c) Determine la distribucin de probabilidad de la media muestral
d) Demuestre que la media muestral es un estimador insesgado de la media poblacional.
f(x) =
0,
otro x
Determine si la mediana muestral es un estimador ms eficiente de la media poblacional que la
media muestral
Sugerencia: Asocie la distribucin de probabilidad de la variable aleatoria X a la siguiente
poblacin: { 1, 2, 2, 3, 3, 3, 4, 4, 4, 4 } y liste todas las muestras de tamao 3
MATLAB
Estudio de estimadores de la media poblacional
>> x=[1 2 3 3 4 5];
>> format rat
>> mu = mean(x)
mu =
3
>> sigma2 = var(x, 1)
sigma2 =
5/3
>> muestras=combnk(x,3)
muestras =
3 4 5
3 4 5
3 3 5
3 3 4
2 4 5
2 3 5
2 3 4
2 3 5
2 3 4
2 3 3
1 4 5
1 3 5
1 3 4
1 3 5
1 3 4
1 3 3
1 2 5
1 2 4
1 2 3
1 2 3
Poblacin
Formato para ver nmeros racionales
Media poblacional
>> n=length(muestras)
n=
20
>> medias = mean(muestras' )
medias =
4
4
11/3
10/3
10/3
3
8/3
3
10/3
7/3
3
8/3
10/3
7/3
3
2
8/3
2
3
3
3
2
3
2
3
2
3
2
ICM ESPOL
Definicin:
: P(Z z) =
.
f(z)
Ejemplo
Encuentre
P(Z
z0.01
z0.01 = 2.33
z0.1
z0.05
z0.025
z0.01
z0.005
197
=
=
=
=
=
1.28
1.645
1.96
2.33
2.575
O equivalentemente:
| Z | z/2
Como se supone que la muestra es grande, por el teorema del lmite central
X
Z=
,
tiene distribucin normal estndar aproximadamente
/ n
Sustituyendo en la desigualdad se obtiene:
X
|
| z/2
con probabilidad 1 -
/ n
De donde | X - | z/2
con probabilidad 1 -
.
|X
X
n
| es el error en la estimacin del parmetro
E = z/2
mediante
n 30
puede afirmar con una confianza de 1 - que el mximo error no exceder de z/2
n
Es decir que si se estima
Ejemplo
Se ha tomado una muestra aleatoria de 50 artculos producidos por una industria y se obtuvo
que el peso de la media muestral fue 165 gr. con una desviacin estndar de 40 gr. Encuentre
el mayor error en la estimacin de la media poblacional, con una confianza de 95%.
Parmetro:
Estimador: X
n30: muestra grande
1
S S = 40
E = z/2
= 1.96 (
40
50
) = 11.08 gr.
Conclusin
Se puede afirmar con una confianza de 95% que al usar la media muestral para estimar
a la media poblacional el error no exceder en mas de 11.08 gr.
.
n = Z / 2
E
4.4721
n = Z / 2
= 2.575
= 132.6 n 133
E
1
Conclusin
Debe usarse una muestra de tamao 133
EJERCICIOS
1) Calcule Z0.025
2) La media de la presin sangunea de 40 mujeres de edad avanzada es 140. Si estos datos
se pueden considerar como una muestra aleatoria de una poblacin cuya desviacin estndar
es 10, encuentre, con una confianza de 95%, el mayor error en la estimacin de la media
poblacional.
O equivalentemente:
| Z | z/2
Como se supone que la muestra es grande, por el teorema del lmite central
X
Z=
,
tiene distribucin normal estndar aproximadamente
/ n
Sustituyendo se obtiene:
X
- z/2 / z/2 con probabilidad 1 -
n
De donde al despejar el parmetro de inters se tiene,
X-
z/2
X + z/2
n
, con
probabilidad 1 -
X + z/2
X - z/2
n
n
Los valores extremos se denominan lmites de confianza
n 30,
Ejemplo
Se ha tomado una muestra aleatoria de 50 artculos producidos por una industria y se obtuvo
que la media muestral del peso de los artculos fue 165 gr. con una desviacin estndar de 40
gr. Encuentre un intervalo para la media poblacional, con un nivel de confianza de 98%.
Parmetro:
Estimador: X
n 30: muestra grande
X-
z/2 X + z/2
n
n
Sustituimos los datos
40
40
165 - 2.33
165 + 2.33
50
50
151.8
178.1
Conclusin
Se puede afirmar con una confianza de 98% que la media poblacional se encuentra
entre 151.8 y 178.1 gr.
En forma similar al caso considerado para el intervalo de confianza bilateral, se pueden obtener
frmulas para intervalos de confianza unilaterales que contengan a la media con una
probabilidad especificada
Definicin: Estimacin por intervalo para la media
Intervalo de confianza para
30,
X + z
n
X - z
n
EJERCICIOS
1) De una poblacin con distribucin desconocida se tom una muestra aleatoria de tamao 40
y se obtuvo una media de 65.2 y una desviacin estndar de 16. Construya un intervalo de
confianza de 90% para la media poblacional.
2) Un fabricante de pinturas desea determinar el tiempo promedio de secado de una nueva
pintura. En 36 pruebas realizadas obtuvo un tiempo de secado medio de 64.2 minutos con una
desviacin estndar de 8.5 minutos. Construya un intervalo de confianza unilateral inferior de
95% para la media del tiempo de secado de la nueva pintura.
MATLAB
Obtencin de intervalos de confianza para la media, n 30
Se pueden calcular intervalos de confianza usando la funcin inversa de la distribucin normal
>> p = [0.01, 0.99];
>> x = norminv(p, 165, 40/sqrt(50))
x=
151.8402 178.1598
O equivalentemente:
| T | t/2
Como se supone que la muestra es grande, por el teorema del lmite central
X
T=
,
tiene distribucin normal estndar aproximadamente
s/ n
Sustituyendo en la desigualdad se obtiene:
X
|
| t/2
con probabilidad 1 -
s/ n
s
De donde | X - | t/2
con probabilidad 1 - .
n
| X - | es el error en la estimacin del parmetro mediante X
Definicin: Estimacin puntual de la media, n < 30
E = z/2
s
n
Ejemplo
Se ha tomado una muestra aleatoria de 20 artculos producidos por una industria y se obtuvo
que el peso de la media muestral fue 165 gr. con una desviacin estndar de 40 gr. Encuentre
el mayor error en la estimacin de la media poblacional, con una confianza de 95%. Suponga
que la poblacin tiene distribucin normal.
Solucin
Parmetro: , poblacin normal, varianza desconocida
Estimador: X
n <30: muestra pequea
1 = 0.95
E = t/2
s
n
= 2.093(
20
) = 18.72 gr.
Conclusin
Se puede afirmar con una confianza de 95% que al usar la media muestral para
estimar a la media poblacional, el error no exceder a 18.72 gr.
EJERCICIOS
Un inspector de alimentos examina una muestra aleatoria de 10 artculos producidos por una
fbrica y obtuvo los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6, 1.8, 3.2,
2.0, 2.1. Suponiendo que la poblacin tiene distribucin normal, encuentre el mayor error en la
estimacin de la media poblacional, con una confianza de 95%.
Consideremos la distribucin T separando el rea en tres partes. La porcin central con rea o
probabilidad 1 - , y dos porciones simtricas a los lados con rea o probabilidad /2 cada
una, siendo un valor especificado
X
en la desigualdad
s
n
Se obtiene:
t/2
s
n
Definicin
t/2
s
n
X + t/2
n
Ejemplo
De una poblacin con distribucin normal se tom una muestra aleatoria de 4 observaciones
obtenindose: 9.4, 12.2, 10.7, 11.6. Encuentre un intervalo para la media poblacional, con un
nivel de confianza de 90%
Parmetro: , poblacin normal, varianza desconocida
Estimador: X
n<30: muestra pequea
Calculamos la media y varianza muestrales:
X=
2
S=
x =
10.975i n i=1
n
1
xi4=
i=1
1
1
2
(xi x)2 = [(9.4 10.975) + ... ] = 1.4825
n 1 i=1
3
2
S= S =
1.4825 = 1.2176
1 = 0.90
Conclusin
Se puede afirmar con una confianza de 90% que la media poblacional
se encuentra entre 9.5425 y 12.4075
EJERCICIOS
1) De una poblacin con distribucin normal y varianza 225 se tom una muestra aleatoria de
tamao 20 y se obtuvo una media de 64.5. Construya un intervalo de confianza de 95% para
la media poblacional.
2) Un fabricante de pinturas desea determinar el tiempo promedio de secado de una nueva
pintura. En diez pruebas realizadas obtuvo un tiempo de secado medio de 65.2 minutos con
una desviacin estndar de 9.4 minutos. Construya un intervalo de confianza de 95% para la
media del tiempo de secado de la nueva pintura. Suponga que la poblacin es normal.
3) El peso de seis artculos de una muestra aleatoria tomada de la produccin de una fbrica
fueron: 0.51, 0.59, 0.52, 0.47, 0.53, 0.49 kg. Encuentre un intervalo de confianza de 98% para
la media del peso de todos los artculos producidos. Suponga distribucin normal.
MATLAB
Obtencin de intervalos de confianza para la media, n < 30
>> u = [9.4 12.2 10.7 11.6];
Vector conteniendo una muestra de cuatro datos
>> m = mean(u)
Media muestral
m=
10.9750
>> s = std(u)
Desviacin estndar muestral
s=
1.2176
>> ta = tinv(0.95,3)
Valor del estadstico t para = 0.05, = 3
ta =
2.3534
>> x =[m - ta*s/sqrt(4), m+ta*s/sqrt(4)] Intervalo de confianza bilateral para
x=
9.5423 12.4077