Академический Документы
Профессиональный Документы
Культура Документы
Cuando queremos realizar un estudio de una poblacin cualquiera de la que desconocemos sus parmetros, por ejemplo su media poblacional o la probabilidad de xito si la poblacin sigue una distribucin binomial, debemos tomar una muestra aleatoria de dicha poblacin a travs de la cual calcular una aproximacin a dichos parmetros que desconocemos y queremos estimar. Bien, pues esa aproximacin se llama estimacin. Adems, junto a esa estimacin, y dado que muy probablemente no coincida con el valor real del parmetro, acompaaremos el error aproximado que se comete al realizarla.
om
Una estimacin puntual del valor de un parmetro poblacional desconocido (como puede ser la media , o la desviacin estndar ), es un nmero que se utiliza para aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar tal estimacin, tomaremos una muestra de la poblacin y calcularemos el parmetro muestral asociado ( x para la media, s para la desviacin estndar, etc.). El valor de este parmetro muestral ser la estimacin puntual del parmetro poblacional. Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y calculan la media de esta muestra, este valor ser un estimador puntual de la media de la poblacin. Qu propiedades debe cumplir todo buen estimador?
ww w.
M at
em
at
ic a1
Estimacin puntual
.c
Insesgado: Un estimador es insesgado cuando la media de su distribucin muestral asociada coincide con la media de la poblacin. Esto ocurre, por ejemplo, con el estimador x , ya que x = y con estimador p ya que p = p De varianza mnima: La variabilidad de un estimador viene determinada por el cuadrado de su desviacin estndar. En el caso del estimador x , su desviacin estndar es
x =
p =
p*(1 p) n
Observar que cuanto mayor sea el tamao de la muestra n , menor ser la variabilidad del estimador x y de p, por tanto, mejor sern nuestras estimaciones.
Estimacin por intervalo Dada una poblacin X, que sigue una distribucin cualquiera con media y desviacin estndar .
1.c
om
ic a
x sigue
ww w.
2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estndar de la media.
at
em
x =
at
x = y desviacin estndar
Intervalos de confianza.
1. Intervalo de confianza para con conocida. Un vendedor mayorista de partes automotrices necesita una estimacin de la vida media que puede esperar de los limpiaparabrisas en condiciones normales de manejo. La administracin de la empresa ya ha determinado que la desviacin estndar de la vida til de la poblacin es de seis meses. Supongamos que se selecciona una sola muestra aleatoria de 100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21 meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la poblacin de los limpiaparabrisas. Tenemos X como la distribucin de la vida til en meses de la poblacin de limpiaparabrisas, no sabemos qu distribucin tiene, al igual que desconocemos su media. En este caso s conocemos la desviacin estndar poblacional.
X ( , = 6)
om
La media muestral normal:
deja un rea de 0,9 entre Z Y +Z es Z=1,96. O de otro modo, como el nivel de confianza es 0,9, = 0,05 , entonces el valor Z que deja su derecha un rea de
Con una confianza del 95%, la vida media de la poblacin de limpiaparabrisas que vende este mayorista est entre 19,824 meses y 22,176 meses. Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional en meses de todos los parabrisas que vende este mayorista.
ww w.
X Z 0 , 05
at
Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la poblacin de limpiaparabrisas, es decir para
em
at
ic a
X N ( x = , x = / n )
1.c
El administrador de una planta industrial generadora de energa desea estimar, por intervalo, la cantidad de carbn que se consumi por termino medio semanalmente durante ao pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400 toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el intervalo de confianza del 95% para el consumo medio semanal durante el ao pasado?. (supongamos normalidad).
Tenemos X como la distribucin de toneladas de carbn consumidas cada semana del ao pasado por la planta de energa y su media y su desviacin estndar desconocidas
X (, )
Aunque n < 30, suponemos que la media muestral, X , sigue una distribucin normal
X N( x = , S x = S / n )
Para estimar la desviacin estndar poblacional vamos a utilizar la desviacin estndar muestral S que es 700 toneladas. Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladas de carbn en cada semana del ao pasado, es decir para , ser:
las tablas, t(10 1, 0,05 ) = 2,262 , una t-Student con 10 1 = 9 grados de libertad que
Utilizamos la t-Student porque la desviacin estndar poblacional es desconocida. En deja su derecha un rea de 0,025. = 0,05 porque el nivel de confianza es de
1 = 0,95
Con una confianza del 95%, el consumo promedio semanal de carbn durante el ao pasado por esta planta de energa estar entre 10.899 toneladas y 11.901 toneladas. Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir al consumo promedio poblacional de toneladas de carbn por semana durante el ao pasado por la planta de energa.
ww w.
at
em
at
ic a
1.c
om
3. Intervalo de confianza para la probabilidad de xito p en una binomial. Durante un ao y medio las ventas han estado disminuyendo de manera coherente en los 1.500 establecimientos de una cadena de comida rpida. Un empresa de consultora ha determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una mala administracin. Construir un intervalo de confianza del 95% para esta porcin. A la poblacin de todos los establecimientos de sta cadena de comida rpida le vamos a llamar X que seguir una binomial con probabilidad de xito, probabilidad de tener signo de mala administracin, p desconocida. A fin de estimar dicho parmetro, se toma una muestra de tamao n = 95 y definimos p como la proporcin de xitos en la muestra. En este caso p es 0,3 y 1- p = 0,7. Como n > 20, n p 5 y aproximadamente normal, i.e.:
n (1 p) 5 , entonces la distribucin X es
X N(np, np(1 p) )
Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p.
Por lo tanto la estimacin del error estndar de la proporcin de establecimientos que tiene claros signos de mala ser 0,057. El intervalo de confianza del 95% para la probabilidad de xito poblacional p viene dado por:
donde
Z = Z 0 ,05 = 1,96 es el valor z*, de manera que el 95% del rea bajo la curva
2 2
normal se incluye entre 1,96 y 1,96. Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de esta cadena de comida rpida que tiene mala administracin estar entre 0,20788 y 0,39212. Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de establecimientos con mala administracin
ww w.
P =
at
em
at
p N(p,
p(1 p) ) n
con:
ic a
1.c
Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la proporcin de la poblacin tendr la siguiente distribucin:
om
Z Confidence Intervals
The assumed sigma = 500 Variable C1 N 15 Mean 8871 StDev 586 SE Mean 129 95,0 % CI 8618; 9124)
ww w.
at
em
at
ic a
(
1.c
om
b) Suponiendo ahora que no conoces la desviacin tpica, halla un intervalo de confianza, a nivel del 95%, para . Compara este nuevo intervalo con el anterior. Seleccionamos Stat > Basic Statistics > 1-Sample t:
at
em
StDev 586
ic a
SE Mean 151
1.c
( 95,0 % CI 8546; 9195)
Observar que el primer intervalo est contenido en el segundo, i.e.: el segundo intervalo es menos preciso que el primero. Ello es lgico si tenemos en cuenta que para hallar el primer intervalo disponamos de mayor informacin (conocamos el valor de la desviacin tpica), por lo que el resultado es ms preciso. c) Suponiendo que no conoces la desviacin tpica, halla un intervalo de confianza, a nivel del 90%, para . Compara este intervalo con el obtenido en b).
T Confidence Intervals
Variable C1
N 15
ww w.
at
Mean 8871
StDev 586
SE Mean 151 (
om
Ahora, como somos menos exigentes por lo que al nivel de confianza se refiere (hemos pasado del 95 al 90%), lo que cabra esperar es que el intervalo obtenido est contenido dentro del hallado en b). Observar que, en efecto, se cumple esta previsin.
2.
Se quiere analizar el ndice de productividad de los trabajadores de una empresa industrial, y se ha tomado una muestra aleatoria de 200 empleados y se ha observado que el 5% de ellos no alcanzan el nivel mnimo productivo que se quiere conseguir de cada uno de ellos. Calcular un intervalo de confianza del 95% para la proporcin de empleados que no llegan al nivel de productividad fijado. Nos interesa calcular un intervalo de confianza del 95% para la probabilidad p, de no alcanzar el nivel mnimo requerido. Adems, comprobamos que efectivamente se cumplen las hiptesis de normalidad: n=200 >>30, n*p= 200*0.09 > 5 y n*p*(1-p) > 5
X N(np, np(1 p) )
Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p. Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la proporcin de la poblacin tendr la siguiente distribucin:
Seleccionamos Options, con las siguientes condiciones: Ponemos el nivel de confianza del intervalo, la proporcin del contraste que en este caso no nos interesa porque slo queremos calcular el intervalo de confianza, por lo que en esta opcin pondremos, o por omisin nos pondr, 0,5.
ww w.
at
Para calcular el intervalo de confianza, seleccionamos: Stat > Basic Statistics > 1 Proportion:
em
at
p N(p,
ic a
1.c
p(1 p) ) n
om
En la alternativa ponemos lo que aparece como estndar, no igual y activamos la casilla de utilizar la normal para calcular el intervalo de confianza.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de trabajadores que no alcanzan el nivel mnimo de productividad requerido.
ww w.
Observamos que el intervalo de confianza est entre 0,0198 y 0,080. Por tanto, podemos concluir que con una confianza del 95%, la proporcin de trabajadores de esta empresa que no alcanzan el nivel mnimo de productividad requerido estar entre el 2% y el 8%.
at
em
at
ic a
Sample 1
X 10
N 200
Sample p 0,050000
1.c
om
Z-Value -12,73
P-Value 0,000