Вы находитесь на странице: 1из 11

Estimacin puntual y estimacin por intervalos de

confianza

ESTIMACIN PUNTUAL Y ESTIMACIN POR INTERVAL


Autores: ngel A. Juan (ajuanp@uoc.edu), Mximo Sedano (msedanoh@uoc.edu), Alicia Vila
(avilag@uoc.edu).

ESQUEMA DE CONTENIDOS
Propiedades

Definicin

INTRODUCCIN

Estimacin
Puntual

En este math-block, se pretende conocer y saber calcular las estimaciones puntuales y por
intervalo para la media ya sea conocida
o no la desviacin
estndar poblacional-,
Tipos as
de como las
Estimacin
por
Definicin
estimaciones
para la probabilidad de xito
en
una
binomial.
estimaciones por intervalo
Intervalo
En el caso en que conozcamos todos los elementos de una poblacin, es sencillo calcular todos
los parmetros asociados; sin embargo, en la mayora de casos no ser as, y necesitaremos
estimar algunos de ellos a partir de los parmetros de la muestra.
Casos prcticos
Proyecto e-Math
Financiado por la Secretara de Estado
dedefinicin
Educacin y Universidades (MECD)
Por la

OBJETIVOS

Entender los conceptos de estimacin puntual y estimacin por intervalos.

Calcular las estimaciones para la media poblacional, tanto en el caso en que la desviacin
estndar poblacional sea conocida como en el caso de que sea desconocida.

Calcular las estimaciones (puntuales y por intervalos) para la probabilidad de xito de una
binomial.

Saber interpretar correctamente los resultados de las estimaciones por intervalos.

CONOCIMIENTOS PREVIOS

Es recomendable haber ledo, previamente los math-blocks: Estadstica Descriptiva con Minitab,
La distribucin binomial y La distribucin normal.

CONCEPTOS FUNDAMENTALES
Q

Qu es una estimacin?
Cuando queremos realizar un estudio de una poblacin cualquiera de la que desconocemos sus
parmetros, por ejemplo su media poblacional o la probabilidad de xito si la poblacin sigue una
distribucin binomial, debemos tomar una muestra aleatoria de dicha poblacin a travs de la cual
calcular una aproximacin a dichos parmetros que desconocemos y queremos estimar. Bien,
pues esa aproximacin se llama estimacin.
Adems, junto a esa estimacin, y dado que muy probablemente no coincida con el valor real del
parmetro, acompaaremos el error aproximado que se comete al realizarla.

Estimacin puntual
Una estimacin puntual del valor de un parmetro poblacional desconocido (como puede ser la
media , o la desviacin estndar ), es un nmero que se utiliza para aproximar el verdadero
valor de dicho parmetro poblacional. A fin de realizar tal estimacin, tomaremos una muestra de
la poblacin y calcularemos el parmetro muestral asociado ( x para la media, s para la
desviacin estndar, etc.). El valor de este parmetro muestral ser la estimacin puntual del
parmetro poblacional.
Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y
calculan la media de esta muestra, este valor ser un estimador puntual de la media de la
poblacin.
Qu propiedades debe cumplir todo buen estimador?

Insesgado: Un estimador es insesgado cuando la media de su distribucin muestral


asociada coincide con la media de la poblacin. Esto ocurre, por ejemplo, con el
estimador x , ya que x y con estimador p ya que p p

De varianza mnima: La variabilidad de un estimador viene determinada por el


cuadrado de su desviacin estndar. En el caso del estimador x , su desviacin estndar
es x

, tambin llamada error estndar de .

En el caso del error estndar de p,

p*(1 p)
p
n

Observar que cuanto mayor sea el tamao de la muestra n , menor ser la variabilidad
del estimador x y de p, por tanto, mejor sern nuestras estimaciones.

Estimacin por intervalo


Dada una poblacin X, que sigue una distribucin cualquiera con media y desviacin estndar
.
1. Sabemos (por el TCL) que, para valores grandes de n , la media muestral x sigue
una distribucin aproximadamente normal con media
y desviacin estndar
x

2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal,
aproximadamente un 95% de los datos estaban situados a una distancia inferior a
dos desviaciones estndar de la media.
De lo anterior se deduce que:

P(2 x 2x ) 0,95 ,
x

0,95 P(x 2x ) P(x 2x ) P(x 2x ) P(x 2x )


P(x 2x x 2x ) 0,95
Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad de que la
media de la poblacin est contenida en l es de 0,95.
Este tipo de intervalos se llaman intervalos de confianza de un parmetro poblacional. El nivel
de confianza (1 - ) del intervalo es la probabilidad de que ste contenga al parmetro
poblacional. En el ejemplo anterior, el nivel de confianza era del 95% (= 0,05).

Intervalos de confianza.

1. Intervalo de confianza para con conocida.

Un vendedor mayorista de partes automotrices necesita una estimacin de la vida media que
puede esperar de los limpiaparabrisas en condiciones normales de manejo. La administracin
de la empresa ya ha determinado que la desviacin estndar de la vida til de la poblacin es
de seis meses. Supongamos que se selecciona una sola muestra aleatoria de 100
limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21
meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la poblacin
de los limpiaparabrisas.
Tenemos X como la distribucin de la vida til en meses de la poblacin de
limpiaparabrisas, no sabemos qu distribucin tiene, al igual que desconocemos su media.
En este caso s conocemos la desviacin estndar poblacional.

X ( , 6)
La media muestral
normal:

por el teorema central del lmite se va a aproximar la distribucin

X N (x , / n )
x

Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la
poblacin de limpiaparabrisas, es decir para

X Z 0,05

6
n 21 1,96 100 21 1,176 [19,824 ; 22,176]

Z Z 0,05 Z 0,025 1,96 , es decir que el valor Z de la tabla de la normal estndar que
2 2

deja un rea de 0,9 entre Z Y +Z es Z=1,96. O de otro modo, como el nivel de confianza
es 0,9, 0,05 , entonces el valor Z que deja su derecha un rea de

0,05 0,025 y a la izquierda de Z un rea de 0,05 0,025 es Z=1,96


2
2
2
2
El error mximo de estimacin es la mitad de la longitud del intervalo, E = z(/2) *

Con una confianza del 95%, la vida media de la poblacin de limpiaparabrisas que vende
este mayorista est entre 19,824 meses y 22,176 meses.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional
en meses de todos los parabrisas que vende este mayorista.

2. Intervalo de confianza para con desconocida.

El administrador de una planta industrial generadora de energa desea estimar, por


intervalo, la cantidad de carbn que se consumi por termino medio semanalmente
durante ao pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue
de 11.400 toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el
intervalo de confianza del 95% para el consumo medio semanal durante el ao pasado?.
(supongamos normalidad).

Tenemos X como la distribucin de toneladas de carbn consumidas cada semana del


ao pasado por la planta de energa y su media y su desviacin estndar desconocidas

X (,
)

Aunque n < 30, suponemos que la media muestral, X , sigue una distribucin normal

X N(x , Sx S / n )
Para estimar la desviacin estndar poblacional vamos a utilizar la desviacin
estndar muestral S que es 700 toneladas.
Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladas
de carbn en cada semana del ao pasado, es decir para , ser:

S
700
X t(n 1,
11.400 500,76 (10.899 ; 11.901)
) n 11.400 2,262

2
10

Utilizamos la t-Student porque la desviacin estndar poblacional es desconocida. En


las tablas,

t(10 1, 0,05 ) 2,262 , una t-Student con 10 1 = 9 grados de libertad que


2
deja su derecha un rea de 0,025. 0,05 porque el nivel de confianza es de
1 0,95
Con una confianza del 95%, el consumo promedio semanal de carbn durante el ao
pasado por esta planta de energa estar entre 10.899 toneladas y 11.901 toneladas.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de todos los intervalos van a incluir al consumo promedio
poblacional de toneladas de carbn por semana durante el ao pasado por la planta de
energa.

3. Intervalo de confianza para la probabilidad de xito p en una binomial.


Durante un ao y medio las ventas han estado disminuyendo de manera coherente en
los 1.500 establecimientos de una cadena de comida rpida. Un empresa de consultora
ha determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una
mala administracin. Construir un intervalo de confianza del 95% para esta porcin.
A la poblacin de todos los establecimientos de sta cadena de comida rpida le vamos
a llamar X que seguir una binomial con probabilidad de xito, probabilidad de tener
signo de mala administracin, p desconocida. A fin de estimar dicho parmetro, se
toma una muestra de tamao n = 95 y definimos pcomo la proporcin de xitos en la
muestra. En este caso pes 0,3 y 1- p= 0,7.
Como

>

20,

n p5

y
aproximadamente normal, i.e.:

n (1 p) 5 , entonces
np(1 p)
X N(np,

la

distribucin

es

Como p es desconocida, la aproximaremos por pque es la estimacin puntual de p.


Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la
proporcin de la poblacin tendr la siguiente distribucin:

pN(p,

p(1 p)
)
n

con:

0,3 0,7
Pp(1 p)
0,047
95
n
Por lo tanto la estimacin del error estndar de la proporcin de establecimientos que
tiene claros signos de mala ser 0,057.
El intervalo de confianza del 95% para la probabilidad de xito poblacional p viene dado
por:

p Z 0,3 1,96 0,047 0,3


P
2
0,0921
donde

[0,20788; 0,39212]

Z Z 0,05 1,96 es el valor z*, de manera que el 95% del rea bajo la curva
2
2

normal se incluye entre 1,96 y 1,96.


Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de
esta cadena de comida rpida que tiene mala administracin estar entre 0,20788 y
0,39212.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de
establecimientos con mala administracin

CASOS PRCTICOS CON SOFTWARE


1.

Imaginemos que trabajamos para una multinacional que se dedica a la venta de pantallas LCD.
El departamento de ingeniera ha realizado pruebas de duracin sobre una muestra aleatoria
de 15 pantallas LCD, obteniendo los siguientes resultados (en horas de duracin):
10014,8

8056,2

9166,1

8363,2

8869,7

8680,0

8930,4

8426,8

9488,3

8426,3

8924,6

7911,9

9667,2

8914,2

9220,2
Supondremos que la duracin (en horas de funcionamiento) de estas pantallas es una variable
aleatoria que se distribuye de forma normal con desviacin tpica = 500 horas.
a) Hallar un intervalo de confianza, a nivel del 95% para la media poblacional (duracin
media de una pantalla LCD).
Seleccionamos Stat > Basic Statistics > 1-Sample Z

Z Confidence Intervals
The assumed sigma = 500

Variable
C1

N
15

Mean
8871

StDev
586

SE Mean
129

95,0 %
CI
8618;

9124)

b) Suponiendo ahora que no conoces la desviacin tpica, halla un intervalo de confianza, a


nivel del 95%, para . Compara este nuevo intervalo con el anterior.
Seleccionamos Stat > Basic Statistics > 1-Sample t:

T Confidence Intervals
Variable
C1

N
15

Mean
8871

StDev
586

SE Mean
151

95,0 % CI
8546;
9195)

Observar que el primer intervalo est contenido en el segundo, i.e.: el segundo intervalo es
menos preciso que el primero. Ello es lgico si tenemos en cuenta que para hallar el
primer intervalo disponamos de mayor informacin (conocamos el valor de la desviacin
tpica), por lo que el resultado es ms preciso.
c) Suponiendo que no conoces la desviacin tpica, halla un intervalo de confianza, a nivel del
90%, para . Compara este intervalo con el obtenido en b).
T Confidence Intervals

Variable
C1

Mean

StDev

SE Mean

15

8871

586

151

90,0 % CI
(

8604;

9137)

Ahora, como somos menos exigentes por lo que al nivel de confianza se refiere (hemos
pasado del 95 al 90%), lo que cabra esperar es que el intervalo obtenido est contenido
dentro del hallado en b). Observar que, en efecto, se cumple esta previsin.

2.

Se quiere analizar el ndice de productividad de los trabajadores de una empresa industrial, y


se ha tomado una muestra aleatoria de 200 empleados y se ha observado que el 5% de ellos
no alcanzan el nivel mnimo productivo que se quiere conseguir de cada uno de ellos. Calcular
un intervalo de confianza del 95% para la proporcin de empleados que no llegan al nivel de
productividad fijado.
Nos interesa calcular un intervalo de confianza del 95% para la probabilidad p, de no alcanzar
el nivel mnimo requerido.
Adems, comprobamos que efectivamente se cumplen las hiptesis de normalidad:
n=200 >>30, n*p= 200*0.09 > 5 y n*p*(1-p) > 5

np(1 p)
X N(np,

Como p es desconocida, la aproximaremos por pque es la estimacin puntual de p.


Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la
proporcin de la poblacin tendr la siguiente distribucin:

pN(p,

p(1 p)
)
n

Para calcular el intervalo de confianza, seleccionamos: Stat > Basic Statistics > 1 Proportion:

Seleccionamos Options, con las siguientes condiciones:


Ponemos el nivel de confianza del intervalo, la proporcin del contraste que en este caso no
nos interesa porque slo queremos calcular el intervalo de confianza, por lo que en esta opcin
pondremos, o por omisin nos pondr, 0,5.

En la alternativa ponemos lo que aparece como estndar, no igual y activamos la casilla de


utilizar la normal para calcular el intervalo de confianza.

Confidence Interval for One Proportion


Test of p = 0,5 vs p not = 0,5
Sample

NSample p

95,0 % CI

Z-ValueP-Value

Observamos que el intervalo


de confianza est entre 0,0198 y 0,080. Por -12,73
tanto, podemos
2000,050000(0,019795; 0,080205)
0,000
1
10
concluir que con una confianza del 95%, la proporcin de trabajadores de esta empresa que no
alcanzan el nivel mnimo de productividad requerido estar entre el 2% y el 8%.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de
trabajadores que no alcanzan el nivel mnimo de productividad requerido.

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

10

BIBLIOGRAFA
[1]

Lind, D.; Mason, R.; Marchal, W. (2001): Estadstica para Administracin y Economa.
Irwin McGraw-Hill.F.

[2]

Kvanli, A. (2000) Introduction to Business Statistics South-Western.

[3]

Johnson, R. (1996): Elementary Statistics. Ed. Duxbury.

[4]

Levin, R.; Rubin, D. (1996): Estadstica para Administradores. Ed. Prentice Hall.

[5]

Farber, E. (1995): A Guide to Minitab. Ed. McGraw-Hill

ENLACES

http://oak.cats.ohiou.edu/~wallacd1/shyp.html
Definicin y ejemplos de contraste de hiptesis de una poblacin conocida la media y la
desviacin estndar de la poblacin.

http://www.unalmed.edu.co/~estadist/C.L.T/T_C_L.htm
Caractersticas y applet del Teorema Central del lmite.

http://www.unalmed.edu.co/~estadist/confinterval/intervalconf.htm
Caractersticas y applet del concepto de Intervalo de confianza.

http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.html
Caractersticas y applet del concepto de Intervalo de confianza.

http://e-stadistica.bio.ucm.es/mod_contraste/contraste_applet.html
Applet sobre contraste de hiptesis para muestras independientes.

http://oak.cats.ohiou.edu/~wallacd1/ssample.html
Teoria y ejemplos sobre distribuciones muestrales

http://kitchen.stat.vt.edu/~sundar/java/applets/
Aplicaciones estadsticas con JAVA

http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.html
Applets sobre estimacin por intervalos

Ed.