You are on page 1of 13

APUNTES: ESTIMACIN PUNTUAL Y POR INTERVALOS ASIGNATURA: ESTADSTICA MATERIA: INFERENCIA ESTADSTICA PROFESOR: Carlos Flores Carvajal.

INTRODUCCIN A LA INFERENCIA ESTADSTICA. La Inferencia Estadstica es el procedimiento por medio del cual se llega a conclusiones acerca de una poblacin con base en la informacin que se obtiene a partir de una muestra seleccionada de esa poblacin El proceso de Estimacin implica calcular, a partir de los datos de una muestra, alguna estadstica que se ofrece como aproximacin correspondiente de la poblacin de la cual fue extrada la muestra.. El razonamiento en el que se basa la estimacin en el campo de la administracin se apoya en la suposicin de que los investigadores tengan inters en parmetros, como la Media y la Proporcin, de varias poblaciones. Si ste es el caso, existe una buena razn por la que se debe confiar en los procedimientos de la estimacin para obtener informacin respecto a dichos parmetros: Muchas poblaciones de inters, aunque finitas, son tan grandes que el costo de un estudio del 100% sera prohibitivo. Suponga que el administrador de un gran hospital le interesa saber la edad promedio de los pacientes internados en el transcurso de un ao. Es posible que considere demasiado laborioso consultar el registro de cada paciente internado en el transcurso de ese ao y, en consecuencia, decide examinar una muestra de los registros a partir de la cual sea posible calcular una estimacin de la edad promedio de los pacientes internados en ese ao. Este caso ejemplifica el inters por estimar la media y la proporcin de la poblacin. Otros parmetros cuya estimacin, son la diferencia entre dos medias, entre dos proporciones, la varianza de la poblacin. Se encontrara para cada uno de los parmetros estudiados, es posible calcular dos tipos de estimacin. PUNTUAL ESTIMACIN POR INTERVALOS Una Estimacin Puntual es solo un valor numrico utilizado para estimar el parmetro correspondiente de la poblacin. ESTIMADORES PUNTUALES Parmetro de la Poblacin Media Estimados X X1 - X2

1 - 2
Proporcin,

P1 - P2
S S

Varianza

Desviacin Estndar

N 2 Se define el Valor Esperado de la Media y el Error Estndar de la media de la siguiente manera.

E(X)=

x =

x =

= N n / N 1 n

Factor de Correccin

Nota: Cuando el tamao de la muestra es menor que el 5% del tamao de la poblacin. El Factor de correccin se puede omitir. EJEMPLO: Un administrador de un hospital pblico, toma una muestra aleatoria de tamao n = 16 de fichas de pacientes de un conjunto de N = 100 fichas. No se conoce la desviacin estndar de los registros para el total de las 100 fichas . Sin embargo, la desviacin estndar de la muestra es S = 57. Determinar el error estndar para la distribucin muestral de la media. Solucin:

x=

Poblacin

S x = Muestra

SX =

s n

N n / N 1

57 100 16 / 100 1 = 13,126 13.13 16

En este ejemplo se estima el error estndar de la media con base en la desviacin estndar muestral, y se requiere utilizar el factor de correccin por poblacin finita. Porque 16 > 5 % de N (poblacin). El Error Estndar de la Media ofrece la base principal para la Inferencia Estadstica con relacin a la media de una poblacin que se desconoce. Un teorema de la Estadstica que conduce a la utilidad del error estndar de la media es: TEOREMA DEL LMITE CENTRAL. Al aumentar el tamao de la muestra, la distribucin muestral de la media se aproxima a la forma de la distribucin normal sin importar la forma de la distribucin de las mediciones individuales de la poblacin. Para propsitos prcticos, puede suponerse que la distribucin que la distribucin muestral de la media es aproximadamente normal cuando el tamao de la muestra es n 30. Por ello, si se tiene una muestra grande de n 30 puede utilizarse siempre la DISTRIBUCIN NORMAL DE PROBABILIDAD junto con el error estndar de la media. Adems, si la poblacin tiene distribucin normal y se conoce la desviacin estndar de la poblacin, puede utilizarse la distribucin normal para hacer inferencias estadsticas a partir de muestras pequeas. EJEMPLO. Un administrador de un banco toma una muestra de tamao n = 36 de una poblacin de 1000 cuentas por cobrar. El valor promedio de las cuentas por cobrar de la poblacin es = $ 26000 con una desviacin estndar poblacional de = $ 4500. Cul es la probabilidad de que la media muestral sea inferior a $ 25000? Se describe la distribucin muestral mediante la media y el error estndar.

N 3

E ( X ) = = $ 26000 ( dado )

4500 4500 = = = 750 6 n 36

Z=

25000 26000 = 1.33 750

Valor de Z en la tabla = 0.0918

P ( X < 25000

= 26000;

= 750 )

Con relacin al ejercicio anterior. Cul es la probabilidad de que la media muestral se encuentre a no ms de $ 1500 de la media de la poblacin? Z1 = Z2 =
24500 26000 = 2 0.4772 750 27500 26000 = +2 0.4772 750

Z1 + Z2 = 0.9544 = 95 %

INTERVALOS DE CONFIANZA PARA ESTIMAR LA MEDIA UTILIZANDO LA DISTRIBUCIN NORMAL. Una estimacin por intervalos de confianza de dos valores numricos que definen un intervalo que, con un grado especfico de confianza, se considera que incluye al parmetro por estimar. Suponga que un grupo de investigadores quiere estimar la media de una poblacin que sigue una distribucin normal. Para ello, extraen una muestra aleatoria de tamao n de la poblacin y calculan el valor de X (media muestral), el cual utilizan como estimacin puntual de . Aunque este estimador de posee todas las cualidades de un buen estimador, se sabe que, debido a los caprichos del muestreo aleatorio no se puede esperar que X (media muestral) sea igual (media poblacional). Por lo tanto, sera mucho ms significativo estimar mediante un intervalo que de alguna forma muestre su probable magnitud . Cuando puede utilizarse la distribucin normal de probabilidad, el intervalo de confianza para la media se determina mediante: X
+

x ( Poblacin )

Z Sx

Los intervalos de confianza que se utilizan con mayor frecuencia son los de 90, 95, y 99%. PROPORCIONES SELECCIONADAS DE REAS BAJO LA CURVA NORMAL. Z (n de unidades de desde la media 1.645 1.96 2.58 EMEPLO N 1 Suponga que se sabe que la desviacin estndar de la vida til de los lentes de una marca especifica de microscopios es = 500 horas, pero no se conoce el promedio de vida til en trminos generales, se supone que la vida til de los lentes tiene una distribucin aproximadamente normal. Para una muestra de n = 15, la vida til promedio es de X = 8900 horas. Construya intervalos de confianza para estimar la media de la poblacin. a) con el 95% b) con el 90% de confianza. Proporcin reas en el Intervalo 0.90 0.95 0.99

N 4

En este caso puede utilizarse la distribucin normal porque la poblacin tiene una distribucin normal y se conoce . . Solucin. a.- datos x = 8900 hrs. n = 15 = 500

x =

=
+

500 500 = = 129.20 3 .87 15

z x = 8900
+

1.96 * 129.20 = 8900


+

253.23 Intervalo 8647 a 9153 hrs

b.- 8900

1.645 (129.20) = 8900

212.53 Intervalo 8687 a 9113 hrs.

EJEMPLO N 2 Con relacin al ejemplo anterior, suponga que no puede asumirse que la vida til de la poblacin de los lentes tiene una distribucin normal. Sin embargo, la media muestral X = 8900 hrs se basa en una muestra de n = 35. Construya un intervalo de confianza del 95 % para estimar la media de la poblacin. En este caso, puede utilizarse la distribucin normal de probabilidad utilizando el Teorema del Lmite Central, que seala que cuando n 30 puede asumirse que la distribucin muestral tiene una distribucin normal, aun cuando no tenga distribucin normal. Solucin. X
+

Z x = 8900

1.96 *

+ 500 = 8900 165.5 35

Intervalo 8735 a 9066 hrs.

EJEMPLO N 3 Con relacin al ejemplo n 2, suponga que puede asumirse que la poblacin tiene distribucin, pero que se desconoce la desviacin estndar de la poblacin, ms bien, se sabe que la desviacin estndar muestral es S = 500 y X = 8900. Estime la media de la poblacin utilizando un intervalo de confianza del 90%. Solucin. La distribucin es normal. El lmite central. X
+

Z Sx

8900

1.645 *

500 35

8900

1.645 * 84.46

Intervalo 8761 a 9039 DETERMINACIN DEL TAMAO DE MUESTRA NECESARIO PARA ESTIMAR LA MEDIA.
z E

n=

Z = Al valor que se utiliza para el grado de confianza.

= La desviacin estndar de la poblacin ( o un estimador )


E = Es un factor de error mas o menos que se permite en el intervalo. Nota : Cuando se determina el tamao de la muestra, cualquier resultado fraccionario siempre se redondea hacia arriba. Adems, si el tamao de la muestra que se calcula est por debajo de

N 5

30, se debe incrementar a esta cantidad, por que la formula se basa en el uso de la distribucin normal. EJEMPLO N 4 Un administrador del departamento de personal del Ministerio de Salud desea estimar el nmero promedio de horas de capacitacin que se dan a los mdicos de cierta especialidad, con un error de ( ms o menos ) 3.0 horas y con una confianza del 90 %, con base en los datos de otros departamentos, estima que la desviacin estndar de las horas de capacitacin es = 20 horas. Determinar el tamao mnimo de la muestra que se requiere. Solucin. n=

z E

] = [

1.645 20 3

] = [ 10.9 ] = 118

LA DISTRIBUCIN

t DE STUDENT Y LOS INTERVALOS DE CONFIANZA PARA


LA MEDIA.

En los ejemplos anteriores se sealo que el uso de la distribucin normal en la estimacin de una media poblacional es vlida para cualquier muestra grande ( n 30 ), y para una muestra pequea ( n < 30 ) slo si la poblacin tiene distribucin y se conoce . Ahora, se revisa el caso en el que la muestra es pequea y la poblacin tiene una distribucin normal pero se desconoce . : Formula.
x ttabla ; gl =n 1 s x

EJEMPLO N 5 La vida til promedio de una muestra aleatoria de n = 10 focos es X = 4000 horas, con una desviacin estndar muestral S = 200 horas. Se supone que la vida til de los focos tiene una distribucin aproximadamente normal. Estimar la vida til promedio de la poblacin de los focos de la cual se tom la muestra, utilizando un intervalo de confianza del 95% Solucin. 4000 2.262
200 200 = 4000 2.262 = 4000 143.16 10 3.16

Limite inferior 4000 - 143.16 = 3857 horas horas

Limite superior = 4000 + 143.16 = 4143

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES. Con frecuencia es necesario estimar la diferencia entre dos medias poblacionales, tal como la diferencia entre los niveles de sueldos en dos empresas. Formula.
Si se conoce las desviaciones estndar poblacionales ( 1 y 2 ).

(x x ) z
1 2

tabla

2 12 2 + Error estndar de la diferencia entre dos medias, suponiendo que n1 n2

resulta apropiado el uso de la distribucin normal.

N 6
Donde:

n1 : es el tamao de la muestra tomada de la poblacin 1 n1 : es el tamao de la muestra tomada de la poblacin 2 x1 : es la media de la muestra tomada de la poblacin 1 x 2 : es la media de la muestra tomada de la poblacin 2 1 : es la desviacin estndar de la poblacin 1 2 : es la desviacin estndar de la poblacin 2 N es el tamao de la poblacin z tabla : es el valor z de la tabla N(0,1)

Cuando no se conocen las desviaciones estndar de las poblaciones, el error estndar de la diferencia entre las dos medias, suponiendo que resulta apropiado el uso de la distribucin normal.

(x

1 x 2 z tabla

2 s12 s 2 + n1 n2

S1 = es la desviacin estndar de la muestra 1 S2 = es la desviacin estndar de la muestra 2


Nota: Se debe utilizar los factores de correccin por poblacin finita cuando sea apropiado. EJEMPLO N 6 El salario diario promedio para una muestra de n = 30 de un laboratorio farmacutico grande es X = $ 28000 con una desviacin estndar de S = $ 1400. En otro laboratorio grande, una muestra aleatoria de n = 40 empleados tiene un salario promedio diario de $ 27000, con una desviacin estndar muestral de S = $ 1000. Determinar un intervalo de confianza del 99% para estimar la diferencia entre los niveles diarios de salarios en las empresas. Solucin. 28000 27000 2.575
(1400) 2 (1000) 2 + 30 40

2800 27000 2.575 300.55 $ 1000 773.92 $ 226.08 a $ 1773.92 $ 226 a $ 1774

Se puede afirmarse que el salario diario promedio del primer laboratorio es mayor que el correspondiente al segundo, en una cantidad que va de $ 226 a $ 1774, con una confianza del 99% en esa estimacin por intervalos. LA DIFERENCIA t STUDENT Y LOS INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES. Resulta necesario utilizar la distribucin t student cuando: 1.- No se conocen las desviaciones estndar de las poblaciones. 2.- Las muestras son pequeas ( n < 30 ). Si las muestras son grandes, entonces es posible aproximar los valores t mediante la distribucin normal estndar Z.

N 7

3.- Se supone que las poblaciones tienen distribuciones aproximadamente normales (debe observarse que no se puede aplicarse el Teorema del Lmite Central cuando se trata de muestras pequeas. Sin embargo, cuando se utiliza la distribucin t para definir los intervalos de confianza para la diferencia entre dos medias, en vez de hacerlo para una sola, se requiere de una suposicin adicional. 4.- Las varianzas de las dos poblaciones (que se desconocen ) son iguales, 1 = 2.
2 Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales, s c representa entonces la varianza comn y se calcula:

sc2 =

( n1 1) s12 + ( n2 1) s22
n1 + n2 2

(x

1 x 2 tgl tabla

2 s12 s 2 + n1 n 2

Donde gl = n1 + n2, = 2

Ejemplo N 7

n1 = 10 focos es X = 4600 hrs, con S 1 = 250 horas. Para otra marca de focos, la vida til promedio y la desviacin para una muestra de n2 =
La vida til promedio de una muestra aleatoria de 8 focos son X = 4000 hrs y S2 = 200 hrs. Se asume que la vida til de los focos de ambas marcas tienen una distribucin normal. Determinar el intervalo de confianza del 90% para estimar la diferencia entre las vidas tiles promedio de las dos marcas de focos. Solucin

(x

x2 = 4600 4000 = 600

t gl = 10 + 8 = 18 2 = 16
s
2 c 2 ( n1 1) s12 + ( n2 1) s 2 =

1. 746
9( 250) 2 + 7(200) 2 = 52656.25 10 + 8 2

n1 + n2 2

2 s12 s2 + = n1 n2

52656.25 + 10

52656.25 = 108.847 8

(x

x 2 tgl tabla

2 s12 s 2 + = 600 1.746 ( 108.847 ) = 410 a 790 horas n1 n 2

Puede afirmarse con una confianza del 90% que la primera marca de focos tiene una vida til promedio mayor que la segunda, en una cantidad de 410 y 790 hrs. INTERVALOS DE CONFIANZA PARA LA PROPORCIN UTILIZANDO LA DISTRIBUCIN NORMAL. Cuando se desconoce la proporcin de la poblacin ( ), la mayor parte de los especialistas en estadstica sugieren que se tome una muestra de n 100. Debe observarse que, en el contexto de la estimacin estadstica, no se conoce sino que se estima mediante P.

N 8 Formulas.

z P tabla s P

Donde:

p (1 p ) n (1 p ) N n p s P = ; Si la poblacin es finita o el muestreo es sin reemplazo n N1 n: es el tamao de la muestra : es la proporcin de la muestra p


N es el tamao de la poblacin z tabla : es el valor z de la tabla N(0,1) Ejemplo N 8 Una empresa de investigacin de mercados entrevista a una muestra aleatoria de 100 hombres de una comunidad grande y encuentra que una proporcin muestral de 0,40 de ellos prefieren maquinas de afeitar fabricadas por la empresa cliente de los investigadores, y no las dems marcas. Determinar el intervalo de confianza del 95% para la proporcin de todos los hombres en esa comunidad que prefieren las maquinas de afeitar de la empresa cliente de los investigadores. Solucin
z P tabla s P

sP

(0.40)(0.60) = 100

0.24 = 0.0024 ~ 0.05 100

0.40 1.96 (0.05) 0.40 0.098 = 0.40 0.10 = 0.30 a 0.50 Por lo tanto, puede estimarse con una confianza del 95% que la proporcin de hombres de esa comunidad que prefieren las maquinas de afeitar de la empresa est entre 0.30 y 0.50. INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES POBALCIONALES. Para estimar la diferencia entre dos proporciones de dos poblaciones, el estimador puntual sesgado de (1 2) es (P1 P2). El intervalo de confianza implica utilizar el error estndar de la diferencia entre las proporciones. El uso de la distribucin normal se basa en las mismas condiciones que para la distribucin muestral de la proporcin, excepto que se trata de dos muestras y se aplican los requerimientos para cada una de ellas. El intervalo de confianza para estimar la diferencia entre las proporciones de dos poblaciones es:

N9 Formula.
1 p 2 ) z tabla (p Q Q P P 1 1 2 + 2 n1 n2

Donde: n1 : es el tamao de la muestra tomada de la poblacin 1 n1 : es el tamao de la muestra tomada de la poblacin 2

: es la proporcin en la muestra tomada de la poblacin 1; 2 : es la proporcin en la muestra tomada de la poblacin 1; N es el tamao de la poblacin z tabla : es el valor z de la tabla N(0,1) EJEMPLO N 9

P 1 P

=1 P Q 1 1 Q2 =1 P 2

En el ejemplo anterior se reporto que una proporcin de 0.40 hombres de una muestra aleatoria de 100 tomada de una comunidad grande, manifest preferir las hojas de afeitar de la empresa cliente de los investigadores y no de las dems marcas. En otra comunidad grande, 60 hombres de una muestra aleatoria de 200 prefirieron las mquinas de afeitar de la empresa cliente. Determinar el intervalo de confianza del 90% para la proporcin de hombres de las dos comunidades que prefirieron las maquinas de afeitar de la empresa cliente. Solucin

1 p 2 ) (p
Z = 1.645

= 0.40 0.30 = 0.10

=1 P = 1 0.40 = 0.60 Q 1 1

=1 P = 1 0.30 = 0.70 Q 2 2

Q Q P P 1 1 2 + 2 n1 n2

(0.40)(0.60) (0.30)(0.70) + = 0.0024 + 0.00105 = 0.00345 = 0.059 100 200

0.10 1.645(0.059) 0.10 0.097 = 0.003 a 0.197

EJERCICIOS DE INTERVALOS 1. De un lote de 3.500 pilas se probaron 98 al azar. La vida promedio en esa muestra result ser de 3,5 horas con una desviacin estndar de 0,9 horas. Construya un intervalo de confianza del 99% para la vida media del lote de pilas (suponer normalidad en la poblacin). 2. Una muestra aleatoria de empleados de un grupo numeroso perteneciente a una empresa, entreg las siguientes calificaciones en un examen de aptitud: 63; 72; 56; 65; 66; 74; 57; 59; 63. Construya un intervalo de confianza del 95% para estimar la calificacin promedio de todos los trabajadores de la empresa, suponiendo normalidad en la poblacin. 3. Se desea medir la diferencia en ventas entre dos tipos de empleados en la actividad de seguros, unos con titulo profesional y otros de personas con estudios medios. Se toma una muestra de 41 empleados entre los primeros y la media de las ventas resulta ser 32($ miles), en tanto que la media de una muestra de 30 empleados con slo estudios medios es de 25. Se encontr tambin que la varianza en la primera muestra es de 48 y en la segunda de 56. Determine el intervalo de confianza del 95% para estimar la diferencia en las ventas medias de los dos tipos de vendedores. (suponer normalidad).

N 10

4. Se desea estimar la diferencia ente los salarios semanales promedios de empleados y obreros. Se toman dos muestras independientes de 61 personas cada una obtenindose: Empleados Obreros Media $150.000 $100.000 Varianz 100.000 81.000 a

Construya un intervalo del 95% de confianza para estimar la diferencia de medias (suponer normalidad). 5. Una pequea empresa compr un lote grande de piezas electrnicas a una firma. En una muestra aleatoria de 50 piezas se comprob que 5 eran defectuosas. Estime la proporcin de piezas defectuosas de todo el lote, empleando un intervalo de 95% de confianza. 6. En una muestra aleatoria de 100 posibles clientes se encontr que 30 dicen que prefieren cierto producto. Estimar el verdadero % de todos los posibles clientes que prefieren el producto, usando un intervalo de 95% de confianza. 7. En dos ciudades se tomaron muestras de automviles, cada una de 100 automviles. En una ciudad 72 automviles pasaron con xito la prueba de seguridad, en la otra solamente lo hicieron 66. Construya un intervalo de 95% de confianza para estimar la diferencia de proporciones de autos seguros en las dos ciudades. 8. Se desea hacer una encuesta para estimar el porcentaje de personas mayores de edad, de una ciudad, que estn a favor de cierto proyecto de ley. Cul debe ser el tamao de la muestra, si se desea un nivel de confianza del 95% y un error mximo de estimacin de 4%? 9. Se desea estimar el gasto medio en movilizacin de los alumnos de cierta Universidad que tiene 5.000 alumnos. Cul es el tamao de muestra necesario, si se desea un nivel de confianza del 95%, un error mximo de $2.000, y se sabe por estudios anteriores que la desviacin estndar es de $15.000?