Академический Документы
Профессиональный Документы
Культура Документы
Z = Z1 coeficiente de confianza
LI: Limite inferior del intervalo de confianza LS: Limite superior del intervalo de confianza = : error de estimacin.
Z2
={
a). cuando la poblacin es infinita Remplazamos en la ecuacin fundamental de muestreo = despejando n obtenemos que: n= b). cuando la poblacin es finita. Remplazamos en la E.F.M; obtenemos n= =
k: N de estado
2. TAMAO DE MUESTRA PARA LA PROPORCIN Ecuacin fundamental del muestreo: a). Cuando la poblacin es infinita: Remplazamos en la E.F.M tmenos:
K: n de estrato i=1,2,3K = : Proporcin por estrato. Ejm: un fabricante afirma que el peso promedio de las latas de frutas en conserva que saca al mercado es de 12 onzas, para verificar esta informacin que tamao de muestra se debe escoger para estimar si se quiere un error no superior a 0.98 onzas con confianza del 95%.? Suponga que la poblacin de los pesos es normal con una desviacin estndar de 2 onzas
Solucin: X: Peso de latas de frutas con conserva : Peso promedio de las latas de frutas en conserva X N( ); = 2 onzas 1- = 0.95 = = n= = = 16 latas tamao de la muestra
= 0.025
= 0.975
Ejm: Si la poblacin de latas de conserva es de 2000 en el ejemplo anterior Cul es el tamao de muestra? = El otro mtodo = = 15.88
= 15.87
Ejm:la oficina de planificacin familiar de cierta provincia quiere estimar el % de familias con mas de 4 hijos Qu tamao de la muestra se requiere para asegurar con una confianza del 95%? Que el error de la estimacin de tal % no sea superior a 0.05. : Proporcin al nmero de familias con ms de 4 hijos. Si la proporcin P no se conoce se asume que. p = q; adems p + q = 1 p = q = 0.5 1 - = 0.95 = 1.96 =0.05 5% Tamao de muestra = La otra forma: N = 4000 n? = 385 = = = = 351.19 aprox. 352 familias = = 384.16 385 familias
Estimacin estadstica de parmetro. I.- Estimacin puntual (estadstica descriptiva) Parmetro : media poblacional : Varianza poblacinal P: proporcin poblacional Estimador = , media muestral =
( )
; varianza muestral
= , proporcin muestral
PROPIEDADES DE LOS BUENOS ESTIMADORES. a). insesgamiento: E () = b). eficiencia Estimador con varianza mnima:
={
E=
c). Consistencia. A medida que el tamao de la muestra aumenta los estimadores tienden a acercarse al valor del parmetro. N d). Suficiencia.los estimadores son suficientes si utilizan la mayor cantidad de observaciones. Md = Me =
= La media es ms suficiente que los dems indicadores. II.- Intervalos de confianza. Z= P ()=1
.. * en *
Remplazando Z = Tenemos P ( P (- P ( + P ( -
Intervalo de confianza al (1
desconocida.
5). Intervalo de confianza para la diferencia entre dos medias. y supuestos conocidos + -
6). Intervalo de confianza para la diferencia entre dos varianzas. y supuestos desconocidos
a).Poblacin no normal. b).Poblacin normal. b.1). varianzas supuestos iguales = : varianza conjunta
7). Intervalo de confianza para la proporcin. 8). Intervalo de confianza para la diferencia de dos proporciones. ( )
Ejercicios: 1. Una muestra aleatoria de 100 hogares de una unidad indica que el promedio de los ingresos normales es de 500. Encuentre un intervalo de confianza del 95 % para la media poblacional de los ingresos de todos los hogares de esta ciudad. Suponga = $ 100. X: ingreso mensual : promedio de los ingresos mensuales $ 500 : $100 n: 100 = $ 500 (1 - ) = 0.95 = 1.96 = = = = 10 remplazando 500 1.96 (10)
19.6 = 480.4 519.6 Interpretacin: El 95 % de los ciudadanos tienen un ingreso promedio de $ 480.4 y 519.6 2. Un anlisis de investigacin de mercado escoge una muestra aleatoria de 100 clientes de un conjunto de 500 clientes de una gran tienda que declara mayor ingreso a $ 5000. La encuesta de los clientes de la muestra gastaron en la tienda en promedio $ 2500. Si con este valor de la muestra se estima que el gasto promedio de la poblacin finita suma de 2446 a 2554 Qu nivel de confianza se utiliza? Suponga que la desviacin estndar es = % 300. Y: ingreso X: gasto : gasto promedio n = 100 = $ 2500 2446 2554 N = poblacin finita = $ 100 (1 - ) = ?
. 0.81786 = 24.54
Remplazando tenemos: 2500 - (24,54) 2500 + (24,54) 2446 2554 2500 + (24,54) = 24,54 (24,54) = 24,54 - 2500 = = 2.20 (1 - ) = P ( =P( =P( =P( =2P( ) ) )-P( ) )- 1-P( )] - 1) 2 (0, 9861) 1
1, 9722 -1 = 0.9722
3. En un studio socioeconmico se forma una muestra aleatoria de 100 comerciantes informales y se encontr entre otros datos los siguientes: un ingreso medio de s/. 50,00 y solo en 30 % tiene ingresos superiores a s/. 80,00. a. Estimar la proporcin de todos los comentarios con ingresos superiores a s/. 800,00 mediante un intervalo de confianza de 98 %. b. Si la proporcin de todos los comerciales con ingresos superiores a s/. 800,00 se estima entre 20,06 % y 39,94 % Qu grado de confianza se utilizo?. X: numero de comerciantes con ingresos superiores a s/. 800,00. = 0,30, n = 100 1 - = 0,98 = 0.02 = 0,01 1 - = 0,99 = = = 2,33 = En la formula 0.30 2.33 (0.046) 0.193 P 0.407 Interpretacin: el98%de los comerciantes Con la confianza del 98% estimamos q el porcentaje de comerciantes con ingresos superiores a 800,00 varia entre el 19 % a 41 %. Se estima entre 20,06 % 39,94 % 0,2006 0,3994 + Igualemos ( ) + = 0,3994 0,30 + + (0,046) = 0,3994 = = 2,16 (1 - ) = P ( =P( = = = 2 (0, 9846) 1 ) ) = = 0,046
( 1-
= 0, 9692 0, 97 = 97 %. 4. Se quiere estimar la diferencia entre dos promedios de tiempo (en minutos) que utilizan dos operarios para realizar determinada tare. Suponga que las poblaciones de los dos tiempos se distribuyen normalmente con varianza comn. Estime la diferencia entre los dos promedios poblacionales mediante un intervalo de confianza de 95 % si el registro de 16 tiempos en cada operario han dado: = 6; 2 = 35; = 4 1 = 38; = = ? Desconocidas. ) .* = 0,95 1= ( - 0,975 = 2,04 =
) = 38 35 = 3 = = = 1,8028 = = 26
Remplazando en * tenemos: 3,68 Segn el 95 % 1 aventaja al operario 2 entre 0,68 y 6,68 minutos. 5. Una firma distribuye dos marcas de cerveza en una reciente encuesta se encontr que 60 de 120 la marca A y 50 de 80 prefieren la marca B. use un intervalo de confianza del 99 % sea la diferencia de proporciones con el fin de determinar si son diferentes las proporciones de diferencias poblacionales. Marca A Marca B (1 ) = 0,99 = 120; = 80; 1=
2 1
= 60
= 50
.* = 0,995
0,071 Remplazando en (*) (0,500 0,625) 2,58 (0,071) 0,125 2,18 Cuando el intervalo de confianza incluye a 6. Se escoge una muestra de 13 tiendas y se encuentra que las ventas de la semana de un determinado producto de consumo popular tiene una deviacin estndar igual a $ 6 se supone que las ventas del producto tienen distribucin normal. Estimar
= Remplazando
= 23,34
= 4,40
7. Una de las maneras de medir el grado de satisfaccin des empleados de una misma categora en cuanto a la poltica salarial, es a travs de las desviaciones estndares de sus salarios. La fabrica A afirma ser mas homognea en la poltica salarial que la fabrica B. para verificar esa afirmacin se escoge una muestra aleatoria de 10 empleados no especializados de la fabrica A y de 13 de B obtenindose las dispersiones del salario mnimo Cul seria su conclusin si utiliza un intervalo del 95 % para el cociente de varianza? Suponga distribuciones normales. Datos. ; (1 - ) = 0,95
= 3,87
PRUEBA DE HIPOTESIS. HIPOTESIS: solucin anticipada al problema que necesita ser demostrada es una afirmacin o conjetura sobre el problema. Hiptesis estadstica: es una afirmacin o conjetura sobre los parmetros de la poblacin o sobre el comportamiento de una variable aleatoria. Por ejm. Tipos de hiptesis. 1) Hiptesis nula : es la hiptesis que es aceptada provisionalmente como verdadera y cuya valides ser comprometida a comprobacin experimental. 2) Hiptesis alternativa : es la hiptesis que ser aceptada cuando se rechace la hiptesis nula.
Ejm: a) := ; : b) : ; : c) : ; : Ejm: X: ingreso mensual de encuestados. := : : 800,00; 800,00; 800,00; : : : 800,00 800,00 800,00
Ejm: X: numero de personas que prefieren un producto W. : p = 0, 45 ; :p :p ; :p :p ; :p Prueba de una hiptesis estadstica. Es un proceso que nos conduce a tomar la decisin de aceptar o rechazar la hiptesis nula en contra posicin de la hiptesis alternativa y en base a los resultados de una muestra aleatoria seleccionada de una poblacin en estudio. Error tipo I y tipo II a nivel de significacin . DESICION Rechazar verdadero Error tipo I Probabilidad : falso Decisin correcta Probabilidad: Error tipo II Probabilidad :
Aceptar
= p (rechazo / es verdadero) = p (acepto / es falso) = nivel de significancia. Regiones crticas y de aceptacin. (Tipo de colas de las pruebas) a) := : Prueba de dos colas ( ) RA: regin de aceptacin RC: regin critica o de rechazo.
1O
R.C.
R.C.
c)
0 RC RA Regla de decisin. Si el estadstico de prueba ( ) cae en la regin de aceptacin, entonces aceptamos ; si cae en la regin critica rechazamos y aceptamos . Estadstico de prueba: Z= .
Procedimiento de Prueba de Hiptesis. Formulacin de la hiptesis := : Especificar el tamao del nivel de significacin ( ) Definir las regiones de aceptacin y rechazo (RA y RC) Calcular en estadstico de prueba despus de seleccionarlo apropiadamente. Decisin estadstica. Aceptar o rechaza , segn comparacin del estadstico de prueba y regiones (RA y RC).
Decisin estadstica en trminos del problema planteado (interpretacin de resultados). PRUEBA DE HIPTESIS ACERCA DE UNA MEDIA. A. Supuesto: si la varianza es conocida. Probar la hiptesis nula : = CONTROLA LA UTILIZA PRUEBA DE: ALTERNATIVA Cola izquierda Cola derecha Dos colas = RA = ( estadstico de prueba. ); Z ~
RECHAZA SI:
RA
Ejm: un proceso automatico llena latas de palmito. Si el peso medio de las lata llenas es de 400gr. Se afirma que el proceso esta controlado, en caso contrario el proceso no esta controlado. En el proceso de estado se ha determinado que los pesos de las latas llenas tiene una desviacin estndar de 20gr. Si una muestra aleatoria de 100 latas llenas de palmito a dado el peso medio de 395gr, a la interrogacin se podra concluir que el proceso esta fuera de control al nivel de significacin del 5 %. Solucin: : =400gr. (proceso controlado) : 400gr. (proceso descontrolado) = 5 % = 0,05 = =
1.96
RA
= RA = (
estadstico de prueba. ); ~
Nota: la poblacin es normal. Ejm: las cajas de cierto tipo de cereal procesado por una fbrica deben tener un contenido promedio de 160gr. Por una queja ante en defensor del consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomo una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos 157; 157; 163; 185; 161; 159; 162; 159; 158; 156. Es razonable que el inspector multe al fabricante utilicen un nivel del 5 % y supongan que los contenidos tienen distribucin normal? De los datos podemos sacar : : = 5 % = 0,05 = = = = 160gr (no lo multe al fabricante) 160gr (multe al fabricante)
PRUEBA DE HIPTESIS ACERCA DE LA VARIANZA. Supuesto: si lo parmetros son desconocida. Probar la hiptesis nula CONTROLA LA ALTERNATIVA : = RECHAZA SI:
RA
= RA = [
estadstico de prueba. ];
Nota: la poblacin es normal. Ejm: una muestra de 16 sobres de cierto producto cuyos pesos se distribuyen normalmente a dado una desviacin estndar de 0,6 gramos. Utilizando un nivel de significacin del 5 %, es valido inferir que la varianza de los pesos de tales sobres es mayor de 0, 25 : : = 0,05 = 0, 25 0, 25 =
= 24,99
25
= 21,6.
= 21,6 = 25 cae en la RA Aceptamos : = 0,25 No es valido inferir que la varianza es mayor que 0,25. PRUEBA DE HIPTESIS ACERCA DE LA RAZN DE DOS VARIANZAS. Supuesto: poblacin normal. Probar la hiptesis nula : = CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda Cola derecha Dos colas RA Estadstico de prueba. * ; Ejm: los tiempos en minutos para realizar cierta tarea observada en 10 hombres y 10 mujeres fueron: Hombres: 50; 45; 49; 50; 38; 58; 53; 47; 48; 55 Mujeres: 55; 56; 57; 56; 58; 53; 54; 59; 60; 57 = = +; ~
Suponiendo `poblaciones normales se podra concluir que las varianzas poblacionales son diferentes? = 5 %. = =
Rechazamos = = Las varianzas poblaciones son diferentes. PRUEBA DE HIPTESIS ACERCA DE DOS MEDIA. A. Supuesto: si la varianza es conocida (poblacin normal) Probar la hiptesis nula : CONTROLA LA UTILIZA =0 RECHAZA
ALTERNATIVA 0 0 0 = RA = (
SI:
RA
estadstico de prueba ); Z ~ 30
Ejm: una fbrica quiere comparar dos marcas A y B; para fabricar un tipo de artculo. Observa dos muestras aleatorias de 60 artculos procesados por A y B respectivamente y encuentra que las medias respectivas son 1230 y 1190 segundos. Suponga segundos al nivel de significancia del 5 %, se puede inferir que la maquina B es mas rpida que la maquina A? Solucin: = 0,05 1 - = 0,95 = = = 2,07 = 1,64 = RC =
0 0
= 2,07
Rechazamos 0 Aceptamos 0 La marca B utiliza menos tiempo en el proceso de fabricacin. B. Supuesto: si la varianzas son desconocidas CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda 0 Cola derecha 0 Dos colas RA 0 = RA = ( estadstico de prueba. ) (poblacin normal)
Ejm: se quiere determinar la diferencia entre los promedios de tiempos (en minutos) que utilizan los hombres y las mujeres para realizar determinada tarea con este fin se escogen 10 hombres y 16 mujeres resultado los tiempos promedios respectivos 40 y 35 minutos y desviaciones estndares respectivas 9 y 8 minutos. Suponga que las poblaciones de
ambos tiempos son independientes y se distribuyen normalmente con varianzas iguales. Al nivel de significacin del 1 %. Este tiempo promedio de hombres mayor al tiempo promedio de mujeres? Solucin: = 0,01 =0 0 = = =
= 2,46 = = 1,66
= 72,5
= 1,66 RA aceptamos =0 No existe diferencia entre hombres y mures para realizar la tarea es decir al 1 % pero si este porcentaje aumenta los resultados pueden ser otros. C. Supuesto: si la varianzas son desconocidas (poblacin normal) CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda 0 Cola derecha 0 Dos colas RA 0 = estadstico de prueba.
RA = (
);
(
=
( ) (
)
)
Ejm: una compaa debe decidir cual de dos tipos de componente electrnica va adquirir A o B hace una prueba de 5 componentes escogidos al azar para cada marca resultando 1 = 8000 y = 2500 horas para A y = 800 horas para B. suponga poblaciones normales con varianzas 2 = 7000 y diferentes. Pruebe la hiptesis nula que los rendimientos medios son iguales contra la alternativa de que A rinde mas que B use = 5%. Datos: = 2500; =5 = 5%. 1 = 8000 y 7000 y = 800; =5 2= Solucin: = 0,05 = =0 0 = = 2,02
(
=
( ) (
)
=
) ((
(
) ) ((
)
= 2,02
) )
= 0, 85
Aceptamos =0 Tienen rendimientos iguales A y B. PRUEBA DE HIPTESIS ACERCA DE UNA PROPORCION. Se resume en la siguiente tabla: Probar la hiptesis nula : = CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda Cola derecha p Dos colas RA = RA = ( estadstico de prueba ); Z ~
Ejm: una fbrica afirma que el 30% de los consumidores prefieren su producto con el fin de evaluar esta afirmacin se tomo una muestra aleatoria de 400 consumidores y se encontr que 100 de ellos prefieren dicho producto. Esta es suficiente evidencia para inferir el % de preferencia del producto no es 30 % utilice = 1? Solucin: : p = 0, 30 : p 0, 30 = 1 % = 0, 01 = =2, 58 = =
= = - 2, 18
= 0, 25
Se acepta que = 30 %. La afirmacin del fabricante es correcta. PRUEBA DE HIPTESIS ACERCA DE DOS PROPORCIONES. Se resume en la siguiente tabla: Probar la hiptesis nula : CONTROLA LA UTILIZA RECHAZA PRUEBA DE: SI: ALTERNATIVA Cola izquierda Cola derecha Dos colas RA
= RA = (
estadstico de prueba. );
Poblacin infinita.
Ejm: una empresa de estudio de mercado quiere saber si un producto promocionado a nivel nacional lo adquieren en mayor porcentaje que las mujeres si en dos muestras aleatorias independientes de 900 hombres y 800 mujeres se encontr que 270 hombres y 200 mujeres adquieren el producto, Cul es su decisin? Datos: = 0,04; = 900; 1 = 270; = = 0,30 = 800 Solucin: =0 0 = 0,04 = = 2,66 = =
= 200
= 0,25
= 2,31.
Se acepta que =0 Por tanto hombres y mujeres adquieren la misma cantidad. PRUEBA DE INDEPENDENCIA. Las pruebas de hiptesis de independencia implican dos variables categricas (cualitativas) y lo que se prueba es la suposicin de que las dos variables son estadsticamente independientes para cada frecuencia observada en una celda hay una frecuencia esperada que se calcula a partir de sus hiptesis nula especificada y que se supone verdadera. Formulacin de la hiptesis. Las variables son independientes (no tienen relacin) : Las variables son dependientes (si tienen relacin) Nivel de significacin y tipo de prueba (Regiones) Dado
Total
Total
Total
Total = Entonces:
( )
(Estadstico de prueba)
Donde: : calcular. Decisin estadstica. Decisin en trmino del problema. Ejm: en un proceso de produccin se registro el numero de objetos defectuosos clasificndolos por turnos de produccin y por maquina de produccin. Las frecuencias observadas se registran en el cuadro dado posteriormente. Verificar al nivel de significacin del 5 % si el numero de objetos, defectuosos producidos por la maquina e independiente de los turnos de produccin. TABLA DE CONTINGENCIA 3*3 Datos Observados TURNOS MAQUINAS A B Maana 75 90 Tarde 70 85 Noche 95 85 Total 240 260 A A A B B = = = = = = 82.19 = 73.97 = 83.84 = 89.04 = 80.30
Total C 85 70 75 230 250 255 255 730 B C C C = = = = = 90.82 = 78.77 = 70.89 = 80.34
Datos Esperados ( ) TURNOS MAQUINAS A B C Maana 82,19 89.04 78.77 Tarde 73,97 80.30 70.89 Noche 83.84 90.82 80.34 Total
Total
El numero de objetos defectuosos poblacin por la maquina no dependen de los turnos. : El numero de objetos defectuosos poblacin por la maquina si dependen de los turnos. = 0.05 = = 9.49 1= 0.95
3.87 Se acepta El numero de objetos defectuosos poblacin por la maquina no dependen de los turnos. No hay relacin no depende, los objetos producidos por la maquina.