Вы находитесь на странице: 1из 12

TEST DE HIPOTESIS.

Probar una hiptesis estadstica consiste en decidir si la afirmacin se encuentra apoyada


por la evidencia experimental que se obtiene de los datos que proporciona una muestra
aleatoria.

Una empresa comercializadora de arroz, informa que sus paquetes para la venta
pesan 500 gr, con un desvo estndar de 10 gr.
Una organizacin de defensa del consumidor quiere testear esta informacin sobre
el parmetro

=500 gr

y para ello toma al azar una muestra de 16 paquetes, los

cuales pesaron: 490, 492, 495, 505, 500, 494, 496, 484, 508, 512, 490,485,482, 497,
485, 505.
Si tomamos un coeficiente de riesgo (significancia) del 5%. Enuncie un criterio de
decisin y determine si la muestra avala o cuestiona el valor del promedio que
informa la empresa.
Para ello, y con la informacin obtenida de la muestra, nos planteamos la pregunta
sera razonable que el peso promedio de la muestra sea 495 gr ?

La hiptesis nula ( H0) es sobre la que buscamos evidencia en su contra, y la hiptesis


alternativa(H1), complementaria de la anterior.
Ho:

=500 gr (el peso promedio de los paquetes de produccin pesan en

promedio 500 gramos)


H1: <500 gr .

------------

Se parte del hecho de que la hiptesis nula es cierta a menos que los datos de la muestra
proporcionen suficiente evidencia en contra.
Un contraste de hiptesis analiza si los datos observados permiten rechazar la hiptesis
nula, comprobando si stos tienen una probabilidad de aparecer lo suficientemente
pequea cuando es cierta dicha hiptesis.
Pueden ocurrir las siguientes situaciones:
1) Que la hiptesis nula sea cierta y la aceptamos.

2) Que la hiptesis nula sea cierta y la rechazamos (Error tipo 1:

3) Que la hiptesis nula sea falsa y la aceptamos. (Error tipo 2:

4) Que la hiptesis nula sea falsa y la rechazamos


El estadgrafo que utilizaremos para hacer el test es la media muestral de la que
sabemos tiene por distribucin de muestreo a:

10
X Norm al( X =500, X =
=2.5)
;y adems necesitamos determinar la regin
16
del dominio de

X , en la cual sea poco probable que el valor de

la muestra ocurra, que es su extremo menor, de acuerdo con la hiptesis


alternativa, y esa regin solo tiene una probabilidad del 5% . El valor de la variable
que separa la regin de aceptacin de la hip. Nula de su regin de significacin, se
llama punto crtico:
Clculo

del

x c .

punto

crtico:

P ( X x c ) =P ( Z zo ) =0.5

entonces

( zo ) =0.5 zo=1.64

zo=

x c 500
=1.64 x c =5002.5 1.64=495.9
2.5

Regla de decisin: si el valor muestral es menor a 495.9, entonces rechazamos la


hiptesis nula, corriendo un riesgo del 5% de cometer error tipo I.
Decisin: Como el valor muestral es de 495 y es menor al valor crtico decidimos no
aceptar la Ho como vlida.

Otra forma de resolver:


Podemos calcular el valor p, que es la probabilidad de obtener una media muestral menor
que la de la muestra:

p=P ( X 495 ) ==0.023 ; el valor de p es menor al nivel de significacin, entonces


rechazamos la Ho.
P nos dice que obtener un valor muestral como el de la muestrao menor es de un 2.3%.
Esto tambin nos dice que; si decidimos correr con un 1% de riesgo cometer error tipo I,
aceptaramos como vlida la Ho ya que el valor crtico que separa las regiones de
aceptacin y rechazo es : 494.18.

Nuestra regla de decisin se bas en el error tipo I( ), sin tener en cuenta el error tipo
II( , que la Ho sea falsa y la aceptamos.
El problema que tenemos para calcular el error tipo dos, es que no sabemos para cual
valor de Ha, hacemos el clculo, por lo cual decidimos hacerlo para distintos valores
supuestos de Ha, con la nocin bsica que cuando ms separado del verdadero Ho del
supuesto Ha, el error II, disminuye..

P ( X x c : Hoo=497 ) =0.05 P ( Z z c : Ho=503 )=0.022 ( z c )= .->


x c =497,96.

Funcin de densidad
0,16

Normal(500,6,25): p(evento)=0,0228

D ensida d

0,12

0,08

0,04

0,00
487,5 491,1 494,6 498,2 501,8 505,4 508,9 512,5

Variable

Funcin de densidad
Normal(500,6,25): p(evento)=0,0505

0,16

Densidad

0,12

0,08

0,04

0,00
487,50 491,67 495,83 500,00 504,17 508,33 512,50

Variable

En una propaganda se anuncia que unas determinadas pilas proporcionan ms


horas de luz que las normales. Doce personas deciden comprarlas y los resultados
obtenidos son los siguientes:
Individuo

Variacin

0,2

0,6

- 0,5

6
-0,6

-1

0,6

9
1

10
0,5

11
-0,4

12
-0,5

Se puede admitir, teniendo en cuenta estos datos, que el anuncio es correcto?


1) Enunciamos las hiptesis:
a. Ho: =0

(no proporcionan ms horas de luz que las normales.)

b. H1: >0

(proporcionan ms horas de luz que las normales)

2) Calculamos la media de la muestra y su cuasi varianza:


Medidas resumen
Variable
Columna1

n
12

Media D.E.
0,08 0,67

Var(n-1)
0,45 0,19

E.E.

3) Utilizaremos como estimador el promedio muestral, que sabemos tiene por


2

distribucin de muestreo:

s 0.45
X Normal( X =0, 2 X = =
=0.0375) ; dividimos
12 12

su dominio en dos regiones, una de significacin y otra de aceptacin de la Ho. La

hiptesis alternativa sugiere que la parte significativa debe estar en la parte superior y
nos decidimos por

=5 .

Clculo del punto crtico:

P ( X x c ) =P ( Z zo )=1P ( Z zo )=0.5

zo=

x c 0

0.0375

, entonces

( zo ) =0.95 zo=1.64

=1.64 x c =0+ 0.0375 1.64=0.31785

Regla de decisin: Si el valor de la media muestral es superior al valor crtico,


entonces rechazo la Ho, lo cual significa que las lmparas alumbran mas de lo normal.
En caso contrario acpto la Ho.
Decisin: como el valor muestral entra en la zona de aceptacin de Ho: las lmparas
no alumbran ms que las normales; la propaganda es falsa.
-- - - - - - - -----------------------------------------------------------------1) Sea X una variable aleatoria con distribucin Normal con esperanza
varianza

=20

y con

=4 .

Alguien que no conoce estos valores planea obtener una muestra aleatoria con 16
realizaciones de la variable X con el propsito realizar inferencia estadstica (estimacin y
prueba de hiptesis). Con los datos que obtenga, esta persona calcular los siguientes
estadsticos:

16

X =
i=1

xi
16 ;

x
xi

16
1
2
S =
15 i=1

1. Explicar qu es la esperanza de X.
2. Explicar qu es la varianza de X.
3. Explicar por qu

y S son variables aleatorias.

4. Explicar qu es la esperanza de

5. Cul es el valor de la esperanza de


6. Explicar qu es la varianza de

X
X

8. Qu distribucin de probabilidad sigue

7. Cul es el valor de la varianza de

9. Cul es la probabilidad de que

tome un valor que difiera de la

esperanza de X en menos que 1?


10. Explicar qu es la esperanza de S.
11. Cul es el valor de la esperanza de S?
12. Qu distribucin de probabilidad tiene el siguiente estadstico?

x 20

s2
16

13. Cunto vale la siguiente probabilidad?

x 20
s2
16

2.602

P(x<= 2.602)=P(2.602)=0.99413

14. Cul es la forma genrica de un intervalo de confianza para la esperanza de


X?

15. Cmo se modifica la precisin del intervalo de confianza para la esperanza


de X si aumenta la varianza de X, si se cambia el nivel de confianza elegido, o si
se aumenta el tamao de la muestra?

Al aumentar la varianza de x el intervalo de confianza aumenta. Al aumentar el


valor de alfa, tenemos mayor

16. Cmo se define, en este caso, el valor p para poner a prueba la hiptesis
nula

Ho: 15 ?

17. Cul es, en este caso, la verdadera distribucin de probabilidad del


estadstico de prueba apropiado para poner a prueba la hiptesis nula

Ho : 15 ?

2) Mediante un intervalo de confianza del 95% se estim la esperanza de una variable

aleatoria X, normal, con desconocido. Si la longitud L del intervalo hallado fue de


2.55 unidades y la muestra tena tamao n=12,
a) Calcule el desvo muestralinsesgado de la muestra utilizada.
b) Si se tomara una nueva muestra aleatoria de X con un tamao n=24, podra
asegurar que obtendr un intervalo de confianza del 95% de menor longitud que
L?Justifique la respuesta.
3) El gerente financiero de una cadena de supermercados seleccion una muestra
aleatoria de 200 de sus clientes que utilizan tarjetas de crdito para el pago de sus
compras y encontr que 136 haban incurrido en cargos por intereses durante el ao
anterior debido a la falta de pago de sus saldos.
a) Encuentre un estimador insesgado de la proporcin de clientes que pagaron
intereses durante el ao pasado entre los clientes que utilizaron tarjeta de crdito
para el pago de sus compras.
b) Encuentre un intervalo de 90% de confianza para dicha proporcin. Interprete.
c) Si la longitud deseada del intervalo de 90% de confianza es 0.05, qu tamao de
muestra se debera tomar?
4) El tiempo que un pasajero invierte esperando en un punto de revisin de un aeropuerto
es una v.a. con media 8.2 minutos y desv. Estndar de 1.5 minutos. Suponga que se
observa una muestra de n=49 pasajeros. Encuentre la probabilidad de que:
a) el tiempo total de espera de todos los pasajeros sea de al menos 7 horas.
Justifique su respuesta.

b) el tiempo de espera promedio en la fila para estos clientes sea entre 7 y 9


minutos. Justifique su respuesta.
c) el tiempo de espera promedio en la fila para estos clientes sea menor que 5.5
minutos, si se sabe que es superior a 6. Justifique su respuesta.
5) Una compaa area necesita estimar el nmero medio de pasajeros en un vuelo de la
reciente apertura. Para ello considera una muestra de 40 das hbiles, obteniendo una
media muestral de 112. Suponiendo que la desviacin tpica es semejante a la de otros
vuelos, 25, obtenga el intervalo de confianza al 95% para el nmero medio de pasajeros
del vuelo.
6) Deseamos contrastar si la media del peso de las cajas de cereales es de 300 g con una
muestra de 25 cajas cuyas peso medio ha resultado 325 g .Suponemos que la distribucin
del peso es normal con desviacin tpica de 20 g .
a) Cul debe ser la hiptesis de contraste y la decisin si la prueba la realizada
la empresa para controlar el ajuste de la mquina de llenado?
b) Cul debe ser en el caso en que el contraste lo realizan los inspectores de
consumo con el objeto de analizar si existe fraude en la cantidad realmente
entregada?
7) Se desea a contrastar la hiptesis de que la varianza de la produccin de leche en una
determinada zona de granjas sigue una distribucin normal con varianza igual 1000 frente
a la alternativa varianza menor que 1000. Para ello se toma una muestra de 101 vacas de
la zona y se obtiene una varianza de 800. Realizar el contraste al nivel de significacin
5%.
8) Una mquina despachadora de refrescos est fuera de control si la varianza de los
contenidos excede 1.15 decilitros. Si una muestra aleatoria de 25 bebidas de esta
mquina tiene una varianza de 2.03 decilitros. Esto indica con un nivel de significancia
de 0.05 que la mquina est fuera de control? Suponga que los contenidos se distribuyen
de forma aproximadamente normal.
9) Se quiere hacer inferencias sobre una poblacin, mediante muestreo simple de una
poblacin infinita ( o con reposicin). Se conocen los siguientes datos:
La poblacin tiene distribucin normal. El tamao de la muestra es 25. La media muestral
197.
a) Obtenga un intervalo de confianza del 95% para la media poblacional.
b) Obtenga un intervalo de confianza del 90% para la desviacin tpica de esta
poblacin.
c) Si se quiere obtener una confianza del 99% de que la estimacin realizada de la
media se encuentre a una distancia menor de 3 unidades de la verdadera media
de la poblacin, cuntas observaciones ms deberan tomarse?

d) Con la muestra inicial, realice un contraste unilateral, con un nivel de significacin


de 0.05 para ver si se puede aceptar que la media de la poblacin es igual o
menor que 194.
e) Con la muestra inicial , realice un contraste bilateral para decidir aceptar o no que
la varianza de la poblacin sea 150, de manera que sea solo del 5% la
probabilidad de que si esta varianza realmente fuera 150, el contraste sin
embargo nos dijera que no.
10) Una empresa desea lanzar al mercado un producto especfico para arquitectos, para
ello realiza un estudio de viabilidad en el mercado, efectuando una consulta mediante
muestreo aleatorio simple, a 1750 arquitectos, result que un 44,3% de los encuestados
tiene intencin de compra en los prximos tres aos.
a) A partir de estos datos, la empresa realiza una presentacin interna de los
resultados, dando un intervalo de confianza para la proporcin de intencin de
compra en tres aos de entre 0,424 y 0,462, sin informar, sin embargo, sobre el
contenido probabilstico de dicho intervalo. Calcule este dato que falta.
b) Obtenga un intervalo del 95% de confianza para el porcentaje de arquitectos que
tienen intenciones de compra en los prximos tres aos.

11) Un can lleva funcionando muchos aos. La distribucin de impactos de este can
es normal. Se quiere comprobar si su distancia mxima esperada sigue siendo la de
fbrica, que era de 4000 metros. Si no fuera as, habra disminuido, y se mandara realizar
reajustes en el can.
a)

Para ello, se disparan 10 obuses. Siendo

x i la distancia alcanzada por cada


10

uno de los 10 obuses, en metros, las distancias obtenidas son:

x
xi

x i=38880
i=1

=32400. Qu debe hacerse en base a estas medidas con el can?

10

i =1

b) Si la distancia mxima esperada ha disminuido y realmente es 3880 metros, qu


probabilidad hay de concluir, sin embargo que el can est perfectamente?
c) Evale los resultados obtenidos, le parece correcta la prueba realizada? O le
parece necesario aumentar el nmero de disparos?.

12) a) Una empresa que fabrica discos de PC ha tomado una muestra de 200 discos, de
los cuales 12 son defectuosos. Calcule un intervalo de confianza bilateral del 95% para la
proporcin de defectuosos en la poblacin.
b)Qu tamao deber tener una muestra de discos si se pretende garantizar con una
probabilidad del 95% que el error muestral no supera el 2%.
13)Un fitotecnista ensaya un nuevo cultivar hbrido de girasol para decidir si conviene
introducirlo el sur de la provincia de Buenos Aires. Para ello selecciona 20 lotes al azar
dentro de la regin y en cada uno cultiva el hbrido en cuestin. Una vez cosechados los
20 lotes encuentra que la media aritmtica de sus rendimientos ha sido de 2,9 tn/ha.
Adems utiliza los valores de los rendimientos observados para calcular el estimador
insesgado de la varianza que resulta ser s= 0,36 (tn/ha).
a) Identificar la poblacin, la muestra y la variable aleatoria involucradas en esta
investigacin.
Nombrar dos posibles causas de la varianza de la variable aleatoria.
b) Qu parmetro se estima con la media muestral de los rendimientos
observados? Qu significa decir que la media aritmtica es un estimador
insesgado y consistente de dicho parmetro?
c) Explicar qu es la varianza de la media muestral. En qu valor la estimara?
d) Construir un intervalo del 95% de confianza para el rendimiento esperado de
este hbrido en el sur de la provincia de Buenos Aires. Interpretar el intervalo
construido.

14) Una compaa productora de automotores asegura que los autos del modelo que
ofrece para ser equipado como taxi cumplen en promedio con la norma de la Agencia de
Proteccin Ambiental de los Estados Unidos que establece que estos vehculos deben
emitir menos de 2,5 gramos de monxido de carbono por kilmetro. Para evaluar si esta
especificacin es correcta decide obteneruna muestra aleatoria de 25 de estos vehculos
matriculados como taxis en la ciudad de San Francisco y se midi el nivel de emisin de
monxido de carbono de cada uno.
a) Formular hiptesis apropiadas para realizar la evaluacin propuesta. Enunciar el
significado de cada hiptesis.
b) Seleccionar un nivel de significacin apropiado. Explicar qu implica el valor
elegido.
c) En qu consiste el procedimiento para obtener la muestra aleatoria necesaria?
Una vez obtenidos los datos obtenidos se calcul la media muestral (2,44 g/km) y
el estimador insesgado de la varianza (0,021g/km).

d) Calcular el valor p. Explicar qu probabilidad representa el valor p calculado.


e) Concluir y explicar la conclusin en trminos del problema particular.
f) A qu poblacin se extiende la inferencia realizada?
g) Cul es la variable aleatoria en cuestin? Por qu causas es una variable
aleatoria?

15) Un fitotecnista ensaya un nuevo cultivar hbrido de girasol para decidir si conviene
introducirlo el sur de la provincia de Buenos Aires. Para ello selecciona 20 lotes al azar
dentro de la regin y en cada uno cultiva el hbrido en cuestin. Una vez cosechados los
20 lotes encuentra que la media aritmtica de sus rendimientos ha sido de 2,9 tn/ha.
Adems utiliza los valores de los rendimientos observados para calcular el estimador
insesgado de la varianza que resulta ser s= 0,36 (tn/ha).
a) Identificar la poblacin, la muestra y la variable aleatoria involucradas en esta
investigacin.
Nombrar dos posibles causas de la varianza de la variable aleatoria.
b) Qu parmetro se estima con la media muestral de los rendimientos
observados? Qu significa decir que la media aritmtica es un estimador
insesgado y consistente de dicho parmetro?
c) Explicar qu es la varianza de la media muestral. En qu valor la estimara?
d) Construir un intervalo del 95% de confianza para el rendimiento esperado de
este hbrido enel sur de la provincia de Buenos Aires. Interpretar el intervalo
construido.

9) Se quiere hacer inferencias sobre una poblacin, mediante muestreo simple de una
poblacin infinita ( o con reposicin). Se conocen los siguientes datos:
La poblacin tiene distribucin normal. El tamao de la muestra es 25. La media muestral
197.
a) Obtenga un intervalo de confianza del 95% para la media poblacional.
b) Obtenga un intervalo de confianza del 90% para la desviacin tpica de esta
poblacin.
c) Si se quiere obtener una confianza del 99% de que la estimacin realizada de la
media se encuentre a una distancia menor de 3 unidades de la verdadera media
de la poblacin, cuntas observaciones ms deberan tomarse?

d) Con la muestra inicial, realice un contraste unilateral, con un nivel de significacin


de 0.05 para ver si se puede aceptar que la media de la poblacin es igual o
menor que 194.
e) Con la muestra inicial , realice un contraste bilateral para decidir aceptar o no que
la varianza de la poblacin sea 150, de manera que sea solo del 5% la
probabilidad de que si esta varianza realmente fuera 150, el contraste sin
embargo nos dijera que no.

Вам также может понравиться