Вы находитесь на странице: 1из 12

1

PRUEBA DE HIPOTESIS: (Estadsticos de prueba)



I. DEFINICIONES PRELIMINARES:

- Q QU U E ES S U UN NA A H HI IP P T TE ES SI IS S? ?
Es un respuesta a priori a un problema.

- - Q QU U E ES S U UN NA A H HI IP P T TE ES SI IS S E ES ST TA AD D S ST TI IC CA A? ?
Es un enunciado acerca del valor de un parmetro poblac ional

- Q QU U E ES S U UN NA A P PR RU UE EB BA A D DE E H HI IP P T TE ES SI IS S? ?
Es un procedimiento basado en la informacin muestral y en la teora de probabilidad, para
determinar si una hiptesis estadstica debe ser aceptada o rechazada.

- QU CLASES DE HIPTESIS EXISTEN?
HIPOTESIS NULA.
Se denota por Ho.
Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un parmetro
poblacional.
Por lo comn es una afirmacin acerca del parmetro de poblacin cuando toma un valor
especfico.
HIPOTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula

- QU ERRORES SE COMETEN EN UNA PRUEBA DE HIPTESIS?
Error Tipo I:
Se comete este error cuando se rechaza la hiptesis nula, cuando es verdadera.
Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:
Se comete este error cuando se acepta la hiptesis, cuando es falsa.
Se denota por = P(Aceptar Ho/Ho es falsa)

- Nivel de Significancia (o)
Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de
rechazar H
0
, denotada por o. A sta se le llama nivel de significancia.

Nivel de Significancia: La probabilidad (o) ms alta de rechazar H
0
cuando H
0
es cierto se llama
nivel de significancia.
Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeo de o.
Usando un valor pre-asignado de o se construye una regin de rechazo o regin crtica en la
curva normal estndar o en la curva t que indica si debemos rechazar H
0
.
Regin Crtica o de Rechazo: Una regin crtica o de rechazo es una parte de la curva de z o de
la curva t donde se rechaza H
0
.
La regin puede ser de una cola o de dos dependiendo de la hiptesis alterna.

Ejemplos Para H
1
: > valor aceptado, la regin de rechazo est dada por:
o
2
(cola derecha, z t)
Para H
1
: < valor aceptado, la regin de rechazo est dada por:
(cola izquierda, z t)
Para H
1
: = valor aceptado, la regin de rechazo es de dos colas y est dada por:
(2-colas, z t)


ETAPAS DE UNA PRUEBA DE HIPTESIS
Plantear la hiptesis nula y alternativa.
Especificar el nivel de significancia (o confianza) que se va a utilizar.(Generalmente la
plantea el investigador)
Elegir el estadstico de prueba que debe ser especificado en trminos de un estimador del
parmetro a probar.
Establecer el valor o valores crticos para rechazar o aceptar Ho. (Se encuentran en la
tabla de probabilidades)
Determinar la Regin de Aceptacin y de Rechazo, en funcin a los valores crticos.
Dar conclusin respectiva

II. FORMULAS DE LOS ESTADISTICOS DE PRUEBA:

FORMULAS DE LOS ESTADISTICOS DE PRUEBA
I. PRUEBA DE HIPOTESIS PARA EL PROMEDIO POBLACIONAL:
A. Si la varianza poblacional se conoce y n es mayor de 30:
Estadstico de prueba: Valor crtico:

n
x
Z
o

=

2 / o
Z Z
t
= (distribucin normal)
B. Si la varianza poblacional no se conoce y n es menor o igual a 30:
Estadstico de prueba: Valor crtico:

n
s
x
t

=
) 1 , 2 /
(

=
n
t
t t
o
(distribucin t de student)

II. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL

Estadstico de prueba: Valor crtico:

n
pq
P p
Z

=

2 / o
Z Z
t
=
Esta formula es tanto para muestras grandes como para muestras pequeas.

o
o/2 o/2
3
III. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS
A. Si las varianzas poblacionales se conocen y las muestras son de tamao n
1
>30 y n
2
>30
(grandes):
Estadstico de prueba: Valor crtico:
2
2
1
1
2 1 2 1
) ( ) (
n n
x x
Z
o o

+

=

2 / o
Z Z
t
=

B. Si las varianzas poblacionales se desconocen y las muestras son de tamao n
1
30 y
n
2
30 (pequeas):
Estadstico de prueba: Valor crtico:
2 1
2 1 2 1
1 1
) ( ) (
n n
S
x x
t
c
+

=


) 2 , 2 /
(
2 1
+
=
n n
t
t t
o
(distribucin t de student)

Donde :


2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
c
+
+
=
, se llama varianza mancomunada


IV. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES:
A. Si p
1
y p
2
se determinan a partir de muestras:
Estadstico de prueba: Valor crtico:

2
2 2
1
1 1
2 1 2 1
) ( ) (
n
q p
n
q p
P P p p
Z
+

=

2 / o
Z Z
t
=

Esta formula es tanto para muestras grandes como para muestras pequeas.


PRUEBA DE HIPTESIS PARA LA MEDIA

1. Un investigador de mercados y hbitos de comportamiento afirma que el tiempo que los nios de
tres a cinco aos dedican a ver la televisin cada semana se distribuye normalmente con una
media de 22 horas y desviacin estndar 6 horas. Frente a este estudio,
una empresa de investigacin de mercados cree que la media es mayor y para probar su
hiptesis toma una muestra de 64 observaciones procedentes de la misma poblacin,
obteniendo como resultado una media de 25. Si se utiliza un nivel de significacin del 5%.
Verifique si la afirmacin del investigador es realmente cierta.

2. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de
ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que
realizan un nmero de visitas promedio superior a 40. Una muestra tomada al azar durante 8
semanas revel un promedio de 42 visitas semanales y una desviacin estndar de 2 visitas.
Utilice un nivel de confianza del 99% para aclarar esta cuestin.
4


3. Un laboratorio contrata a un especialista en estadstica para controlar el llenado de capsulas de
antibiticos cuyo peso neto es de 250 mg. El llenado de estas capsulas es automtico y realiza de
inmediato un control para verificar el llenado, si este presenta fallas muy notorias regresa para el
correspondiente ajuste, elevndose as los costos de produccin. Para verificar si el llenado se est
realizando satisfactoriamente, se toma al azar n=19, capsulas encontrndose los siguientes
resultados: =251 mg; s=2mg; Cul es la solucin?.

4. Una cadena grande de supermercados, expide su propia tarjeta de crdito. El gerente financiero
desea averiguar si el saldo deudor medio mensual es mayor que $400. El nivel de significacin se
fija en 0.05. Una revisin aleatoria de 172 saldos revel que la media muestral es $407 y la
desviacin estndar de la muestra es $38. Debera concluir el gerente que la media poblacional es
mayor que $400, o es razonable suponer que la diferencia de $7 (de $407 $400 = $7) se debe al
azar?

5. En un estudio de control de calidad de automviles, se considera un parmetro de evaluacin si
arranca en menos de 3 minutos. Para lo cual se ha tomado 10 autos de la misma marca para
estudiar el tiempo de arranque encontrndose los siguientes resultados (en segundos):
2. 84 , 2.86 , 3.06 , 2.94 , 2.94 , 2.82 , 3.02 , 3.14 , 3.42 , 3.16.
Probar si los automviles cumplen con este parmetro de calidad.
Verificar H
0
: = 3 frente a H
1
: < 3, utilizando =0.05
A qu conclusin llegara usted?.

6. Una muestra aleatoria de 100 docentes universitarios del pas, dio los siguientes resultados.
Xi = 4,000 Xi = 990, 000
a) La autoridad educativa afirma que el promedio de edad de un docente universitario es de 43
aos, promedio que consideramos demasiado alto.
b) Realice una prueba de hiptesis, establezca, use alfa = 0.01.

PRUEBA DE HIPTESIS PARA LA PROPORCION

1. El jefe de admisin de una universidad afirmo en una reunin con las directivas que el 15% de
los estudiantes que ingresan, se retiran antes de haber completado cuatro semestres
acadmicos. En una revisin a los registros de los ltimos aos, mediante una muestra aleatoria
de 300 alumnos, se encontr que 54 de ellos se retiraron. Al nivel del 1% es vlida dicha
informacin?.

2. Un fabricante de papel higinico DELUXE considera que tiene asegurado el 20% del mercado.
Para probar esta aseveracin, la fbrica de la competencia toma una muestra de 200 clientes
potenciales a quienes les pregunta por la marca papel higinico de su preferencia. De los 200
entrevistados, 60 prefieren el papel DELUXE. Cules deberan ser las hiptesis que se deben
plantear, para probar si en realidad el fabricante de DELUXE tiene asegurado una mayor
proporcin del mercado de la que sostiene? Darle solucin.

3. Una nueva serie de TV debe demostrar que capta ms del 25% de la audiencia despus de su
periodo inicial de 10 semanas, para decir que tuvo xito. Suponga que en una muestra de 400
familias 112 estaban viendo la serie.
A un nivel de significacin de 0,10; puede decirse que la serie tuvo xito, con base en la
informacin de la muestra?.


4. Se plantea una hiptesis de trabajo de que no ms del 5% de las piezas que se fabrican en un
proceso de manufactura tienen defectos. Para tal estudio se selecciona una muestra de 100
piezas, encontrndose que 10 estn defectuosas.
Pruebe la hiptesis anterior al 5% de significacin.
5


5. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de
ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que
realizan un nmero de visitas promedio superior a 40. Una muestra tomada al azar durante 8
semanas revel un promedio de 42 visitas semanales y una desviacin estndar de 2 visitas.
Utilice un nivel de confianza del 99% para aclarar esta cuestin.


PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS

1. Un departamento de investigacin de mercados en software para usos educativos desea saber si un
producto con marca conocida se vende a un precio superior al de una marca desconocida. Se
procedi a seleccionar 16 almacenes que distribuyen el producto cuya marca es ampliamente
conocida y 12 almacenes que vende el mismo producto pero con marca que apenas entra al
mercado. Los resultados fueron en promedio de $30.000 y $26.000, con desviacin estndar
poblacional de $6200 y $ 4800 respectivamente. Al nivel del 1%, se puede aceptar tal
informacin? determine su estimacin.

2. Scandura y Wells, hicieron un experimento de material introductorio que organiza lo que se va a
aprender, 2 organizadores previos en relacin con el rendimiento de matemticas abstractas. Se
selecciona 50 estudiantes, 25 de los cuales recibirn un organizador previo antes de estudiar un
ensayo de 1000 palabras sobre topologa de Euler. Al final del periodo experimental, a ambos
grupos se les administro una prueba objetiva sobre conceptos topolgicos. La variable dependiente
X, era el nmero de respuestas correctas.
Grupo 01 (organizador previo) Grupo 02 (resumen histrico)

n1 = 25 n2 = 25
x1 = 7,65 x2 = 6,00
S1= 6,50 S2= 5,90
Contraste las hiptesis respectivas
3. Ricardo Garca, gerente de operaciones de UNIBANK, est interesado en saber si existe diferencia
significativa entre los tiempos de atencin al cliente de los empleados que trabajan en los dos
turnos, maana y tarde. Al respecto, ayer personalmente registr los tiempos que utilizaron los
empleados para atender a los clientes en ambos turnos y en forma aleatoria. Los tiempos en
minutos que registr fueron los siguientes:

Maana 2,10 4,10 4,70 3,70 6,00 3,90
Tarde 4,00 4,50 3,70 4,00 4,10 3,45

Ricardo proces los datos en un programa estadstico y obtuvo la siguiente informacin:

n Promedio Desviacin Estndar.
Maana 6 4.08 1.28
Tarde 6 3.958 0.358


A la luz de estos resultados, A qu conclusin lleg Ricardo?. Compruebe con 5% de
significacin.

4. Una compaa de transportes requiere comprar un gran lote de buses para el transporte urbano
con el fin de reemplazar su parque automotor y para tal fin desea comprobar la afirmacin hecha
por el proveedor de la marca B, en el sentido de que la marca A es menos ahorradora de
combustible. Para tal fin la empresa toma una muestra aleatoria de 35 vehculos marca A y
encuentra que la misma tiene un promedio en el rendimiento de 18 kilmetros/galn con una
desviacin estndar de 8 kilmetros/galn, mientras que una muestra de 32 vehculos marca B
6
presenta un promedio de 22 kilmetros/galn con desviacin estndar de 3 kilmetros /galn.
Qu decisin debe tomar el gerente de la compaa con un nivel de significacin del 5%?

5. Samuels (1967) efectu un experimento para determinar si los dibujos facilitaban o interferan el
aprendizaje de palabras en nios pequeos. Se escogi aleatoriamente a 20 nios del 1 grado
de primaria para que aprendan palabras ilustradas por sencillos dibujos o para que aprendieran
las mismas palabras sin ilustracin de ningn tipo. Despus de varios ensayos se determin el
dominio de dichas palabras, midiendo el nmero de respuestas correctas de cada nio. A
continuacin se muestran las medias y desviaciones tpicas de los respectivos aciertos.
Grupo 01 (sin ilustracin) Grupo 02 (con ilustracin)

n1 = 10 n2 = 10
x1 = 19,20 x2 = 11,30
1= 7,93 2= 5,79
Con = 0,05; contrastar la respectiva hiptesis.
6. Una compaa desea estudiar el efecto que tiene la pausa para el caf, sobre la productividad de
sus obreros. Selecciona 6 obreros y mide su productividad en un da corriente, y luego mide la
productividad de los mismos 6 obreros en un da que se concede la pausa para el caf. Las cifras
que miden la productividad son las que siguen: Con o = 0,05. A qu conclusin llegar la
compaa?.

TRABAJADOR 1 2 3 4 5 6
Sin pausa 23 35 29 33 43 32
Con pausa 28 38 29 37 42 30

PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES

1. Un fabricante de microprocesadores compra los microcircuitos de sus productos a dos proveedores:
una muestra de 300 microcircuitos del proveedor A contuvo 50 defectuosos, mientras que una
muestra de 400 piezas del proveedor B present 70 con fallas. Pruebe la hiptesis nula de que no
hay diferencia entre la proporcin de circuitos defectuosos de los dos proveedores.

2. Una empresa de estudios de mercado quiere saber si un producto promocionado a nivel nacional lo
adquieren los hombres en mayor proporcin que las mujeres. De dos muestras aleatorias
independientes de 900 hombres y 800 mujeres se encontr que 270 hombres y 200 mujeres
adquieren el producto. Cul es su decisin al 5% de significacin?

3. Un investigador de mercados que trabaja para una agencia de publicidad, trataba de explicar la
adquisicin de un automvil. Los resultados de una encuesta mostraron que un 30% (n = 60) de los
entrevistados con ttulo universitario poseen automvil, en comparacin con 21% (n = 45) de
aquellos que no tienen ttulo universitario. Qu debe concluir el investigador al 1% de significacin?

4. Una organizacin de investigacin de mercados realiz 2 encuestas al mismo tiempo. Ambas se
relacionaban con la poblacin de personas de 18 aos o mayores. A pesar de que las 2 muestras
fueron seleccionadas independientemente; una referente a los ingresos buscaba tener informacin
sobre los cambios en los gastos de artculos de consumo como resultado de los cambios en los
ingresos. La otra encuesta se refera a las preferencias de marcas y buscaba obtener informacin
sobre las preferencias por las marcas de los diferentes tipos de alimentos. En la encuesta sobre
ingresos aplicada a 1,200 personas, 189 se rehusaron a contestar. En la encuesta sobre
preferencias de marcas aplicada a 1,500 personas, 81 se rehusaron a contestar. Indican estos
resultados que el asunto de la encuesta afecta a la proporcin de personas que se rehusaron a
contestar. Establezca la regla de decisin adecuada suponiendo que el riesgo de concluir que el
asunto de la encuesta tiene un efecto cundo realmente no existe tal efecto debe ser 0,01. A qu
conclusin deber llegarse?
7
PRUEBA DE HIPTESIS PARA UNA VARIANZA


EJEMPLO:







8





9






REGRESIN Y CORRELACIN

ANALISIS DE REGRESIN LINEAL SIMPLE:
- El anlisis de regresin es una tcnica estadstica que consisten en determinar la relacin
funcional entre dos variables cuantitativas en estudio.
- Esta relacin funcional entre las variables, es una ecuacin matemtica de la forma Y= A + B X,
que recibe el nombre tambin de Funcin de Regresin o Modelo de Regresin.
- A la variable Y se le denomina variable dependiente, a la variable X independiente y a A,B se les
llama parmetros de la ecuacin de regresin..
- La finalidad del Anlisis de Regresin es hacer pronsticos es decir, hacer estimaciones futuros de
la variable dependiente.
- PASOS A SEGUIR:
a. Realizar el diagrama de dispersin y ver el comportamiento de la variable.
b. Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los parmetros de la
ecuacin. Las formulas son las siguientes:



= =
= = =

=
n
i
n
i
i i
n
i
n
i
i i
n
i
i i
X X n
Y X Y X n
B
1
2
1
2
1 1 1
) (


X B Y A =


c. Para hacer el pronstico o el valor estimado de Y, reemplazar en la ecuacin matemtica el
respectivo valor de Xo, de la siguiente manera:
Y = A + B (Xo)



10
ANALISIS DE CORRELACION LINEAL SIMPLE:

- El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o afinidad
entre las variables cuantitativas consideradas en un estudio.
- Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin entre dos variables. Se
llamar CORRELACION LINEAL O RECTILINEA si la funcin es una recta, y de CORRELACION NO
LINEAL cuando la funcin es una curva o una funcin de grado superior.
- El COEFICIENTE DE CORRELACION DE PEARSON, es el estadgrafo que mide el grado de
asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se define como:



= = = =
= = =

=
n
i
n
i
i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
Y Y n X X n
Y X Y X n
r
1
2
1
1
2
1 1
2 2
1 1 1
) ( ) (


Interpretacin
-1 -0.7 -0.4 0 0.4 0.7 -1

Perfecta Alta Regular Baja Baja Regular Alta Perfecta
N E G A T I V A P O S I T I V A


1. LA EMPRESA LUZANDINA de la ciudad de Piura, est haciendo un estudio sobre los consumos
de energa (en miles de kilowatts - hora) y el nmero de habitaciones en una residencia
privada multifamiliar. Para este estudio se selecciona una muestra aleatoria de 10 residencias
multifamiliares, en la cual se obtuvo los siguientes resultados:

N de
casa
Nmero de
habitaciones
Consumo de energa (miles
de kw)
1 12 9
2 9 7
3 14 10
4 6 5
5 10 8
6 8 6
7 10 8
8 10 10
9 5 4
10 7 7
Total
a. Determine la variable dependiente (y) y la variable independiente (x)
Y =
X =
b. Estime la ecuacin de regresin lineal e interprete sus coeficientes
c. Evale el consumo (en miles de kilowatts-hora), para una casa de 11 habitaciones.
d. Determine e interprete el coeficiente de determinacin y de correlacin.
e. Pruebe la contribucin de la variable explicativa, establezca su intervalo de confianza use =
0.05.







11
2. El gerente de una empresa est haciendo un estudio entre el nmero de contactos que tienen
sus vendedores y sus ventas en miles de dlares. Para esto recurre al departamento de
ventas y contabilidad obteniendo la siguiente informacin:


N
Nmero de
contactos
Ventas (en miles
de dlares)
1 14 24
2 12 14
3 20 28
4 16 30
5 46 80
6 23 30
7 48 90
8 50 85
9 55 120
10 50 110
Total

a. Determine la variable dependiente (y) y la variable independiente (x)
Y =
X =
b. Estime la ecuacin de regresin lineal: Y = A + B X
c. Evale las ventas estimadas si se contacta, o comunica, con 40 clientes.
d. Determine e interprete el coeficiente de determinacin y de correlacin.
e. Pruebe la contribucin de la variable explicativa, establezca su intervalo de confianza use =
0.05.

3. El departamento de produccin de una fbrica desea explorar la relacin entre el nmero de
obreros que ensamblan y la cantidad de artculos producidos. Como experimento se
asignaron grupos de trabajadores para verificar su produccin y los resultados obtenidos
fueron los siguientes:

N Nmero de
ensambladores
Produccin en
(unidades)
1 2 15
2 4 25
3 1 10
4 5 40
5 3 30
Total

a. Determine la variable dependiente (y) y la variable independiente (x)
Y =
X =
b. Estime la ecuacin de regresin lineal: Y = a + b X
c. Para 6 operarios Cul es la produccin esperada?
d. Determine e interprete el coeficiente de determinacin y de correlacin.
e. Pruebe la contribucin de la variable explicativa, establezca su intervalo de confianza use =
0.05.








12
4. El jefe de personal de una empresa cree que existe una relacin entre la ausencia al trabajo
y la edad del empleado. Con el propsito de estudiar el problema tom en cuenta la edad de
diez trabajadores escogidos al azar y contabiliz los das de ausencia durante el ao. Los
resultados fueron como se observa en la tabla que sigue:


N
Edad en
aos
Ausencia en
das
1 25 20
2 50 5
3 35 10
4 20 20
5 45 8
6 50 2
7 30 15
8 40 12
9 62 1
10 40 8
Total

a. Construya el diagrama de dispersin.
b. Obtenga la ecuacin de la recta de regresin
c. Si un trabajador tiene 38 aos, Cuntos das se espera que falte al ao?
d. Si un trabajador falt 3 das al ao. Qu edad se puede esperar que tenga este trabajador?
e. Determine e interprete el coeficiente de determinacin y de correlacin.
f. Pruebe la contribucin de la variable explicativa, establezca su intervalo de confianza use =
0.05.

Вам также может понравиться