Вы находитесь на странице: 1из 77

Estadstica Aplicada 1

Procedimientos generales de una


prueba de hiptesis estadstica
Hiptesis Estadstica es una proposicin concerniente a uno o ms

parmetros de una o ms poblaciones.


Siempre existirn dos hiptesis contrapuestas:
H0: Hiptesis nula (afirmacin que inicialmente se supone cierta)
Ha: Hiptesis alternativa (afirmacin contradictoria a H0 y donde

cae el peso de la prueba)


Por definicin, H0 se acepta como
cierta a no ser que la evidencia
muestral apoye fuertemente a Ha.

Existen 2 conclusiones:
1) Rechazar H0
2) No Rechazar H0

Prueba de Hiptesis es un mtodo que emplea datos de una muestra


para decidir si se debe rechazar la hiptesis nula o no.
2

Procedimientos generales de una


prueba de hiptesis estadstica
Si es el parmetro de inters, H0 ser siempre de la
forma:
donde 0 es un nmero
0 : = 0 denominado valor nulo del
parmetro.

Mientras que Ha tendr una de las siguientes formas:

1) : > 0

2) : < 0

3) : 0

Ejemplo:
Un fabricante de automviles asegura que su nuevo modelo tiene un
rendimiento de no menos de 10 [km/l]. No sera aconsejable contradecir al
fabricante sin contar con fuerte evidencia en contra de lo que l afirma. Cul
sera una formulacin apropiada para el problema?
3

Procedimientos generales de una


prueba de hiptesis estadstica
Procedimiento de Prueba es una regla, con base en datos

muestrales, para determinar si se rechaza H0. Posee dos


componentes:.
1.

Estadstico de prueba: Estadstico en el que se basa la


decisin de rechazar o no H0. Su distribucin de
probabilidad se basa en que H0 es cierta.

2.

Regin de Rechazo: Conjunto de todos los valores del


estadstico de prueba para los cuales H0 ser rechazada.

Ejemplo
Un fabricante de cigarrillos indica que el promedio
de nicotina de la marca Kent de cigarrillos es de a
lo sumo 1,5 [mg].
Formulacin:

H 0 : 1,5
H a : 1,5

Regla de decisin basada en una muestra de 32 cigarrillos


Estadstico de prueba: X
Regin de rechazo: X 1,6

No se rechaza H0
1,6

Cmo elegir la regin de rechazo?

Se rechaza H0

X
5

Errores Tipo I y II
ERROR TIPO I: Rechazar H0 cuando es verdadera.
ERROR TIPO II: No Rechazar H0 cuando es falsa.

Cuando se trabaja con muestras, siempre es posible cometer alguno


de estos errores (independiente de la regin de rechazo que se
elija).
Al probar cualquier hiptesis estadstica se puede presentar lo siguiente:
Decisin

H0 es verdadera

H0 es falsa

No Rechazar H0

No hay error

Error tipo II

Rechazar H0

Error tipo I

No hay error

P Error tipo I P Rechazar H 0 | H 0 es verdadera


P Error tipo II P No rechazar H 0 | H 0 es falsa
Lo que se busca son procedimientos en los que se minimicen las
probabilidades de cometer ambos errores ( y respectivamente)

Ejemplo
Represente con , el nivel de radiactividad promedio
real (picocuries por litro). El valor 5 [pCi/lt] es
considerado la lnea divisora entre el agua segura
e insegura.
Recomendara probar:
H0: = 5 v/s Ha: > 5 H0: = 5 v/s Ha: < 5?
Explique su razonamiento.
(Sugerencia: considere las consecuencias de un error
de tipo I y tipo II para cada posibilidad).
7

Ejemplo
Muchos hogares antiguos tienen sistemas elctricos que utilizan
fusibles en vez de interruptores de circuito. Un fabricante de
fusibles de 40 [A] quiere asegurarse de que el amperaje promedio al
que se queman los fusibles es de hecho 40. Si el amperaje promedio
es menor que 40, los clientes reclamarn porque los fusibles
requerirn ser cambiados con mucha frecuencia. Si el amperaje
promedio es mayor que 40, el fabricante podra ser responsable de
dao a un sistema elctrico debido al mal funcionamiento del
fusible. Para comprobar el amperaje de los fusibles, se elige e
inspecciona una muestra de fusibles. Si se realizara una prueba de
hiptesis a partir de los datos resultantes, cules hiptesis nula y
alternativa seran de inters para el fabricante? Describa los errores
tipo I y tipo II en el contexto de esta situacin del problema.
8

Pasos para realizar un procedimiento


de prueba de hiptesis
1.
2.
3.
4.
5.
6.
7.

Identificar el parmetro de inters y describirlo en el


contexto de la situacin del problema.
Determinar el valor nulo y establecer la hiptesis nula.
Establecer la hiptesis alternativa adecuada.
Dar la frmula para el valor calculado del estadstico de
prueba (sustituyendo valores conocidos).
Establecer la regin de rechazo para el nivel
especificado.
Calcular las cantidades muestrales necesarias, sustituir en
la frmula del estadstico de prueba y calcular ese valor.
Determinar si H0 debe ser rechazada o no y establecer una
conclusin en el contexto del problema.
9

En CCU se toma una muestra de 20 botellas llenadas desde la lnea de produccin, y se mide el
volumen de llenado promedio. Si el verdadero promedio de llenado supera los 300 cc., habr
que detener el proceso productivo y volver a configurarlo. A partir de la muestra obtenida,
habr que detener el proceso?
En Falabella desean conocer si las mujeres gastan, en promedio, en las liquidaciones ms que
los hombres para as determinar el stock de mercadera apropiado y la distribucin (layout)
apropiada en sus tiendas.

10

Pruebas de hiptesis para una


media poblacional
Existen tres casos para realizar este tipo de prueba:

1. conocido, poblacin normal, no importa el tamao


muestral.
Estadstico: =

0
/

~ (0,1)

0
/

0,1 =

2. conocido o desconocido, poblacin no importa,


tamao muestral grande ( 30, aplica el TCL).
Estadstico: =

0
/

(0,1)

3. desconocido, poblacin normal, tamao muestral


pequeo ( < 30, no aplica el TCL).
Estadstico: =

0
~ 1
/

11

Pruebas de hiptesis para una


media poblacional
Por lo tanto, el procedimiento de prueba y las regiones de rechazo para el caso 1
son las siguientes:
Procedimiento de prueba:
Si H0: = 0

X 0

...es el estadstico de prueba.

Regiones de rechazo:
Hiptesis alternativa

Regin de rechazo para prueba de nivel

Ha : > 0

z z

Ha : < 0

z z

Ha : 0

z z / 2 z z / 2

12

Determinacin de la probabilidad
de cometer un error tipo II
Para la prueba de cola superior: Ha: > 0 , la regin de rechazo es:

H0 no es
z z o bien X 0 z
Para: X 0 z
rechazada
n
n
Entonces para una prueba de nivel , y siendo un valor de mayor al valor
nulo 0:
' P H 0 no sea rechazada | '

P X 0 z
'
n

X '
'
P
z 0

Mientras crece
( ) disminuye.

0 ' Donde (z) = P(Z z)


z

13

Determinacin de la probabilidad
de cometer un error tipo II
Anlogamente, para una prueba de nivel ,
Para Ha: < 0
Para Ha: 0

0 '

' 1 z
n

0 '
0 '
z 2

' z 2

n
n

14

Determinacin del tamao muestral


Si se especifica , y , es decir: P(error tipo I) = y () = , entonces:
Para una prueba de cola superior n debe ser tal que:

0 '
0 '
z

n
n

Despejando n, se tiene:

z z 2

0 '

n
2
z 2 z

0 '

Prueba de una cola


(superior o inferior)
Prueba de dos colas
(aproximacin)
15

Pruebas de hiptesis para una


media poblacional
Caso 2: Cuando es grande se encuentra cercana a para la mayora de las
muestras, de modo que la VA:

X
Z
S n

Tiene aproximadamente una


distribucin normal estndar

Sustituyendo 0 en lugar de , produce el siguiente estadstico:

X 0
S

...se distribuye aproximadamente de


forma normal estndar cuando H0 es
verdadera.

Los procedimientos anteriores resultan en niveles de significacin


aproximados a (en lugar de exactamente).
16

Regiones de Rechazo para Pruebas Z


PRUEBA DE COLA SUPERIOR

PRUEBA DE COLA INFERIOR

z
0
Regin de Rechazo: z z

0
Regin de Rechazo: z z

PRUEBA DE DOS COLAS

2
z 2

Regin de Rechazo:

z 2

z z /2

z z /2

17

Pruebas de hiptesis para una


media poblacional
Caso 3: Poblacin Normal con desconocido (muestra pequea)
Si H0: = 0

X 0
S

...es el estadstico de prueba


cuando H0 es verdadera.

Hiptesis alternativa

Regin de rechazo para prueba de nivel

Ha : > 0

t t,n-1

Ha : < 0

t t,n-1

Ha : 0

t t / 2 ,n 1 t t / 2 , n 1
18

Ejemplo
Un fabricante de sistemas de aspersin utilizados para
proteccin de incendios en edificios de oficina, afirma que el
verdadero promedio de temperatura de activacin del sistema
es de 130 . Al probar = 9 sistemas de aspersin, se
produjo un promedio muestral de temperatura de activacin
de 131,08 . Si la distribucin de los tiempos de activacin
se distribuye normal con = 1,5 , la muestra obtenida
contradice la afirmacin del fabricante? Utilice un nivel de
significancia = 0,01.

19

Pruebas de hiptesis para comparar


dos medias poblacionales
Suposiciones bsicas:
1. X1, X2, ..., Xm es una muestra aleatoria de una poblacin N 1 , 12
2. Y1, Y2, ..., Yn

es una muestra aleatoria de una poblacin N

2
,

2
2

3. Las muestras X e Y son independientes entre s.

Por otra parte:

Como E X Y 1 2 X Y es estimador insesgado de 1 2

X Y

2
1

2
2

Luego, la
estandarizacin
resulta en la variable
normal estndar,

X Y 1 2

12
m

22
n
20

Prueba Z para poblaciones Normales y


Varianza Conocida
Estadstico de prueba:

H 0 : 1 2 0

X Y 0

12
m

22
n

Regiones de rechazo:
Hiptesis
alternativa

Regin de rechazo para prueba de


nivel

Ha: 1 2 > 0

z z

Ha: 1 2 < 0

z z

Ha: 1 2 0

z z / 2 z z / 2
21

Ejemplo
El anlisis de una muestra aleatoria formada por = 20
especmenes de acero laminado en fro, para determinar su
resistencia, dio por resultado una resistencia promedio
muestral de = 29,8 . Una segunda muestra de = 25
especmenes de acero galvanizado de 2 lados mostr una
resistencia promedio muestral de = 34,7 . Si se supone
que las dos distribuciones de resistencia son normales
con1 = 4 y 2 = 5 indican los datos que las verdaderas
resistencias promedio 1 y 2 son diferentes? Realice una
prueba al nivel de significancia de 0,01.

22

y Seleccin del Tamao Muestral


Suponga un test de cola superior (Ha: 1 2 > 0) en el que la regin de rechazo
es de la forma:
z z o bien X Y 0 z X Y
Para: X Y 0 z X Y H0 no es
rechazada
Por lo tanto, la probabilidad de un error tipo II cuando 1 2 = es:

' P No rechazar H 0 cuando 1 2 '

P X Y 0 z X Y cuando 1 2 '

Cuando 1 2 = , la diferencia de las medias muestrales se distribuye


normalmente con media y desviacin estndar X Y .
Utilizando esto para estandarizar, se obtiene:
23

y Seleccin del Tamao Muestral


Hiptesis alternativa () = P(No Rechazar H0 | 1 2 = )
Ha: 1 2 > 0

' 0
z

X Y

Ha: 1 2 < 0

' 0
1 z

X Y

Ha: 1 2 0

' 0
' 0
z / 2
z / 2

X Y
X Y

24

y Seleccin del Tamao Muestral


Es posible determinar tambin los tamaos muestrales m y n que satisfagan P
(error tipo I) = y P(error tipo II cuando 1 - 2 = ) = especficas.
Para una prueba de cola superior:

' 0
( ) z
X Y

'

Igualando ambos trminos se obtiene:

m n z z 2
2
1

'

2
2

( 12 22 )z z

Cuando m = n esta ecuacin se traduce en:

mn

'

25

Prueba Z para Muestras Grandes


Segn el Teorema Central del Lmite, independiente de cual sea la distribucin
de las poblaciones de origen, si ambas muestras son suficientemente grandes
(vale decir > 30 y > 30), los promedios muestrales se distribuirn en
forma aproximadamente normal.
Luego, las diferencias de las medias muestrales tambin tendrn
aproximadamente una distribucin normal. Por lo tanto, es adecuado el uso del
estadstico de prueba:

X Y 0
S12 S 22

m
n

Estadstico que tiene aproximadamente


una distribucin normal estndar
cuando H0 es verdadera

Los procedimientos anteriores resultan en niveles de significacin aproximados


a (en lugar de exactamente).
26

Ejemplo
El gerente del supermercado R&P, el cual atiende las 24 hrs., preocupado
por la satisfaccin de sus clientes no slo en los alimentos adquiridos, si
no tambin en la calidad del servicio, desea saber si la cantidad de
personas que esperan en horarios Peak es mayor a la misma variable en
horarios normales (los horarios nocturnos no son relevantes para el
gerente debido a que el flujo de clientes es significativamente menor).
Para realizar este estudio, el gerente decidi que c/u de las 24 hrs. de un
da fueran divididas en 48 horarios de 30 min. c/u. Adems, los horarios
Peak definidos fueron: 6AM - 9AM, 11:30AM - 1:30PM, 4:30PM 6:30PM , mientras que el horario nocturno considerado es desde las 11 PM
hasta las 6 AM. De esta forma, los horarios normales son aquellos que no
quedaron anteriormente definidos.

27

Ejemplo (continuacin)
El periodo de estudio considerado fue de 1 semana, vale decir 24 x 7 = 168
hrs., o bien 168 x 2 = 336 horarios de 30 minutos, medidos continuamente
durante una semana. Un da Lunes a las 8 AM comenz el estudio. A
modo de ejemplo, se muestran los datos recopilados en los 32 horarios de
30 min. de ese da.
En base al estudio realizado, puede concluir el gerente del supermercado
R&P que el nmero promedio de clientes que esperan en los horarios
Peak es mayor que en los horarios normales? Utilice la cantidad de
clientes que esperan al final de cada horario para realizar su anlisis. Use
un nivel de significancia del 1%.

28

Da

Comienzo

Tipo de
Horario

Esperas
Iniciales

Llegadas

Salidas

Esperas
Finales

Cajeros

Clientes
Totales

Lun

8:00 AM

Peak

21

22

23

Lun

8:30 AM

Peak

25

18

26

Lun

9:00 AM

Normal

27

28

35

Lun

9:30 AM

Normal

21

23

28

Lun

10:00 AM

Normal

20

23

25

Lun

10:30 AM

Normal

36

31

38

Lun

11:00 AM

Normal

30

36

37

Lun

11:30 AM

Peak

34

29

35

Lun

12:00 PM

Peak

56

48

14

62

Lun

12:30 PM

Peak

14

58

64

72

Lun

1:00 PM

Peak

53

52

61

Lun

1:30 PM

Normal

30

36

39

Lun

2:00 PM

Normal

34

31

37

Lun

2:30 PM

Normal

36

37

42

Lun

3:00 PM

Normal

30

28

35

Lun

3:30 PM

Normal

29

34

36

Lun

4:00 PM

Normal

35

33

37

Lun

4:30 PM

Peak

32

25

11

36

Lun

5:00 PM

Peak

11

46

43

14

57

Lun

5:30 PM

Peak

14

39

45

53

Prueba T para la diferencia entre dos


medias poblacionales (1 2 )
Para usar este procedimiento de prueba, debe cumplirse que:

Ambas poblaciones son normales, independientes y con distinta varianza.

X Y 1 2
S12 S 22

m
n

Variable estandarizada que tiene


aproximadamente una distribucin t,
con grados de libertad, estimados a
partir de:

s12 s22

m
n


2
2
2
2
s
/
m
s
/
n
2
1
m 1
n 1

30

Prueba T para la diferencia entre dos


medias poblacionales (1 2 )
Luego, la prueba t con dos muestras para probar H0: 1 2 = 0 se basa en:

Valor del estadstico de prueba:

x y 0
s12 s22

m
n

Hiptesis alternativa

Regin de rechazo para prueba de


nivel aproximado

Ha: 1 2 > 0

t t,

Ha: 1 2 < 0

t t,

Ha: 1 2 0

t t / 2 , t t / 2 ,

31

Ejemplo
La siguiente tabla informa sobre la resistencia a la tensin, en psi, de
especmenes de forros (que podran ser utilizados para proteger tuberas),
en procesos con y sin fusin.
Proceso

Tamao muestral

Sin fusin
Con fusin

m = 10
n=8

Promedio muestral de Desviacin estndar


resistencia a la tensin
muestral
2.902,80
3.108,10

277,3
205,9

Investigadores afirman que el proceso de fusin aumenta la resistencia


promedio a la tensin. Suponiendo normalidad y que las varianzas
poblacionales son distintas, respaldan los datos esta conclusin? Utilice
un nivel de significancia del 10%.

32

Prueba T para la diferencia entre dos


medias poblacionales (1 = 2 )
Para usar este procedimiento de prueba, debe cumplirse que:

Ambas poblaciones sean normales, independientes y con igual varianza.

Varianza del estimador :

V X Y V X V Y
indep .

2
m

1 1
2
n
m n

Si se utiliza un estimador de sigma cuadrado apropiado, la variable


resultante de la estandarizacin tendr una distribucin t.
Este estimador , el cual es un estimador insesgado para 2 , es:
2
2

1
n

1
m

1
S

1
S
1
2
S p2
S12
S 22
mn2
mn2
mn2

Es conocido como el ESTIMADOR AGRUPADO o PONDERADO de la varianza.


33

Prueba T para la diferencia entre dos


medias poblacionales (1 = 2 )
Reemplazando Sp en la estandarizacin de la variable T se obtiene el estadstico,

X Y 1 2
Sp

1 1

m n

...que obedece a una distribucin t con (m + n 2) grados de libertad.


Entonces, el valor del estadstico de prueba t de dos muestras para probar H0:
1 - 2 = 0 se obtiene sustituyendo en la v.a. T. 0 en lugar de 1 - 2 .

34

Prueba T para la diferencia entre dos


medias poblacionales (1 = 2 )
Luego, la prueba t con dos muestras para probar H0: 1 2 = 0 es:
Valor del estadstico de prueba:

x y 0
sp

1 1

m n

Hiptesis alternativa

Regin de rechazo para prueba de


nivel

Ha: 1 2 > 0

t t, m + n 2

Ha: 1 2 < 0

t t , m + n 2

Ha: 1 2 0

t t / 2 , m + n 2 t t / 2 , m + n 2
35

Ejemplo

La Compaa SureStep fabrica trotadoras de alta calidad para gimnasios.


Actualmente, SureStep compra los motores de sus trotadoras al proveedor A. Sin
embargo, est considerando cambiar a un nuevo proveedor B, el cual ofrece un
costo ligeramente menor. Para tomar la decisin de cambiar de proveedor,
SureStep slo necesita validar que los motores del proveedor B sean tan confiables
como los del proveedor A.
Para corroborar esto, SureStep decide instalar 30 motores del proveedor A en 30
trotadoras, as como 30 motores del proveedor B en otras 30 trotadoras. Una vez
instalados los 60 motores (30 de cada proveedor), hace funcionar las trotadores
bajo condiciones regulares (imitando el uso dado en un tpico gimnasio) y registra
la duracin, en hrs. cerradas, de cada motor instalado en la trotadora respectiva
hasta su falla. Los datos obtenidos se muestran a continuacin.
Proveedor A 1358 793
Proveedor B 658 404

587
735

608
457

472
431

562
658

879
453

575 1293 1457 705 623


488 522 1247 1095 430

725
726

569
793

424
498

Proveedor A 436 1250 493


Proveedor B 502 589 975

485
808

462
456

765
731

854
491

634 1109 800 883 522


487 503 465 1475 508

791
846

684
732

666
507

Asumiendo las duraciones de los motores de ambos proveedores son normales, y


con igual varianza, se puede concluir que son igualmente confiables los
proveedores? Use un nivel de significacin del 5%.

36

Anlisis para relacin entre datos


en pares
A diferencia de lo que hemos estudiado hasta ahora, hay casos en los que
hay un conjunto de individuos u objetos y se hacen dos observaciones
en cada individuo u objeto. En este caso claramente las observaciones no
son independientes.
Suponga:
- pares (X1,Y1),...,(Xn,Yn) seleccionados
de manera independiente.
- E(Xi) = 1 y E(Yi) = 2
- Sean Di las diferencias dentro de pares.

Se supone que las Di se


distribuyen normalmente
con varianza D2.

Debido a que no hay independencia entre las observaciones de cada par la


prueba t tradicional con dos muestras no es vlida.

37

Prueba t para Pares


Si los diferentes pares son independientes entre s, luego las Di son
independientes. Si definimos D = X Y, donde X e Y son la primera y segunda
observaciones, dentro de un par arbitrario, entonces la diferencia esperada es:

D E X Y E X E Y 1 2

Luego, en el caso de informacin por pares, se forman las diferencias Di. Como
las Di constituyen una muestra aleatoria normal con media D las hiptesis sobre
D se pueden probar usando una prueba t de una muestra.
La Hiptesis nula es de la forma:
El estadstico de prueba es:

H 0 : D 0
T

D 0
SD / n

Con n - 1 grados de
libertad (GL)

38

Prueba t para Pares

Por lo tanto, la prueba t para pares es:

H 0 : D 0

(Donde D = X Y y D = 1 - 2)

Estadstico de prueba: T

D 0
SD / n

Hiptesis
alternativa

Regin de rechazo para prueba de


nivel

Ha: D > 0

t t, n 1

Ha: D < 0

t t, n 1

Ha: D 0

t t / 2 , n 1 t t / 2 , n 1
39

Ejemplo

El concesionario de automviles Steven Honda-Olds a menudo vende sus


automviles a parejas, digamos marido-mujer.
El encargado quisiera saber si los vendedores que actualmente est usando son
mejor evaluados por los maridos que sus esposas, o viceversa o bien son evaluados
de forma similar. De encontrar diferencias, se realizara una capacitacin especial
en los vendedores para lograr cautivar a los clientes insatisfechos.
Para poder detectar la existencia o no de tales diferencias, se les solicita a 35
parejas escogidas al azar (maridos y esposas) que califiquen el servicio entregado
por el vendedor, de manera independiente, en una escala de 1 a 10, siendo 10 la
nota ms favorable. La informacin recopilada se muestra a continuacin:
Pareja

10

11

12

13

14

15

16

17

18

Marido
Esposa

6
3

7
8

8
5

6
4

8
5

7
6

8
5

6
7

7
8

7
5

6
3

5
4

8
5

7
8

7
5

7
6

6
5

5
4

Pareja

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

Marido

10

Esposa

10

A partir de la informacin entregada por las parejas, qu puede concluir el


encargado de la concesionaria? Use un nivel de significancia del 5%.

40

Cunta evidencia existe en la muestra obtenida para cambiar el proceso que


actualmente se realiza y asumir todos los costos asociados al cambio? Qu
probabilidad hay de que al obtener una nueva muestra la tendencia actual se siga
produciendo?
Cul es la probabilidad de cambiar el proceso actual porque realmente
corresponde hacerlo?

41

Introduccin al Valor p
Considere un procedimiento de prueba en el que H0: = 1,5 y Ha: > 1,5 (Cola
superior), luego H0 se rechaza si z z
Si se calcula que z = 2,1, entonces:
Nivel
Significacin

Regin de
Rechazo

Conclusin

0,05

z 1,645

Rechazar H0

0,025

z 1,96

Rechazar H0

0,01

z 2,33

No rechazar H0

0,005

z 2,58

No rechazar H0

42

Definiciones del Valor p


(1) Conceptual: Es el mnimo valor de significacin al que H0 sera rechazada
cuando se utiliza un procedimiento de prueba especificado en un conjunto
dado de informacin. La conclusin resulta de comparar p con .
(2) Prctica: El valor p de una muestra es la probabilidad de encontrar en una
muestra al menos tanta evidencia a favor de la hiptesis alternativa como la
que se ha encontrado en la muestra actualmente observada.
1. Valor

P Rechazar

2. Valor

P No

H0

al

rechazar

H0

nivel
al

nivel

Valor P : mnimo nivel en el cual H0 puede ser


rechazada

No Rechazar H0

Rechazar H0

1
43

Significancia desde los Valores p


Este enfoque es actualmente ms popular que el nivel de

significancia y el enfoque de regin de rechazo.


Este enfoque sirve para evitar el uso del nivel de significancia
e indicar simplemente cuan significativa es la evidencia de
la muestra.
Cunto menor sea el valor p, existir ms evidencia a favor (o
en apoyo) de la hiptesis alternativa.
Si un valor p es suficientemente pequeo, casi cualquier
tomador de decisiones concluir que rechazar la hiptesis
nula es la decisin ms razonable.

44

Cun pequeo debe ser el Valor p


para apoyar a Ha?
La respuesta no es nica, depende del tomador de decisiones. Pero:
Un valor p menor que 0,01, proporciona evidencia convincente que la
hiptesis alternativa es cierta;
Un valor p entre 0,01 y 0,05, proporciona evidencia fuerte a favor de la
hiptesis alternativa;
Un valor p entre 0,05 y 0,10, proporciona evidencia moderada a favor de
la hiptesis alternativa;
Valor p mayor que 0,10 se interpreta como dbil o ninguna evidencia
en apoyo de la hiptesis alternativa.
0

0,01

0,05

0,10

valor p
convincente

fuerte

moderada

dbil o ninguna

45

Cmo calcular el Valor p?:


Caso Distribucin Normal
1. Prueba de Cola Superior Ha: > 0

Regin de Rechazo: z z

Valor P P Z z 1 z

46

Cmo calcular el Valor p?:


Caso Distribucin Normal
2. Prueba de Cola Inferior Ha: < 0

0
Regin de Rechazo: z - z

Valor P P Z z z
47

Cmo calcular el Valor p?:


Caso Distribucin Normal
3. Prueba de Dos Colas Ha: 0
2

z 2

z 2

Regin de Rechazo:
z - z / 2 z z / 2

Valor P 2 min P Z z , P Z z 2 1 z
48

Cmo calcular el Valor p?:


Caso Distribucin Normal
En Resumen para una Prueba Z:

1 z

Valor P
z

2
1

Prueba de cola superior


Prueba de cola inferior
Prueba de dos colas

49

Cmo calcular el Valor p?:


Caso General
Para los casos de prueba de cola superior y de cola inferior, se basa en lo
mismo que para la prueba Z. Sin embargo, para el Caso de las prueba de dos
colas es diferente, esto se presenta a continuacin.
Prueba de Dos Colas Ha: 0
Suponga que X es una variable aleatoria que tiene cierta distribucin y que el
valor observado de X es x. Se rechazar H0 si:

PX x

PX x

o bien si:

2
50

Cmo calcular el Valor p?:


Caso General
De aqu se desprende que el contraste, a nivel de significacin , rechazar H0 si:

min P X x , P X x

O, equivalentemente, si

2 min P X x , P X x
Por lo tanto el Valor P para una prueba de dos colas, se calcula a partir de la
siguiente expresin:

Valor P 2 min P X x , P X x
51

Por qu debe ser el MNIMO


entre ambas reas?

0,40

0,60

0,60

0,60

Si NO se elige el rea MNIMA, las reas se superponen

52

Cmo calcular el Valor p?:


Caso General
En Resumen para cualquier distribucin:

P X x

Valor P
P X x
2 min P X x , P X x

Prueba de cola superior


Prueba de cola inferior
Prueba de dos colas

53

Potencia de una Prueba de


Hiptesis
Definicin Conceptual: Es la probabilidad de rechazar una

Hiptesis Nula cuando la Hiptesis Alternativa es


VERDADERA.
Forma de clculo: POTENCIA = 1 .
Definicin Prctica: Es la probabilidad de rechazar
correctamente una Hiptesis Nula FALSA.
La potencia es una medida muy descriptiva de la sensibilidad
de una prueba estadstica, es decir de su capacidad para
detectar diferencias.

54

Ejemplo
Considere que corresponde al verdadero calor
promedio emanado de una mezcla de cemento (en
caloras). Se prueba H0: = 50 [cal] v/s Ha : 50
[cal]. Supngase que el verdadero calor promedio es
de 52 [cal]. Cuando n = 10, se tiene que = 0,2643.
Cul es la potencia de esta prueba? Cmo
interpretamos este valor?

55

Si al encuestar a 1.000 chilenos sobre si son fumadores o no, el 45% afirma que s, y el Ministerio de
Salud est pensando en implementar una nueva campaa anti-tabaco si descubre que ms del 40%
de la poblacin chilena fuma, existe informacin concluyente para que el MinSal comience esta
campaa?
Una compaa manufactera que posee dos plantas productivas que producen los mismos productos
desea saber hasta qu punto la proporcin de productos fuera de los rangos de especificacin vlidos
difiere entre las dos plantas, para asegurar la calidad de sus productos independiente de la planta de
donde provengan.

56

Pruebas de hiptesis para una


proporcin poblacional
Pruebas para muestras grandes:
Si H0: p = p0

p p0

p0 1 p0 n

...es el estadstico de
prueba cuando H0 es
verdadera.

Hiptesis alternativa

Regin de rechazo para prueba de nivel

H a : p > p0

z z

H a : p < p0

z z

H a : p p0

z z / 2 z z / 2

Estos procedimientos son vlidos siempre que np0 5, n (1p0) 5, n 30, y


p0 no sea muy pequeo (cercano a 0) ni muy grande (cercano a 1).
57

Ejemplo
Muchos consumidores estn incurriendo a
productos genricos para reducir el costo de
medicamentos por prescripcin. Un estudio
realizado a 102 mdicos revel que slo 47 de ellos
conoca el nombre genrico de la metadona.
Proporciona esto fuerte evidencia para concluir que
menos de la mitad de todos los mdicos conocen el
nombre genrico de la metadona? Utilice un nivel de
significancia de 0,01.
58

Determinacin de
Si H0 no es verdadera y p = p, entonces para una prueba de cola superior, cuya
regin de rechazo es
Tenemos que

z z

P No Rechazar H 0 | H 0 es falsa
P Z z | p p '
Luego, las expresiones para son las que se muestran a continuacin.

59

Determinacin de
Hiptesis alternativa

(p)

H a : p > p0

p0 p ' z p0 1 p0 n

p ' 1 p ' n

H a : p < p0

H a : p p0

p0 p ' z p0 1 p0 n

p ' 1 p ' n

p0 p ' z 2 p0 1 p0 n

p ' 1 p ' n

p0 p ' z 2 p0 1 p0 n

p ' 1 p ' n

60

Pruebas de hiptesis para comparar


dos proporciones poblacionales
Sean p1 y p2 las proporciones de individuos en las poblaciones 1 y 2
respectivamente.
m : tamao de la muestra de la poblacin 1
n : tamao de la muestra de la poblacin 2
X : nmero de individuos en la muestra de la poblacin 1 que poseen
la caracterstica definida por p1.
Y : nmero de individuos en la muestra de la poblacin 2 que poseen
la caracterstica definida por p2.
Siempre que los tamaos poblacionales sean mucho ms grandes que
los tamaos muestrales, la distribucin de:
X ~ Bin (m, p1) y Y ~ Bin (n, p2).

Adems se supone que las muestras son independientes entre s, por


lo que X e Y son v.a. independientes.
61

Pruebas de hiptesis para comparar


dos proporciones poblacionales
El estimador para p1 p2, es la diferencia entre las proporciones muestrales X/m
Y/n. Con p 1 X m y p 2 Y n el estimador de p1 p2 es p 1 p 2 .
Proposicin:
Sea X ~ Bin (m, p1) y Y ~ Bin (n, p2) con X e Y independientes. Entonces:

E p 1 p 2 p1 p2
V p 1 p 2

p1q1 p2 q2

m
n

Estadstico de prueba distribuido


de forma aproximada normal
estndar:

Estimador Insesgado
(donde qi = 1 pi)

p 1 p 2 p1 p2
Z
p1q1 p2 q2

m
n
62

Pruebas de hiptesis para comparar


dos proporciones poblacionales
El caso ms comn lo constituye la prueba: H 0 : p1 p2 0
En este caso el estadstico de prueba es igual al anterior pero asumiendo que p1
= p2 = p, es decir
p p 2 0
Z 1
1 1
pq
m n
Si se asume que la H0 es verdadera, entonces p1 = p2 y se utilizar entonces, un
estimador nico para p.

El estimador p nico se obtiene asumiendo que p1 p2 p


Entonces se calcula:

X Y
m
n
p

p 1
p 2
mn mn
mn
63

Prueba para diferencia entre


proporciones para muestras grandes
H 0 : p1 p2 0

Estadstico de
prueba:

1 p
2
p
1
1
q
p

m n

Hiptesis
alternativa

Regin de rechazo para prueba de


nivel

Ha: p1 p2 > 0

z z

Ha: p1 p2 < 0

z z

Ha: p1 p2 0

z z / 2 z z / 2
64

Ejemplo
Una tienda de electrodomsticos est a punto de lanzar un nuevo
producto estrella al mercado. Desde sus bases de datos, selecciona 300 de
sus mejores clientes y los divide aleatoriamente en dos grupos de 150
clientes cada uno. A continuacin, enva por correo electrnico un
anuncio de venta a c/u de los 300 clientes, pero slo incluye un cupn de
descuento del 5% al segundo grupo de 150 clientes.
El estudio consider un periodo de tiempo de 1 mes (tiempo de validez de
los cupones de descuento). Tras dicho periodo, los resultados obtenidos
por la tienda fueron los siguientes: de los 150 clientes que recibieron slo
el aviso del nuevo producto (sin un cupn de descuento adjunto), slo 35
compraron el producto; mientras que de los 150 clientes que recibieron el
aviso y el cupn de descuento, slo 55 compraron el producto.
Qu puede concluir el gerente de la tienda sobre la eficacia de los
cupones de descuento? Use el criterio del valor p.
65

Variabilidad en la produccin de un proceso es un factor clave en diversas industrias. Si existe mucha


variabilidad en el dimetro de las ruedas producidas, el proceso tendr que ser detenido y revisar las
causas asociadas a esta variabilidad (desajuste).
La administracin del TranSantiago siente que la variabilidad en los tiempos de servicio prestados
por dos operadores no es la misma, debido a la gran cantidad de reclamos surgidos al respecto. A
partir de dos muestras aleatorias se busca medir la variabilidad en los tiempos de servicio. Si se
determina que los tiempos de servicio presentan diferentes variabilidades, se tomarn medidas
mitigacin para mejorar la calidad del servicio.

66

Pruebas de hiptesis para


de una poblacin normal

Suponga que deseamos probar la hiptesis que la varianza de una


poblacin normal 2 es igual a algn valor especfico 02, o
equivalentemente, que la desviacin estndar es igual a 0. Sea X1,
X2, ., Xn una muestra aleatoria de tamao n de esta poblacin. Para
probar:

H 0 : 2 02

H 0 : 2 02

Ha :
Ha :
usaremos el estadstico de prueba:
2

2
0

X 02

2
n

1
S

02

2
0

H 0 : 2 02
H a : 2 02

~ n2 1
67

Pruebas de hiptesis para


de una poblacin normal

Las regiones de rechazo, dependiendo de la Ha son:


Hiptesis alternativa

Regin de rechazo para prueba de nivel

Ha : 2 > 02

X 02 2 , n 1

Ha : 2 < 02

X 02 12 , n 1

Ha : 2 02

X 02 12 / 2, n 1 X 02 2 / 2, n 1

A continuacin se muestran las regiones de rechazo en forma


grfica.
68

Pruebas de hiptesis para


de una poblacin normal

Regin de Rechazo
para Ha:
(a) Ha: 2 02

Regin de Rechazo para Ha:


(b)Ha: 2 > 02

Regin de Rechazo para Ha: (c) Ha: 2 < 02

69

Ejemplo
Un fabricante de detergente lquido est interesado en la
uniformidad de la mquina utilizada para llenar las botellas.
Al tomar una muestra aleatoria de 20 botellas, se obtuvo una
varianza muestral para el volumen de llenado de s2 = 0,0153
[oz2]. Si la varianza del volumen de llenado es mayor a 0,01
[oz2], entonces existe una proporcin inaceptable de botellas
que sern llenadas con una cantidad menor o mayor que la
especificada. Existe evidencia en los datos muestrales que
sugiera que el fabricante tiene un problema con el llenado de
las botellas? Use = 0,05, y asuma que el volumen de llenado
de detergente en las botellas sigue una distribucin normal.
Use el criterio del valor p.
70

Determinacin de y el tamao
muestral
En el caso de prueba de cola superior, tenemos que:

' P No Rechazar H 0 | H 0 es falsa


P X 2 2 , n 1 | '

n 1 S 2

2
P
, n 1 | '
2
0

2
n 1 S 2

2
0
P

, n 1
2
' 2

'

2
2

0
P n 1 2 ,n 1
2

'

71

Pruebas de hiptesis para comparar


dos varianzas de poblaciones
En muchas ocasiones estamos interesados en saber si la
variabilidad de dos poblaciones es la misma o no. Por ejemplo
saber si la calibracin de dos mquinas fue la misma o no, a
partir de la calidad de los productos que cada una de ellas
genera.
Sin ir ms lejos, cuando queremos realizar una prueba de
hiptesis para comparar dos medias, en algunas ocasiones
(prueba t) necesitamos saber si las poblaciones tienen igual
varianza o no.
Por estas y otras razones esta prueba es importante.
Para realizar esta prueba necesitamos definir una nueva
distribucin de probabilidad en la cual se basa, la cual se
define a continuacin.
72

Distribucin F de Fisher Snedecor


Sean 1 y 2 dos v.a. chi cuadrado independientes 1 y
2 grados de libertad, respectivamente.
Entonces el cociente:
1
1
=
~1 ,2
2
2

73

Distribucin F de Fisher Snedecor


+
12 2
=

21 22

1
1 2
2

1
2 1

1
2 + 1
0

= +
0
2
=
2 2

1 +2
2

1 , 2
= 22

1 + 2 2
1 2 2 2 2 4

1,, =

1
,,
74

Distribucin F de Fisher Snedecor


Uso en el muestreo
Sean 1 , 2 , , una muestra aleatoria tomada de una
distribucin normal cuya desviacin tpica result ser 1 ,
y 1 , 2 , , una muestra aleatoria tomada de una
distribucin normal cuya desviacin tpica result ser 2 .
Es posible demostrar que la estadstica:
1 2
1 2
= 2
~1,1
2
2 2
75

Prueba para el cociente entre Varianzas


Poblacionales
H0 :
2
1

2
2

Hiptesis
alternativa

Estadstico de prueba:

Regin de rechazo para prueba de


nivel

H a : 12 22

f F ,m 1,n 1

H a : 12 22

f F1 ,m 1,n 1

H a : 12 22

S12
F 2
S2

f F1 /2,m 1,n 1 f F /2, m 1, n 1


76

Ejemplo
La Compaa SureStep, que fabrica trotadoras de alta calidad
para gimnasios, ahora est interesada en conocer si la
variabilidad en la duracin de los motores de ambos
proveedores (A y B) es la misma o no.
Usando los datos entregados, se puede concluir que los
motores de ambos proveedores presentan igual variabilidad?
Use el criterio del valor p.
Proveedor A 1358 793
Proveedor B 658 404

587
735

608
457

472
431

562
658

879
453

575 1293 1457 705 623


488 522 1247 1095 430

725
726

569
793

424
498

Proveedor A 436 1250 493


Proveedor B 502 589 975

485
808

462
456

765
731

854
491

634 1109 800 883 522


487 503 465 1475 508

791
846

684
732

666
507

77

Вам также может понравиться