You are on page 1of 65

Pruebas de Hiptesis

desde un punto de vista aplicado

Previo a cualquier estudio se debe fijar el


nivel de significancia con el cual se
trabajar, que se denota por
En la mayor parte de los estudios se utiliza
=0.05, es decir, cada vez que el valor p
de un test determinado es menor que este
valor se dice que se rechaza la hiptesis
nula. O simplemente que el test fue
Algunos ejemplos
El Ministerio de Salud ha fijado en 70 el nmero medio de
bacterias por centmetro cbico de agua constituye un nivel
mximo aceptable para las aguas en que se practica la
recogida de almejas. Un valor medio superior a 70 parece
peligroso, porque comer almejas recogidas en tales aguas
puede causar hepatitis. A fin de establecer un patrn
gubernamental para las aguas, interesa probar:
Un estudio reciente del ecosistema en un bosque de hoja
caduca indica que, en el bosque natural, el promedio neto de
transformaciones del nitrgeno en nitrato presenta un
incremento promedio de 2 kg por hectrea al ao. Los
ingenieros forestales creen que una desfoliacin de la
maleza del bosque conducira a una disminucin de este
valor promedio. La prueba que interesa probar es:
El promedio total de protenas en la sangre en un adulto
sano es de 7.25 g por decilitro. En un anlisis de sangre, el
laborante est probando:
Conceptos Bsicos

Una hiptesis estadstica es una afirmacin acerca


de los parmetros de una (o ms) poblacin, es decir
sobre la distribucin de una (o ms) variable
aleatoria.

Un test de hiptesis estadstica es una regla que


lleva a la decisin de aceptar o rechazar una
hiptesis nula despus que observamos una
muestra.
Regin crtica es un subconjunto del espacio
muestral que lleva al rechazo de la hiptesis
en consideracin.

Nivel de significancia de un test (o tamao de


la regin crtica) es el valor mximo de la
probabilidad de rechazar H0 cuando ella es
verdadera, esta es una mala decisin.
H0: hiptesis nula H1: hiptesis alterna
Es lo conocido, el no Es lo que se
rechazarla implica sospecha.
que no hay cambio. H1 : 0 (simple)
H1 : >0
H0 : =0 (simple)
(compuesta)
H0 : <0 (compuesta)
H1 : <0
H0 : >0 (compuesta) (compuesta)
Hiptesis bilateral
H0 : =0
H1 : 0
Hiptesis unilateral
H0 : =0 H0 : =0
H1 : <0 H1 : >0
Error tipo I y Error tipo II
Aceptar H0 Rechazar H0
H0 verdadera bien Error tipo I
H0 falsa Error tipo II bien
= P(rechazar H0 / H0 verdadera)

= P(aceptar H0 / H0 falsa)
Funcin Potencia de una
Prueba
1- =Probabilidad de rechazar la
hiptesis
nula cuando sta es falsa.
valor-p = Probabilidad que la estadstica de prueba tome un
valor mayor o igual que el obtenido con base en la muestra
aleatoria, dado que la hiptesis nula es verdadera.
Pasos a seguir:
DEFINIR LA VARIABLE
a) Formular la hiptesis nula y alternativa de acuerdo al
problema.
b) Seleccionar el nivel de significancia .
c) Seleccionar el estadstico de prueba apropiado, cuya
distribucin por muestreo sea conocida en el supuesto de
que H0 es cierta.
d) Establecer la regin crtica, es decir, determinar el valor (o
valores) crtico.
e) Obtener los valores de la prueba estadstica de una muestra
aleatoria de tamao n.
f) Conclusin : rechazar H0 si la estadstica tiene un valor en la
regin crtica y no rechazar (aceptar), en otro caso.
Pruebas de hiptesis para la media

Varianza conocida Varianza desconocida

Poblacin Normal Muestras grandes Poblacin Normal

X - 0 X 0
Z calculado Tcalculado
s
n n

Tambin se utilizar para n


Este estadstico de prueba se utiliza
cuando la Varianza es conocida, lo
cual es muy difcil que ocurra en la
vida real.
Hiptesis Estadstico Regin
Alternativ de Prueba Crtica
a
0 Z cal z
x 0
Z cal
0 Z cal z1
n

Z cal z / 2 o
0
Z cal z1 / 2
Varianzas desconocidas Poblacin normal
Este es el estadstico ms utilizado cuando la variable
tiene distribucin normal.
Tambin lo utilizan los software estadsticos cuando la
variable no tiene distribucin normal y el tamao de la
muestra es grande.
Hiptesis Estadstico Regin
Alternativ de Prueba Crtica
a

0
Tcal t , n1
X 0
Tcal
0 S Tcal t1 , n1
n
0 Tcal t / 2, n1 o
Tcal t1 / 2, n1
Prueba de hiptesis para la varianza
poblacional

Hiptesis Estadstico Regin


Alternativa de Prueba Crtica

2
2
0
W 2
cal
2

(n 1) S 2
W 2
2
2
2
W
2
cal 1
0
0 cal 2

2
Wcal 2 / 2 o
2 02 2
Wcal 12 / 2
Pruebas relativas a proporciones

Hiptesis Estadstico de Regin de


alternativa prueba rechazo

p p0
p0
p Zcal < z
Z cal
p0 q0
p p0 n Z cal z1

Z cal z / 2 o
p p0
Z cal z1 / 2
el tamao de la muestra es
grande o cuando la o las
variables tiene distribucin
normal.
Test t de Student para un grupo.
Test t de Student para grupos pareados.
Test t de Student para grupos
independientes:
Varianzas poblacionales iguales.
Varianzas poblacionales distintas.
(La prueba de homogeneidad de varianzas
debe realizarse antes del test de
Un grupo. Comparacin con un
valor de referencia.

1. Los siguientes datos son los pesos


uterinos (en mg) de 20 ratas extradas al
azar de un grupo grande. Es probable
que el peso promedio de todo el grupo
sea 24 mg. un valor observado en
estudios anteriores?

X: peso del tero de una rata en mg.


Dado que el tamao de muestra es de n=20,
debemos verificar primero si la variable en
estudio tiene distribucin normal, esto lo
haremos a travs del test de Shapiro-Wilk.
Como obtener el valor p asociado al
test de Shapiro-Wilk
Aqu las hiptesis son:
H0: X tiene distribucin normal
Ha: X no tiene distribucin normal.

Si el valor p es menor que 0.05 se concluye


que la variable en estudio NO tiene
distribucin normal.
H0: = 24 versus Ha: 24
Forma
estadstica
De manera equivalente:
H0: el peso uterino promedio de ratas es de 24
mg.
Ha: el peso uterino promedio de ratas es
diferente Forma no
de 24 mg. estadstica

n X 0
T
Estadstico de prueba: : tn 1
S
Observar que esta es una prueba bilateral
(dos colas), es decir se rechaza cuando el
valor se aleja mucho en ambos sentidos.
Obviamente este se aleja mucho se
refiere:
- Forma antigua de resolver el problema: a
que cae en la regin de rechazo.
- Forma actual de resolver el problema: el
valor p asociado a este test es menor que
el nivel de significancia (=0,05).
Test
Qu quiere bilatera
que se l
imprima en la
salida del test
t de Student
H0: = 24
para un
grupo?
Conclusin estadstica:
Se rechaza la hiptesis nula (valor
p=0,0351).

Conclusin en el contexto del


problema planteado:
El promedio del peso uterino de ratas es
significativamente diferente de 24 mg
(valor p=0,0351).

Observacin generalmente se le pone


la palabra significativamente cuando se
2. Recientes estudios sobre el ejercicio de la
Medicina en centros en los que no actan
estudiantes, indican que la duracin media de
la visita por paciente es de 22 minutos. Se cree
que en centros donde con un elevado nmero
de estudiantes en prcticas esta cifra es
menor. Se obtuvieron los siguientes datos
sobre las visitas de 20 pacientes
aleatoriamente seleccionados. La duracin de
la visita est en minutos:

X: duracin de una visita en minutos.


Forma estadstica:
H0: =22 versus Ha: 22

En palabras:
H0: La duracin promedio de las visitas por
paciente es de 22 minutos.
Ha: La duracin promedio de las visitas por
paciente es MENOR de 22 minutos.

Conclusin:_____________________

Observar que esta es una prueba unilateral a


izquierda.
Dos grupos pareados.
En este caso tenemos mediciones a n
pares de objetos o individuos.
3. A continuacin se
presenta el contenido de
plomo en tejido cerebral
(mgr/gr), medido con dos
espectrofotmetros
distintos en once muestras,
presenta esta muestra
evidencia de que los
promedios de las
mediciones son diferentes?
XA: contenido de plomo en tejido cerebral
(gr/gr), medido en una muestra con el
espectrofotmetros A.
XB: contenido de plomo en tejido cerebral
(gr/gr), medido en una muestra con el
espectrofotmetros B.
D= XA-XB.
Observar que aqu nos interesa determinar si la
diferencia, D, tiene distribucin normal, ya que
n=11.
Test de Shapiro Wilk.
H0: D tiene distribucin normal
Ha: D no tiene distribucin normal.
En forma estadstica:
H0: = versus Ha:

En el contexto del problema:


H0: el contenido promedio de plomo en tejido
cerebral medido en ambos espectrofotmetros
es igual.
Ha: el contenido promedio de plomo en tejido
cerebral medido en ambos espectrofotmetros
es diferente.
Flecha roja para grupos pareados.
Flecha verde para grupos
independientes.
Comparacin de las medias de dos
medias de dos poblaciones
independientes
Las varianzas poblacionales son
desconocidas:
pero son iguales,
pero son distintas.

Luego lo primero que debemos


determinar es si hay homogeneidad
de varianzas.
Test F para comparar dos varianzas

Este es
el que
nos
interesa!
Caso 1. Hay igualdad de
varianzas
Caso 2. NO hay igualdad de
varianzas
Dos grupos
independientes.
Si el tamao de ambos grupos es
grande o si ambas variables tienen
distribucin normal se prosigue de la
manera siguiente:
i) Determinar si las varianzas
poblacionales son iguales, esto es
determinar el si el valor p del
estadstico de prueba de la igualdad de
varianzas es o no menor que 0,05.
Comentar.
ii) Determinar si se rechaza la hiptesis
5. Se obtuvieron concentraciones de un determinado
metal (Ni) en dos zonas del norte de Chile. Se
obtuvieron diez muestras de cada lugar, las que
fueron analizadas en el miso laboratorio arrojando
los resultados siguientes:

Determinar si las concentraciones promedios de Ni


son distintas en los lugares A y B.
XA: concentracin de Niquel de una muestra del lugar
A.
XB: concentracin de Niquel de una muestra del lugar
B.
a) Aplicacin de el test de Shapiro-Wilk a cada variable
por separado.
b) Test de igualdad de varianzas
poblacionales:

Este test es importante pues nos dice si


las variables tienen la misma
variabilidad en cada grupo.

InfoStat entrega este valor en


, en nuestro caso se concluye que las
varianzas poblacionales son iguales,
ya que el valor p asociado a este test es
mayor que 0,05.
c) As las hiptesis son:
En forma estadstica:
H0: = versus Ha:

En el contexto del problema:


H0: la concentracin promedio de niquel en el
lugar A es igual a la concentracin promedio
de niquel en el lugar B.
Ha: la concentracin promedio de niquel en el
lugar A es distinto a la concentracin
promedio de niquel en el lugar B.
El test correspondiente es el test t de Student
para grupos independientes con varianzas
poblacionales iguales. En este caso el
estadstico de prueba est dado por:

donde ( n 1) s 2
( n 1) s 2
es la
S p2 A A B B

varianza nA nB 2

combinada.
Observar que en nuestro caso 0=0.
Verifiquemos los valores entregados por
InfoStat.

( n 1) s 2
( n 1) s 2
9*126,32 9* 261,17
Sp
2 A A B B
193, 745
nA nB 2 18

Tcalculado
X A XB

24,1 35,5
S p2 S p2 193, 745 193, 745

nA nB 10 10

Conclusin:
Resultados

Comparacin de la media de una muestra con


un valor de referencia.

Comparacin de dos series de medidas


pareadas.

Comparacin de las medias de dos muestras


independientes.

Anlisis de Varianza (ANOVA), aqu hay muchos


diseos (completamente aleatorio, bloques, medidas
repetidas, lattice, parcelas divididas, etc.)
Test Noparamtricos
Las tcnicas estadsticas de estimacin de parmetros,
intervalos de confianza y prueba de hiptesis son, en
conjunto, denominadas estadstica paramtrica y son
aplicadas bsicamente a variables continuas.

Estas tcnicas se basan en especificar una forma de


distribucin de la variable aleatoria y de los estadsticos
derivados de los datos.
En estadstica paramtrica se asume que la poblacin de
la cual la muestra es extrada es NORMAL o
aproximadamente normal. Esta propiedad es necesaria
para que la prueba de hiptesis sea valida.

Sin embargo, en un gran nmero de casos no se puede


determinar la distribucin original ni la distribucin de
los estadsticos por lo que en realidad no tenemos
parmetros a estimar. Tenemos solo distribuciones que
comparar. Esto se llama estadstica noparamtrica.
La mayor desventaja de la estadstica
noparamtrica es que cuando los supuestos
se cumplen es mucho menos poderosa que
la estadstica paramtrica.
Asignacin de rangos: aqu se
trabaja con los rangos de los
datos observados.

Hiptesis: el parmetro que se


usa para hacer las pruebas
estadsticas es la Mediana y no
la Media.
Todas las pruebas que veremos requieren
que la variable en estudio sea continua.
Test de normalidad comnmente
utilizados:
Kolmogorov-Smirnov,

Shapiro-Wilk (implementado en
InfoStat),
Anderson-Darling,

Jarque-Bera, etc.

Todos estos test vienen implementados


en el software SAS.
Test Noparamtricos para
uno y dos grupos.
Para Un Grupo
Test del Signo
Test de Wilcoxon

Para dos Grupos


Test de Mann-Whitney
de Wilcoxon para muestras independientes
de Wilcoxon-Mann-Whitney.
Test noparamtricos
Test Noparamtricos
Las tcnicas estadsticas de estimacin de parmetros,
intervalos de confianza y prueba de hiptesis son, en
conjunto, denominadas estadstica paramtrica y son
aplicadas bsicamente a variables continuas.

Estas tcnicas se basan en especificar una forma de


distribucin de la variable aleatoria y de los
estadsticos derivados de los datos.
En estadstica paramtrica se asume que la poblacin de
la cual la muestra es extrada es NORMAL o
aproximadamente normal. Esta propiedad es necesaria
para que la prueba de hiptesis sea valida.

Sin embargo, en un gran nmero de casos no se puede


determinar la distribucin original ni la distribucin de
los estadsticos por lo que en realidad no tenemos
parmetros a estimar. Tenemos solo distribuciones que
comparar. Esto se llama estadstica noparamtrica.

La mayor desventaja de la estadstica noparamtrica es


que cuando los supuestos se cumplen es mucho menos
poderosa que la estadstica paramtrica.
Test de Kruskal-Wallis
No necesita del supuesto de normalidad
de los errores.
Se basa en el rango de las observaciones.
Se ordenan todas las observaciones en
sentido creciente y se reemplazan por su
rango ( en caso de empate, se reemplazan las
observaciones empatadas por el rango
promedio).
Se suman los rangos de las observaciones de
cada tratamiento, Ri.
Se calcula el estadstico del contraste.
Si los ni 5, H ~ 2 con k 1 grados de
libertad.
El criterio es rechazar la igualdad de
efectos si Hcalculado > 21-,k-1 .
Ejemplo. Se quiere evaluar la concentracin de plomo en cinco
lugares, para ello se obtinen cinco muestras de cada uno de
estos lugares.
Conclusin:
Test de Friedman

bajo H0 se distribuye 2 con (k-1) grados de


libertad.
Ejemplo. Con objeto de estudiar la diferencia de concentracin de
un txico (mg/1000) en distintos rganos de peces, se extrae una
muestra aleatoria de peces de un ro y se estudia en cada uno de
ellos la concentracin del txico (mg/1000) en cerebro, corazn y
sangre. El objetivo del estudio es conocer si la concentracin del
txico en los tres rganos es igual o distinta. Los resultados
obtenidos son los siguientes:

Observar que son en total b=12 peces y k=3 rganos que se est
estudiando (de un mismo pez).

H0: No existen diferencias significativas en la concentracin del txico
en cerebro, corazn y sangre.
H1: Existen diferencias significativas en la concentracin del toxico en
cerebro, corazn y sangre.
Comentarios
Test Noparamtricos para uno y dos
grupos.
Para Un Grupo
Test del Signo
Test de Wilcoxon

Para dos Grupos


Test de Mann-Whitney
de Wilcoxon para muestras independientes
de Wilcoxon-Mann-Whitney.