Ejemplo
Un médico traumatólogo afirma que el contenido de calcio en los huesos de mujeres que
padecen osteoporosis después de aplicársele cierto tratamiento es mayor al valor promedio
observado para la población femenina que padece está enfermedad, el cual se sabe es igual a
270 mg/g con una desviación de 120 mg/g. Para probar su premisa el investigador determinó el
contenido de calcio en los huesos de 36 individuos que fueron sometidos al tratamiento y pudo
determinar que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g. La
concentración de calcio es una variable que se distribuye normalmente.
Ante la ausencia de una especificación particular, se puede escoger como nivel de significación
un valor de = 0
Elección de un estadístico de la muestra y de su distribución para someter a prueba las
hipótesis.
Z (x ) ( n)
ZA = {Z / Z < z ()}
Cómputos necesarios.
b. Decisión.
Como z = 2 > z(0.95) = 1.65 el valor del estadístico de prueba se encuentra dentro de la zona
de rechazo. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para
rechazar Ho.
La información obtenida de la muestra permite afirmar que se tiene un 95% de confianza que el
tratamiento aplicado a los pacientes enfermos de osteoporosis aumenta el nivel de calcio en los
tejidos óseos.
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla
normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden
ser de una o dos colas.
Ejemplo ilustrativo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción
real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra
aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue
tomada de 10000 estudiantes.
Los datos son:
H0 : = k
H1 : k
En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o
corregida.
(3.6)
(3.7)
REGLA DE DECISION
H1 : k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en
dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.8
Figura 3.8 Regla de decisión para una prueba de hipótesis a dos colas
y pertenecen a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo
(T) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica
aceptar H1 . Es decir, si < T < no se rechaza H0.
H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la
parte superior de la distribución, vease figura 3.9
Figura 3.9 Regla de decisión para una prueba de hipótesis a una cola superior
Z1- pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es
menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica aceptar H1 . Es
decir, si T < no se rechaza H0 .
H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la
parte inferior de la distribución, vease figura 3.10
Figura 3.10 Regla de decisión para una prueba de hipótesis a una cola inferior
Z pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es
mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica aceptar H1 . Es
decir, si T >Z no se rechaza H0.
EJEMPLO
Se supone que los diámetros de cierta marca de válvulas están distribuídos normalmente con una varianza
poblacional de 0,2 pulgadas 2 , pero se cree que últimamente ha aumentado. Se toma una muestra aleatoria
de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas: 5,5 5,4
5,4 5,6 5,8 5,4 5,5 5,4 5,6 5,7
Solución
Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto:
H0 : = 0,2
Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribución chi-cuadrado con 9 grados de
libertad, se obtiene un valor para Z de 16,919. Como puede observarse en la figura 3.11, el valor de la
estadística de trabajo se ubica en la zona de no rechazo de la hipótesis nula, por consiguiente con una
confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado.
Figura 3.11 Regla de decisión para una prueba de hipótesis a una cola superior
3.3. ANOVA
ANOVA evalúa la importancia de uno o más factores al comparar las medias de la variable de
respuesta en los diferentes niveles de los factores. La hipótesis nula establece que todas las
medias de la población (medias de los niveles de los factores) son iguales mientras que la
hipótesis alternativa establece que al menos una es diferente.
Para ejecutar un ANOVA, debe tener una variable de respuesta continua y al menos un factor
categórico con dos o más niveles. Los análisis ANOVA requieren datos de poblaciones que
sigan una distribución aproximadamente normal con varianzas iguales entre los niveles de
factores. Sin embargo, los procedimientos de ANOVA funcionan bastante bien incluso cuando
se viola el supuesto de normalidad, a menos que una o más de las distribuciones sean muy
asimétricas o si las varianzas son bastante diferentes. Las transformaciones del conjunto de
datos original pueden corregir estas violaciones.
Por ejemplo, usted diseña un experimento para evaluar la durabilidad de cuatro productos de
alfombra experimentales. Usted coloca una muestra de cada tipo de alfombra en diez hogares
y mide la durabilidad después de 60 días. Debido a que está examinando un factor (tipo de
alfombra), usted utiliza un ANOVA de un solo factor.
Si el valor p es menor que el nivel de significancia, entonces usted concluye que al menos una
media de durabilidad es diferente. Para información más detallada sobre las diferencias entre
medias específicas, utilice un método de comparaciones múltiples como el de Tukey.
1. Anova I
Cuando solo existe un criterio de clasificación (variable independiente; por ejemplo, tipo de
técnica terapéutica). A su vez, puede ser intergrupo (existen varios grupos experimentales) e
intragrupo (existe un único grupo experimental).
2. Anova II
En este caso, hay más de un criterio de clasificación (variable independiente). Igual que en el
caso anterior, esta puede ser intergrupo e intragrupo.
Características y supuestos
Cuando se aplica el análisis de varianza (ANOVA) en estudios experimentales, cada grupo
consta de un determinado número de sujetos, siendo posible que difieran los grupos en cuanto
a este número. Cuando el número de sujetos coincide, se habla de un modelo equilibrado o
balanceado.
En estadística, para poder aplicar el análisis de varianza (ANOVA) deben cumplirse una serie
de supuestos:
1. Normalidad
Esto quiere decir que las puntuaciones en la variable dependiente (por ejemplo la ansiedad)
deben seguir una distribución normal. Este supuesto se comprueba mediante las llamadas
pruebas de bondad de ajuste.
2. Independencia
Implica que no exista autocorrelación entre las puntuaciones, es decir, la existencia de
independencia de las puntuaciones entre sí. Para asegurarnos del cumplimiento de este
supuesto, deberemos realizar un MAS (muestreo aleatorio simple) para seleccionar la muestra
que vamos a estudiar o sobre la que vamos a trabajar.
3. Homocedasticidad
Este término significa “igualdad de varianzas de las subpoblaciones”. La varianza es un
estadístico de variabilidad y dispersión, y aumenta cuanto mayor sea la variabilidad o
dispersión de las puntuaciones.
El supuesto de homocedasticidad se comprueba mediante la Prueba de Levene o la de Barlett. En caso de no
cumplirlo, otra alternativa es realizar una transformación logarítmica de las puntuaciones
Ejemplo 1
Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial,
comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se
distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún
tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al
cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las
presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:
Grupo
1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 171 155
181 175 170 155 160
La tabla de anova es:
Fuente de variación GL SS MS F
Tratamiento 4 2010,64 502,66 11,24
Error 20 894,4 44,72
Total 24 2905,04
Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.
Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS, deberíamos crear un archivo con
2 variables: Trata (con un código distinto para cada grupo, p.e. de 1 a 5) y Presion con la
presión arterial de cada individuo al acabar el estudio. Para calcular el Anova desplegamos los
menús que se ven en la gráfica:
La tabla de anova que devuelve el programa es