Вы находитесь на странице: 1из 13

Pruebas de hipótesis para medias y proporciones

En la investigación biológica es frecuente que se quiera conocer si la media poblacional de


una variable aumento, disminuyó o no cambió con relación a una situación anterior. Se puede
querer saber si el contenido de proteínas totales en la sangre de los animales de una población
silvestre aumentó al finalizar un período en el cual la oferta de alimentos fue abundante; o si el
tratamiento con una solución clorada disminuyó el número promedio de bacterias en el agua
usada para el consumo humano en cierta región; o verificar si la aplicación de una droga altera
el valor promedio de la presión arterial de los conejos usados en pruebas de laboratorio.
La respuesta a cada una de estas situaciones se puede lograr poniendo a prueba la hipótesis
nula de que la media poblacional es igual a un valor determinado,  = o.
Sin embargo el proceso de docimasia de hipótesis para una media poblacional, al igual que en
el caso de la estimación de , depende de varios aspectos: i) de la distribución probabilística
que siga la variable estudiada; ii) del conocimiento de la varianza poblacional, y iii) del tamaño
de la muestra. A continuación estudiaremos mediante ejemplos las distintas situaciones o
casos que se pueden presentar en la prueba de hipótesis sobre una media poblacional.

Ejemplo
Un médico traumatólogo afirma que el contenido de calcio en los huesos de mujeres que
padecen osteoporosis después de aplicársele cierto tratamiento es mayor al valor promedio
observado para la población femenina que padece está enfermedad, el cual se sabe es igual a
270 mg/g con una desviación de 120 mg/g. Para probar su premisa el investigador determinó el
contenido de calcio en los huesos de 36 individuos que fueron sometidos al tratamiento y pudo
determinar que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g. La
concentración de calcio es una variable que se distribuye normalmente.

Las hipótesis de investigación son las siguientes:

Ho : El tratamiento para la osteoporosis no tiene ningún efecto


H1 : El tratamiento para la osteoporosis aumenta los niveles de calcio en los huesos. Prueba
de las hipótesis estadísticas
Formulación de hipótesis
Ho :  = 270
H1 :  > 270

Especificación de un valor de probabilidad crítico o nivel de significación.

Ante la ausencia de una especificación particular, se puede escoger como nivel de significación
un valor de  = 0
Elección de un estadístico de la muestra y de su distribución para someter a prueba las
hipótesis.

Puesto que el parámetro involucrado en la docimasia es la media poblacional , y la variable


se distribuye normalmente con varianza conocida lo más conveniente es usar como estadístico
de prueba la media muestral en su forma derivada Z.

Z  (x   ) ( n)

Establecer una zona de aceptación para Ho.


Como H1:  > o se trata de una prueba de una cola hacia la derecha, siendo la zona de
aceptación la siguiente:

ZA = {Z / Z < z ()}
Cómputos necesarios.

a.1)Estadístico de prueba: Z  (x  ) ( n )  (310  270) (120 36)  40 20  2

a.2)Zona de aceptación: Z = {Z / Z < z(0.95)} = {Z / Z < 1.65}

b. Decisión.

Como z = 2 > z(0.95) = 1.65 el valor del estadístico de prueba se encuentra dentro de la zona
de rechazo. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para
rechazar Ho.

La información obtenida de la muestra permite afirmar que se tiene un 95% de confianza que el
tratamiento aplicado a los pacientes enfermos de osteoporosis aumenta el nivel de calcio en los
tejidos óseos.

Prueba de hipotesis de proporciones


Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la
proporción de una población, es adecuado utilizar una prueba de una muestra.
La metodología de prueba depende de si el número de observaciones de la muestra es grande
o pequeño.
Como se habrá observado anteriormente, las pruebas de grandes muestras de medias y
proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba
miden la desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas
pruebas se basan en la distribución normal estándar para valores críticos. Quizá la única
diferencia real entre las ambas radica en la forma corno se obtiene la desviación estándar de la
distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla
normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden
ser de una o dos colas.

Ejemplo ilustrativo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción
real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra
aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue
tomada de 10000 estudiantes.
Los datos son:

Como en los datos aparece el tamaño de la población, se debe verificar si el tamaño de la


nuestra es mayor que el 5%. Se remplaza valores en la siguiente fórmula:

Los cálculos en Excel se muestran en la siguiente figura:


El gráfico elaborado en Winstats y Paint se muestra a continuación:

. Pruebas de hipótesis para varianzas


Es frecuente que se desee comprobar si la variación o dispersión de una variable ha tenido alguna modificación,
lo cual se hace con la prueba de hipótesis para la varianza.
Hipótesis

Se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis a dos colas

H0 :   = k

H1 :     k

- Prueba de hipótesis a una cola superior

H0 :   = k     ó     H0 :     k

H1 :  > k     ó     H1 :   > k

- Prueba de hipótesis a una cola inferior

H0 :   = k     ó     H1 :   k

H1 :  < k     ó     H1 :  <k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o
corregida.

•  Si se utiliza la varianza sin corregir (  ) la estadística de trabajo es la expresión (1.4):

(3.6)

•  Si se utiliza la varianza corregida, la estadística de trabajo es la expresión (1.5):

 (3.7)

REGLA DE DECISION

- Si se ha planteado la hipótesis alternativa como:

H1 :     k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia (   ) se divide en
dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.8
Figura 3.8 Regla de decisión para una prueba de hipótesis a dos colas

 y   pertenecen a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo
(T) está entre   y   no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica
aceptar H1 . Es decir, si   < T <   no se rechaza H0.

- Si se ha planteado la hipótesis alternativa como:

H1 :   > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia (   ) en la
parte superior de la distribución, vease figura 3.9

Figura 3.9 Regla de decisión para una prueba de hipótesis a una cola superior

Z1-  pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es
menor que   no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica aceptar H1 . Es
decir, si T <   no se rechaza H0 .

- Si se ha planteado la hipótesis alternativa como:

H1 :   < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia (   ) en la
parte inferior de la distribución, vease figura 3.10
Figura 3.10 Regla de decisión para una prueba de hipótesis a una cola inferior

Z  pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es
mayor que Z  no se rechaza la hipótesis nula, en caso contrario se rechaza H 0 lo cual implica aceptar H1 . Es
decir, si T >Z  no se rechaza H0.

EJEMPLO

Se supone que los diámetros de cierta marca de válvulas están distribuídos normalmente con una varianza
poblacional de 0,2 pulgadas 2 , pero se cree que últimamente ha aumentado. Se toma una muestra aleatoria
de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas: 5,5     5,4
5,4     5,6     5,8     5,4     5,5     5,4     5,6     5,7

Con ésta información pruebe si lo que se cree es cierto.

Solución

Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto:

H0 :   = 0,2

H1 :   > 0,2

Para realizar esta prueba de hipótesis se utiliza la expresión 3.6

Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribución chi-cuadrado con 9 grados de
libertad, se obtiene un valor para Z de 16,919. Como puede observarse en la figura 3.11, el valor de la
estadística de trabajo se ubica en la zona de no rechazo de la hipótesis nula, por consiguiente con una
confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado.
Figura 3.11 Regla de decisión para una prueba de hipótesis a una cola superior

3.3. ANOVA
ANOVA evalúa la importancia de uno o más factores al comparar las medias de la variable de
respuesta en los diferentes niveles de los factores. La hipótesis nula establece que todas las
medias de la población (medias de los niveles de los factores) son iguales mientras que la
hipótesis alternativa establece que al menos una es diferente.

Para ejecutar un ANOVA, debe tener una variable de respuesta continua y al menos un factor
categórico con dos o más niveles. Los análisis ANOVA requieren datos de poblaciones que
sigan una distribución aproximadamente normal con varianzas iguales entre los niveles de
factores. Sin embargo, los procedimientos de ANOVA funcionan bastante bien incluso cuando
se viola el supuesto de normalidad, a menos que una o más de las distribuciones sean muy
asimétricas o si las varianzas son bastante diferentes. Las transformaciones del conjunto de
datos original pueden corregir estas violaciones.

Por ejemplo, usted diseña un experimento para evaluar la durabilidad de cuatro productos de
alfombra experimentales. Usted coloca una muestra de cada tipo de alfombra en diez hogares
y mide la durabilidad después de 60 días. Debido a que está examinando un factor (tipo de
alfombra), usted utiliza un ANOVA de un solo factor.

Si el valor p es menor que el nivel de significancia, entonces usted concluye que al menos una
media de durabilidad es diferente. Para información más detallada sobre las diferencias entre
medias específicas, utilice un método de comparaciones múltiples como el de Tukey.

El nombre "análisis de varianza" se basa en el enfoque en el cual el procedimiento utiliza las


varianzas para determinar si las medias son diferentes. El procedimiento funciona comparando
la varianza entre las medias de los grupos y la varianza dentro de los grupos como una manera
de determinar si los grupos son todos parte de una población más grande o poblaciones
separadas con características diferentes.

1. Anova I
Cuando solo existe un criterio de clasificación (variable independiente; por ejemplo, tipo de
técnica terapéutica). A su vez, puede ser intergrupo (existen varios grupos experimentales) e
intragrupo (existe un único grupo experimental).
2. Anova II
En este caso, hay más de un criterio de clasificación (variable independiente). Igual que en el
caso anterior, esta puede ser intergrupo e intragrupo.
Características y supuestos
Cuando se aplica el análisis de varianza (ANOVA) en estudios experimentales, cada grupo
consta de un determinado número de sujetos, siendo posible que difieran los grupos en cuanto
a este número. Cuando el número de sujetos coincide, se habla de un modelo equilibrado o
balanceado.
En estadística, para poder aplicar el análisis de varianza (ANOVA) deben cumplirse una serie
de supuestos:
1. Normalidad
Esto quiere decir que las puntuaciones en la variable dependiente (por ejemplo la ansiedad)
deben seguir una distribución normal. Este supuesto se comprueba mediante las llamadas
pruebas de bondad de ajuste.
2. Independencia
Implica que no exista autocorrelación entre las puntuaciones, es decir, la existencia de
independencia de las puntuaciones entre sí. Para asegurarnos del cumplimiento de este
supuesto, deberemos realizar un MAS (muestreo aleatorio simple) para seleccionar la muestra
que vamos a estudiar o sobre la que vamos a trabajar.
3. Homocedasticidad
Este término significa “igualdad de varianzas de las subpoblaciones”. La varianza es un
estadístico de variabilidad y dispersión, y aumenta cuanto mayor sea la variabilidad o
dispersión de las puntuaciones.
El supuesto de homocedasticidad se comprueba mediante la Prueba de Levene o la de Barlett. En caso de no
cumplirlo, otra alternativa es realizar una transformación logarítmica de las puntuaciones
Ejemplo 1
Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial,
comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se
distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún
tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al
cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las
presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:
Grupo
1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 171 155
181 175 170 155 160
La tabla de anova es:
Fuente de variación GL SS MS F
Tratamiento 4 2010,64 502,66 11,24
Error 20 894,4 44,72
Total 24 2905,04
Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.
Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS, deberíamos crear un archivo con
2 variables: Trata (con un código distinto para cada grupo, p.e. de 1 a 5) y Presion con la
presión arterial de cada individuo al acabar el estudio. Para calcular el Anova desplegamos los
menús que se ven en la gráfica:
La tabla de anova que devuelve el programa es

3.4. Estudios de Regresión