Вы находитесь на странице: 1из 11

Tres criterios de rechazo o aceptación equivalentes

Por lo menos en las hipótesis para los parámetros más usuales existen tres criterios
equivalentes para decidir si se rechaza o no la hipótesis nula. Se consideran
equivalentes porque los tres llevan invariablemente a la misma decisión en términos
de rechazar o no a H0. Sin embargo, no proporcionan la misma información adicional
sobre la decisión que se está tomando, por lo que en algunas situaciones resulta
conveniente emplear un criterio y no otro. A continuación, detallaremos estos tres
criterios.

Significancia observada frente a significancia predefinida

La significancia predefinida que se denota con α es el riesgo máximo que se está


dispuesto a correr por rechazar H0 indebidamente (error tipo I). Mientras que la
significancia observada o calculada, también conocida como p-value o valor-p, es
el área bajo la distribución de referencia que está más allá del valor del estadístico
de prueba. La expresión “más allá del estadístico de prueba” significa, por ejemplo,
en la prueba T bilateral, el área bajo la curva fuera del intervalo [-t0, t0], con t0 > 0,
es decir:

Estadístico de prueba frente a valor crítico

Este criterio se utilizó en el ejemplo previo y es el que de manera tradicional se


empleaba antes de los avances en materia computacional que ahora existe. Este
método consiste en rechazar H0 si el estadístico de prueba cae en la región de
rechazo que está delimitada por el valor crítico. No obstante, se debe tener cuidado
de comparar los valores adecuados, dependiendo de la hipótesis alternativa de que
se trate. Cuando se hacen los cálculos en forma manual este criterio es el que más
se usa; sin embargo, es el que proporciona menos información adicional acerca de
la decisión tomada.
donde T es una variable que tiene una distribución T de Student con n - 1 grados de
libertad. Si la prueba es unilateral de cola derecha, la significancia observada es el
área bajo la curva de la distribución a la derecha de t0. Pero si la prueba es unilateral
de cola izquierda, el área será a la izquierda de –t0. De lo anterior se desprende que
H0 se rechaza si la significancia observada es menor que la significancia
predefinida, o sea, si valor-p < α.

Este criterio es mejor que el anterior porque la significancia observada se ve como


la probabilidad o evidencia a favor de H0, por lo tanto, representa una medida de la
contundencia con la que se rechaza o no la hipótesis nula. Por ejemplo, si la
significancia observada o valor-p es igual a 0.0001, entonces sólo hay una
probabilidad a favor de H0 de 0.0001, por lo que se rechazaría la hipótesis nula en
forma contundente con un riesgo tipo I de sólo 0.0001, que es menor del que se
está dispuesto a admitir, típicamente α = 0.05. En otras palabras, un valor-p =
0.0001 indica que el valor observado del estadístico de prueba prácticamente no
tiene ninguna posibilidad de ocurrir si la hipótesis nula es verdadera, lo que lleva a
concluir de manera contundente que la hipótesis nula debe rechazarse.

En la figura 4.6 se muestra, utilizando una hipótesis bilateral, que cuando ocurre el
evento |t0| < tα/2 necesariamente sucede que valor-p > α, y viceversa. En el caso
representado en la

figura citada no se rechaza H0 con cualquiera de los dos criterios. La comparación


de t0 frente a tα/2 consiste en contrastar simples números, mientras que comparar
las significancias α frente a valor-p implica contrastar probabilidades, de aquí que
esto último sea más informativo.

Intervalo de confianza

En este método se rechaza H0 si el valor del parámetro declarado en la hipótesis


nula se encuentra fuera del intervalo de confianza para el mismo parámetro. Cuando
la hipótesis planteada es de tipo bilateral, se utiliza directamente el intervalo al 100(1
- α) % de confianza. En cambio, si la hipótesis es unilateral, se requiere el intervalo
al 100(1 - 2α) % para que el área bajo la curva, fuera de cada extremo del intervalo,
sea igual a α. Por ejemplo, en el caso de la hipótesis unilateral sobre la media del
peso de costales dada por la expresión (4.11) se debe construir el intervalo al 100(1
-(2 x 0.05)) % = 90% de confianza para aplicar este criterio con una significancia α
= 0.05. El intervalo a 90% de confianza para la media μ está dado por:

Así, con una confianza de 90%, μ está entre 48.9 y 49.9. En tanto, el valor 50.1
declarado en la hipótesis nula no pertenece al intervalo, y además éste se encuentra
ubicado a la izquierda de 50.1, por lo tanto, se rechaza la hipótesis H0: μ = 50.1 y
la evidencia señala que contienen menos azúcar de la que se afirma.

Nótese que para rechazar una hipótesis unilateral también es necesario verificar la
ubicación del intervalo en relación al valor declarado en la hipótesis nula; en tanto,
el intervalo debe ubicarse con respecto a este valor, como lo indica la hipótesis
alternativa. En el ejemplo, la hipótesis alternativa es HA: μ < 50.1, por lo que para
rechazar la hipótesis nula el intervalo debe ubicarse a la izquierda de 50.1, como
ocurre en este caso.

Hipótesis para dos parámetros: comparación de dos procesos o poblaciones


Con frecuencia se presentan situaciones en las que es preciso comparar dos
procesos o poblaciones. Por ejemplo, se requieren comparar dos proveedores, dos
materiales, dos máquinas o dos métodos de trabajo.

Comparación de dos medias (varianzas desconocidas pero iguales)

Sean dos poblaciones o procesos con distribuciones normal con medias μx y μy, y
varianzas 𝜎 2 y 𝜎 2 , respectivamente. Todos estos parámetros son desconocidos, y
en el caso de las varianzas se supone que son iguales entre sí. Interesa investigar
si las medias poblacionales pueden considerarse estadísticamente iguales. Para
ello se plantean las siguientes hipótesis:

las cuales se reescriben como:

Para probar H0 se toma una muestra aleatoria e independiente de cada población,


de tamaño nx la de la población X, y de tamaño ny la de la población Y. Es
recomendable que nx = ny, pero también puede trabajarse con nx ≠ ny. Bajo los
supuestos anteriores, el estadístico de prueba adecuado para probar la hipótesis de
igualdad de medias está dado por

que sigue una distribución T de Student con nx + ny - 2 grados de libertad, donde


𝑆𝑝2 es un estimador de la varianza muestral común, suponiendo que dichas
varianzas desconocidas sean iguales, y se calcula como
Comparación de dos medias (varianzas desconocidas sin suponer igualdad)

En ocasiones cuando se quiere probar la hipótesis de igualdad de dos medias


poblacionales, no es razonable suponer que las varianzas poblacionales sean
iguales, incluso, puede ser que los datos muestrales indiquen que la suposición de
igualdad de varianzas es muy cuestionable. En estos casos es mejor aplicar un
procedimiento que no requiere suponer igualdad de las varianzas, cuyo estadístico
de prueba está dado por

que sigue aproximadamente una distribución T de Student con v grados de libertad,


donde v se obtiene con la siguiente fórmula:
Prueba para la igualdad de varianzas

En lugar de suponer, en la prueba de medias, que las varianzas son iguales o


diferentes, se procede a verificarlo de manera estadística mediante las siguientes
hipótesis:

La comparación de varianzas tiene interés en sí misma, con independencia de las


medias, puesto que éstas son determinantes en cualquier estudio estadístico. En
general se considera que una varianza menor implica potencialmente mejor calidad.
Por ejemplo, en el caso de las centrifugadoras interesa ver si alguna de ellas tiene
mayor error (variabilidad) en sus mediciones. El planteamiento de la hipótesis se
reescribe como:

para enfatizar que la prueba se basa en el siguiente estadístico


Es decir, uno es el inverso del otro, ya que se intercambian los grados de libertad
del numerador y del denominador.

Comparación de proporciones

Una situación de frecuente interés es investigar la igualdad de las proporciones de


dos poblaciones. Por lo tanto, es necesario probar la siguiente hipótesis:

H0: p1 = p2

HA: p1 = p2

donde p1 y p2 son las proporciones de cada una de las poblaciones. Por ejemplo,
para evaluar dos fármacos contra cierta enfermedad se integran dos grupos
formados por dos muestras aleatorias de n1 = n2 = 100 personas cada una. A cada
grupo se le suministra un fármaco

diferente. Una vez transcurrido el tiempo de prueba se observan x1 = 65 y x2 = 75


personas que se recuperaron con el fármaco en los grupos correspondientes. Para
ver si estas diferencias son significativas a favor del fármaco 2, es necesario probar
la hipótesis de igualdad de proporciones. Para ello, bajo el supuesto de distribución
binomial el estadístico de prueba Z0 está dado por:
Poblaciones pareadas (comparación de dos medias con muestras
dependientes)

En la sección anterior se probó la hipótesis de igualdad de las medias de dos


poblaciones bajo el supuesto de que éstas son independientes y, por lo tanto, no
hay una relación directa entre los datos de las dos muestras. Por ejemplo, si se
comparan dos proveedores del mismo material, es claro que ambos son
independientes y las dos muestras de material de prueba son dos conjuntos
físicamente distintos. Pero si se toma una muestra representativa del material de
cada proveedor, digamos 15 unidades de cada uno, entonces es importante
aleatorizar el orden en que se probarán las 30 unidades y que la prueba sea
desarrollada por el mismo operador, utilizando los mismos equipos de medición y
prueba; todo lo anterior con

la idea de evitar cualquier sesgo que favorezca a uno de los tratamientos o


proveedores. Sin embargo, en muchas situaciones prácticas no conviene o no es
posible tomar muestras independientes, sino que la mejor estrategia consiste en
tomar muestras pareadas. Esto significa que los datos de ambas muestras se ven
como pares porque tienen algo en común. Por lo general, coinciden en que de la
misma pieza o individuo se obtienen dos mediciones. Por ejemplo:

 A los mismos pacientes se les aplican dos medicamentos (tratamientos) para


el dolor en distintas ocasiones; los tratamientos a comparar son los dos
medicamentos.
 A las mismas piezas se les hace una prueba de dureza con distintos
instrumentos; aquí se quiere comparar a los instrumentos.

En el primer caso, el apareamiento consiste en que el grupo de pacientes que recibe


el medicamento A es el mismo grupo que recibe el medicamento B, por lo que las
mediciones del efecto de los medicamentos sobre el mismo paciente están
relacionadas, y en este sentido no son independientes. Debido a que es el mismo
grupo el que recibe ambos tratamientos, se logra una comparación más justa y
precisa, pero, además, al observar las diferencias entre los tratamientos en un
mismo paciente se eliminan otras fuentes de variación y se logra hacer una
comparación sin sesgos. En el caso de las piezas, si una es grande se espera que
ambos instrumentos tiendan a reportar una medición alta, por lo que se pronostica
una fuerte corre-lación entre las mediciones reportadas con los dos instrumentos.
Además, al medir las piezas con los dos instrumentos, si hay diferencias en las
mediciones sobre la misma pieza, entonces éstas se deben principalmente al
sistema de medición.

Resumen de fórmulas para procedimientos de prueba de hipótesis

En la tabla 4.3 se resumen las fórmulas de los procedimientos de pruebas de


hipótesis que involucran un parámetro de una sola población, mientras que en la
tabla 4.4 se listan los procedimientos que se refieren a los parámetros de dos
poblaciones. En cada caso se muestra
el planteamiento de la hipótesis, el estadístico de prueba y el criterio de rechazo,
este último para cada una de las tres posibles alternativas. Si se trabaja con un
software estadístico es más directo y conveniente basarse en el criterio del valor-p,
el cual debe ser menor que α para cualquier hipótesis a fin de que sea posible
rechazar H0.

En la tabla 4.4 note que aparecen tres maneras de probar la igualdad de medias H 0:
μ1 = μ2. La primera a) es para el caso de muestras independientes suponiendo
varianzas iguales. La segunda b) es para muestras independientes sin suponer
varianzas iguales y el caso e) es para muestras pareadas.

Вам также может понравиться