Вы находитесь на странице: 1из 5

Unidad 1: Experimento con un solo factor.

ANOVA
Introduccin
1.1

Conceptos Bsicos de Prueba de Hiptesis

Un estudio experimental o una investigacin, por lo general tiene como ltimo objetivo,
responder en forma segura ciertas preguntas y/o tomar decisiones. En este contexto, el
experimentador tiene a priori ciertas creencias o hiptesis que desea comprobar. Por ejemplo:

Los tres proveedores del material x tienen el mismo nivel de calidad.


El porcentaje de este ingrediente afecta el resultado de la mezcla.
El tiempo de espera de esta operacin es de tres horas, en promedio.
Si aumentamos la cantidad de reactivo se elimina el problema.

A continuacin se describen los conceptos bsicos de prueba de hiptesis, es decir, los pasos
fundamentales de cualquier procedimiento de prueba de hiptesis, como son: planteamiento de
la hiptesis, estadstico de prueba y criterio de rechazo.

Planteamiento de una hiptesis estadstica


Una hiptesis estadstica es una afirmacin sobre los valores de los parmetros de una
poblacin o proceso, que es susceptible de probarse a partir de la informacin contenida en una
muestra representativa que es obtenida de la poblacin. Por ejemplo, la afirmacin este
proceso produce menos de 8% de defectuosos se puede plantear estadsticamente, en
trminos de la proporcin p desconocida de artculos defectuosos que genera el proceso, como
se hace a continuacin.

A la expresin H0 : p = 0.08 se le conoce como hiptesis nula y HA : p < 0.08 se le llama


hiptesis alternativa. El nombre de hiptesis nula se deriva del hecho de que comnmente se
plantea como una igualdad, lo cual facilita el tener una distribucin de probabilidad de referencia
especfica. En general, la estrategia a seguir para probar una hiptesis es suponer que la
hiptesis nula es verdadera, y que en caso de ser rechazada por la evidencia que aportan los
datos, se estar aceptando la hiptesis alternativa. As, en el caso de las proporciones, la
afirmacin que se desea probar se aceptar como cierta, slo en caso de rechazar la hiptesis
nula.
Supongamos ahora que la afirmacin a probar es este proceso produce 8% de defectuosos.
Observe que la afirmacin seala que su falsedad se da, tanto si se observan menos de 8% de
defectuosos como si se observan ms de 8% de defectuosos. En este sentido, el planteamiento
estadstico debe ser:

Ahora, lo que se desea concluir es la hiptesis nula. Ntese la diferencia entre las hiptesis
alternativas en las expresiones (2.4) y (2.5). En (2.4) HA se conoce como hiptesis alternativa
de un solo lado (unilateral), ya que la nica manera de rechazar H0 es teniendo valores de la
proporcin muestral p significativamente ms pequeos que 0.08. Asimismo, en (2.5) HA se
llama hiptesis alternativa de dos lados (bilateral), ya que la evidencia en contra de H0 se
obtiene con valores pequeos o grandes de la proporcin muestral p. As, la eleccin de la
hiptesis alternativa en cuanto a si debe ser unilateral o bilateral depende de la afirmacin que
se quiera probar.
Otro aspecto importante es la seleccin del valor del parmetro que especifica la hiptesis nula,
esto es, por qu 0.08 en las hiptesis de las expresiones (2.4) y (2.5)? Este valor se elige de
manera que separe dos situaciones que llevan a tomar diferentes acciones. Por ejemplo, en la
hiptesis dada en (2.4) se eligi 0.08, porque sta es la proporcin de defectuosos reportada el
mes anterior, y despus de implementar un programa de mejora se quiere ver si dio el resultado
esperado. En caso de no rechazar H0 se concluira que el programa no funcion y que se
deben tomar medidas adicionales para bajar la proporcin de defectuosos.

Estadstico de Prueba
Probar una hiptesis consiste en investigar si lo afirmado por la hiptesis nula es verdad o no.
La estrategia de prueba parte del supuesto de que H0 es verdadera, y si los resultados de la
investigacin contradicen en forma suficiente dicho supuesto, entonces se rechaza H0 y se
acepta la hiptesis alternativa. En caso de que los resultados de la investigacin no demuestren
claramente la falsedad de H0, sta no se rechaza. Es decir, la hiptesis nula es verdadera
mientras no se demuestre lo contrario.
Una vez planteada la hiptesis, se toma una muestra aleatoria de la poblacin de estudio o se
obtienen datos mediante un experimento planeado de acuerdo con la hiptesis. El estadstico
de prueba es un nmero calculado a partir de los datos y la hiptesis nula, cuya magnitud
permite discernir si se rechaza o no la hiptesis nula H0. Al conjunto de posibles valores del
estadstico de prueba que llevan a rechazar H0, se le llama regin o intervalo de rechazo para
la prueba, y a los posibles valores donde no se rechaza H0 se les llama regin o intervalo de
aceptacin. Por ejemplo, para las hiptesis planteadas en (2.4) y (2.5), el estadstico de prueba
est dado por:

donde p es la proporcin de defectuosos que se encontr en una muestra de n artculos


inspeccionados. Si H0 es verdad, el estadstico z0 sigue aproximadamente la distribucin
normal estndar; la aproximacin es mejor mientras ms grande es el valor de n. En general, se
requiere np > 10 para una buena aproximacin; en este caso, con np 120 unidades
inspeccionadas sera suficiente.
Por ejemplo, supongamos que se toma una muestra de n = 150 piezas y de ellas x = 20 son
defectuosas, entonces el valor de la proporcin es p = x/n = 0.13. Vamos a ver si esto implica

una diferencia suficiente para rechazar que p = 0.08. Por lo pronto, el valor estadstico es z0 =
2.41.

Criterio de rechazo
El estadstico de prueba, construido bajo el supuesto de que H0 es verdad, es una variable
aleatoria con distribucin conocida. Si efectivamente H0 es verdad, el valor del estadstico de
prueba debera caer dentro del rango de valores ms probables de su distribucin asociada, el
cual se conoce como regin de aceptacin. Si cae en una de las colas de su distribucin
asociada, fuera del rango de valores ms probables (en la regin de rechazo), es evidencia en
contra de que este valor pertenece a dicha distribucin (vase figura 2.3). De aqu se deduce
que debe estar mal el supuesto bajo el cual se construy, es decir, H0 debe ser falsa.

Pruebas de una y dos colas (unilaterales y bilaterales). La ubicacin de la regin o intervalo


de rechazo depende de si la hiptesis es bilateral o unilateral. Como se vio en el caso de las
proporciones, una hiptesis es bilateral cuando la hiptesis alternativa (HA) es del tipo no es
igual (); y es unilateral cuando la alternativa es del tipo mayor que (>) o menor que (<).
Cuando es bilateral, como en la expresin (2.5), la regin de rechazo est repartida de manera
equitativa entre ambas colas de la distribucin del estadstico de prueba. Pero si la hiptesis es
unilateral, como en la expresin (2.4), la evidencia en contra de la hiptesis nula se ubica en un
solo lado de la distribucin, esto es, la regin de rechazo slo se concentra en una de las colas.
En la expresin (2.4) la regin de rechazo se concentra en el lado izquierdo de la distribucin
del estadstico dado por (2.6) (vase figura 2.3).
Para probar la hiptesis sobre la proporcin se calcula el estadstico de prueba z0 de la
ecuacin (2.6) y se verifica si cae en la regin de rechazo o aceptacin. Por ejemplo, si las
hiptesis planteadas son las expresiones (2.4) se rechaza H0 si z0 < za; si las hiptesis estn
dadas por las relaciones (2.5) se rechaza H0 si z0 < za/2 o si z0 > za/2, o simplemente, si |z0|
> za/2. En la figura 2.3 esto equivale a que z0 caiga en el rango de las reas sombreadas, de
acuerdo con la hiptesis de que se trate.
Si queremos probar la hiptesis bilateral con una confianza de 95%, entonces za/2 = 1.96;
adems, como p = 0.13 y z0 = 2.41, entonces z0 > 1.96; por lo tanto, se rechaza H0 : p = 0.08.
De alguna forma, esto ya se intua, puesto que la proporcin muestral haba sido p = 0.13.

Si en lugar de tener x = 20 defectos, se tuvieran x = 15, entonces p = 0.10. Al sustituir esto en


(2.6) con n = 150, se obtiene que z0 = 0.90 que no es mayor que Za/2 = 1.96. De aqu que no
se rechace H0 : p = 0.08. Es decir, en este caso p = 0.10 no es evidencia suficiente contra H0 :
p = 0.08.

El riesgo de una decisin equivocada: errores tipo I y tipo II


Probar una hiptesis estadstica es una decisin probabilstica, por lo que existe el riesgo de
cometer un error tipo I o un error tipo II. El primero ocurre cuando se rechaza H0 cuando sta
es verdadera, y el error tipo II es cuando se acepta H0 y sta es falsa. En toda prueba de
hiptesis cada tipo de error tiene una probabilidad de ocurrir.
Con y se denotan las probabilidades de los errores tipo I y II, respectivamente. As,
= P{error tipo I} = probabilidad de rechazar H0 siendo verdadera
= P{error tipo II} = probabilidad de aceptar H0 siendo falsa
A 1 se le llama potencia de la prueba, y es la probabilidad de rechazar H0 cuando es falsa.
A tambin se le conoce como la significancia dada de la prueba y es la probabilidad de la
regin o intervalo de rechazo; su valor se especifica por parte del investigador desde que
planea el estudio.
Por lo general se utilizan los valores = 0.05 o 0.01, dependiendo del riesgo que se quiera
admitir en la conclusin. Mientras ms pequeo es el valor de se requiere ms evidencia en
los datos para rechazar H0.
Por ejemplo, si la accin a tomar despus de rechazar H0 implica una inversin fuerte de
recursos, se recomienda utilizar = 0.01 para tener mayor confianza de que la decisin ser la
adecuada. Si la decisin no implica una inversin fuerte, es suficiente trabajar con = 0.05, que
es el valor ms utilizado para este riesgo.
Esto es, un valor ms pequeo que no necesariamente ser mejor, ya que si se admite poco
riesgo ( 0.01) se est truncando la posibilidad de muchos cambios que seran positivos para
la empresa. Utilizar = 0.05 significa que por cada 100 veces independientes que se aplica el
procedimiento y se rechaza H0, se espera que en un promedio de 95 veces, tal decisin sea la
correcta.
Por lo general, en las pruebas de hiptesis se especifica el valor de y se disea la prueba de
tal forma que el valor de sea pequeo. Esto es, la probabilidad del error tipo I se controla
directamente, mientras que la probabilidad de error tipo II se controla de manera indirecta con el
tamao de la muestra, ya que a ms datos ser menor. En otras palabras, con una muestra
grande es mayor la potencia de la prueba, es decir, se incrementa la probabilidad de rechazar
H0 si sta es falsa.
En la prctica suele ser ms delicado cometer el error tipo I que el error tipo II, debido a que en
la mayora de las hiptesis el rechazar H0 implica objetar algo que se acepta de manera
convencional. No rechazar H0 implica, en muchos casos, seguir como hasta ahora. Por lo
anterior, es comn que se controle slo el error tipo I, mientras que el error tipo II se deja libre
como si su magnitud no importara.
Lo cierto es que el error tipo II tambin importa y la magnitud de su probabilidad debe ser
pequea (se recomienda = 0.10). El problema es que controlar a tiene varios problemas; por

ejemplo, muchas veces se requieren grandes tamaos muestrales o se deben realizar muchas
repeticiones en el experimento. Por ello, en este libro no enfatizamos el control del error tipo II,
pero damos las recomendaciones del nmero de repeticiones que deben obtenerse en cada
experimento para tener un valor pequeo de .