Вы находитесь на странице: 1из 6

PRUEBAS DE HIPÓTESIS ESTADÍSTICAS.

Apunte elaborado por Verónica Bittner Sch.

Con frecuencia los problemas con los que se enfrentan los investigadores no se refieren sólo a
estimar un parámetro, sino que a tomar decisiones relativas a la población sobre la base de
información proveniente de muestras. Por ejemplo, un médico puede querer decidir, sobre la base
de evidencia experimental, que beber café aumenta el riesgo de cáncer; o un sociólogo desea
determinar si ciertos rasgos físicos y la agresión son variables independientes; o un ingeniero desea
demostrar que un proceso de producción genera mejores resultados que otro.

El propósito de la prueba de hipótesis es determinar si el valor supuesto de un parámetro


poblacional, como la media (μ), es verosímil con base en la evidencia muestral. Por ejemplo,
planteamos la hipótesis de que los pacientes que acuden al servicio de urgencia del Hospital
Regional, esperan en promedio 2 horas para ser atendidos. Luego, registramos los tiempos de
espera de una muestra aleatoria de pacientes y, a partir de ella, calculamos el tiempo medio de
espera; si éste es cercano a 2 podemos aceptar nuestra hipótesis y si es muy lejano la rechazamos.
Es decir, si los datos muestrales son consistentes con la hipótesis planteada, ésta se acepta y
decimos que no tenemos suficiente evidencia para concluir que es falsa. Si los datos observados en
la muestra son inconsistentes con la hipótesis, la rechazamos y decimos que tenemos suficiente
evidencia para concluir que es falsa.

La función de la estadística es la de apoyar el razonamiento para llegar a decisiones sólidas a pesar


de la incertidumbre. En cada uno de los ejemplos mencionados se deben tomar decisiones
basándose en datos experimentales (muestrales) y si hay que tomar decisiones es porque hay
alternativas: cada una de estas alternativas se formaliza como una hipótesis estadística y el proceso
mediante el cual enfrentamos estas hipótesis al tomar como referencia los datos de la muestra se
denomina PRUEBA O CONTRASTE DE HIPÓTESIS.

Hipótesis estadística: Es una aseveración o conjetura respecto a una o más poblaciones.

Al realizar un estudio se formulan dos hipótesis: la hipótesis nula (H₀) y la hipótesis alternativa
(H₁). Por ejemplo:

1.- Se desea probar si el porcentaje de mujeres que aumenta más de 12 kilos durante el embarazo es
superior al 40%:
H₀ : P = 0,4 Kg. H₁ : P > 0,4 kg.

2.- Si hasta ahora se ha pensado que la edad promedio en que los jóvenes comienzan el consumo
de alcohol es de 16 años, pero nosotros, basados en nuestra experiencia, creemos que es menor,
podemos postular:
H₀ : μ = 16 H₁ : μ < 16

3.- En un proceso de producción cierta máquina envasadora debe llenar los frascos de remedio con
200 ml. promedio. Si esto no ocurre, debe detenerse el proceso para ajustarla. Entonces, con base
en muestras extraídas aleatoriamente puede probarse:

H₀ : μ = 200 ml. H₁ : μ ≠ 200 ml.


La hipótesis nula es aquella que esperamos rechazar y debe incluir en su planteamiento la condición
de no cambio ( =, ≤, ≥ ), de ahí su nombre de hipótesis nula.

Por el contrario, la hipótesis alternativa es una proposición que niega o contradice una hipótesis
nula y expresa lo que se desea aceptar.

El término “nula” implica nada o nulo. Esto surge de sus primeras aplicaciones por parte de los
investigadores agrícolas quienes probaron la efectividad de un nuevo fertilizante para determinar su
impacto en la producción de la cosecha. Asumieron que el fertilizante no hacía ninguna diferencia
en el rendimiento hasta que éste produjo algún efecto. Por tanto, la hipótesis nula, tradicionalmente
contiene alguna referencia de un signo con igual (Webster, 2000).

Una vez identificadas las hipótesis se procede a reunir evidencia (tomar muestra) cuyos resultados
serán de apoyo a una u otra hipótesis. Una hipótesis nula se considera verdadera amenos que exista
evidencia suficiente en su contra. La prueba tiene como propósito hacer un juicio a la diferencia
entre el parámetro poblacional estudiado y la estadística muestral, para determinar si ésta es
pequeña y se debe al azar (error de muestreo) o si es tan grande que es muy poco probable que
ocurra.

Volviendo al ejemplo 3, supongamos que se extrae una muestra aleatoria de frascos de la línea de
llenado y se observa una diferencia en el contenido promedio, con respecto a los 200 ml. Surge
entonces la pregunta: ¿de qué magnitud debe ser esta diferencia para afirmar que el proceso está
fuera de control y no se debe solamente a un error de muestreo (o al azar)?

Sabemos que la media aritmética de una muestra puede diferir de la poblacional ya que la
distribución muestral de este estadígrafo varía alrededor de μ, por lo tanto es posible encontrar
diferencias entre los valores muestrales y el poblacional. Lo que debemos determinar en este caso
es: “si realmente μ = 200 ml. ¿qué tan probable es encontrar en la muestra el valor que se observó?

Si el valor observado en la muestra tiene una alta probabilidad de ocurrir, entonces existe evidencia
suficiente para firmar que μ = 200 ml., sin embargo, si el valor observado tiene una baja
probabilidad de ocurrencia (por ejemplo 0,001) entonces podemos afirmar que esta muestra
proviene de una distribución que tiene una media distinta a 200 ml. y diremos que la media
aritmética es significativamente diferente a 200.

Sin embargo, cada vez que se toma una decisión (aceptar o rechazar Ho) se hace basándose en la
información que proporciona una sola muestra, por lo tanto, siempre se corre el riesgo de cometer
un error. Volviendo al ejemplo anterior, la estadística de prueba, el valor que utilizaremos para
aceptar una u otra hipótesis, es la media observada en la muestra. Supongamos que si se observa
un contenido medio menor a 197 ml. o mayor a 203 ml. el proceso está fuera de control, entonces
podríamos cometer dos errores:

1) El llenado de los frascos podría tener realmente un promedio de 200 ml., sin embargo,
casualmente la muestra observada arrojó un valor de 204 ml. En este caso, rechazaríamos Ho a
favor de H₁ cuando de hecho Ho es verdadera; este error se denomina error tipo I y se
simboliza por α.

2) Si, en cambio, realmente el contenido promedio de los frascos es menor a 197, pero
‘casualmente’ la muestra observada arroja un valor medio de 100 ml., aceptaremos la Ho
siendo ésta falsa; este error corresponde al error tipo II y se denomina β.
Error tipo I: Es el error que se comete al rechazar la hipótesis nula siendo ésta verdadera.

Error tipo II: Es el error que se comete al aceptar la hipótesis nula siendo ésta falsa.

Por lo tanto, se pueden presentar las siguientes situaciones:

Ho es verdadera Ho es falsa
Decisión

Rechazar Ho Error tipo I (α) No hay error

Aceptar Ho No hay error Error tipo II (β)

Al tomar decisiones en base a muestras, cualquier cosa puede ocurrir, desde cometer un error tipo I
a tomar una decisión correcta. Se considera más grave cometer un error tipo I y, ante la
imposibilidad de descartarlo, se le asigna una probabilidad de ocurrencia, obviamente pequeña, para
así controlar el riesgo de equivocarnos. Llegamos así al concepto de nivel de significación.

Nivel de significación: Corresponde a la probabilidad de cometer el error tipo I. Es decir, es la


probabilidad de rechazar H₀ siendo ésta verdadera.

Esta probabilidad se denota por α y se utilizará para obtener valores a partir de los cuales
rechazaremos la hipótesis nula según los datos observados en la muestra. Los niveles de
significación más usados son 0,05 y 0,01. La probabilidad de aceptar H0 siendo ésta verdadera se
denomina nivel de confianza (1 – α).
ETAPAS EN LA CONTRASTACIÓN DE HIPÓTESIS.

1.- Planteamiento de las hipótesis estadísticas:

Se plantea la hipótesis nula que se va a probar y la hipótesis alternativa.

2.- Formulación de supuestos:

Para poder aplicar la teoría de las probabilidades a una distribución determinada se deben formular
una serie de supuestos acerca de la población respecto de la cual se va a realizar el estudio y de los
procedimientos de muestreo empleados. En general siempre se deben establecer supuestos sobre:

a) La forma en que se seleccionó l a muestra (debe ser al azar).


b) La distribución de la población estudiada y del estadígrafo utilizado para estimar el parámetro.

3.- Determinación del tamaño muestral y del nivel de significación:

El tamaño muestral se calcula de acuerdo a los procedimientos antes estudiados y el nivel de


significación lo elige el investigador según el riesgo que esté dispuesto a correr (de rechazar H₀ si
es verdadera).

4.- Selección de la estadística de prueba:

La estadística de prueba corresponde a un número calculado con los datos muestrales y se


selecciona según el parámetro que se encuentre en la hipótesis nula.

5.- Formulación de una regla de decisión:

La regla de decisión debe especificar qué valores de la estadística de prueba llevan a aceptar H₀ y
cuáles a rechazarla. El conjunto de valores cuya probabilidad de ocurrencia es baja (α ) si H₀ es
verdadera recibe el nombre de región crítica o zona de rechazo de la hipótesis. El conjunto de
valores cuya probabilidad de ocurrencia es alta ( 1 – α ) si H₀ es verdadera recibe el nombre de
zona de aceptación de la hipótesis nula.

6.- Cálculo de la estadística de prueba:

Al seleccionar la muestra aleatoria se calcula el estadígrafo que se usará como estimador del
parámetro y la estadística de prueba.
7.- Aplicación de la regla de decisión:

Si la estadística de prueba cae en la región de rechazo, rechazamos H₀ con una probabilidad α de


cometer el error tipo I; si el valor cae en la región de aceptación, aceptamos H₀ o más bien, no hay
evidencia para rechazarla.

8.- Conclusión:

En base a lo observado anteriormente se podrá interpretar el resultado obtenido en el área específica


de estudio, lo que llevará a los expertos a tomar decisiones, cambiar los cursos de acción o
simplemente reafirmar sus teorías con respecto al fenómeno estudiado.

Nosotros resumiremos estos ocho pasos en los siguientes:

1.- Planteamiento de las hipótesis.


2.- Selección de un nivel de significación α.
3.- Selección de la estadística de prueba y región crítica.
4.- Cálculo de la estadística de prueba.
5.- Decisión.
6.- Interpretación y conclusiones.

P –VALOR

Tradicionalmente, la decisión de aceptar o rechazar la hipótesis nula (Ho) se ha tomado de acuerdo


al valor crítico determinado por el nivel de significación (α) seleccionado. Así, si una hipótesis
nula se rechaza a un nivel de significación de 0,05, simplemente conocemos la de cisión tomada,
pero no sabemos nada de si la estadística de prueba cayó apenas en la cercanía del valor crítico o
si rebasó con creces este punto. Esta información generalmente es útil para las personas que
realizan el estudio, con el fin de tener una idea de la “fuerza” que tiene la conclusión a la que se
llegó.

Por ejemplo, se piensa que el peso promedio de los niños nacidos en Concepción ha aumentado
durante los últimos años. Si el promedio conocido era de 2,95 kg., las hipótesis que se plantearán
serán:

Ho: μ = 2,95 kg. H1: μ > 2,95 kg.

Se decide utilizar un nivel de significación del 5% (α= 0,05), así la región crítica es: Z > 1,645. Si
la estadística de prueba es Zc = 1,8 se rechaza Ho. Sin embargo, si hacemos α = 0,01, la región
crítica será Z > 2,33, valor que no permite el rechazo de Ho, con lo cual, no tenemos la certeza
absoluta de que el peso medio de los niños ha aumentado. Debido a esto suele entregarse el
denominado p-valor, que corresponde a la probabilidad de observar en la muestra valores tan o
más extremos que los realmente observados, si la hipótesis nula es verdadera.

En el ejemplo, la probabilidad de observar un Z > 1,8 es 0,0359, es decir, si el peso medio de los
niños sigue siendo 2,95 kg., hay un 3,95% de posibilidades de observar en la muestra los valores
obtenidos. Si α es mayor a este valor, rechazamos Ho y si es menor a 0,0359, aceptamos.
Normal Distribución
0.4 Media,Desv . Típ.
0,1

densidad
0.3

0.2

0.1

0
-3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 3

Si la estadística de prueba es Zc = 2,45, la probabilidad de observar en la muestra un valor tan


extremo o mayor que éste sería 0,0071, o sea, existe sólo un 0,71 % de posibilidades de que en la
práctica se registre un Zc de 2,45 si el peso medio de los niños sigue siendo de 2,95 kg.

Por lo tanto:

El p-valor es el nivel de significación α más bajo al cual se puede rechazar la hipótesis nula.

En palabras sencillas, el p-valor es la probabilidad de que la muestra observada provenga de una


población donde se cumple lo planteado en Ho. Mientras más pequeño es el p-valor, menos fuerza
tendrá la hipótesis nula como una explicación de los datos observados.

Una vez determinado el p-valor, la conclusión resulta de comparar este valor con el de α:

p-valor < α se rechaza Ho

p-valor ≥ α no se rechaza Ho

1 – Φ(z) Prueba de cola superior (H1: μ > μo)

p-valor = Φ(z) Prueba de cola inferior (H1: μ < μo)

2 1 – Φ(z) Prueba a dos colas (H1: μ ≠ μo)

Вам также может понравиться