Академический Документы
Профессиональный Документы
Культура Документы
"CONTRASTES DE HIPTESIS"
277
278
279
En el ejemplo anterior, el estadstico de contraste puede ser la media muestral, pero segn hemos visto en unidades anteriores, conocemos que la variable
x! Z= "
n
con n > 30
sigue una distribucin normal N(0,1), por lo que puede utilizarse sta variable como un estadstico de contraste, ya que se conoce su distribucin.
280
de
significacin
potencia
del
Nivel de significacin del contraste es la probabilidad de cometer un error del tipo I, es decir, de rechazar la hiptesis nula siendo cierta, acostumbra a denotar por ! ! = P(cometer error tipo I) = P(rechazar Ho siendo cierta) y se
La interpretacin estadstica del error tipo I es la siguiente: Si el experimento se repitiera un gran nmero de veces, sobre una poblacin con media de 150 unidades, en el 100(1 - a)% de los casos, ese experimento llevara a la conclusin verdadera de que = 150, y en el 100 a% de las veces conducira a la decisin falsa de que ! 150.
281
La probabilidad de cometer error del tipo II se denota por " " = P(cometer error tipo II) = P(aceptar Ho siendo falsa) Su complementario hasta uno es lo que se llama potencia del contraste La potencia del contraste, es la probabilidad de rechazar la hiptesis nula siendo sta falsa., es decir, aceptar la hiptesis alternativa siendo cierta. La interpretacin estadstica del error tipo II es la siguiente: Si el experimento se repitiera un gran nmero de veces, sobre una poblacin con media de 150 unidades, en el 100"% de los casos, ese experimento llevara a la conclusin falsa de que = 150, y en el 100 (1 - ")% de las veces conducira a la decisin verdadera de que ! 150. Estas probabilidades se pueden conocer: Si en el ejemplo de una poblacin normal N(, 30) tomamos una muestra de 36 elementos, y contrastamos Ho (=150) contra la hiptesis alternativa Ha (=165), y consideramos como regin de aceptacin el intervalo (140, 160), entonces la probabilidad de cometer error tipo I, es la probabilidad de que la media muestral pertenezca a la regin crtica; es decir, sea mayor que 160, o menor que 140 unidades, y la hiptesis nula sea cierta. As ! = P(cometer error tipo I) = P( x " 160/N(150,30))+P( x # 140/N(150,30))= =P(Z " 2) + P(Z # -2) = 0.0228 + 0.0228 = 0.0456 lo que nos da cierta informacin sobre la posibilidad de acertar en nuestra decisin, aunque no sepamos el verdadero valor del parmetro poblacional. Anlogamente se puede calcular la probabilidad de cometer error tipo II, es decir, de que la media muestral pertenezca al intervalo (140, 160) y sea cierta la hiptesis alternativa: " = P(cometer error tipo II) = P(140 # x # 160/N(165,30))= P(-5 # Z # -1) = P(Z # -1) - P(Z # -5) = 0.1687 - 0.00001 = 0.168699.
282
Estos son los conceptos iniciales que deben tenerse en cuenta en un contraste de hiptesis.
283
! !
En ste caso, la hiptesis nula ser, en general: Ho ( = o ) Mientras que la hiptesis alternativa puede tener diversas expresiones:
Ha ( = 1 ) , o bien, Ha ( < o ), Ha ( > o ), o bien Ha ( ! o ). ! Estadgrafo de contraste: El contraste se efectuar tomando muestras aleatorias de tamao n. Conocemos que la distribucin de la media muestral sigue una distribucin normal N(, #/$n). Entonces, si x es la media de una muestra de tamao n, entonces la variable
x! Z= " o
n
seguir, cuando la hiptesis nula sea cierta una distribucin normal estndar N(0,1). Se puede utilizar as pues sta variable como estadstico de contraste en ste caso. ! Nivel de significacin: El nivel de significacin ser !, que, generalmente
tomar los valores 0.1, 0.05 0.01. ! Regin crtica: Si la hiptesis nula fuese cierta y = o , cabe esperar que la media muestral x se distribuya en torno al valor o, es decir, x - o tendr un valor elevado para que existan evidencias de que la hiptesis nula sea falsa, es decir, la variable Z tomar un valor absoluto grande; as pues, la regin crtica estar formada por los valores de Z elevados, tanto positivos como negativos. Para especificar cuando se consideran
284
elevados, teniendo en cuenta la distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que z!/2, en el contraste bilateral, o que z! en el contraste unilateral. Si la hiptesis nula fuese Ho ( " o ), entonces dejaran de pertenecer a la regin crtica los valores positivos grandes, y el contraste es, en ste caso, unilateral. (Ver figuras 4.2 y 4.3).
1-! ! /2 -z! /2
Regin crtica
nivel de significacin
! /2 0
Regin de Aceptacin
z! /2
Regin crtica
Figura 4.10: Regiones crtica y de aceptacin en un contraste bilateral cuando la distribucin es normal estndar.
1- !
nivel de significacin
0
Regin de Aceptacin
z!
Regin crtica
Figura 4.11: Regiones crtica y de aceptacin en un contraste unilateral cuando la distribucin es normal estndar.
285
4.4.3.2 Contraste para la media de una poblacin normal, con varianza poblacional desconocida
MUESTRAS GRANDES
! Estadgrafo de contraste: En el mismo caso que en el prrafo anterior, y con las mismas hiptesis, si el tamao de la muestra es suficientemente grande (n > 30), aunque sea desconocida la varianza poblacional, se consiguen buenos resultados utilizando como estimador de la varianza poblacional la cuasi-varianza muestral y, por lo tanto, se puede tomar como estadstico de contraste el mismo que se tom cuando la varianza poblacional era conocida; es decir
Z=
x ! o
s n
es una variable que sigue una distribucin normal estndar N(0,1), por lo que el razonamiento es idntico al caso anterior.
MUESTRAS PEQUEAS
! Estadgrafo de contraste: Si el tamao de la muestra es pequeo (n < 30), sabemos de unidades anteriores que la variable
t=
x ! o
s n !1
difiere sensiblemente de una distribucin normal, aproximndose bastante mejor por una distribucin t de Student, con n-1 grados de libertad, por lo que sta variable t puede utilizarse con un estadstico de contraste. ! Regin crtica: La regin crtica, en ste caso, estar determinada por los valores de la variable t que sean excesivamente grandes en valor absoluto, si el contraste es bilateral, y para especificar el nivel de cuando pueden considerarse grandes, teniendo en cuenta la
286
distribucin de la variable t, que sigue una distribucin t con n-1 grados de libertad, sern aquellos valores mayores que t!/2,n-1 en el contraste bilateral, o que t!,n-1 en el contraste unilateral. Las regiones crticas sern pues, anlogamente al caso de la varianza poblacional conocida, los siguientes (ver figuras 4.4 y 4.5):
nivel de confianza
!/2
1"!
!/2
nivel de significacin
-t !/2
Regin crtica
0
Regin de Aceptacin
t !/2
Regin crtica
Figura 4.12: Regiones crtica y de aceptacin en el contraste bilateral cuando la variable se distribuye segn una t de Student.
Figura 4.13: Regiones crtica y de aceptacin en el contraste unilateral cuando la variable se distribuye segn una t de Student.
287
4.4.4.1 Contraste de hiptesis para la igualdad de medias de dos poblaciones normales con varianzas poblacionales conocidas.
! Estadgrafo de contraste: Conocemos del tema relacionado con las distribuciones normales, que la diferencia de dos distribuciones normales se distribuye tambin normalmente con media la diferencia de las medias, y varianza la suma de las varianzas, por lo que la variable # 2 & "1 "2 + 2 ( , por x1 ! x2 ser una variable que se distribuye normalmente N% 1 ! 2 , n1 n2 ' $ lo que en el caso particular de conocer las varianzas poblacionales, podemos utilizar como estadstico de contraste la variable
Z=
x1 ! x2
2 "2 "1 + 2 n1 n 2
288
que, en el caso de que la hiptesis nula sea cierta (1 = 2 ), se distribuye como una distribucin normal estndar N(0,1), y, por lo tanto, puede utilizarse como estadstico de contraste, dado que conocemos su distribucin.
! Regin crtica: La regin crtica estar formada por los valores de Z elevados, tanto positivos como negativos. Para especificar cuando se consideran elevados, teniendo en cuenta la distribucin de Z, sern aquellos que sean mayores, en valor absoluto, que Z!/2, en el contraste bilateral, o que z! en el contraste unilateral.
4.4.4.2 Contraste de hiptesis para la igualdad de medias de dos poblaciones normales con varianzas poblacionales desconocidas pero iguales
MUESTRAS GRANDES ! Estadgrafo de contraste: Supongamos ahora que las varianzas son desconocidas pero iguales (#1 = #2 = #). Si las muestras tienen tamao grande, aunque no se conozca la varianza poblacional, se trabaja como si se conociese utilizando en lugar de la varianza poblacional, su estimador la cuasivarianza muestral, por lo que la distribucin de la diferencia de " 1 1 % ' , medias muestrales es ahora N $ 1 ! 2 , s + n1 n2 & # siendo s= estndar
2 + (n ! 1)s 2 (n1 ! 1) s1 2 2 , por lo que la variable tipificada es una normal n1 + n2 ! 2
Z=
( x1 ! x2 ) ! (1 ! 2 )
1 + 1 S n1 n2
Z=
( x1 ! x2 )
S 1 1 + n1 n 2
289
se distribuye como una distribucin normal estndar, por lo que se puede utilizar como un estadstico de contraste.
! Regin crtica: La regin crtica se determina igual que en el prrafo anterior, es decir, para los valores de Z mayores, en valor absoluto, que z!/2 (contraste bilateral), o que z! (contraste unilateral).
MUESTRAS PEQUEAS ! Estadgrafo de contraste Pero, si las muestras son pequeas (n1 + n2 < 30), entonces la variable siguiente
t=
(x1 ! x2 ) ! ( 1 ! 2 ) 1 + 1 S n1 n2
= con S
t=
(x1 ! x2 ) 1 + 1 S n1 n 2
porque se distribuye como una t de Student con n1+n2-2. ! Regin crtica: La regin crtica viene determinada por los valores de esta variable t, que son mayores en valor absoluto que t!/2 en el contraste bilateral, o bien los valores de t, que son mayores en valor absoluto que t! en el contraste unilateral.
290
para
distribuciones
Estudiaremos slo contrastes en los que sea posible aproximaciones de la binomial mediante la normal, por lo que estudiaremos slo los casos de muestras
! Hiptesis de partida En ste caso, la hiptesis nula ser: Ho : p = p o y la hiptesis alternativa puede ser: Ha : p ! po en el contraste bilateral, o bien Ha : p > po , en el contraste unilateral (tambin Ha : p < po).
! Estadgrafo de contraste: Como conocemos que la distribucin binomial B(n, p) se aproxima mediante una variable normal N(np, npq ), entonces, se verifica que la variable ! po p Z= (1 ! p ) p n se distribuye como una distribucin normal estndar N(0,1).
291
! Regin crtica: La regin crtica, ahora, ser la determinada por los valores de la variable Z que son mayores en valor absoluto que z!/2 , en el contraste bilateral, o bien, mayores que z! , en el contraste unilateral.
! Hiptesis de partida: La hiptesis nula ser: Ho : p 1 = p 2 mientras que la hiptesis alternativa puede ser : Ha : p 1 ! p 2
! Estadgrafo de contraste: Ahora, teniendo en cuenta las propiedades de las distribuciones normales, por las que se aproximan las binomiales, se verifica que la variable
Z=
! ! p1 ! p2 ! ! ! ! p1(1 ! p1) p2 (1 ! p 2 ) + n1 n2
se distribuye, cuando la hiptesis nula es cierta, como una distribucin normal estndar N(0,1)
! Regin crtica:
292
La regin crtica ser anloga a todas aqullas en el que el estadstico de contraste sigue una distribucin normal.
293
"CONTRASTES DE HIPTESIS"
4.5 Ampliacin
294
Comenzaremos ilustrando las ideas generales sobre el contraste ms simple, el de la media de una poblacin Normal, para ir extendiendo progresivamente las ideas a dos poblaciones, a la comparacin de proporciones y a las poblaciones no normales. Analizaremos la problemtica de realizar un nmero elevado de contrastes sobre el mismo conjunto de datos, y extenderemos las ideas fundamentales al diseo de experimentos con varios grupos experimentales.
295
La definicin del problema a estudiar nos permite determinar la poblacin que queremos estudiar, los vinos jvenes de ribera de Duero en el ao actual; la variable que queremos medir, el grado alcohlico de los mismos, y la hiptesis de trabajo inicial Se ha modificado el grado alcohlico?. El paso siguiente consiste en suponer un modelo de comportamiento terico para la poblacin (a priori). Suponemos que la variable que estamos midiendo en la poblacin a estudiar sigue una distribucin Normal. La suposicin de normalidad la haremos de acuerdo con el conocimiento previo que tengamos sobre la poblacin objeto de estudio tratando de que las caractersticas de la distribucin reflejen en la mayor medida posible las de la poblacin, se trata simplemente de buscar un modelo probabilstico que aproxime la variable a estudiar. En el caso que nos ocupa, parece razonable suponer, a priori, que el grado alcohlico se concentra de forma simtrica alrededor de un valor medio. Si considerramos, por ejemplo, los salarios de una empresa la hiptesis de normalidad no es plausible puesto que cabe esperar que la distribucin de los mismos sea marcadamente asimtrica debido a los altos salarios de un grupo reducido de ejecutivos. Formularemos ahora la hiptesis de trabajo en trminos de los parmetros del modelo (media y/o desviacin tpica en el caso de la Normal). La hiptesis principal la denominamos hiptesis nula (H0).
H0 = = 0 = 12.5
La hiptesis nula suele ser la de igualdad del parmetro a un nico valor concreto o procedente de la hiptesis de trabajo. Junto con la hiptesis nula planteamos la que denominamos hiptesis alternativa (Ha o H1) que ser aceptada cuando se rechace la nula y viceversa. Por el momento tomaremos la ms sencilla, la hiptesis e que la media es diferente de 12 que resultar en un contraste bilateral.
Ha = ! 0 = 12.5
Trataremos de disear un procedimiento para decidir entre ambas hiptesis a partir de la informacin contenida en una muestra de tamao n, por ejemplo 14 observaciones.
296
Supongamos que la muestra ha sido seleccionada al azar de la poblacin y que se han obtenido los resultados siguientes.
RIBERA DE DUERO 12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
Tabla 4.1: Grado alcohlico de 14 vinos de la denominacin de Ribera de Duero.
La primera cuestin que hemos de tener en cuenta es que la decisin por una hiptesis concreta ha de tomarse con un cierto riesgo de equivocarse al no disponer de la informacin de todos los individuos de la poblacin. Trabajaremos con la media muestral como estimador de la media poblacional desconocida. En el ejemplo la media muestral es de 12,529, que como ya sabemos no coincide con la media poblacional. Trataremos de decidir entre las dos hiptesis a partir del valor de la media muestral pero, si la media muestral no coincide con la media poblacional, ser la diferencia entre el valor observado y el terico lo suficientemente grande como para rechazar la hiptesis nula? o la diferencia observada es lo suficientemente pequea como para ser debida simplemente al azar o al desconocimiento de la poblacin?. Daremos respuesta a ambas preguntas utilizando los conceptos sobre distribuciones aprendidos en temas anteriores.
conocida. Sabemos que la media muestral para distintas muestras sigue una distribucin ! ) , luego, cuando la hiptesis nula es cierta Normal N( , n
x ! N( 0 ,
" ) n
En la prctica, este resultado tiene implicaciones importantes. Vemoslo con un dibujo (figura 4.7).
297
x ! N( 0 , " ) n
0
Figura 4.14: Distribucin de la media muestral.
El dibujo muestra cmo, aunque los valores de la media muestral no coinciden con la media poblacional, se concentran en torno a ella y por tanto es muy probable que sean cercanos aunque, con el modelo supuesto puede tomar cualquier valor. Obsrvese tambin que cuanto mayor es el tamao muestral ms se concentran los valores de la media muestral en torno a la media poblacional. Intuitivamente, aceptaremos la hiptesis nula cuando la media muestral sea prxima a 0 y la rechazaremos (aceptando la alternativa) cuando la media muestral sea muy diferente de 0 , es decir, utilizamos la media muestral como estadstico, o estadgrafo, de contraste. Nos queda por determinar cual es el criterio para decidir si la media muestral est prxima o no al valor terico propuesto utilizando el concepto de riesgo tipo I definido previamente. Fijamos el riesgo tipo Y en ! (por ejemplo en 0.05 o el 5%) Nos plantearemos el contraste como un juicio en el que la media muestral es inocente (procede de una poblacin con media 0 ) y no la declararemos culpable (no procede de una poblacin con media 0 ) hasta que no se demuestre claramente lo contrario. Sobre la distribucin de la media seleccionamos dos puntos 0 ! a y 0 + a , simtricos alrededor de 0 de forma que si la hiptesis nula cierta en el (1-!)100% (por ejemplo el 95%) de las muestras la media muestral est entre esos dos valores (figura 4.8).
P( 0 ! a " x " 0 + a) = 1 ! #
298
Aceptaremos la hiptesis nula si la media muestral est dentro del intervalo seleccionado y la rechazaremos en caso contrario. Es claro que si la media est fuera del intervalo seleccionado hay una clara evidencia de que la hiptesis no es cierta ya que toma los valores correspondientes solo en el 5% de los casos en los que la hiptesis nula es cierta. Por supuesto, estamos asumiendo un riesgo del 5% de equivocarnos y rechazar indebidamente. Como ya es conocido, al conjunto de valores que nos llevan a aceptar la hiptesis nula lo denominamos Regin de Aceptacin, y al conjunto de valores que nos llevan a rechazarla Regin Crtica. En este caso la regin crtica se ha dividido en las dos colas de la distribucin por lo que se dice que el contraste es bilateral o de dos colas. En la prctica no se trabaja directamente con la media muestral y su distribucin asociada sino con la distribucin Normal estndar. Teniendo en cuenta las propiedades de la Normal podemos escribir
x ! P( 0 ! a " x " 0 + a) = P( !z# /2 " $ 0 " z # / 2 ) = 1 ! # n
de forma que el procedimiento descrito se convierte ahora en el que se muestra en la x! figura 4.9. El estadgrafo de contraste es ahora " 0 y mide la discrepancia entre el n valor observado de la media l valor terico de la misma, en la escala de la desviacin
299
tpica. No es lo mismo una diferencia de una unidad en una escala de centmetros que en una escala de kilmetros.
La interpretacin intuitiva del nuevo procedimiento sigue siendo clara, rechazaremos la hiptesis nula solamente cuando la discrepancia entre la media observada y la terica ( x ! 0 ) sea grande, en relacin a la variabilidad intrnseca ! medida por . La magnitud de la diferencia necesaria para rechazar se determina a n travs del riesgo de tipo 1 mediante la distribucin Normal estndar. A los valores de z!/2 se les suele denominar valores crticos ya que determinan la frontera entre la regin crtica y la regin de aceptacin. El cuadro 4.2 muestra el procedimiento completo con los pasos que se siguen habitualmente en la construccin de cualquier contraste.
300
Hiptesis H0 : = 0
Ha : ! 0
Nivel de significacin: ! x ! Estadgrafo de contraste: Z = " 0 n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }
Cuadro 4.2: Contraste para la media de una poblacin Normal con varianza conocida.
Una vez que hemos determinado la forma general del contraste pasamos a aplicarlo a los datos del problema inicial que nos ocupa (ver cuadro 4.3). Hiptesis:
H0 : = 12.5 Ha : ! 12.5
Nivel de significacin: 5% y 1%. x ! 12.529 ! 12.5 = 0.217 Estadgrafo de contraste: Z = " 0 = 0.5 n 14 Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha modificado significativamente el grado alcohlico.
Cuadro 4.3: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al problema de la modificacin en el grado alcohlico del vino de Ribera de Duero
Una vez que hemos tomado la decisin final, no sabemos si es correcta o no, simplemente esperamos que sea del 95% de las muestras en las que aceptamos la hiptesis correctamente. Si aceptamos la hiptesis nula no quiere decir que sea cierta y el grado medio sea exactamente de 12.5 grados (probablemente no lo es), sera ms correcto interpretar que, con la informacin de la que disponemos no hemos encontrado evidencia suficiente de que la media sea distinta de 12.5. Evidentemente, los valores muestrales son compatibles con muchos otros posibles valores tericos. Si aumentamos el tamao de muestra indefinidamente, la variabilidad de la media
301
sera cada vez menor y conseguiramos que la pequea diferencia observada sea lo suficientemente grande como para considerarla significativa. Es por esto por lo que en Estadstica decimos que es tan malo tener un tamao de muestra demasiado alto como tenerlo demasiado bajo ya que en el primer caso cualquier pequea diferencia es considerada como significativa mientras que en el segundo no se declara significacin incluso en el caso en el que la diferencia sea elevada.
302
Figura 4.17: Clculo de la potencia del contraste para una alternativa predeterminada.
En la figura 4.11 se muestra la funcin de potencia para distintos valores posibles de la hiptesis alternativa.
El grfico muestra como la potencia es mayor cuando los valores de la alternativa se alejan del valor para la hiptesis nula. En la prctica este hecho tiene una implicacin obvia: es ms fcil detectar diferencias o efectos experimentales de gran magnitud. Aunque no es posible un control directo de la potencia, a la vista de la figura 4.10
303
es claro que la potencia puede modificarse modificando el nivel de significacin o el tamao muestral ya que la forma de las curvas depende de ste. Cuanto mayor sea el tamao muestral ms concentrada es la curva Normal y, por tanto, mayor es la potencia para el mismo nivel de significacin. En la prctica suele hacerse un estudio de potencia para los contrastes no significativos, calculando cual sera el tamao muestral necesario para que la diferencia observada en los datos sea significativa. Si este tamao es muy grande es difcil declarar la significacin por lo que consideraremos que estamos haciendo lo correcto, si el tamao muestral necesario es pequeo, sera conveniente revisar el experimento. El clculo es muy simple cuando se trabaja con distribuciones normales. La x ! 0 > z # / 2 de forma que, para que la diferencia hiptesis nula se rechaza cuando " n sea significativa el valor de n ser
z2 "2 n > !/ 2 x # 0
para el ejemplo del grado alcohlico, n> 1141,97, es decir, para que la diferencia observada fuera significativa tendramos que haber recogido ms de 1142 observaciones lo que da una idea de que la diferencia observada es muy pequea y, por tanto es muy probable que la hiptesis nula sea cierta.
304
De forma general, el p-valor para el contraste actual se puede calcular como # x ! & P% Z > " 0 ( en una distribucin Normal estndar. $ n ' Para el ejemplo anterior el p-valor es 1-P(-0.217 < Z < 0.217) = 2 P(Z > 0.217) = 0.8285, es decir el p-valor puede considerarse grande. En la prctica se suele adoptar el criterio de aceptar la hiptesis cuando el p-valor es mayor que el nivel de significacin fijado en el procedimiento de contraste.
305
Hiptesis H0 : = 0
Ha : > 0
Nivel de significacin: ! x ! Estadgrafo de contraste: Z = " 0 n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }
Cuadro 4.4: Contraste unilateral superior para la media de una poblacin Normal con varianza conocida.
El contraste as obtenido se denomina contraste unilateral superior ya que solo estamos interesados en las desviaciones positivas. La diferencia fundamental con el contraste bilateral es que se produce un incremento en la potencia para detectar diferencias positivas de la hiptesis nula y un decremento drstico para detectar las negativas. El p-valor sigue teniendo la misma interpretacin aunque ahora se calcula como # x ! & P% Z > " 0 ( . $ n '
De la misma manera que se ha construido el contraste unilateral superior es posible construir el contraste unilateral inferior (ver cuadro 4.5) si estamos interesados
306
exclusivamente en detectar diferencias negativas con respecto a la hiptesis nula. La construccin del contraste es completamente anloga con la correspondiente modificacin de la hiptesis alternativa. El contraste unilateral inferior incrementa la potencia para detectar diferencias negativas aunque no tiene potencia para detectar las positivas. Hiptesis H0 : = 0
Ha : < 0
Nivel de significacin: ! x ! Estadgrafo de contraste: Z = " 0 n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z < z ! / 2 } # x ! 0 & p-valor: P% Z > ( " $ n '
Cuadro 4.5: Contraste unilateral inferior para la media de una poblacin Normal con varianza conocida.
La decisin por el tipo de contraste debe hacerse a priori, antes de tomar los datos. Supongamos, por ejemplo, que sospechamos, antes de realizar el experimento, que la modificacin en el proceso de fabricacin, aumenta el grado alcohlico. El procedimiento de contraste para los datos de la tabla 1 se muestra en el cuadro 4.6.
307
Hiptesis:
H0 : = 12.5 Ha : > 0
Nivel de significacin: 5% y 1%. x ! 12.529 ! 12.5 = 0.217 Estadgrafo de contraste: Z = " 0 = 0.5 n 14 Valores crticos : para el 5% z0.025= 1,65 para el 1% z0.005= 2,33 p-valor: 0.4129 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha aumentado significativamente el grado alcohlico.
Cuadro 4.6: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al problema de la modificacin en el grado alcohlico del vino de Ribera de Duero
La funcin de potencia para distintos valores de la alternativa aparece en la figura 4.15. Obsrvese como el contraste no tiene ninguna potencia para detectar valores a la izquierda de la hiptesis nula.
308
t=
sigue una distribucin t de Student con n-1 grados de libertad. El procedimiento de contraste en este caso es anlogo al anterior pero sustituyendo la distribucin Normal por la distribucin t. El cuadro 4.7 muestra el procedimiento de contraste completo.
309
Hiptesis H0 : = 0
Ha : ! 0
Nivel de significacin: ! x ! 0 Estadgrafo de contraste: t = S n Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1 Regin de aceptacin: {t / t ! t n "1, # } Regin critica: {t / t > t n !1, " } *
Cuadro 4.7: Contraste para la media de una poblacin Normal con varianza desconocida.
En la prctica, la sustitucin de la distribucin Normal por la distribucin t de Student implica un aumento de la dispersin por lo que es ms difcil detectar diferencias. La situacin se muestra el la figura 4.16 en la que se comparan la distribucin Normal estndar (en lnea discontinua) y la distribucin t (en lnea continua).
1"! !/2
-t !
t!
Es posible construir contrastes unilaterales de la misma manera que en el caso de varianza conocida. El cuadro 4.8 muestra el contraste unilateral superior, el contraste unilateral inferior se deja como ejercicio al lector.
tn-1,! es el valor crtico de la t de Student tal que P(-tn-1,! ! tn-1 ! tn-1,! ) = 1-!. Se ha denotado con el
310
Hiptesis H0 : = 0
Ha : > 0
Nivel de significacin: ! x ! 0 Estadgrafo de contraste: t = S n Distribucin del estadgrafo cuando la hiptesis nula es cierta: tn-1 Regin de aceptacin: {t / t ! t n "1,2# }* Regin critica: {t / t > t n !1,2" }
Cuadro 4.8: Contraste para la media de una poblacin Normal con varianza desconocida.
Para el ejemplo del grado alcohlico de los vinos de la denominacin de origen de Ribera de Duero los resultados del contraste bilateral se muestran en el cuadro 4.9 Hiptesis:
H0 : = 12.5 Ha : ! 12.5
Nivel de significacin: 5% y 1%. x ! 0 12.529 ! 12.5 = 0.338 = 0.316 Estadgrafo de contraste: Z = S 14 n Valores crticos : para el 5% t0.05= 1,96 para el 1% t0.01= 2,57 p-valor : 0,7571 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin no ha modificado significativamente el grado alcohlico.
Cuadro 4.9: Aplicacin del contraste para la media de una poblacin Normal con varianza conocida al problema de la modificacin en el grado alcohlico del vino de Ribera de Duero
Todos los conceptos explicados para el contraste de la media de una poblacin Normal con varianza conocida siguen siendo vlidos aqu.
tn-1,2! es el valor crtico de la t de Student tal que P( tn-1 > tn-1,2! ) = !. Se ha denotado con el subndice
311
Hiptesis:
H0 : = 0 Ha : ! 0
Nivel de significacin: ! x ! 0 Estadgrafo de contraste: Z = S n Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }
Cuadro 4.10: Contraste para la media de una poblacin Normal con varianza desconocida cuando la muestra es grande.
312
4.5.3 Contraste para la diferencia de medias de dos poblaciones normales con datos independientes
4.5.3.1 Planteamiento general
En la investigacin aplicada la situacin ms habitual es aquella en la que se quieren comparar dos poblaciones a las que se les ha aplicado, por ejemplo, dos tratamientos diferentes. Pongmonos en el mismo supuesto que en el ejemplo que sirvi para ilustrar el contraste para una poblacin, y supongamos que lo que deseamos es conocer si los vinos de nuestra denominacin de origen tienen el mismo contenido alcohlico que los de otra denominacin de origen, por ejemplo la de Toro. Se trata de saber si existe una clara diferenciacin en los mismos ya que, debido a la proximidad geogrfica de ambas regiones, es posible que haya fraudes y se intercambien vinos de ambas dependiendo del mercado de los mismos. La hiptesis de trabajo inicial es entonces Existen diferencias en el grado alcohlico de ambas denominaciones?. Procediendo de la misma manera que en el caso de una poblacin, suponemos una distribucin de probabilidad para la poblacin que es la distribucin Normal. En la primera poblacin (Ribera de Duero) el grado alcohlico sigue una distribucin Normal N(1, "1); en la segunda poblacin (Toro) el grado alcohlico sigue un Modelo Normal N(2, "2). Formulamos a continuacin las hiptesis de trabajo en trminos de los parmetros de los modelos. Las hiptesis nula y alternativa son ahora
H 0 : 1 = 2 Ha : 1 " 2 ( 1 ! 2 = 0) (1 ! 2 " 0)
para el contraste bilateral. Vemos como el contraste de que las medias son iguales es equivalente al contraste de que la diferencia de medias vale 0.
Supongamos que los datos obtenidos son los siguientes para muestras aleatorias
313
de tamao
n1 = 14 y n2 = 6.
Ribera de Duero 12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0 Toro 13,0 14,0 13,2 13,4 13,2 13,9
Tabla 4.2: Grado alcohlico de 20 vinos de las denominaciones de origen de Ribera y Toro.
Se supone que las muestras se han obtenido de forma independiente en ambas denominaciones. La estadstica descriptiva bsica para ambos grupos aparece en la tabla 4.3.
Una primera aproximacin a las diferencias entre los dos grupos sera la construccin de grficos comparativos que muestren la estructura de los mismos, por ejemplo, un Box-Plot con los grupos separados. (Ver figura 4.17). Una simple inspeccin visual del grfico nos muestra que hay una clara diferencia entre los grados de ambas denominaciones, a pesar de que la diferencia muestral es muy evidente necesitamos un procedimiento ms formal para establecer si las diferencias observadas pueden ser consideradas estadsticamente significativas. Construiremos el procedimiento de contraste en varios supuestos comenzando desde el ms sencillo hasta los ms complejos.
314
Figura 4.24: Box plot para la comparacin del grado alcohlico de las denominaciones de Ribera y Toro.
y ambas distribuciones son independientes. El estimador de la diferencia de medias poblacionales ser la diferencia de medias muestrales y, como la diferencia de normales independientes es tambin una distribucin Normal, tenemos que
x1 ! x2 " N(1 ! 2 ,
2 #2 1 + #2 ) n1 n2
315
Z=
(x1 ! x2 ) ! ( 1 ! 2 )
2 "2 1 + "2 n1 n2
# N(0,1)
Z=
(x1 ! x2 )
2 "2 "1 + 2 n1 n 2
# N(0,1)
El procedimiento de contraste completo se muestra el cuadro 4.11. Solo se incluye el contraste bilateral ya que la construccin de los correspondientes unilaterales es la misma que en los casos previos y se deja como ejercicio al lector. Hiptesis:
H 0 : 1 = 2 Ha : 1 " 2 ( 1 ! 2 = 0) (1 ! 2 " 0)
Nivel de significacin: ! (x1 ! x2 ) Estadgrafo de contraste: Z = 2 "2 "1 + 2 n1 n 2 Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0, 1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }
Cuadro 4.11: Contraste para la diferencia de medias de dos poblaciones normales con varianza conocida.
Si aplicamos el contraste a los datos del ejemplo, obtenemos los resultados del cuadro 4.12.
316
Hiptesis:
H 0 : 1 = 2 Ha : 1 " 2
( 1 ! 2 = 0) (1 ! 2 " 0)
Nivel de significacin: != 0.05 (5%) 0.01 (1%) (12.529 ! 13.450) Estadgrafo de contraste: Z = = !10.829 0.25 0.36 + 14 6 Valores crticos : para el 5% z0.025= 1,96 para el 1% z0.005= 2,57 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin crtica, por tanto rechazamos la hiptesis nula. Conclusin no estadstica: La modificacin en el proceso de fabricacin ha aumentado significativamente el grado alcohlico.
Cuadro 4.12: Contraste para la diferencia de medias de dos poblaciones normales con varianza desconocida.
Z=
Tenemos que eliminar el parmetro ", para lo cual utilizaremos las distribuciones muestrales asociadas a las cuasi-varianzas muestrales
2 1 (n1 ! 1)S # $2 n1 !1 2 "
2 (n 2 ! 1)S 2 # $2 n 2 !1 2 "
La suma de dos ji-cuadrado es tambin una ji-cuadrado, sumando las dos anteriores
317
Suponiendo que ambas distribuciones son independientes* , podemos combinarlas para obtener una distribucin t de Student. La variable aleatoria
t=
(x1 ! x 2 ) ! (1 ! 2 ) 1 1 " + n1 n 2
2 + (n ! 1)S 1 2 (n1 ! 1)S 2 2 "2
n1 + n2 ! 2
(x1 ! x2 ) ! (1 ! 2 ) 1 + 1 S n1 n2
= con S
t=
(x1 ! x2 ) = t n1 + n 2 ! 2 1 1 S + n1 n 2
Es posible considerar un estadgrafo de contraste alternativo si se utilizan las varianzas muestrales en lugar de las cuasi-varianzas. Para ello basta tener en cuenta que las distribuciones muestrales asociadas a las varianzas son
2 n1 S1 2 2 " # n1 $ 1 !
n2 S 2 2 2 2 " #n 2 $1 !
t=
(x1 ! x2 ) = t n1 + n 2 ! 2 1 1 S + n1 n 2
con S =
que pueden utilizarse indistintamente. Usaremos el calculado a partir de las cuasivarianzas porque son estimadores insesgados de la varianza poblacional.
*
La demostracin puede encontrarse en cualquier libro de Estadstica Matemtica. No se ha incluido aqu porqwue supera los propsitos de este trabajo.
318
En ambos casos lo que se ha hecho es estimar la varianza comn de ambas poblaciones mediante una media ponderada de las varianzas estimadas en cada poblacin, y se ha cambiado la distribucin Normal por la t de Student con el correspondiente aumento en la dispersin que hace que sea ms difcil encontrar diferencias. En este caso es necesario que las varianzas sean iguales para poder despejarlas y eliminarlas en el clculo del estadgrafo de contraste. La comprobacin de la igualdad de varianzas se har posteriormente aunque sea un paso previo a la decisin del tipo de contraste. Las cuestiones relacionadas con la potencia del contraste se interpretan de la misma manera que en todos los casos anteriores. Cuanto mayor sea la diferencia que queremos detectar mayor ser la potencia para detectarla. Cuanto ms pequeo sea el efecto que queremos detectar mayor ser el tamao de muestra necesario para hacerlo. Si aumentamos indefinidamente el tamao muestral conseguiremos que la diferencia muestral sea siempre estadsticamente significativa por pequea que sea. El contraste completo se muestra en el cuadro 4.13.
H0 : 1 = 2 ( 1 ! 2 = 0) Ha : 1 " 2 (1 ! 2 " 0) Nivel de significacin: ! (x1 ! x2 ) (x1 ! x 2 ) t= Estadgrafo de contraste: t = 1 1 1 + 1 S S + n1 n 2 n1 n 2
Hiptesis:
2 + (n ! 1)S 1 2 2 2 (n1 ! 1)S 2 2 S = n1 S1 + n2 S 2 n1 + n 2 ! 2 n1 + n2 ! 2 Distribucin del estadgrafo cuando la hiptesis nula es cierta: t de Student t n1 +n 2 !2
= con S
Cuadro 4.13: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales.
El contraste se ha aplicado a los datos del ejemplo inicial y se han obtenido los siguientes resultados (ver cuadro 4.14).
319
H0 : 1 = 2 ( 1 ! 2 = 0) Ha : 1 " 2 (1 ! 2 " 0) Nivel de significacin: != 0.05 (5%) 0.01 (1%) (12.529 ! 13.450) Estadgrafo de contraste: t = = !5.256 1 1 0.359 + 14 6 Valores crticos : para el 5% t18,0.025= 2.101 para el 1% t18,0.005= 2.878
Hiptesis:
Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin crtica, por tanto rechazamos la hiptesis nula. Conclusin no estadstica: El grado alcohlico es significativamente diferente en Ribera de Duero y Toro.
Cuadro 4.14: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales, aplicado a los datos sobre el grado alcohlico.
Hiptesis:
Cuadro 4.15: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas.
320
Hiptesis:
Distribucin del estadgrafo cuando la hiptesis nula es cierta: N(0,1) Regin de aceptacin: {Z / Z ! z " / 2 } Regin critica: {Z / Z > z ! / 2 }
Cuadro 4.16: Contraste para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y tamaos muestrales grandes.
Obsrvese que estamos suponiendo implcitamente que la cuasi-varianza muestral es un buen estimador de la varianza poblacional, prximo al verdadero valor.
321
Los datos experimentales se corresponden con experimentos planificados en los que se asignan dos tratamientos distintos a un grupo de individuos. En este tipo de diseos es necesario que todas las caractersticas que no intervienen en el diseo y puedan modificar la respuesta, estn controlados y sean similares en los dos grupos a comparar. Por ejemplo, si se desea hacer un ensayo clnico en el que se dispone de un grupo de pacientes de forma que a un subconjunto se le aplicar el tratamiento a comparar y el resto ser utilizado como control sobre el que se utilizar un placebo (substancia no activa) con la misma apariencia que el tratamiento, los pacientes de ambos grupos han de ser similares en composicin con respecto a caractersticas como la edad peso u otros factores que pudieran alterar la respuesta y que no intervienen directamente en el diseo. Se tratar de evitar sesgos de forma que los efectos puedan ser asignados a los tratamientos, por ejemplo, en un experimento con ratones de laboratorio en el que se dispone de dos camadas distintas, no sera correcto asignar un tratamiento diferente a cada una de las camadas ya que sera imposible separar los efectos del tratamiento y de la camada. En Estadstica decimos que los tratamientos estn confundidos. La forma de asignar tratamientos a individuos para que no existan errores sistemticos es hacerlo al azar, por ejemplo, sorteando cual es el tratamiento que se aplica a cada individuo. A este procedimiento se le denomina aleatorizacin, y juega un papel fundamental en el diseo de experimentos planificados. Hay que hacer notar que al azar no significa "de cualquier manera" o "cualquiera de los tratamientos", para conseguir una verdadera aleatorizacin es necesario utilizar la probabilidad. En los experimentos diseados es muy importante realizar estudios previos sobre el tamao de muestra necesario para detectar un determinado efecto. Este problema est fuera del alcance de un curso introductorio aunque las ideas bsicas fueron expuestas cuando se trat con los intervalos de confianza. Este tipo de experimentos se comenz en Agricultura para extenderse despus a otras aplicaciones como la Industria o la Medicina. Actualmente los ensayos clnicos controlados, basados fundamentalmente en conceptos de Estadstica, forman una parte importante de la investigacin mdica. Todo el mundo ha odo alguna vez en las noticias los resultados de ensayos clnicos controlados antes de lanzar al mercado un nuevo medicamento.
322
Como las variables estn relacionadas, todos los clculos que realizamos en el caso de datos independientes ya no son vlidos. Para evitar este problema nos centraremos en una sola variable aleatoria que es la diferencia entre los dos valores obtenidos para cada uno de los individuos estudiados que mide el efecto del tratamiento aplicado. Tenemos ahora una nueva variable D que suponemos que tiene una distribucin Normal de media d desviacin tpica "d . La hiptesis de inters es ahora que, en promedio, el tratamiento aplicado a los individuos es 0, es decir, d = 0. El contraste es ahora exactamente igual que el descrito para la media de una poblacin Normal (ahora la poblacin de las diferencias.
323
Describimos a continuacin el contraste para muestras pequeas y varianza desconocida para datos apareados. Llamaremos d , a la media muestral de las a la cuasi desviacin tpica. El contraste se muestra en el cuadro 4.17. diferencias y S d
Hiptesis:
H0 : d = 0 H a : d ! 0
d
Cuadro 4.17: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados.
El resto de los contrastes se construye de la misma manera que en el caso de una sola poblacin. El cuadro 4.18 muestra ejemplo.
Hiptesis:
H0 : d = 0 H a : d ! 0
Nivel de significacin: 5% y 1% 6 = 2.250 Estadgrafo de contraste: t = 8.433 10 Distribucin del estadgrafo cuando h0 es cierta: t9 Valores crticos : para el 5% t9, 0.05= 2,262 para el 1% t9, 0.01= 3,250 p-valor : 0,0510 Decisin estadstica: El valor del estadgrafo de contraste pertenece a la regin de aceptacin, por tanto aceptamos la hiptesis nula. Conclusin no estadstica: Con los datos de los que disponemos no existe una evidencia significativa de que exista una diferencia entre la presin sistlica antes y despus de haber dejado de beber.
Cuadro 4.18: Contraste para la diferencia de medias de dos poblaciones normales con datos apareados aplicado al ejemplo de la reduccin de la tensin arterial en alcohlicos.
324
325
4.5.3.9 Contraste para la comparacin de la tendencia central cuando las poblaciones no son normales
En muchas situaciones prcticas es difcil aceptar la hiptesis previa de que los datos son normales al disponerse, por ejemplo, de distribuciones muy asimtricas. En estos casos los contrastes anteriores no detectan claras diferencias en el comportamiento de las poblaciones, debido a que la dispersin es muy grande o debido a que la medida de tendencia central utilizada (la media) no es la correcta porque est afectada por los valores extremos. Los contrastes paramtricos descritos antes son especialmente sensibles a valores extremos de la variable. Para solucionar el problema se utiliza la mediana en lugar de la media construyndose los que se denominan contrastes no paramtricos al no referirse ya a parmetros de una distribucin concreta.
Me1
x1
x2
Me2
En la figura se muestra como para distribuciones asimtricas es mucho ms intuitiva la comparacin de las medianas que la comparacin de las medias, ya que estas estn afectadas por los valores muy extremos de la distribucin. La situacin del esquema es muy tpica, por ejemplo, en problamas mdicos en los que la mayora de los controles (curva de la izquierda) presentan valores normales de la variable, y solamente algunos de ellos presentan valores elevados, en el grupo de los pacientes enfremos, la mayora presenta valores elevados y solamente alguno presenta valores normales. El problema es particularmente crtico cuando el tamao de muestra es pequeo pero, incluso cuando el tamao de muestra es grande y se utiliza errneamente el contraste paramtrico
326
correspondiente, se subestima el tamao del efecto a pesar de que la distribucin normal est correctamente utilizada aplicando el Teorema Central del lmite. La prctica habitual, especialmente en el mbito mdico, de aplicar contrastes no paramtricos cuando la muestra es pequea y paramtricos cuando es grande es claramente errnea y puede llevar a no encontrar efectos experimentales que aparecen claramente definidos en los datos. Para la comparacin de medianas de dos poblaciones con datos independientes el contraste ms utilizado es el conocido como U de Mann-Withney, est basado en la suma de los rangos de orden de las observaciones de las dos poblaciones consideradas conjuntamente y consiste bsicamente en calcular todas las ordenaciones posibles con muestras de los mismos tamaos en el caso de que las medianas fueran iguales, para comprobar el percentil en el que se encuentra nuestro caso particular. Cabe esperar que si las medianas de las dos poblaciones son iguales los datos estn mezclados y las sumas de rangos de orden sean similares en amos grupos. El resto del razonamiento es similar al de cualquier contraste, si el valor muestral obtenido es muy probable aceptamos la hiptesis nula y si no la rechazamos. Para el caso de datos apareados se utiliza el test de Wilcoxon que contrasta la hiptesis de que la mediana de las diferencias es cero. La base del contraste es similar al caso de muestras independientes.
Comparacin de medianas de dos poblaciones con datos independientes: el contraste U de Mann-Withney Est basado en la suma de los rangos de orden de las observaciones de las dos poblaciones consideradas conjuntamente y consiste bsicamente en calcular la distribucin muestral a partir de todas las ordenaciones posibles con muestras de los mismos tamaos en el caso de que las medianas fueran iguales. Cabe esperar que si las medianas de las dos poblaciones son iguales los datos estn mezclados y las sumas de rangos de orden sean similares en ambos grupos.
327
HIPOTESIS:
ESTADIGRAFO DE CONTRASTE: Ordenar las observaciones, asignar el rango correspondiente y calcular las sumas de rangos de las observaciones de cada grupo.(R1 y R2)
n (n + 1) U = min(U 1 , U 2 ) U i = n 1n 2 + i i ! Ri 2
Para muestras grandes: Z =
n n U! 1 2 2 n 1 n 2 (n 1 + n 2 + 1) 12
DISTRIBUCION DEL ESTADIGRAFO CUANDO H0 ES CIERTA: Distribucin emprica o N(0,1) para muestras grandes. REG. DE ACEP.:
inf {U / U! ;n ,n
1 2
REGION CRITICA:
sup
{Z /
Z ! z " /2 }
{Z /
Z > z ! /2 }
Comparacin de medianas de dos poblaciones con datos apareados: el test de Wilcoxon Contrasta la hiptesis de que la mediana de las diferencias es cero. La base del contraste es similar al caso de muestras independientes.
HIPOTESIS:
H 0 : Me d = 0 H a : Me d ! 0
ESTADIGRAFO DE CONTRASTE: Calcular las diferencias entre los valores de ambos grupos, Suprimir las observaciones nulas, Ordenar las observaciones en valor absoluto, asignar el rango correspondiente y calcular las sumas de rangos de las observaciones positivas y negativas.(T+ y T-)
T = min(T+ , T! )
328
sup {T / T!inf ;n " T " T! ;n } sup inf REGION CRITICA: {T / T ![T";n ; T" ;n ]}
REG. DE ACEP.:
{Z /
Z ! z " /2 } Z > z ! /2 }
{Z /
H 0 : 1 = = i = = r
La hiptesis es cierta si y solo si las hiptesis por parejas H0 : i = j para todas ! r $ r(r & 1) las k = # = combinaciones posibles de i y de j. " 2% 2 Si contrastamos la hiptesis por separado a un nivel de significacin !, tenemos
P(Aceptar
j i, j H i, 0 / H0
i, j
cierta ) = 1 ! "
329
P(Aceptar
H0 / H0
cierta ) = P( ! Aceptar
i!j
j Hi, 0 / H0
cierta ) =
i!j
Por ejemplo, para tres poblaciones en las que se realizan comparaciones 3 individuales al 5%, hay una probabilidad de 1 ! 0.95 = 1 ! 0.8574 = 0.1426 de rechazar la hiptesis nula indebidamente. Con 5 poblaciones la probabilidad sera 1 ! 0.9510 = 1 ! 0.5987 = 0.4013 . Con 10 poblaciones 1 ! 0. 95
45
poblaciones, aunque todas las medias fueran iguales tendramos una probabilidad del 90% de encontrar diferencias en alguna de las parejas. Este problema es importante no solo en la comparacin de medias por parejas sino tambin cuando se quieren realizar muchas comparaciones sobre el mismo conjunto de datos. Supongamos, por ejemplo, que un investigador desea demostrar que es capaz de encontrar diferencias entre personas convictas por algn tipo de delito y personas que no. A tal fin realiza 100 medidas biomtricas como el permetro torcico, el permetro craneal, etc.... que compara en los dos grupos. En cada comparacin tiene una probabilidad del 5% de rechazar indebidamente, sin embargo (si las medidas fueran independientes) tendra una probabilidad del 99,41% de encontrar diferencias en alguna de las variables. El nmero esperado de contrastes significativos sera de 5.
El problema de mantener el nivel de significacin global en la comparacin de las medias de varios grupos se soluciona mediante la tcnica denominada Anlisis de la varianza seguido de las comparaciones por parejas en las que se hace algn tipo de correccin en el nivel de significacin individual.
330
Figura 4.26: Box plot para la comparacin del grado alcohlico de las
331
El grfico muestra como no hay observaciones muy extremas, las dos distribuciones tienen aproximadamente la misma dispersin y la correspondiente a la denominacin de origen de Toro parece ms asimtrica. La asimetra podra ser debida simplemente a que el tamao muestral es muy pequeo en este grupo. En lneas generales parece que las hiptesis se verifican y es posible aplicar el contraste par la igualdad de medias de dos poblaciones normales con varianzas desconocidas pero iguales. Para contrastar ms formalmente que las varianzas son iguales se puede construir un contraste muy simple teniendo en cuenta la distribucin del cociente de varianzas basado en el cociente de las distribuciones ji-cuadrado asociadas. El cociente
2 S "2 1 = 2 2 2 S2 "1
libertad.
332
Hiptesis:
Regin de aceptacin: F / F ![Fn 1 "1,n2 "1, 1"# / 2 ,F n1 " 1,n 2 "1, 1"# / 2 ]
Para el ejemplo de la comparacin del grado alcohlico en las dos denominaciones de origen consideradas el contraste de comparacin de varianzas se muestra en el cuadro 4.20. Hiptesis:
2 H0 : !1 = !2 2 2 " !2 Ha : !1 2
Distribucin del estadgrafo cuando h0 es cierta: F n1 !1, n 2 !1 p-valor : 0.6261 Conclusin : Se acepta la hiptesis nula.
Cuadro 4.20: Contraste de comparacin de las varianzas de dos poblaciones normales aplicado a la comparacin de la variabilidad del grado alcohlico.
Como se acepta la hiptesis de igualdad de varianzas, la comparacin de medias ha de hacerse en el supuesto de que las varianzas son iguales.
El valor F n ! 1,n !1, 1!" /2 es el valor crtico que deja a la derecha un rea de 1 ! " / 2 . En la 1 2 prctica puede calcularse como F n ! 1,n !1, 1!" /2 = 1 F n ! 1, n ! 1, " / 2 1 2 2 1
*
333
"TABLAS DE CONTINGENCIA"
334
5.1.1 Introduccin
La existencia de distintas pruebas estadsticas es consecuencia, en parte, de las distintas escalas de medida que se utilizan para tratar las variables objeto de una determinada investigacin. Los investigadores de distintos campos utilizan de modo habitual variables medidas en escala nominal y pasan buena parte de su tiempo clasificando y contando individuos. As por ejemplo cualquier individuo puede ser clasificado en categoras (varn, mujer; enfermo, sano; ausencia, presencia; soltero, casado, viudo, separado). El resultado de tales clasificaciones da lugar a lo que en la terminologa estadstica se le conoce como tablas de contingencia o tablas de frecuencias. Tablas de contingencia son tablas de variables aleatorias cualitativas cuyos datos estn recogidos en forma de tablas de frecuencias.
1) Test de bondad de ajuste a distribuciones: Para comprobar si nuestros datos muestrales se ajustan a un determinado modelo terico. (Ejemplo: Sigue la estatura media de los espaoles una ley normal?) 2) Test de homogeneidad de varias muestras cualitativas: Contraste para probar si varias muestras de un carcter cualitativo proceden de igual poblacin. (Ejemplo: Es la proporcin de parados en Espaa la misma que en el resto de los pases Europeos?)
335
3) Test de asociacin: Para comprobar si dos o mas caractersticas cualitativas estn relacionadas entre s. (Ejemplo: Est la intencin de voto, a un determinado partido poltico, relacionada con el sexo?).
En el desarrollo del captulo nos vamos a centrar en este ltimo tipo de contrastes.
EJEMPLO 5.1: Supongamos una muestra de 100 individuos de una poblacin en los que estamos estudiando el estado civil. Esta variable aleatoria puede tener cuatro categoras: soltero, casado, viudo y divorciado. Supongamos que el nmero de individuos en
336
nuestro estudio ha sido: 50 casados, 30 solteros, 15 viudos y 5 divorciados, estos nmeros representan nuestras frecuencias observadas. Solucin: Nuestra hiptesis de partida (H0) podra ser que las cuatro categoras estn igualmente representadas. En este caso cabra esperar que nuestra muestra constara de 25 individuos en cada casilla, que se corresponden con nuestras frecuencias esperadas.
Solteros frecuencia Observada frecuencia Esperada 25 25 25 25 30 Casados 50 Viudos 15 Divorciados 5
esperadas discreparan poco y, seran muy diferentes en caso contrario. Se nos plantea
Cmo medir las discrepancias?. La forma ms simple de medir divergencias entre ambas magnitudes sera efectuar la diferencia entre ambas (foi -fei ), en todas y cada una de las casillas de la tabla y, obtener, de este modo, una magnitud que: si es grande nos har pensar en rechazar la hiptesis de partida, y si es pequea en aceptarla.
En realidad el estadstico con el que vamos a trabajar se basa en esta idea, si bien tiene algunas correcciones (no trabaja con diferencias sino con diferencias al cuadrado, para evitar problemas de signos, y trabaja con discrepancias normalizadas, obtenindolas en valores relativos).
Estadgrafo de contraste:
!2 = #
i
(fo i " fe i )2
fei
foi= Frecuencia observada para la i-sima categora fei= Frecuencia esperada para la i-sima categora
337
El siguiente problema que se nos plantea: qu entendemos por magnitud grande? Necesitamos un criterio uniforme para declarar rechazos o aceptaciones. Pearson nos soluciona este problema demostrando que el estadgrafo de contraste propuesto segua un modelo terico: Una Ji-cuadrado con (r-1)(s-1) grados de libertad, cuando la hiptesis nula se verificaba. (Siendo r= n de filas de la tabla y s= n de columnas de la tabla). De este modo el criterio de decisin ya est establecido, declararemos rechazo, es decir declararemos diferencias grandes, cuando nuestro valor del estadgrafo experimental supere al valor crtico encontrado en la tabla de la distribucin Ji-cuadrado con esos grados de libertad, al nivel de significacin elegido.
Recurdese que un valor crtico no es ms que un valor de la variable aleatoria que slo es superado por un porcentaje pequeo, preestablecido de antemano, de individuos cuando la hiptesis nula es cierta
338
EJEMPLO 5.2: Supongamos cuatro tratamientos (Ai) que se piensa efectivos para curar una determinada enfermedad, estos tratamientos se aplican a enfermos de dicha enfermedad y se anota el tipo de respuesta que presentan (Bj). La respuesta se clasifica en tres posibles clases: "peor", "igual", "mejor". Ejemplo tomado de MARTN ANDRS, A. et al. (1995).
TOTAL 150 f1. 120 f2. 130 f3. 160 f4. 560 f..
37 f .1
fi. = Total fila i f.j = Total columna j f.. = Gran total Solucin: Disponemos de nuestra tabla de frecuencias observadas, se necesita establecer una hiptesis de partida que nos permita el clculo de las correspondientes frecuencias esperadas. La hiptesis de la que se parte es la hiptesis de independencia, es decir vamos a suponer que ambos caracteres no estn relacionados (no estn asociados). Si denotamos: Ai= Suceso de que un individuo pertenezca a la clase i de A Bj= Suceso de que un individuo pertenezca a la clase j de B Podemos escribir las hiptesis como: Ho: Los caracteres A y B son independientes bien los caracteres A y B no estn relacionados los caracteres A y B no estn asociados Ha: Son dependientes, relacionados, asociados
339
En nuestro ejemplo: Ho: El tipo de tratamiento no condiciona la respuesta del individuo. Ha: Si condiciona.
Si ambas caractersticas son independientes podemos escribir las hiptesis de la siguiente forma:
fe 21 = f .. P(A2 )P(B1 )
Para su clculo necesitamos P(A2) , es decir la probabilidad de los individuos a recibir el tratamiento 2, y la P(B1) es decir la probabilidad de los individuos de empeorar. Ntese que en la frmula aparecen, ademas de estas dos probabilidades el total global. El total global es necesario para pasar de probabilidades a frecuencias Ambas probabilidades son desconocidas pero estimables a partir de la tabla (casos favorables entre casos totales). A los correspondientes estimadores de las ij probabilidades les vamos a denotar con: p
p(A2 ) =
p(B1 ) =
340
De donde se desprende la regla general que nos permitir calcular la frecuencia esperada de cualquiera de las casillas de la tabla: feij= (Total fila i-sima)(Total col. j-sima)/Total global Sin ms que aplicar esta frmula general obtendremos la tabla de frecuencias esperadas:
Peor 7 9.91 15 7.93 10 8.59 5 10.57 37 Igual 28 31.61 20 25.28 30 27.39 40 33.72 118 mejor 115 108.48 85 86.79 90 94.02 115 115.71 405 TOTAL 150 120 130 160 560
Obtencin de la cantidad experimental: Para medir las discrepancias entre ambas utilizamos el estadgrafo de contraste adecuado que como veamos era:
!2 exp =
##
i j
(7 " 9.91)2
9. 91
+ ... +
= 13.87
Ya sabemos que valores grandes nos llevaran a rechazar la hiptesis de independencia, y los pequeos a aceptarla. Sabemos tambin que la regla de decisin est clara pues basta con buscar el valor crtico en la tabla de la Ji-cuadrado ( con los grados de libertad adecuados, y al nivel de significacin deseado, 5% por ejemplo), y
341
comparar nuestro valor experimental con l. Declararemos significacin siempre que el valor experimental supere el valor crtico.
2 2 o ! exp " " # !$ ,%
2 ! 0. 05,6 = 12. 59
12.59<13.87 , por tanto Rechazo Ho En nuestro caso concreto son 6 los grados de libertad y 12.59 el valor crtico. El valor experimental, 13.87, supera al valor crtico. Conclusin: El tipo de tratamiento condiciona el tipo de respuesta encontrada en el paciente. No podemos suponer independencia de las dos variables en estudio.
1 Clculo individual de las frecuencias esperadas que cabra esperar si H0 fuera cierta. La hiptesis de la que partiremos es siempre la de independencia entre las dos variables, ya que slo bajo este supuesto conocemos la distribucin del estadgrafo de contraste (distribucin ji-cuadrado de Pearson) 2 2 Clculo de los componentes individuales de ! , es decir clculo de las divergencias entre observadas y esperadas para cada casilla. 3 Suma de los valores obtenidos en el apartado anterior y obtencin , de esta forma, del valor experimental de nuestro estadgrafo de contraste. 4 Determinacin de los grados de libertad de la forma (r-1)(s-1) 2 5 Obtencin del valor crtico en la tabla de la distribucin ! con los grados de libertad correspondientes y decidir si el estadstico calculado en el paso 3 excede este valor crtico con p=0.05 o bien con p=0.01 6 Concluir en consecuencia. Es decir, hablar de que existe o no asociacin entre ambas variables segn el valor experimental exceda o no al valor crtico.
342
343
344
independencia entre las variables, el problema acaba ah, pero, si la significacin se produce, lo inmediato es intentar localizar la causa de la misma. La idea ahora es la descomponer la tabla original en subtablas que nos expliquen 2 las causas de la significacin. Para ello nos basamos en la propiedad aditiva de la ! .
Es decir: si tenemos dos variables aleatorias que siguen respectivamente un modelo terico Ji-cuadrado con !1 y !2 grados de libertad, la suma de las dos nos da otra variable aleatoria que sigue un modelo Ji-cuadrado con la suma de los grados de libertad de las de partida.
345
(fo i ! fe i )2
fe i
Tabla de contribuciones
Trat 1 Trat 2 Trat 3 Trat 4 Peor 0.85 6.31 0.23 2.94 Igual 0.41 1.11 0.25 1.17 mejor 0.39 0.04 0.17 0.00 TOTAL 1.65 7.46 0.65 4.11 13.87
(7 ! 9.91) 2
9.91
= 0.85
(28 ! 31.61)2
31.61
= 0.41 etc.
El anlisis de la tabla nos sugiere que el principal responsable de la significacin es el tratamiento 2 con una contribucin total de 7.46, superior a la de los otros 3 conjuntamente. Esto parece sugerir que los tratamientos 1,3,4 son homogneos entre si (la respuesta es independiente de estos tratamientos) y difieren del 2. De ah que intentemos realizar estos dos contrastes: Primero: Los tratamientos 1,3,4 son homogneos Segundo: Los tratamientos anteriores difieren del 2 Para llevar a cabo el primero de ellos construimos una subtabla en la que hemos de eliminar el tratamiento 2 (el aparentemente responsable de la significacin):
PEOR 7 IGUAL 28 MEJOR 115 TOTAL 150
T1
346
T3 T4 TOTAL
10 5 22
30 40 98
90 115 320
En dicha tabla realizaremos el contraste de independencia del mismo modo a como lo hicimos en la tabla original, con la esperanza de que en este caso la conclusin sea la de aceptar la Ho (lo que sugiere la observacin de los datos). Ahora las frecuencias esperadas no van a coincidir con el primer supuesto ya que los marginales de columnas son distintos (hemos eliminado a los enfermos tratados con el segundo de los tratamientos), tampoco coincidir el valor experimental ni los grados de libertad de la tabla. Siguiendo los pasos enunciados en el ejercicio de los alumnos obtenemos para este caso:
Concusin: ACEPTO Ho : HOMOGENEIDAD Como era de esperar hemos llegado a la conclusin de que estos tres tratamientos eran igualmente efectivos. Por tanto no se trata de tres tratamientos distintos sino de uno slo que llamaremos a partir de ahora tratamiento (1+3+4).
Para llevar a cabo el segundo de los contrastes, que nos ponga de manifiesto que es el tratamiento 2 el que difiere del resto necesitamos construir otra subtabla en la que se disponga de la informacin que nos interesa, es decir el tratamiento 2 y el tratamiento (1+3+4).
347
T2 T(1+3+4) Total
PEOR 15 22 37
IGUAL 20 98 118
Realizado el contraste de independencia en esta subtabla obtenemos: 2 ! exp = 9.488 que hemos de comparar con un valor crtico, correspondiente a esta 2 situacin, con 2 grados de libertad. Dicho valor es: ! 2;0.05 = 9.21
La conclusin a la que llegamos es pues: Rechazo la H0 de independencia entre la respuesta y los dos tratamientos el 2 cualquiera de los otros.
Obsrvese que la descomposicin realizada de la tabla original es lcita puesto que se verifica la propiedad aditiva de la Ji-cuadrado. Hemos obtenido dos subtablas en la que las sumas de sus grados de libertad (4 y 2 respectivamente) coinciden con los grados de libertad de la tabla de partida (6). En resumen lo que hemos hecho es:
g.l. 4 2 6
!2 exp.
5.04 9.48 14.52 13.87
significacin No ** **
tratamientos 1,2,3,4
Con esta descomposicin hemos probado que el tratamiento 2 difiere del resto como pareca intuirse de la tabla de contribuciones, pero esta afirmacin, aunque vlida no deja de ser incompleta ya que nada nos dice de en qu sentido es diferente, dicho de otra forma, difiere el tratamiento 2 del resto porque es peor o porque es mejor. Faltara,
348
pues, descomponer la ltima tabla que nos dio significativa, y que tena dos grados de libertad, en otras dos subtablas de 1 grado de libertad cada una para saber el sentido de las diferencias. Un esquema global de los pasos pueden verse en la figura 5.1.
P T1 P T1 T2 T3 T4 T2 I M T3 T4 P I M T1+T2+T3 T2 NS NS I M I M
*
T1+T2+T3 T2
(I+M)
*
T1+T2+T3
Figura 5.1: Esquema de descomposicin de la tabla de contingencia de partida para la bsqueda de la significacin
349
MEJORAN
NO MEJORAN 20 24 20 16
De acuerdo con la tabla, 20 de los 40 individuos que reciben el nuevo tratamiento mejoraron y 24 de los 40 individuos que recibieron el estndar mejoraron. Por tanto el 50% de los individuos mejoraron con el nuevo tratamiento, mientras que el 60% de los individuos mejoraron con el tratamiento estndar. El nuevo tratamiento parece inferior al tratamiento estndar. Para investigar la eficacia del nuevo tratamiento ms a fondo, se podra comparar con el tratamiento estndar slo para los hombres de la muestra y separadamente slo para las mujeres. Podramos pues desagregar esta tabla en otras dos subtablas: la de hombres y la de mujeres. Supngase que tenemos informacin suficiente para construir estas subtablas y que el resultado es el siguiente:
SOLO HOMBRES MEJORAN NO MEJORAN
12 3
18 7
MEJORAN
NO MEJORAN
8 21
2 9
350
Obsrvese que si agregamos de nuevo las dos subtablas obtendramos de nuevo la tabla de partida. Sin embargo, el anlisis de las subtablas nos pone de manifiesto algo sorprendente, ya que el nuevo tratamiento parece ser ms efectivo que el estndar tanto en hombres como en mujeres. Especficamente, el 40% de los hombres (12 de cada 30) que reciben el nuevo tratamiento mejoraron, pero slo el 30% de los hombres (3 de cada 10) que recibieron el estndar mejoraron. Adems el 80% de las mujeres (8 de cada 10) que recibieron el nuevo tratamiento mejoraron pero slo el 70% de ellas (21 de cada 30) que recibieron el tratamiento estndar mejoraron. Est claro que la tabla inicial y las subtablas proporcionan resultados contradictorios. De acuerdo con la primera el tratamiento estndar es mejor para todos pero con las subtablas, el nuevo es superior, para hombres y para mujeres. A este tipo de resultados se le conoce como paradoja de Simpson. La paradoja de Simpson no es realmente una paradoja, slo es un resultado que sorprende y confunde cuando no se ha observado antes. Se puede ver en la subtabla correspondiente a mujeres que stas tienen una tasa de recuperacin de la enfermedad mayor que la de los hombres, independientemente del tratamiento que reciban. Adems, entre los 40 hombres de la muestra, 30 recibieron el nuevo tratamiento y slo 10 el estndar, mientras que para las mujeres estos nmeros son justamente al revs. Por tanto aunque los nmeros de hombres y de mujeres en el experimento fueron iguales, una alta proporcin de mujeres y una baja proporcin de hombres recibieron el tratamiento estndar. Puesto que las mujeres tienen una tasa de recuperacin mayor, se encuentra en la tabla agregada que el tratamiento estndar manifiesta una mayor tasa global de recuperacin que el nuevo tratamiento. La paradoja de Simpson demuestra de una forma drstica los peligros de realizar inferencias a partir de tablas agregadas. Para estar seguros de que la paradoja no est presente en un experimento las proporciones de relativas de hombres y de mujeres entre los individuos que reciben el nuevo tratamiento debe ser aproximadamente la misma, as como las proporciones relativas de hombres y de mujeres entre los individuos que reciben el tratamiento estndar. La posibilidad de la paradoja subyace en cualquier tabla de contingencia. An cuando se tuviera cuidado al disear un experimento particular de forma que no pudiera
351
ocurrir la paradoja cuando se desagrega para hombres y mujeres, siempre es posible que exista alguna otra variable, como la edad de los individuos o la intensidad y grado de avance de la enfermedad, con respecto a la cual la desagregacin podra conducir a una conclusin directamente opuesta a la indicada por la tabla agregada.