Вы находитесь на странице: 1из 17

8

Introduccin a la inferencia estadstica


II. El contraste de hiptesis

La estimacin de parmetros estudiada en el captulo anterior es una de las dos estrategias


propuestas para realizar inferencias. Ya hemos sealado que la otra estrategia es el contraste
de hiptesis. Un contraste de hiptesis (hypothesis test), tambin llamado contraste o prue-
ba de significacin (significance test), es una estrategia diseada para tomar decisiones: un
procedimiento que permite decidir si una proposicin acerca de una poblacin puede ser man-
tenida o debe ser rechazada.
En la investigacin emprica es frecuente encontrarse con problemas de conocimiento
surgidos a partir de conocimientos ya existentes o a partir de la observacin de nuevos datos:
es el tratamiento A ms apropiado que el B para aliviar los sntomas de los pacientes con
trastorno depresivo?, son los sujetos que se sienten inseguros ms agresivos que los que se
sienten seguros?, difieren los hombres y las mujeres en intencin de voto?, etc. Estos interro-
gantes son slo un pequeo ejemplo de la multitud de problemas que se generan en la inves-
tigacin emprica en las ciencias sociales y de la salud. Tales interrogantes surgen, en general,
en el seno de una teora que intenta dar cuenta de alguna parcela de la realidad y se plantean
con la intencin de cubrir alguna laguna concreta de conocimiento que esa teora no cubre o
para corroborar una parte o el total de esa teora.
Surgido el problema, el paso siguiente consiste en aventurar algn tipo de solucin al
mismo. Esta solucin tentativa o provisional suele tomar forma de afirmacin directamente
verificable (es decir, empricamente contrastable; de no ser as, nos moveramos en el terreno
de la especulacin y no en el de la ciencia) en la que se establece de forma operativa el com-
portamiento de la variable o variables involucradas en el problema. Esa afirmacin verificable
recibe el nombre de hiptesis cientfica o de investigacin (ver Pereda, 1987, Captulo 5).
As, ante la pregunta (problema de conocimiento) cul de dos tratamientos, A y B, es ms
eficaz para aliviar los sntomas de pacientes con depresin?, podra aventurarse la hiptesis
de que los tratamientos son igualmente eficaces. Por supuesto, habra que definir con preci-
sin (operativamente) en qu consiste cada tratamiento, y qu se entiende por depresin y
cmo medirla. Slo entonces la afirmacin podra considerarse una hiptesis cientfica.
Hecho esto, ya se estara en condiciones de iniciar el proceso de verificacin de esa hip-
tesis. Y el proceso de verificacin habitualmente utilizado en las ciencias empricas sigue los
pasos que en este apartado se describen bajo la denominacin de contraste de hiptesis.
222 Anlisis de datos (vol. I)

El contraste de hiptesis
El primer paso del proceso de verificacin de una hiptesis1 consiste en formular estadstica-
mente la hiptesis cientfica que se desea contrastar; es decir, en transformar la hiptesis
cientfica en hiptesis estadstica. Esto supone que de una hiptesis cientfica se derivan una
serie de consecuencias referidas a la forma de una o varias distribuciones poblacionales, o al
valor de uno o ms parmetros de esas distribuciones. As, por ejemplo, la hiptesis cientfica
los tratamientos antidepresivos A y B son igualmente eficaces implica, en trminos estadsti-
cos, A = B; es decir, que el promedio A de la distribucin de la variable depresin en la po-
blacin de pacientes que reciben el tratamiento A es igual al promedio B de esa misma distri-
bucin en la poblacin de pacientes que reciben el tratamiento B.
Formulada la hiptesis estadstica, el segundo paso de un contraste de hiptesis consiste
en buscar evidencia emprica relevante capaz de informar sobre si la hiptesis formulada
es o no sostenible. Esto, en general, no resulta demasiado complicado de conseguir: parece
razonable pensar que, si una hiptesis concreta referida a una distribucin poblacional es cier-
ta, al extraer una muestra de esa poblacin debe encontrarse un resultado muestral similar al
que esa hiptesis propone para la distribucin poblacional. Si una hiptesis afirma que dos
tratamientos antidepresivos son igualmente eficaces (A = B) y se asume que esa hiptesis
es cierta, debe esperarse que, al extraer una muestra aleatoria de la poblacin de pacientes tra-
tados con A y otra de la poblacin
_ _ de pacientes tratados con B, el nivel de depresin observa-
do en ambas muestras, Y A y Y B, sea similar.
Ahora bien, si el resultado muestral encontrado no coincide con la afirmacin establecida
en la hiptesis, pueden estar ocurriendo dos cosas diferentes: bien la hiptesis planteada no
es cierta y, por tanto, es incapaz de ofrecer predicciones correctas; bien la hiptesis es cierta
y la discrepancia observada entre la hiptesis y los datos es slo producto de las fluctuaciones
propias del azar muestral. La clave est precisamente en poder discernir cundo una discre-
pancia entre el comportamiento de los datos y la afirmacin establecida en la hiptesis es lo
bastante grande como para poder considerar que el resultado muestral observado es incompa-
tible con la hiptesis formulada, es decir, lo bastante grande como para considerar que la dis-
crepancia hiptesis-datos no es explicable por las fluctuaciones del azar muestral sino por el
hecho de que la hiptesis planteada es falsa.
Hace falta, y ste es el tercer paso del proceso, una regla de decisin. Y esa regla se esta-
blece en trminos de probabilidad. Si en el ejemplo propuesto sobre la eficacia de dos trata-
mientos se pudiera trabajar con las poblaciones completas de pacientes tratados con A y con
B (es decir, si se pudiera medir el nivel de depresin en todos los pacientes tratados con A y
con B), no habra que recurrir a la teora de la probabilidad porque tampoco sera necesario
efectuar ningn tipo de contraste de hiptesis: se conoceran los valores poblacionales A y
B, y se sabra si son iguales o no. Pero el hecho de tener que trabajar con muestras en lugar

1
Por supuesto, no todas las hiptesis cientficas requieren de la utilizacin del contraste de hiptesis para ser verificadas.
Recordemos a este respecto lo dicho en el primer captulo sobre los fenmenos deterministas y aleatorios. Una afirmacin
del tipo tal persona posee una inteligencia superior a la media puede verificarse simplemente observando a ese sujeto. Sin
embargo, una afirmacin del tipo las personas autoritarias tienen una inteligencia inferior a la media no puede ser verifi-
cada recurriendo slo a la observacin: difcilmente alguien podra observar a todas las personas autoritarias. Es justamente
en las situaciones en las que no se tiene acceso a todos los elementos de la poblacin donde las estrategias basadas en la
inferencia estadstica (la estimacin de parmetros y el contraste de hiptesis) aportan todo su potencial para la verificacin
de hiptesis cientficas.
Captulo 8. El contraste de hiptesis 223

de poblaciones obliga a recurrir a la inferencia y a tener que establecer una regla de decisin
en trminos de probabilidad.
Ahora bien, el nmero de reglas de decisin que se pueden establecer en una situacin
particular es casi ilimitado. Por supuesto, unas reglas sern mejores o ms tiles que otras y,
probablemente, ninguna de ellas ser lo bastante buena como para resultar til en todo tipo
de situaciones. Afortunadamente, la teora de la decisin se ha encargado de elaborar algunos
argumentos que pueden trasladarse al contexto del contraste de hiptesis. En general, la regla
de decisin que se utiliza en los contrastes de hiptesis se basa en el siguiente razonamiento:
si, suponiendo cierta la hiptesis, el resultado muestral observado es improbable, se conside-
rar que la hiptesis es incompatible con los datos; por el contrario, si, suponiendo cierta la
hiptesis, el resultado muestral observado es probable, se considerar que la hiptesis es com-
patible con los datos2. Por tanto, se trata de una regla de decisin que se basa en el grado de
compatibilidad (expresada sta en trminos de probabilidad) existente entre la hiptesis y los
datos.
Imaginemos que estamos interesados en averiguar si un graflogo posee o no la capaci-
dad de detectar la presencia de trastornos depresivos a partir de la escritura. Para ello, podra-
mos comenzar formulando la hiptesis de que el graflogo no posee tal capacidad. Si esta
hiptesis es cierta, al presentar al graflogo un par de muestras de escritura (una perteneciente
a un paciente con trastorno y otra a un paciente sin trastorno) para que elija la que pertenece
al paciente con trastorno, cabe esperar que responda al azar (se est asumiendo que la hipte-
sis es cierta), por lo que la probabilidad de acierto ser de 0,5. Por el contrario, si la hiptesis
es falsa (y, por tanto, el graflogo s posee la mencionada capacidad), al presentarle el mismo
par de muestras de escritura, la probabilidad de acierto ser mayor que 0,5, es decir, mayor
que la probabilidad de acertar por azar. En este escenario, la hiptesis de que el graflogo no
posee la capacidad de diagnosticar trastornos depresivos a travs de la escritura implica una
afirmacin estadstica del tipo

$ 0,5
acierto <

Para contrastar esta hiptesis se pueden presentar, en lugar de un par de muestras de escritura,
10 pares. Si la hiptesis es verdadera, cabe esperar encontrar no ms de 5 aciertos (es decir,
no ms del nmero de aciertos esperable por azar). Por el contario, si la hiptesis es falsa,
cabe esperar encontrar un nmero de aciertos superior a 5 (es decir, ms aciertos de los espe-
rables por azar).
Ahora bien, si el graflogo obtiene 6 aciertos, podr decirse que ese resultado es mayor
que el esperable por azar? Y si obtiene 7? Con cuntos aciertos podremos decir que el gra-
flogo ha superado el resultado ms alto esperable slo por azar? Para responder a esta pre-
gunta, en lugar de basarnos en nuestras apreciaciones subjetivas, recurrimos a la teora de la
probabilidad intentando establecer una regla que nos permita decidir cundo los datos son
compatibles con esa hiptesis y cundo no lo son. Aplicando esta regla, un nmero de aciertos
esperable por azar (es decir, un resultado probable cuando se diagnostica al azar) llevar a
decidir que la hiptesis planteada es compatible con los datos y a sospechar que el graflogo
no posee la capacidad de diagnosticar a partir de la escritura; por el contrario, un nmero de
aciertos mayor que el esperable por azar (es decir, un resultado improbable cuando se diag-
nostica al azar) llevar a decidir que la hiptesis planteada es incompatible con los datos y a

2
Sobre el significado de los trminos probable e improbable volveremos ms adelante.
224 Anlisis de datos (vol. I)

$ 0,5 es una afirmacin in-


concluir que el graflogo s posee esa capacidad (pues si acierto <
correcta, entonces la afirmacin correcta debe ser acierto 0,5). As pues, resumiendo:
Un contraste de hiptesis es un proceso de decisin en el que una hiptesis formulada
en trminos estadsticos es puesta en relacin con los datos empricos para determinar
si es o no compatible con ellos.
Y, en cuanto proceso que es, se desarrolla en una serie de pasos que se ajustan a la lgica que
acabamos de resumir y que se describe con ms detalle a continuacin3.

Las hiptesis estadsticas


Una hiptesis estadstica es una afirmacin sobre una o ms distribuciones de probabilidad;
ms concretamente, sobre la forma de una o ms distribuciones de probabilidad, o sobre el
valor de uno o ms parmetros de esas distribuciones. Las hiptesis estadsticas se suelen re-
presentar por la letra H seguida de una afirmacin que da contenido a la hiptesis:
H: la variable Y se distribuye normalmente con Y = 100 y Y = 15
H: acierto = 0,5
$ 30
H: Y <
H: Mdn1 =/ Mdn2
H: 1 = 2 = 3 = 4

En general, una hiptesis estadstica surge a partir de una hiptesis cientfica. Pero entre una
hiptesis cientfica y una hiptesis estadstica no existe una correspondencia exacta. La pri-
mera acta como referente para la formulacin de la segunda, pero no son la misma cosa. Una
hiptesis cientfica se refiere a algn aspecto de la realidad; una hiptesis estadstica se refiere
a algn aspecto de una distribucin de probabilidad. Esto significa, por ejemplo, que la expre-
sin A = B propuesta anteriormente no es la nica formulacin estadstica que puede deri-
varse de la hiptesis cientfica ambos tratamientos son igualmente eficaces. En lugar del pro-
medio podra utilizarse el promedio Mdn y establecer esta otra formulacin estadstica:
MdnA = MdnB. Y todava podra transformarse esa hiptesis cientfica en estadstica utilizando
otras estrategias muy distintas; por ejemplo: F (YA) = F (YB), es decir, la funcin de distribu-
cin de la variable Y = nivel de depresin es la misma en la poblacin de pacientes tratados
con A y en la de pacientes tratados con B.
Existen, por tanto, varias formas distintas de expresar estadsticamente una hiptesis cien-
tfica concreta. A lo largo de este captulo y de los que siguen iremos viendo qu hiptesis es-
tadsticas es posible plantear y cmo deben plantearse. De momento, basta con saber que el
primer paso de todo contraste de hiptesis consiste en formular en trminos estadsticos la
afirmacin contenida en la hiptesis cientfica que se desea contrastar.

3
En la inferencia estadstica no existe un nico punto de vista. Es frecuente encontrarse con la distincin entre el enfoque
clsico, en el que se considera que la nica informacin disponible sobre la poblacin es la que contienen las muestras, y
el enfoque bayesiano, en el que, adems de la informacin muestral, se hace uso de conocimientos previos. Las ideas sobre
el contraste de hiptesis tal como se expone aqu fueron introducidas inicialmente por Ronald A. Fisher (1925, 1955) y
completadas por Neyman y Pearson (1928, 1932, 1933), aunque las principales aportaciones de Neyman y Pearson las
dejaremos para el segundo volumen. Esta versin del contrate de hiptesis debe ser enmarcada dentro del enfoque clsico.
Captulo 8. El contraste de hiptesis 225

Dicho esto, es necesario sealar que, aunque hasta ahora se han venido proponiendo
ejemplos en los que se ha formulado una sola hiptesis, lo cierto es que los contrastes de hip-
tesis se basan en la formulacin de dos hiptesis:
1. La hiptesis nula, representada por H0.
2. La hiptesis alternativa, representada por H1.
La hiptesis nula H0 es la hiptesis que se pone a prueba. Es la clave de todo el proceso: no
slo es el punto de partida sino que, segn veremos, gua todo el proceso y es sobre quien fi-
nalmente recae la decisin (de hecho, a los contrastes de hiptesis tambin se les suele llamar
pruebas de significacin de la hiptesis nula). Esta hiptesis adopta la forma de afirmacin
concreta sobre la forma de una distribucin de probabilidad o sobre el valor de alguno de los
parmetros de esa distribucin:
H0: La variable Y se distribuye normalmente con Y = 100 y Y = 15.
H 0: 1 = 2.
H0: 1 = 2.
H0: XY = 0.
H0: acierto = 0,5.
La hiptesis alternativa H1 es la negacin de la hiptesis nula. H1 incluye todo lo que H0 ex-
cluye. Mientras que H0 es una hiptesis exacta (tal cosa es igual a tal otra), H1 es inexacta (tal
cosa es distinta, mayor o menor que tal otra):
H1: La variable Y no se distribuye normalmente con Y = 100 y Y = 15.
H 1: 1 > 2.
H1: 1 < 2.
H1: XY =/ 0.
H1: acierto < 0,5.
Cuando en H1 aparece el signo distinto (=/), se dice que el contraste es bilateral o bidireccio-
nal. Cuando en H1 aparece el signo menor que (<) o mayor que (>) se dice que el contraste
es unilateral o unidireccional. Enseguida volveremos sobre esta distincin.
La hiptesis nula y la hiptesis alternativa suelen plantearse como hiptesis rivales. Son
hiptesis exhaustivas (agotan todas las posibilidades) y mutuamente exclusivas (no se sola-
pan), lo cual implica que si una es verdadera, la otra es necesariamente falsa. Segn esto, en
los ejemplos propuestos anteriormente pueden plantearse las siguientes hiptesis:
a) H0: A = B.
H1: A =/ B.
$ 0,5.
b) H0: acierto <
H1: acierto > 0,5.
Las hiptesis del prrafo a se refieren al ejemplo sobre la eficacia de dos tratamientos antide-
presivos: la hiptesis nula afirma que el nivel medio de depresin de los pacientes tratados
con A es el mismo que el de los tratados con B; la hiptesis alternativa afirma que no es el
226 Anlisis de datos (vol. I)

mismo. Las hiptesis del prrafo b se refieren al ejemplo del graflogo capaz de diagnosticar
trastornos depresivos a travs de la escritura: la hiptesis nula afirma que el graflogo no po-
see tal capacidad; la hiptesis alternativa afirma que s la posee. En ambos casos, H0 y H1 se
plantean como hiptesis exhaustivas y mutuamente exclusivas.
Conviene no pasar por alto un detalle de especial importancia: el signo igual (=), tanto
si va solo (A = B) como si va acompaado (acierto <$ 0,5), siempre va en la hiptesis nula. Ya
hemos sealado que H0 es la hiptesis que se somete a contraste. Esto significa que la afirma-
cin concreta establecida en H0 (y la nica afirmacin concreta que se est haciendo es la que
corresponde al signo =) es el punto de partida de todo el proceso. Es decir, tanto si H0 es
$ 0,5), todo el proceso de decisin va a estar ba-
exacta (A = B) como si es inexacta (acierto <
sado en un modelo probabilstico construido a partir de la afirmacin concreta correspondien-
te al signo = presente en H0. Enseguida veremos que es justamente ese modelo probabils-
tico el que ofrece la informacin necesaria para tomar una decisin sobre H0.

Los supuestos del contraste


Para que una hiptesis estadstica pueda predecir un resultado muestral con cierta exactitud
es necesario que la distribucin muestral con la que se va a trabajar est completamente es-
pecificada.
Por ejemplo, una afirmacin del tipo la variable Y se distribuye normalmente con par-
metros Y = 100 y Y = 15 es una afirmacin que identifica por completo las caractersticas
de la poblacin de referencia: define una poblacin normal con parmetros conocidos. Sabe-
mos qu se puede esperar de una muestra aleatoriamente seleccionada de esa poblacin. Pero
una afirmacin del tipo Y = 30 hace referencia a una poblacin de la que nicamente se
sabe que la media de la variable Y vale 30. No sabemos qu se puede esperar en una muestra
seleccionada de esa poblacin a no ser que impongamos alguna condicin extra como la for-
ma de la poblacin y el valor de la desviacin tpica.
Con las hiptesis de un contraste pasa algo parecido. Enseguida veremos que la distribu-
cin que es necesario conocer en un contrate de hiptesis es la distribucin muestral del esta-
dstico del contraste. Y, como las hiptesis nulas no siempre permiten especificar por com-
pleto esa distribucin muestral, es necesario establecer condiciones adicionales a las que im-
pone la hiptesis nula. Estas condiciones adicionales son las que llamamos supuestos del con-
traste.
En el ejemplo del graflogo supuestamente capaz de detectar trastornos depresivos a tra-
vs de la escritura, para verificar si el graflogo posee o no esa capacidad, se han planteado
$ 0,5 y H1: acierto > 0,5. Y para contrastar esas hiptesis se
las hiptesis estadsticas H0: acierto <
han presentado al graflogo 10 pares de muestras de escritura. Pues bien, si los 10 pares de
muestras de escritura se presentan de forma independiente (muestra aleatoria) y en cada pre-
sentacin slo hay dos resultados posibles (acierto-error) con acierto = 0,5 en cada presenta-
cin, la variable nmero de aciertos tendr una distribucin de probabilidad completamente
especificada (la binomial, con parmetros n = 10 y acierto = 0,5; ver, en el Captulo 6, el apar-
tado Distribucin muestral del estadstico proporcin) y eso permitir poder tomar una deci-
sin respecto a H0 en trminos de probabilidad.
Normalmente ser necesario establecer supuestos sobre las caractersticas de las poblacio-
nes muestreadas. Pero tambin ser necesario establecer otro tipo de supuestos relacionados
Captulo 8. El contraste de hiptesis 227

con la forma de llevar a cabo el estudio: si la muestra es aleatoria..., si las presentaciones son
independientes...
Resumiendo: los supuestos de un contraste de hiptesis son el conjunto de condiciones
que deben darse (forma de la poblacin de partida, caractersticas de la muestra elegida, etc.)
para que la distribucin de probabilidad en la que se basar la decisin sobre H0 quede com-
pletamente especificada.

El estadstico del contraste y su distribucin muestral


El estadstico del contraste es un valor muestral que cumple una doble condicin: (1) ofrece
informacin relevante sobre la afirmacin establecida en la hiptesis nula y (2) tiene distri-
bucin muestral conocida.
Si la hiptesis que se desea contrastar es H0: Y = 30, debe recurrirse a un estadstico ca-
paz de detectar cualquier desviacin emprica de la afirmacin establecida en H0. Obviamente,
ni SY, ni Pacierto, por citar algunos estadsticos conocidos, ofrecern informacin relevante sobre
el parmetro Y. Para contrastar
_ H0: Y = 30, lo razonable ser utilizar la informacin muestral
basada en el estadstico Y ; del mismo modo, si la hiptesis que se desea contrastar es del tipo
H0: acierto = 0,70, lo razonable ser recurrir a un estadstico que pueda ofrecer informacin
relevante sobre acierto, por ejemplo, Pacierto; etc.
La segunda condicin que debe cumplir un estadstico para que pueda utilizarse como es-
tadstico del contraste es la de tener distribucin muestral conocida. Precisamente la distribu-
cin muestral del estadstico del contraste es la que contiene las probabilidades en las que ms
tarde se basar la decisin sobre H0.
Por tanto, una vez formuladas las hiptesis, el siguiente paso consiste en seleccionar un
estadstico capaz de informar sobre ellas y en fijar las condiciones (supuestos) necesarias para
conseguir determinar su distribucin muestral. En el ejemplo sobre el graflogo supuestamen-
te capaz de diagnosticar trastornos depresivos a partir de la escritura se haban planteado las
hiptesis H0: acierto < $ 0,5 y H1: acierto > 0,5. Existen dos estadsticos (en realidad los dos son
el mismo, pues uno es transformacin lineal del otro) que aportan informacin relevante sobre
esa hiptesis:
nacierto = nmero de aciertos o de diagnsticos correctos.
Pacierto = proporcin de aciertos o de diagnsticos correctos.
Asumiendo, segn se ha sealado antes, que las presentaciones de los 10 pares de muestras
de escritura son independientes entre s y que la probabilidad de cada uno de los dos resulta-
dos posibles (acierto-error) es la misma en cada presentacin, la distribucin muestral de las
variables (estadsticos del contraste) nacierto y Pacierto es la binomial con parmetros n = 10 y
acierto = 0,5. Por tanto, la probabilidad asociada a cada uno de los valores de nacierto y Pacierto
puede obtenerse aplicando la ecuacin de la funcin binomial (ver ecuacin [3.4]) o, ms r-
pido y sencillo, recurriendo a la Tabla B del Apndice final (sin olvidar que la tabla ofrece
probabilidades acumuladas).
La Tabla 8.1 recoge estas probabilidades, es decir, las distribuciones muestrales de nacierto
y Pacierto con n = 10 y acierto = 0,5. En la tabla puede comprobarse, por ejemplo, que la probabi-
lidad de encontrar 10 aciertos (es decir, la probabilidad de nacierto = 10 o Pacierto = 1) vale 0,001.
Y tambin puede comprobarse, por ejemplo, que la probabilidad de encontrar 9 aciertos o ms
228 Anlisis de datos (vol. I)

(es decir, la probabilidad de nacierto >$ 9 o Pacierto >


$ 0,9), siempre asumiendo acierto = 0,5, vale
0,010 + 0,001 = 0,011. Segn veremos enseguida, es justamente en estas probabilidades en
las que se basar la decisin sobre H0.
Por tanto, los estadsticos nacierto y Pacierto permiten contrastar la hiptesis H0: acierto < $ 0,5
porque ambos cumplen las dos condiciones exigidas a los estadsticos utilizados en los con-
trastes de hiptesis: (1) contienen informacin relevante sobre H0 y (2) tienen distribucin
muestra conocida. Por tanto, al contrastar H0: acierto < $ 0,5, tanto nacierto como Pacierto sirven co-
mo estadsticos del contraste.

Tabla 8.1. Distribucin muestral de nacierto y Pacierto (con n = 10 y acierto = 0,5)

nacierto Pacierto f (nacierto) = f (Pacierto)


0 0,0 0,001
1 0,1 0,010
2 0,2 0,044
3 0,3 0,117
4 0,4 0,205
5 0,5 0,246
6 0,6 0,205
7 0,7 0,117
8 0,8 0,044
9 0,9 0,010
10 1,0 0,001

La regla de decisin

La regla de decisin es el criterio que se utiliza para decidir si la hiptesis nula puede mante-
nerse o debe rechazarse. La lgica en la que se basa esta regla es bastante simple: la hiptesis
nula se mantiene o rechaza dependiendo de su grado de compatibilidad con los datos; y los
datos estn resumidos en el estadstico del contraste. Para determinar el grado de compatibili-
dad entre la hiptesis nula y los datos, la distribucin muestral del estadstico del contraste
se divide en dos zonas exclusivas y exhaustivas: la zona de rechazo y la zona de aceptacin.
La zona de rechazo, tambin llamada zona crtica, es la zona de la distribucin muestral
correspondiente a los valores del estadstico del contraste que se encuentran tan alejados de
la afirmacin establecida en H0 que es muy poco probable que ocurran si H0, como se supone,
es verdadera; es decir, la zona en la que se encuentran los datos poco compatibles con H0. La
probabilidad asociada a esta zona de rechazo o crtica se denomina nivel de significacin o
nivel de riesgo y se representa con la letra griega .
La zona de aceptacin es la zona de la distribucin muestral correspondiente a los valo-
res del estadstico del contraste prximos a la afirmacin establecida en H0. Es, por tanto, la
zona en la que se encuentran los valores del estadstico que es probable que ocurran si H0,
como se supone, es verdadera; es decir, la zona en la que se encuentran los datos compatibles
con H0. La probabilidad asociada a esta zona de aceptacin se denomina nivel de confianza
y se representa mediante 1 ! .
Captulo 8. El contraste de hiptesis 229

Una vez definidas las zonas de rechazo y de aceptacin, se aplica la siguiente regla de
decisin:
Rechazar H0 cuando el estadstico del contraste toma un valor perteneciente a la zona
de rechazo o crtica; mantener H0 cuando el estadstico del contraste toma un valor
perteneciente a la zona de aceptacin.
Por tanto, se rechaza una H0 particular porque eso significa que el valor del estadstico del
contraste se aleja demasiado de la prediccin establecida en esa hiptesis, es decir, porque,
si esa H0 fuera verdadera, el estadstico del contraste no debera tomar ese valor (sera muy
poco probable que lo tomara); si de hecho lo toma, la conclusin razonable es que esa H0 no
puede ser verdadera (es importante advertir que la decisin siempre se toma sobre H0).
Con esta regla de decisin se est asumiendo que la probabilidad asociada al estadstico
del contraste indica el grado de compatibilidad existente entre la hiptesis nula y los datos.
Esta probabilidad (grado de compatibilidad) recibe el nombre de nivel crtico (tambin se le
llama nivel de significacin observado) y se representa mediante p:

p = nivel crtico = P (D | H0) (D = Datos) [8.1]


Es decir, p representa la probabilidad de encontrar, en la distribucin muestral definida por
H0, los datos de hecho encontrados (ms concretamente, la probabilidad de encontrar datos
tan alejados, o ms alejados, de la afirmacin establecida en H0 como los de hecho encontra-
dos). Aplicando este criterio de compatibilidad entre la hiptesis nula y los datos, la regla de
decisin puede formularse de esta otra manera:
Rechazar H0 si p < ; mantenerla en caso contrario
El tamao de las zonas de rechazo y aceptacin se determina fijando el valor de , es decir,
fijando el nivel de significacin o nivel de riesgo con el que se desea trabajar. Por supuesto,
si se tiene en cuenta que es la probabilidad que se va a considerar como lo bastante pequea
para que valores con esa probabilidad o menor no ocurran bajo H0, se comprender que
ser, necesariamente, un valor pequeo. Cmo de pequeo es algo que debe establecerse de
forma arbitraria, si bien el valor habitualmente propuesto para en la literatura estadstica y
aceptado por la comunidad cientfica es 0,05 (tambin referido como nivel de significacin
del 5 %).
La forma de dividir la distribucin muestral en zona de rechazo y zona de aceptacin
depende de que el contraste sea bilateral o unilateral. En un contraste bilateral o bidireccional
no se tiene una idea previa sobre la direccin en la que pueden aparecer resultados muestrales
incompatibles con H0. Esto es lo que ocurre, por ejemplo, cuando se desea comprobar si un
parmetro toma o no un determinado valor, o si dos grupos difieren en alguna variable, o si
dos variables son independientes:
1. H0 : acierto = 0,5.
H1 : acierto =/ 0,5.
2. H0 : A = B.
H1 : A =/ B.
3. H0 : XY = 0.
H1 : XY =/ 0.
230 Anlisis de datos (vol. I)

En el caso 1, H0 ser rechazada tanto si acierto es mayor que 0,5 como si es menor; en el caso
2, H0 ser rechazada tanto si A es mayor que B como si A es menor que B; en el caso 3, H0
ser rechazada tanto si la relacin es positiva como si es negativa. Todos estos contrastes son
bilaterales: las hiptesis alternativas no indican la direccin en la que se encuentran los resul-
tados muestrales incompatibles con H0 (lo cual se expresa con el signo =/).
En un contraste unilateral o unidireccional se tiene una idea previa sobre la direccin en
la que se encuentran los resultados muestrales incompatibles con H0. Esto es lo que ocurre,
por ejemplo, cuando se desea comprobar si el valor de un parmetro ha aumentado, o si un
grupo supera a otro en alguna variable, o si dos variables se encuentran positivamente relacio-
nadas:
$ 0,50.
1. H0 : acierto <
H1 : acierto > 0,50.
$ B.
2. H0 : A <
H1 : A > B.
$ 0.
3. H0 : XY <
H1 : XY > 0.

En el caso 1, H0 ser rechazada si acierto es mayor que 0,50, pero no si es menor; en el caso
2, H0 ser rechazada si A es mayor que B, pero no si es menor; en el caso 3, H0 ser recha-
zada si la relacin es positiva, pero no si es negativa. Todos estos contrastes son unilaterales:
las hiptesis alternativas contienen una prediccin concreta (expresada con los signos < y
>) sobre la direccin en la que se encuentran los resultados muestrales incompatibles con
la afirmacin establecida en H0.
La zona de rechazo o crtica, por tanto, debe situarse all donde pueden aparecer los valo-
res muestrales incompatibles con H0, es decir, all donde indica H1. Y esto es algo que depen-
de nicamente de lo que interese estudiar en cada caso concreto. Por ejemplo, para comparar
la eficacia de dos tratamientos sin una expectativa justificada (estudios previos, intereses
concretos, etc.) sobre cul de los dos es ms eficaz, lo razonable es plantear un contraste bila-
teral (H1: A =/ B). Lo cual significa que la zona crtica debe recoger los valores muestrales
que vayan tanto en la direccin A ! B > 0 como en la direccin A ! B < 0. Dicho de otro
modo, si H0: A = B es falsa, lo ser tanto si A es mayor que B como si A es menor que B;
y la zona crtica deber recoger ambas posibilidades4. Por esta razn, en los contrastes bilate-
rales, la zona crtica se encuentra repartida5, generalmente a partes iguales, entre las dos
colas de la distribucin muestral (Figura 8.1, izquierda).
Sin embargo, para comprobar si un graflogo posee o no la capacidad de diagnosticar
trastornos depresivos a partir de la escritura, lo razonable es plantear un contraste unilateral
(H1: acierto > 0,5), pues slo tiene sentido considerar que el graflogo posee tal capacidad si

4
Por supuesto, si se desea contrastar, no si dos tratamientos difieren, sino si uno es mejor que el otro, habr que plantear
un contraste unilateral.
5
Existen excepciones a esta regla. Dependiendo del estadstico utilizado y de su distribucin muestral, puede ocurrir que
la zona crtica de un contraste bilateral est, toda ella, ubicada en la cola derecha de la distribucin. Cuando se utiliza la
distribucin normal o la distribucin t de Student, la zona crtica de los contrastes bilaterales est repartida, generalmente
en partes iguales, entre las dos colas de la distribucin muestra. Pero la cosa cambia cuando se utilizan otras distribuciones
como, por ejemplo, la distribucin 2. Esto es algo que tendremos ocasin de estudiar ms adelante.
Captulo 8. El contraste de hiptesis 231

la proporcin de aciertos es mayor que la esperable por azar (no si esa proporcin es menor).
En este caso, los nicos valores muestrales incompatibles con H0 son los que van en la direc-
cin acierto > 0,5, que es la direccin apuntada en H1. Y la zona crtica debe reflejar esta cir-
cunstancia quedando ubicada en la cola derecha de la distribucin muestral. Por tanto, en los
contrastes unilaterales, la zona crtica se encuentra en una de las dos colas de la distribucin
muestral (Figura 8.1, derecha).

Figura 8.1. Ejemplo de zonas crticas en un contraste bilateral (izquierda) y unilateral derecho (derecha) en
una distribucin muestral de forma normal

1- 1-

/2 /2

Segn esto, las reglas de decisin para los contrastes de nuestros dos ejemplos (el de las dife-
rencias entre dos tratamientos y el del graflogo capaz de diagnosticar trastornos depresivos
a partir de la escritura) pueden concretarse de la siguiente manera:
1. Rechazar H0: A = B si el estadstico del contraste cae en la zona crtica, es decir, si toma
un valor mayor que el cuantil 100(1! /2) o menor que el cuantil 100(/2) de su distribu-
cin muestral.
O bien: rechazar H0: A = B si el estadstico del contraste toma un valor tan grande o tan
pequeo que la probabilidad de obtener un valor tan extremo o ms que el obtenido es
menor que /2. Es decir, rechazar H0 si p /2 < /2; o, lo que es lo mismo, si p < .
$ 0,5 si el estadstico del contraste cae en la zona crtica, es decir, si
2. Rechazar H0: acierto <
toma un valor mayor que el percentil 100 (1! ) de su distribucin muestral.
$ 0,5 si el estadstico del contraste toma un valor tan grande
O bien: rechazar H0: acierto <
que la probabilidad de obtener un valor como se o mayor es menor que . Es decir, re-
chazar H0 si p < .

La regla de decisin encierra un argumento claro acerca del rol que juega el azar muestral en
la variabilidad observada en los datos. Cuando se decide no rechazar una H0 se est asumien-
do que el efecto (diferencia, relacin) observado puede explicarse sin recurrir a otra cosa que
a la variabilidad propia del azar muestral; cuando se decide rechazar una H0 se est descar-
tando el azar muestral como nica explicacin del efecto observado. As, cuando un efecto
no es lo bastante grande como para decidir rechazar H0, lo que se est queriendo decir es que
ese efecto se encuentra dentro del rango de valores esperables por azar si H0 se asume verda-
dera. Por el contrario, cuando el efecto es lo bastante grande como para decidir rechazar H0,
lo que se est queriendo decir es que el efecto excede el rango de valores esperables por azar
cuando H0 es verdadera; y esto implica que el efecto observado no puede explicarse nica-
mente a partir de la variabilidad atribuible al azar muestral. Cuando se da esta circunstancia,
se dice que el resultado es estadsticamente significativo.
232 Anlisis de datos (vol. I)

La decisin
Planteada la hiptesis, formulados los supuestos, obtenido el estadstico del contraste y su dis-
tribucin muestral, y establecida la regla de decisin, el paso siguiente de un contraste consis-
te en tomar una decisin. Tal decisin se toma, siempre, sobre H0, y siempre consiste en re-
chazarla o mantenerla de acuerdo con las condiciones establecidas en la regla de decisin: si
el estadstico del contraste cae en la zona crtica (p < ), se rechaza H0; si el estadstico del
contraste cae en la zona de aceptacin (p > ), se mantiene H0.
La decisin, as planteada, parece no revestir problemas. Pero eso no es del todo cierto.
Conviene resaltar un aspecto importante de este proceso de decisin que no siempre es tenido
en cuenta. Si se rechaza una H0 particular se est afirmado que ha quedado probado (con las
limitaciones de un procedimiento basado en probabilidades) que esa hiptesis es falsa. Por
el contrario, si se mantiene, no se est afirmando que ha quedado probado que es verdadera;
simplemente se est afirmando que se considera compatible con los datos, es decir, que no
se dispone de evidencia emprica suficiente para rechazarla. Por tanto:

Mantener una hiptesis nula significa que se considera que esa hiptesis es compatible
con los datos. Rechazar una hiptesis nula significa que se considera probado (con la
limitacin sealada) que esa hiptesis es falsa.

La razn de esta asimetra en la conclusin es doble. Por un lado, dada la naturaleza inespec-
fica de H1, raramente es posible afirmar que H1 no es verdadera; las desviaciones pequeas
de H0 forman parte de H1, por lo que al mantener una H0 particular, tambin se estn mante-
niendo, muy probablemente, algunos valores de H1; debe concluirse, por tanto, que se mantie-
ne o no rechaza H0, pero no que se acepta como verdadera. Por otro lado, en el razonamiento
que lleva a tomar una decisin sobre H0, puede reconocerse el argumento deductivo modus
tollens, aunque de tipo probabilstico:
Si H0 es verdadera, entonces, muy probablemente, el estadstico del contraste T tomar
un valor compatible con ella; T no toma un valor compatible con ella; luego, muy proba-
blemente, H0 no es verdadera.
Este argumento es impecable; nada hay en l que lo invalide desde el punto de vista lgico.
Sin embargo, si una vez establecida la primera premisa se contina de esta otra manera: T
toma un valor compatible con H0; luego H0, muy probablemente, es verdadera, se comete un
error lgico llamado falacia de la afirmacin del consecuente, pues T puede haber tomado
un valor compatible con H0 por razones diferentes de las contenidas en H0.

Resumiendo
Probablemente ahora se entender mejor la definicin propuesta para el contraste de hiptesis
como proceso de toma de decisiones en el que una afirmacin sobre alguna caracterstica
poblacional (hiptesis nula) es puesta en relacin con los datos empricos (resumidos en el
estadstico del contraste y su distribucin muestral) para determinar si es o no compatible con
ellos (compatibilidad que se establece en trminos de probabilidad: p).
Todos los contrastes de hiptesis siguen la misma lgica: hiptesis, supuestos, estadstico
del contraste y distribucin muestral, y decisin basada en una probabilidad que expresa el
Captulo 8. El contraste de hiptesis 233

grado de compatibilidad entre la hiptesis y los datos. Ahora bien, puesto que las situaciones
concretas que interesa analizar poseen caractersticas particulares, el proceso general recin
descrito necesita adaptarse a las peculiaridades de cada una de ellas. Esto es lo que hacen las
tcnicas de anlisis que se describen en los captulos siguientes: cada tcnica (cada contraste
de hiptesis o prueba de significacin) es una adaptacin de este proceso general a una situa-
cin concreta (situacin que vendr caracterizada por el nmero de variables que intervienen,
la naturaleza de las variables, la forma de recoger los datos, etc.).

Estimacin por intervalos y contraste de hiptesis


Un intervalo de confianza no slo permite formarse una idea acerca del rango de valores entre
los que cabe esperar que se encuentre el verdadero valor del parmetro estimado. Tambin
sirve para contrastar hiptesis. De hecho, la estimacin por intervalos y el contraste de hipte-
sis se encuentran estrechamente relacionados. No en vano nos hemos referido ya a la estima-
cin y al contraste como las dos caras de la misma moneda. Ha llegado el momento de aclarar
esta relacin.
Al construir un intervalo con un nivel de confianza de, por ejemplo, 0,95, se est afirman-
do que, de cada 100 intervalos que se construyan con muestras del mismo tamao extradas
en las mismas condiciones, 95 de ellos incluirn el verdadero valor del parmetro estimado.
Esto es equivalente a afirmar que ninguna de las hiptesis nulas referidas a los valores inclui-
dos dentro del intervalo de confianza ser rechazada en un contraste bilateral con = 0,05.
En este sentido, los valores incluidos dentro del intervalo de confianza pueden interpretarse
como el conjunto de hiptesis aceptables del correspondiente contraste bilateral; y los no in-
cluidos, como el conjunto de hiptesis rechazables.
La Figura 8.2 puede ayudar a entender esta equivalencia. La curva muestra una distribu-
cin normal en la que se ha representado el tamao del error mximo (Emx), la amplitud del
intervalo de confianza y las zonas de aceptacin (1! ) y rechazo (/2 + /2) de un contraste
bilateral.

Figura 8.2. Relacin entre la estimacin por intervalos y el contraste de hiptesis

/2 Emx /2
^

Emx + Emx

Amplitud del intervalo de confianza

Sabemos que cualquier intervalo construido a partir de un valor de la zona rayada llevar
a construir un intervalo entre cuyos lmites no se encontrar el valor del parmetro . Tam-
234 Anlisis de datos (vol. I)

bin sabemos que cualquier valor de la zona rayada que se utilice como estadstico en un
contraste bilateral llevar al rechazo de H0 . Por tanto, si el valor propuesto para el parmetro
en la H0 de un contraste bilateral no se encuentra dentro del intervalo construido a partir de
con un nivel de confianza de 1!, entonces el contraste bilateral basado en llevar al recha-
zo de H0 con un nivel de significacin .
Del mismo modo, cualquier intervalo construido a partir de un valor de la zona no ra-
yada llevar no slo a construir un intervalo entre cuyos lmites se encontrar el valor del pa-
rmetro , sino a mantener H0 con el correspondiente contraste bilateral. Por tanto, si el valor
propuesto para el parmetro en H0 en un contraste bilateral se encuentra dentro del intervalo
construido a partir de con un nivel de confianza de 1!, entonces ese contraste llevar al
rechazo de H0 con un nivel de significacin .
Supongamos que en un contraste se plantea la hiptesis nula H0: Y = 0 frente a la alter-
nativa H1: Y =/ 0 con un nivel de confianza
_ de 0,95. Supongamos adems que, para contras-
tar esa hiptesis se utiliza el estadstico Y , cuya distribucin muestral est representada en la
curva de la Figura 8.3. De_acuerdo con la lgica del contraste de hiptesis recin estudiada,
cualquier valor muestral Y perteneciente a la zona no rayada llevar a mantener H0; y de
acuerdo con la lgica_de la estimacin por intervalos estudiada en el captulo anterior, cual-
quier valor muestral Y perteneciente a la zona no rayada llevar a construir un intervalo de
confianza que captar el_ valor_ propuesto para Y en H0. Tal es el caso de los intervalos cons-
truidos con las medias Y 1 e Y 2: estas medias no slo pertenecen a la zona de aceptacin, sino
que, tal como indica el grfico, al sumarles y restarles el error mximo (1,96 ), se obtienen
intervalos entre cuyos_ lmites se encuentra el valor del parmetro Y. Por el contrario, cual-
quier valor muestral Y perteneciente a la zona rayada llevar, no slo a rechazar H0, sino a
construir un intervalo de confianza que no captar _el valor _ propuesto para Y en H0. Tal es el
caso de los intervalos construidos con las medias Y 3 e Y 4: estas medias no slo pertenecen a
la zona de rechazo (zona rayada), sino que al sumarles y restarles el valor del error mximo
(1,96 ) se obtienen intervalos de confianza entre cuyos lmites no se encuentra el valor del
parmetro que se est intentando estimar (Y).
Por tanto, al construir un intervalo de confianza para el parmetro Y con un nivel de con-
fianza de 0,95, se est asumiendo que las hiptesis nulas correspondientes a los valores de Y
no incluidos en ese intervalo son falsas.

Figura 8.3. Relacin entre la estimacin por intervalos y el contraste de hiptesis

0,95

0,025 1,96 Y_ 0,025 _


Y
_
Y
Y1
_
Y2
_ _
Y3 Y4
Captulo 8. El contraste de hiptesis 235

Clasificacin de los contrastes de hiptesis


Para poder aplicar un contraste de hiptesis, la primera decisin que es necesario tomar (quiz
la ms importante) es la de elegir correctamente el contraste concreto que permitir poner a
prueba la hiptesis que se desea contrastar. Lgicamente, si un estudio incluye varias hip-
tesis ser necesario utilizar varios contrastes, en cuyo caso, cada uno de ellos deber elegirse
pensando en una hiptesis concreta.
Este argumento sugiere que la clasificacin de los contrastes de hiptesis podra hacerse,
antes que nada, tomando como referencia el tipo de hiptesis que permiten contrastar. Con
este criterio, los contrastes podran clasificarse, por ejemplo, en funcin de que permitan com-
parar medias, o comparar proporciones, o estudiar relaciones, etc. Pero lo cierto es que este
criterio, por s solo, no conduce a una clasificacin del todo satisfactoria porque no resulta
muy til a quienes se inician en el anlisis de datos.
Una clasificacin de los contrastes de hiptesis debe servir para cubrir, al menos, estos
dos objetivos: (1) ofrecer una panormica de los contrastes disponibles y (2) ayudar al analista
de datos a elegir el contraste apropiado para cada situacin concreta. Creemos que ambos
objetivos pueden conseguirse fcilmente si el criterio referido al tipo de hiptesis que cada
contraste permite poner a prueba se complementa con otros dos: (1) el nmero de las variables
que intervienen en el anlisis y (2) la naturaleza categrica o cuantitativa de las variables ana-
lizadas6. El Cuadro 8.1 ofrece una clasificacin de los contrastes basada en todos o parte de
estos criterios. Incluye los contrastes disponibles para el anlisis de una y dos variables. En
este volumen estudiaremos algunos de estos contrastes (los marcados en cursiva); el resto los
estudiaremos en el segundo volumen.
En la clasificacin propuesta se utiliza, como primer criterio de clasificacin, el nmero
de variables; a continuacin, la naturaleza categrica o cuantitativa de las variables; por lti-
mo, el tipo de hiptesis que cada contraste permite poner a prueba. Creemos que, de esta ma-
nera, se facilita enormemente la eleccin del contraste apropiado.
Los contrastes disponibles para analizar una sola variable sirven para tomar decisiones
basadas en la comparacin entre un valor muestral y un valor poblacional, o entre una distri-
bucin emprica y una terica. Para analizar una variable categrica se proponen dos con-
trastes. El primero de ellos sirve para hacer inferencias con una variable dicotmica; por
ejemplo, consigue un nuevo tratamiento ms recuperaciones de las que se vienen obteniendo
con el tratamiento convencional? El segundo sirve para analizar una variable politmica; por
ejemplo, ha cambiado en la ltima dcada la proporcin de espaoles con ideologa poltica
de derecha, de centro y de izquierda? Por tanto, para elegir entre los dos contrastes propuestos
para analizar una variable categrica nicamente hay que considerar si la variable tiene dos
categoras o ms. Estudiaremos ambos contrastes en este volumen.

6
No falta quien considera (ver, en el Captulo 1, el apartado Rol de las escalas de medida) que este criterio de clasificacin
es inapropiado. Pero lo cierto es que la naturaleza categrica o cuantitativa de las variables condiciona el tipo de estads-
ticos que permiten obtener informacin til de los datos. Con variables nominales como, por ejemplo, el lugar de nacimiento
no tiene sentido calcular medias: cul es la media de Andaluca, Aragn, Asturias, ..., Valencia? Y con variables cuantitati-
vas como, por ejemplo, la edad no tiene mucha utilidad preguntarse qu porcentaje de sujetos tiene una determinada edad
(si la variable est medida con suficiente precisin, no habr repeticiones o habr muy pocas), es ms til conocer el centro,
la dispersin y la forma de la distribucin. Por tanto, los estadsticos que ofrecen informacin til con variables categricas
no son los mismos que los que ofrecen informacin til con variables cuantitativas. La clasificacin propuesta tiene en
cuenta esta circunstancia incorporando la naturaleza de las variables como un criterio ms.
236 Anlisis de datos (vol. I)

Para analizar una variable cuantitativa se proponen cinco contrastes. Tres de ellos sir-
ven para contrastar hiptesis sobre el centro de una distribucin: es cierto que el peso medio
de los recin nacidos de madres fumadoras no alcanza los 2,5 kg? El cuarto, para contrastar
hiptesis sobre la dispersin de una distribucin: ha cambiado la varianza del peso de los
recin nacidos? Y el quinto, para contrastar hiptesis sobre la forma de la distribucin: pue-
de afirmarse que el peso de los recin nacidos se distribuye normalmente? La eleccin entre
los tres primeros depende del tipo de supuestos que puedan establecerse sobre la forma de la
poblacin muestreada. La prueba T asume que la poblacin muestreada es normal, pero, segn
veremos, este supuesto puede pasarse por alto si el tamao muestral es lo bastante grande.
Cuando es necesario trabajar con muestras pequeas y no puede asumirse que la poblacin
de partida es normal, la prueba de Wilcoxon es una excelente alternativa a la prueba T, pero
exige que la distribucin poblacional de la variable sea simtrica. Si tampoco puede asumirse
poblacin simtrica, puede recurrirse a la prueba de los signos. En este volumen estudiaremos
la prueba T de Student para una muestra.
En lo relativo al estudio de dos variables, estudiaremos contrastes tanto para efectuar
comparaciones como para estudiar relaciones. Para analizar dos variables categricas se pro-
ponen varios contrastes. Para elegir entre ellos hay que prestar atencin, en primer lugar, a
si interesa contrastar la hiptesis de independencia o la de homogeneidad marginal. Supon-
gamos que se pregunta a una serie de personas su opinin sobre la eutanasia y sobre el aborto
(a favor, en contra). El contraste de la hiptesis de independencia (prueba X 2 de Pearson,
odds ratio, etc.) permite estudiar si las personas que estn a favor de la eutanasia tambin
lo estn a favor del aborto. El contraste de la hiptesis de homogeneidad marginal (prueba de
McNemar) permite estudiar si la proporcin de personas que estn a favor de la eutanasia
difiere o no de la proporcin de personas que estn a favor del aborto (la hiptesis de homo-
geneidad marginal slo tiene sentido si las dos variables analizadas tienen las mismas catego-
ras). Para estudiar, no si existen diferencias o relaciones, sino el tamao de las diferencias
o la intensidad de las relaciones, propondremos diferentes medidas de asociacin. Y tambin
prestaremos atencin al acuerdo como un caso especial de la asociacin entre variables. En
este volumen estudiaremos la prueba X 2 de Pearson sobre independencia o igualdad de pro-
porciones.
Para analizar una variable categrica y una cuantitativa se proponen cuatro contrastes:
dos para cuando la variable categrica tiene slo dos niveles (hombres, mujeres; grupo expe-
rimental, grupo control; etc.) y otros dos para cuando la variable categrica tiene ms de dos
niveles (nivel de estudios primarios, secundarios, medios, superiores ; tipo de tratamiento
farmacolgico, mixto, control ; etc.). La eleccin entre cada par de contrastes depende de
si puede asumirse o no que las distribuciones poblacionales son normales y del tamao mues-
tral (si puede asumirse normalidad o el tamao muestral es grande se utiliza la prueba T de
Student y el anlisis de varianza; en caso contrario, la prueba de Mann-Whitney y la prueba
de Kruskal-Wallis). En este volumen estudiaremos la prueba T de Student para muestras in-
dependientes.
Por ltimo, para analizar dos variables cuantitativas se proponen varios contrastes. Tres
de ellos sirven para compararlas: ha disminuido el nivel de depresin de los pacientes tras
aplicar un determinado tratamiento? Los dems sirven para relacionarlas: tiene algo que ver
la inteligencia con el rendimiento? En ambos casos, la eleccin entre los diferentes contrastes
depende de si puede o no asumirse que las distribuciones poblacionales de ambas variables
son normales y del nivel de medida de las variables. En este volumen estudiaremos la prueba
T y el coeficiente de correlacin de Pearson.
Captulo 8. El contraste de hiptesis 237

Cuadro 8.1. Clasificacin de los contrastes de hiptesis para una y dos variables (los contrastes que apare-
cen en cursiva se estudian en este volumen; el resto se estudia en el siguiente volumen)

Una variable categrica:


! Si la variable es dicotmica:
Prueba binomial o contraste sobre una proporcin.
! Si la variable es politmica:
Prueba X 2 de Pearson sobre bondad de ajuste.

Una variable cuantitativa:


! Para estudiar el centro de la distribucin:
Prueba T de Student para una muestra.
Prueba de Wilcoxon para una muestra.
Prueba de los signos para una muestra.
! Para estudiar la dispersin de la distribucin:
Contraste sobre una varianza.
! Para estudiar la forma de la distribucin:
Prueba de Kolmogorov-Smirnov sobre bondad de ajuste.

Dos variables categricas:


! Para contrastar la hiptesis de independencia:
Prueba X 2 de Pearson sobre independencia o igualdad de proporciones.
ndices de riesgo y odds ratio.
! Para contrastar la hiptesis de homogeneidad marginal (tablas 2 2):
Prueba de McNemar.
! Para cuantificar el grado de asociacin:
Medidas de asociacin (variables nominales, variables ordinales, acuerdo).

Una variable categrica y una cuantitativa:


! Si la variable categrica tiene 2 niveles:
Prueba T para muestras independientes.
Prueba U de Mann-Whitney.
! Si la variable categrica tiene ms de dos niveles:
Anlisis de varianza de un factor.
Prueba H de Kruskal-Wallis.

Dos variables cuantitativas:


! Para compararlas:
Prueba T de Student para muestras relacionadas.
Prueba de Wilcoxon para dos muestras.
Prueba de los signos para dos muestras.
! Para relacionarlas:
Coeficiente de correlacin RXY de Pearson.
Coeficientes de correlacin para variables ordinales.