Академический Документы
Профессиональный Документы
Культура Документы
7.1 INTRODUCCIÓN
Ejemplos de este tipo de variables pueden ser el sexo, el nivel socio-cultural, etc. En
este caso tendríamos, a lo sumo, las observaciones agrupadas en forma de
frecuencia, dependiendo de las modalidades que presente cada paciente en cada una
de las variables.
El objetivo de este tema es el estudio de este tipo de cuestiones en relación con las
variables cualitativas (y también variables aleatorias discretas o continuas agrupadas
en intervalo).
1
En inglés, “chi-squared”, por eso puede encontrarse también la expresión “chi-cuadrado” en castellano,
incluidos los resultados de SPSS. El nombre correcto en español de la letra X es ji.
Estos son los contrastes asociados con el estadístico ji-cuadrado. En general este
tipo de tests consisten en tomar una muestra y observar si hay diferencia significativa
entre las frecuencias observadas y las especificadas por la ley teórica del modelo que
se contrasta, también denominadas “frecuencias esperadas”.
La ji cuadrado tiene como primera utilidad hacer una comparación, dentro de una
sola variable categórica, para comprobar si la distribución observada se corresponde
con una distribución teóricamente esperada.
Ejemplo 7.1:
Supongamos que realizamos una encuesta a 20 universitarios donde el 45% (9) son
mujeres y el 55% (11) son hombres. En este caso, existe una sola variable (sexo) que
es cualitativa y dicotómica.
H0: la muestra procede de una población donde el 50% son hombres y el 50%
mujeres ( esperada observada )
H1: esperada observada
Lo ESPERADO sería que el 50% fuesen hombres (10) pero lo son el 55% (11), luego
hay una diferencia entre lo observado y lo esperado de 11-10=1.
Para las mujeres también existe una diferencia (9-10= -1) entre lo observado (9) y lo
esperado (10).
observado esperado 2
2
esperado
2
Como las hipótesis se plantean siempre a nivel de población, se usa π en vez de p.
3
La estimación de la variabilidad aleatoria (“error”) es precisamente lo esperado (denominador de la X2).
El numerador es lo que quedaría sin explicar si la H0 fuese cierta.
07. Inferencia paramétrica: relación entre dos variables cualitativas 3 - 10
Diplomado en Salud Pública
2. Metodología en Salud Pública
Lo primero que tenemos que calcular son los grados de libertad. Como la variable
tiene dos categorías (k=2) y los grados de libertad son k-1, tendremos 1 grado de
libertad.
Como el valor que hemos hallado es 0,2 y la ji cuadrado con un grado de libertad no
es significativo hasta que no llega a valer 3,84 (p=0,05), se puede afirmar que la
prueba ji cuadrado ha resultado no significativa (p > 0,05).
X2 3,84 5,02
p 0,05 0,025
4
El p-valor lo podemos obtener directamente con un software estadístico (lo veremos con SPSS).
07. Inferencia paramétrica: relación entre dos variables cualitativas 4 - 10
Diplomado en Salud Pública
2. Metodología en Salud Pública
Condiciones de aplicación:
Obtenidas las frecuencias esperadas para cada casilla, la ji cuadrado tiene la misma
expresión que antes, pero ahora cuenta con cuatro términos, uno por cada casilla.
observado esperado 2
2
esperado
Condiciones de aplicación:
Veamos los pasos que debemos seguir para realizar este test con el siguiente
ejemplo.
Ejemplo 7.2:
Calculamos los valores esperados partiendo de la tabla anterior pero sólo con los
valores totales de las filas y las columnas (a estos valores totales se les llama en
estadística “marginales”). Se multiplica el total de la fila por el total de la columna y se
divide por el total de observaciones.
TOTAL 35 50 85
De manera que, pueden calcularse los otros 3 esperados mediante restas con el total
de la respectiva fila o columna:
Figura 7.2
Conclusión:
Como el valor calculado ji-cuadrado =5,16 está entre ji-cuadrado 1; 0.025= 5,02 y ji-
cuadrado 1; 0.01=6,63, podemos afirmar que la diferencia es estadísticamente
significativa, tenemos evidencias para rechazar la H0 ya que le corresponde un
valor p < 0,05.
Podemos decir que existe una asociación estadísticamente significativa entre ser
fumador y la incidencia de cáncer de piel en ancianos (se puede afirmar que existen
evidencias de un mayor riesgo de cáncer de piel entre fumadores).
No vamos a entrar en el desarrollo del test exacto de Fisher ya que tiene las mismas
utilidades que la ji cuadrado en tablas de contingencia.
5
Una alternativa es usar Excel, que con la expresión =DISTR.CHI (valor de chi; grados de libertad) nos
devuelve el valor p.
07. Inferencia paramétrica: relación entre dos variables cualitativas 7 - 10
Diplomado en Salud Pública
2. Metodología en Salud Pública
Realmente, el test exacto de Fisher no tiene requisitos de aplicación. Por tanto, al ser
un método más exacto, siempre se puede utilizar para comparar proporciones (incluso
cuando todos los valores esperados sean iguales o superiores a 5).
Cuando se pida a SPSS una ji cuadrado para una tabla 2x2, siempre calculará el test
exacto de Fisher, que es válido siempre en este tipo de tablas. Además, SPSS nos
señalará siempre cuántas casillas tienen una frecuencia esperada inferior a 5.
En las tablas que tengan más de cuatro casillas, al menos el 80% de los valores
esperados deben ser superiores o iguales a 5.
Figura 7.4
Figura 7.5
Interpretación: