Вы находитесь на странице: 1из 34

SOCIOESTADSTICA TEMA: Asociacin bivariada (Chi cuadrado).

Osvaldo Blanco, Socilogo Magster Cs. Sociales U. de Chile

Asociacin bivarida

Cuando hablamos de asociacin bivariada estamos diciendo que existen dos variables que afectan mutuamente sus distribuciones.

La asociacin entre 2 variables muchas veces viene precedida de nuestro marco terico, pues en l hemos relacionado al menos 2 variables, sealando a una como variable independiente y a otra como variable dependiente.
Existen distintos tipos de estadsticos que nos ayudan al estudio de la asociacin de las variables en las muestras. Si estamos en el caso de variables cuantitativas continuas los estadsticos apropiados sern la correlacin producto momento de Pearson y el coeficiente de regresin. Si las dos variables son cualitativas (nominal u ordinal), el contraste de chi-cuadrado es el ms apropiado y el que ms se usa. As como los coeficientes relacionados a ste (coeficiente de contingencia, el coeficiente Lambda y los coeficientes Phi y V de Cramer,). Las variables ordinales tambin tienen sus propios coeficientes de asociacin: Gamma de Goodman y Kruskal, d de Somers, Tau-a de Kendall, Tau-b de Kendall, rho de Spearman, entre otros.
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Asociacin bivariada

Las asociaciones bivariadas se pueden estudiar a partir de los siguientes criterios (Garca ferrando):
La existencia de la asociacin La fuerza de la asociacin La direccin de la asociacin. La naturaleza de la asociacin.

Los distintos estadsticos existentes se emplean para determinar cada uno de estos criterios.

En este sentido, la prueba de hiptesis basada en el estadstico chi-cuadrado (x2) nos seala si existe o no asociacin bivariada. Es decir, el x2 nos da cuenta de la existencia de la asociacin.
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

La prueba Chi-cuadrado para la asociacin bivariada.

Tipologa de pruebas Chi-cuadrado

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada.

Cuando construimos una tabla de contingencia precisamente lo que hacemos es cruzar 2 variables y analizar la distribucin conjunta de ambas variable en los cruces de sus distintas categoras.

Count EDAD Es t Cesante Total S No joven 45 39 84 adulto 274 126 400 Total 319 165 484

Lo que hacemos en la prueba de chi-cuadrado de asociacin es probar si existe una relacin de asociacin o, por el contrario, si existe independencia entre 2 variables de escala nominal u ordinal.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Las Hiptesis en la prueba Prueba Chicuadrado para la asociacin bivariada.

Si tenemos en cuenta que la investigacin sociolgica viene fundamentada por un marco terico donde, por lo general, queremos contrastar una hiptesis que seala la dependencia de una variable respecto de otra, se podr decir entonces trabajamos con dos tipos de hiptesis:

H0 = No existe asociacin entre las dos variables (son variables independientes) H1 = Existe asociacin entre las dos variables (ambas variables estn relacionadas).

La H0 dir que lo que observamos en la muestra se debe al azar y que cualquier asociacin entre las variables no es estadsticamente significativa. En cambio, la H1 nos dir que lo que observamos en nuestra muestra s es estadsticamente significativo y, por tanto, no se debe a un error causado por el azar.
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada.

Cuestiones centrales de la prueba chicuadrado (a no olvidar):


1. El nivel de medicin de ambas variables es nominal u ordinal (si estuviramos trabajando variables intervalo o razn debemos reducirlas a ordinales). La prueba contrasta la H0, la cual dice que las dos variables son independientes. Cuanto mayor es el estadstico x2 y menor su grado de significacin (Asymp.Sig) ms probable que exista relacin/dependencia entre ambas variables, por tanto, mayor probabilidad de rechazar la H0. Admitiremos una relacin significativa entre ambas variables (esto es, rechazaremos H0 y aceptaremos H1) cuando el grado de significacin del estadstico x2 obtenido en la prueba sea menor que nuestro nivel de significacin (0.05 0.01).

2.
3.

4.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada.


Otros conceptos que se deben tener en cuenta son:
1. Residuos: Son las diferencias (restas) entre frecuencias observadas y esperadas. Forman parte de la frmula de clculo del x2. Grados de libertad (df): Nmero de categoras (k) de la variable menos 1, esto es: k 1.

2.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada.

Cuando vimos la prueba chi-cuadrado para una muestra decamos que sta trabaja con las frecuencias de cada casilla, contraponiendo las frecuencias observadas con las frecuencias esperadas. En la prueba chi-cuadrado de asociacin tambin operamos con la comparacin entre las frecuencias observadas y las frecuencias esperadas. De hecho, la frmula es la misma que en la prueba Chi-cuadrado para una muestra, a saber:

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada.

La nocin de frecuencia esperada est relacionada con la H0 en el sentido de que son frecuencias que cabra esperar en el caso de que ambas variables no estn relacionadas, es decir, sean independientes.
En este sentido, al comparar las frecuencias observadas (es decir, la distribucin de frecuencias obtenidas en mi muestra) con las frecuencias esperadas (las que cabra esperar an caso de independencia entre ambas variables), la prueba Chi-cuadrado establece si existen diferencias significativas. Es decir, la prueba Chi-cuadrado nos dice si las frecuencias observadas son diferentes de lo que pudiera esperarse en caso de ausencia de asociacin. Esto significa que la nocin de frecuencia esperada en este caso es la de una distribucin de absoluta independencia entre ambas variables.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada.


Recordemos que el Chi-cuadrado se calcula como la diferencia entre lo observado y lo esperado para cada casilla o celda. La frecuencia esperada de cada casilla se calcula a travs de la siguiente frmula:

Para la siguiente tabla, la frecuencia observada de la casilla jove-cesante es 45, mientras que su frecuencia esperada sera:
Count

fe =

319

84

EDAD

= 55.36

484

Est Cesante Total

S No

joven 45 39 84

adulto 274 126 400

Total 319 165 484

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba Chi-cuadrado para la asociacin bivariada

1.
2. 3. 4. 5. 6.

El clculo de chi-cuadrado realizado de forma manual implica los siguientes pasos:


Calcular para cada casilla de frecuencia observada su correspondiente frecuencia esperada. Luego, restar la frecuencia observada con la frecuencia esperada correspondiente. Elevar el resultado al cuadrado. Dividir el resultado por la frecuencia esperada. Sumar cada resultado de la divisin de la resta entre O y E al cuadrado por E.
Calcular los grados de libertad (gl), el nivel de significacin y determinar si el valor x2 obtenido es o no significativo.

Esto quiere decir que para el caso de la tabla recin expuesta obtendremos los siguientes clculos:

x2 = 7
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba chi-cuadrado sin SPSS

El estadstico x2 se calcula a partir de la suma de

(O E) 2
E

Por lo tanto, el valor de x2 ser igual a 2.03 + 3.75 + 0.4 + 0.82 = 7 El siguiente paso sera calcular los grados de libertad (gl) mediante la frmula: gl = (filas 1) (columnas 1) En nuestro caso, los grados de libertad son: gl = (2 1) (2 1) = 1

Luego, deberamos ir a la tabla de distribucin de chi-cuadrado que vienen en todos los libros de estadstica eligiendo con anterioridad nuestro nivel de significacin (0.05 0.01). Si nuestro valor calculado de x2 es igual o superior al de la tabla concluimos que las variables estaran relacionadas (x2 fue significativa).

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba chi-cuadrado sin SPSS

En efecto, vamos a una tabla de distribucin del estadstico chicuadrado y nos damos cuenta de que para que un valor x2 obtenido sea significativo a un nivel de significacin de 0.05 con 1 grado de libertad el valor debe ser igual o mayor que 3.841. Nuestro valor x2 obtenido es de 7, por tanto, es significativo o, lo que es lo mismo, existe asociacin entre ambas variables. Si bien el chi-cuadrado se calcula de la misma forma manualmente que en SPSS, la lgica del contraste de la significancia de nuestro valor x2 obtenido es muy distinto entre ambos procedimientos.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba chi-cuadrado con SPSS


Por ello, el procedimiento anterior no es necesario que Ud. se lo aprenda.
Chi-Square Te s ts A sy mp. Sig. (2-s ided) .009 .013 .010 Ex ac t Sig. (2-s ided) Ex ac t Sig. (1-s ided)

Pearson Chi-Square a Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by -Linear A ss ociation N of V alid Cas es

V alue 6.886b 6.237 6.650

df 1 1 1

.011 6.871 484 1 .009

.007

a. Computed only f or a 2x 2 table b. 0 cells (.0%) hav e ex pec ted count less than 5. The minimum expected c ount is 28.64.

Lo que s debe aprender es el contraste en SPSS. De todos los estadsticos y sus respectivas significancias Ud. debe preocuparse del Pearson Chi-Square (Chi-cuadrado de Pearson), el cual tiene un valor de 6.886, un grado de libertad y una significancia o probabilidad de cometer el error tipo I de 0.009 (0.9%) Como 0.009 es menor que 0.05 (e incluso menor que 0.01) concluimos que la edad y el estar cesante estn relacionados. Es decir, rechazamos H0 pues 0.009 es menor que el nivel de significacin previamente establecido (0.05).
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Prueba chi-cuadrado con SPSS


Chi-Square Te s ts A sy mp. Sig. (2-s ided) .009 .013 .010 Ex ac t Sig. (2-s ided) Ex ac t Sig. (1-s ided) V alue 6.886b 6.237 6.650 df 1 1 1

Pearson Chi-Square a Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by -Linear A ss ociation N of V alid Cas es

.011 6.871 484 1 .009

.007

a. Computed only f or a 2x 2 table b. 0 cells (.0%) hav e ex pec ted count less than 5. The minimum expected c ount is 28.64.

Volvemos a repetir: en el presente ejemplo la significacin del valor del x2 obtenido (Asymp.Sig. 2 sided = 0.009) es menor que 0,05.

Cuando la significacin de nuestro valor x2 obtenido es menor que el nivel de significacin previamente establecido por nosotros, entonces rechazamos H0 (por tanto, aceptamos H1 y concluimos que existe asociacin bivariada). En cambio, cuando la significacin de nuestro valor x2 obtenido es mayor que el nivel de significacin previamente establecido por nosotros, entonces aceptamos H0 (por tanto, concluimos que no existe asociacin bivariada o, lo que es lo mismo, ambas variables son independientes).

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Requisitos a satisfacer para aplicar la prueba chi-cuadrado

Tanto el estadstico x2 como su probabilidad se distorsionan si la tabla de contingencia no cumple 2 condiciones:

1.

2.

No debe existir ms de un 20% de casillas inferiores a 5. En otras palabras, se aceptan casillas menores a 5, siempre que stas no alcancen ms de 20% del total. Por otra parte, por ningn motivo puede haber una casilla con una frecuencia esperada inferior a 1.

Cuando ello sucede, el SPSS nos avisa inmediatamente: Chi-Square Te s ts


V alue 26.580 a 27.686 11.292 484 df 16 16 1 A sy mp. Sig. (2-s ided) .046 .034 .001
En este ejemplo, se violaron las 2 reglas. Por tanto, el anlisis est viciado.

Pearson Chi-Square Likelihood Ratio Linear-by -Linear A ss ociation N of V alid Cases

a. 13 c ells (38.2%) have expected c ount less than 5. The minimum ex pec ted count is .17.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Requisitos a satisfacer para aplicar la prueba chi-cuadrado

Eso suele ocurrir cuando el nmero de casillas es muy grande, pues muchas de stas quedan vacas o, en su defecto, con muy frecuencias observadas y esperadas muy bajas. La solucin es anular o bien agrupar categoras con el fin de obtener valores ms altos (se recomienda la recodificacin).

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo 1: Ejemplo de prueba x2 donde rechazamos H0 (existencia de asociacin bivariada)

Ejemplo de prueba x2 donde rechazamos H0 (existencia de asociacin bivariada)

Imaginemos que queremos estratificar a algunos alumnos de la universidad y dos de los criterios son la zona de residencia (urbano rural) y el nivel educativo de los padres (E. Bsica, E. Media, E. Superior). Tendramos entonces 2 variables (en este caso una nominal y otra ordinal): zona de residencia y nivel educativo padres.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo de prueba x2 donde rechazamos H0


zona residencia RURAL URBANO 19 10.9% 44 22 25.1% 12.6% 3 57 1.7% 32.6% 30 17.1% 66 109 37.7% 62.3%

Es tudios del padre

Sin estudios Educ . Bsica Educ . Media Educ . Superior

Total

Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total

Total 19 10.9% 66 37.7% 60 34.3% 30 17.1% 175 100.0%

De esta forma, la lectura de la tabla de contingencia nos seala que 10.9% del total de alumnos que tienen padres sin estudios que viven en zonas rurales. Mientras eso sucede, en la zona urbana no se encuentran casos de padres sin estudios. Otra relacin interesante de observar en este ejemplo ficticio, es que los padres que slo tienen una escolaridad de E. Bsica son el doble en las zonas rurales (25.1%) respecto de las urbanas (12.6%), cuestin que se invierte de manera notable cuando el nivel de escolaridad es la E. Media, donde apenas un 1.7% de padres rurales llegan a este nivel frente a 32.6% de padres residentes en zonas urbanas. Por ltimo, no existen padres residentes en zonas rurales que hayan logrado llegar a la E.superior, mientras que un 17.1% de los padres de zonas urbanas tienen este nivel de escolaridad.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo de prueba x2 donde rechazamos H0


Es tudios del padre Sin estudios Educ . Bsica Educ . Media Educ . Superior Total Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total zona residencia RURAL URBANO 19 10.9% 44 22 25.1% 12.6% 3 57 1.7% 32.6% 30 17.1% 66 109 37.7% 62.3% Total 19 10.9% 66 37.7% 60 34.3% 30 17.1% 175 100.0%

Todo ello nos llevara concluir que existira una diferencia significativa entre vivir en determinada zona (urbano rural) y alcanzar determinado nivel educativo (E. Bsica, E. Media, E. Superior). En este sentido, podramos decir que la zona de residencia es una variable independiente que afecta la distribucin del nivel educativo (variable dependiente). No obstante, cabe preguntarse: Podemos estar seguros de que estadsticamente hablandohay una relacin entre el vivir en una determinada zona y alcanzar determinado nivel de estudios?

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo de prueba x2 donde rechazamos H0


Estamos frente a un problema en donde lo que queremos probar es si existe independencia o asociacin entre 2 variables cualitativas o no mtricas (zona de residencia y nivel de escolaridad padres). Una de las variables establece grupos a comparar respecto de la otra variable: la variable independiente (zona de residencia) establece dos grupos (padres urbanos y padres rurales) que se diferencian en funcin de la variable dependiente (nivel educativo).
zona residencia RURAL URBANO 19 10.9% 44 22 25.1% 12.6% 3 57 1.7% 32.6% 30 17.1% 66 109 37.7% 62.3% Total 19 10.9% 66 37.7% 60 34.3% 30 17.1% 175 100.0%

Es tudios del padre

Sin estudios Educ . Bsica Educ . Media Educ . Superior

Total

Count % of Total Count % of Total Count % of Total Count % of Total Count % of Total

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo de prueba x2 donde rechazamos H0


Valor del x2 obtenido
Chi-Square Te s ts A sy mp. Sig. (2-s ided) .000 .000 V alue 100.431a 124.085 175 df 3 3

Pearson Chi-Square Likelihood Ratio N of V alid Cases

a. 0 cells (.0%) have ex pected count less than 5. The minimum ex pec ted count is 7.17.

En este ejemplo son 3 los grados de libertad

Significacin del x2 obtenido. Este significacin se compara con el nivel de significacin previamente establecido por el investigador (por lo general es 0,05 0,01).

Todo el anlisis de la tabla de contingencia nos permite dar cuenta de una hiptesis: la zona de residencia afecta la distribucin del nivel educativo.
Es una H1, pues establece que ambas variables estn asociadas.

Por otra parte, sabemos que en todas las pruebas de hiptesis (chi-cuadrado tambin) la hiptesis que se somete a prueba es la hiptesis nula (H0).
Recordemos que la H0 sostiene que las variables son independientes (no existe asociacin bivariadas).

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo de prueba x2 donde rechazamos H0

Chi-Square Te s ts Asy mp. Sig. (2-s ided) .000 .000

Pearson Chi-Square Likelihood Ratio N of Valid Cases

Value 100.431a 124.085 175

df 3 3

a. 0 cells (.0%) have ex pected count less than 5. The minimum ex pec ted count is 7.17.

Para someter a contraste la H0 vemos la significacin del chi-cuadrado obtenido (0.000). Claramente es menor que nuestro nivel de significacin (0,05 e, incluso, menor que 0,01).

Por lo tanto rechazamos H0 y concluimos que existe asociacin bivariada.


Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo 2: Ejemplo de prueba x2 donde aceptamos H0 (las 2 variables son independientes)

Ejemplo de prueba x2 donde aceptamos H0


re ligin * EDAD Cross tabulation EDAD religin catlico ev anglic o Total Count % of Total Count % of Total Count % of Total joven 47 9.7% 37 7.6% 84 17.4% adulto 251 51.9% 149 30.8% 400 82.6% Total 298 61.6% 186 38.4% 484 100.0%

Imaginemos que estamos estudiando si existe relacin entre la edad (joven adulto) y el tipo de religin profesada (catlica evanglica).
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Ejemplo de prueba x2 donde aceptamos H0


Chi-Square Te s ts A sy mp. Sig. (2-s ided) .244 .298 .247

Significacin del x2 obtenido = 0.244


Ex ac t Sig. (2-s ided) Ex ac t Sig. (1-s ided)

Pearson Chi-Square a Continuity Correction Likelihood Ratio Fisher's Exact Test Linear-by -Linear A ss ociation N of V alid Cas es

V alue 1.356b 1.084 1.339

df 1 1 1

.268 1.353 484 1 .245

.149

a. Computed only f or a 2x 2 table b. 0 cells (.0%) hav e ex pec ted count less than 5. The minimum expected c ount is 32.28.

Independiente de la lectura de la tabla de contingencia, vmonos inmediatamente al contraste propiamente tal. Vemos que la significancia del valor chi-cuadrado obtenido es 0.244. En tanto 0.244 es claramente ms alto que 0,05 tenemos una probabilidad muy alta de cometer el error tipo I si nos atrevemos a rechazar H0. De hecho, la probabilidad de cometer el error tipo I es muy alta (24.4%).

Por lo mismo, aceptamos H0 y concluimos que las dos variables son indpendientes.
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

TABLAS DE FRECUENCIAS Y PRUEBA CHI-CUADRADO EN SPSS.

Para obtener una tabla de contingencia y un contraste chi-cuadrado de asociacin debemos ir al men Analizar (Analyce) Estadsticos Descriptivos (Descriptive Statistics) Tablas de contingencia... (Crosstabs...). Obtendr el presente cuadro de dilogo.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

TABLAS DE FRECUENCIAS Y PRUEBA CHI-CUADRADO EN SPSS.

Pase las dos variables en Filas y Columnas, segn corresponda.


Luego, haga clic en la pestalla Casillas de la parte de debajo del cuadro.

Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

TABLAS DE FRECUENCIAS Y PRUEBA CHI-CUADRADO EN SPSS.

Elija Frecuencias Observadas y Esperadas. Tambin debiera elegir porcentajes en los 3 sentidos que vimos hoy ( Fila, Columna, Total) Por ltimo, en cuanto a los residuos, haga clic en No tipificados. ....Continuar...
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

TABLAS DE FRECUENCIAS Y PRUEBA CHICUADRADO EN SPSS.

Volver a la ventana de las tablas de contingencia. Ahora aprete en la pestaa Estadsticos ubicada en la parte de abajo del cuadro.
Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

TABLAS DE FRECUENCIAS Y PRUEBA CHI-CUADRADO EN SPSS.

Elija el estadstico Chi-cuadrado. ...Continuar....


Osvaldo Blanco Socilogo Magster Cs. Sociales U. de Chile

Вам также может понравиться