Вы находитесь на странице: 1из 5

10. Relación entre variables nominales.

En muchas ocasiones disponemos de información de variables medidas en escala nominal o


cualitativas, en las que únicamente podemos observar la presencia o ausencia de diferentes
modalidades. Para su análisis recurrimos a las frecuencias, es decir, el número de individuos
que presentan cada una de las categorías o modalidades de la variable.

El primer paso para el estudio de las relaciones que existen entre dos variables de estas
características es la construcción de una tabla de contingencia. Se denomina tabla de
contingencia a la que describe a N individuos simultáneamente en las variables X e Y siendo fij
el número de individuos que presentan a la vez las modalidades de Xi e Yj.

Tabla 1. Tabla de Contingencia

Y1 … Yj … YJ Total
X1 f11 … f1j … f1J f1.


Xi fi1 … fij … fiJ fi.


XI fI1 … fIj … fIJ fI.
Total f.1 … f.j … f.J f..

Utilizaremos la siguiente notación:


𝐽 𝐼

𝑓𝑖. = ∑ 𝑓𝑖𝑗 𝑓.𝑗 = ∑ 𝑓𝑖𝑗


𝑗=1 𝑖=1
A partir de estas frecuencias marginales podemos calcular la frecuencia total o número total
de observaciones.

𝐼 𝐽 𝐼 𝐽

𝑁 = 𝑓.. = ∑ 𝑓𝑖. = ∑ 𝑓.𝑗 = ∑ ∑ 𝑓𝑖𝑗


𝑖=1 𝑗=1 𝑖=1 𝑗=1

En el caso particular de las tablas de 2x2 la notación que se suele utilizar es:

Cat.1 Cat.2 Total


Cat.1 a b a+b
Cat.2 c d c+d
Total a+c b+d N

A partir de estas tablas se pueden calcular los siguientes índices de asociación


Nombre Q de Yule

Utilización Dos variables cualitativas con dos categorías cada una de ellas

ad  bc
Fórmula Q
ad  bc

Oscila entre –1 y 1 (asociación perfecta)


Interpretación
El valor 0 indica independencia
Presenta una definición menos restrictiva que otros coeficientes ya que
Dificultades de
se alcanza el valor 1 cuando una de las casillas es cero, es decir, cuando
interpretación
la asociación perfecta es estricta, implícita o dudosa.
Es invariante ante cambios de escala de filas o columnas, por lo que
Otras puede utilizarse cuando no se trabaja con frecuencias sino con
características proporciones.
Es simétrica.

Nombre Coeficiente de Contingencia


Dos variables cualitativas. Una de ellas, al menos, con más de dos
Utilización
categorías.
2
Fórmula C
2  N
Teóricamente oscila entre 0 y 1.
Interpretación Cero indica independencia y según el valor se acerque a uno indica
mayor grado de asociación.
No siempre alcanza el valor 1 cuando las variables están perfectamente
Dificultades de
asociadas.
interpretación
Sólo se pueden comparar los obtenidos con tablas de igual tamaño.
En tablas cuadradas se puede calcular el Coeficiente de Contingencia
Máximo (Cmáx) y un Coeficiente de Contingencia Ajustado (Cajus):

I 1 C ajus 
C
C máx 
Otras I C máx
características
El coeficiente ajustado proporciona una idea del verdadero grado de
asociación al evaluar la discrepancia entre el valor obtenido y el
máximo que podría alcanzar para la tabla dada.

Para el cálculo del coeficiente de contingencia es necesario calcular previamente 𝜒 2


(ji-cuadrado o chi-cuadrado)

I J ( feij  ft ij ) 2 f i.  f . j
  
2
, donde ft ij 
i 1 j 1 ft ij f ..
Ejemplo de cálculo de Q de Yule.
Nombre Q de Yule

Tipo de Centro
Público Concertado Total

Tabla C.Largo 815 484 1299

Estudios
C.Corto 419 124 543
Total 1234 608 1842

ad  bc
Q
ad  bc

815  124  484  419


Q 
Cálculo 815  124  484  419
101060  202796  101736
   0,335
101060  202796 303856
Q  0,335

La relación entre las variables se puede considerar baja. El signo del


resultado nos indica el sentido de la asociación, es decir, en tablas de 2x2
nos indica qué categorías están asociadas. En este caso la asociación nos
Interpretación
estaría indicando que las categorías asociadas son las de la diagonal b-c, es
decir, estudios de Ciclo Corto con el tipo de centro Público y estudios de
Ciclo Largo con el tipo de centro Concertado.
Ejemplo de cálculo del Coeficiente de Contingencia

Nombre Coeficiente de Contingencia

Estudios del Padre

Expectativas de Univ Bachi Prim Total


Diplomatura 41 223 138 402
Tabla
Licenciatura 247 580 206 1033
estudio

Doctorado 126 227 68 421


Total 414 1030 412 1856

Cálculos Previos Ji-cuadrado = 74,792 g.l. = 4 p = 0,000

2
C
2  N

Cálculos
74,792 74,792
C  
74,792  1856 1930,792

 0,03874  0,197

C  0,197

La relación entre las dos variables es baja. Existe muy poca relación entre los
Interpretación
estudios del padre y la expectativa de estudio de sus hijos.
Ejemplo de cálculo de 2
Nombre 2
TIPCENT Público Privado Total

Diplomatura 307 102 409

Licenciatura 673 375 1048

NIVEST
Doctorado 271 154 425

Total 1251 631 1882


f1.  f .1 409  1251 511659
ft11  ; ft11    271,87
f .. 1882 1882

f1.  f .2 409  631 258079


ft12  ; ft12    137,13
f .. 1882 1882

f 2.  f .1 1048  1251 1311048


ft 21  ; ft 21    696,63
Cálculos Previo f .. 1882 1882

Frecuencias
f 2.  f .2 1048  631 661288
teóricas ft 22  ; ft 22    351,37
f .. 1882 1882

f 3.  f .1 425  1251 531675


ft 31  ; ft 31    282,50
f .. 1882 1882

f 3.  f .2 425  631 268175


ft 32  ; ft 32    142,50
f .. 1882 1882

Frecuencias teóricas
TIPCENT
Público Privado Total
Diplomatura 271,87 137,13 409
Licenciatura 696,63 351,37 1048
NIVEST

Doctorado 282,50 142,50 425


Total 1251 631
Cálculos
Sumandos de 2
TIPCENT
Público Privado l
Diplomatura 4,5394 8,9996

Licenciatura 0,8015 1,5892


NIVEST

Doctorado 0,4681 0,9281

2 = 4,5394 + 8,9996 + 0,8015 + 1,5892 + 0,4681 + 0,9281


Cálculo final
2 = 17,3259

Вам также может понравиться