Вы находитесь на странице: 1из 11

PSICOESTADSTICA

MODULO 5 ASOCIACIN VARIABLES CUALITATIVAS


OBJETIVOS ESPECFICOS

Comprender la importancia de relacionar dos variables cualitativas.

Valorar la utilidad de la informacin que suministra la asociacin de variables cualitativas.

Calcular e interpretar los coeficientes para variables nominales y ordinales.

CONTENIDOS TEMTICOS
5. Coeficiente para variables cualitativas nominales.
5.1 Coeficiente de Q de Yule: Fundamento, Formula, Calculo, Propiedades.
5.2 Coeficiente X2: Fundamento, Formula, Calculo, Propiedades.
5.3 Coeficiente C de contingencia: Fundamento, Formula, Calculo, Propiedades
5.4 Coeficiente de asociacin para variables cualitativas ordinales: Coeficiente Ro
de Sperman. Fundamento, Formula, Calculo, Propiedades

Antes de comenzar vamos a reflexionar sobre


cundo podremos aplicar toda la informacin
que aprenderemos en este mdulo.
La palabra clave de este mdulo es: para Variables Cualitativas .
Seguimos haciendo referencia a los conceptos de variables que vimos en el tema 1.
Las variables cualitativas se clasifican en dicotmicas cuando puede asumir dos estados
posibles como ser:
Sexo: Varn Mujer.
Vidente No vidente.
O Policotmica como ser:
Estado Civil: soltero, casado, viudo, separado.
Lengua Extrajera que conoce: ingles, francs, alemn, etc.
Tambin debe recordar cuales son las escalas de clasificacin de las variables cualitativas:
Nominal o de clasificacin y
Ordinal o jerrquicas.
Veamos algunos ejemplos:
Para nominal: nacionalidad, deporte que practica, ocupacin, lugar de nacimiento.
Para ordinal: puesto en el campeonato de ftbol, lugar en el cuadro de honor, cargo
que ocupa en la escuela.
Si ya tiene presente estos conceptos entonces

Comencemos!
5. COEFICIENTE PARA VARIABLES CUALITATIVAS
Existe una serie de tcnicas estadsticas que nos permiten detectar:
a) la existencia de correlacin y
b) la intensidad de la correlacin.
Por correlacin se entiende el grado de relacin o asociacin entre 2 o ms variables cualitativas y la intensidad de la relacin de las mismas. Por ejemplo: muchas veces abra escuchado decir el nio estaba jugando muy bien hasta que lleg su mam y se puso molesto.
Qu quiere decir esto?, que la presencia de la madre altera el comportamiento del nio
sobre todo cuando hay algn problema de relacin madre-hijo. Lo importante es poder encontrar el grado de asociacin que hay entre estas dos variables, que no se pueden medir
con nmeros.
Desde el punto de vista estadstico estos coeficientes estudian el grado de dependencia
entre dos variables cualitativas.
Para ello nos ayudaremos con los cuadros de doble entrada. Es decir para la presentacin
de las observaciones correspondientes a dos variables se utiliza un cuadro que nos permita
colocar en la primera hilera las categoras de una de las variables y en la primera columna

las categoras de la segunda variable, ubicando en el cuerpo de la tabla, en cada una de las
celdas las observaciones correspondientes al resultado de la interseccin de ambas variables y en la ltima columna y fila se colocan los subtotales de cada sub-categora y el total
general, en el cruce de estas dos. Como lo vimos en la unidad 2.
Lo vemos con un ejemplo:
Sexo

Tipo de ocupacin de los tutores de la Escuela

Varones
Mujeres

Sin trabajo
187
246

Independiente
466
313

En relacin de dependencia
638
459

Total

433

779

1097

Total
1291
1018
2309

5.1 COEFICIENTE Q DE YULE:


FUNDAMENTO
Se trata de un coeficiente que mide la asociacin de dos variables cualitativas dicotmicas. Se debe tener la precaucin que este coeficiente se basa en la premisa de independencia entre las variables que estemos estudiando. Para ello se debe tener la precaucin
de que la premisa de independencia ocupe la primera celda de la interseccin como muestra
el esquema del dibujo.
Variable X
Variable X1
Variable X2
Total

Variable Y
Variable Y1
Variable Y2
1 celda

Total

Lo que se pretende decir es que:


Si la variable X la establecemos como la consigan Fuma: X1 es Si y X2 es NO.
Si la Variable Y es Padece de enfermedades pulmonares: Y1 Si y Y2 No.
Nuestro objetivo de estudio, o hiptesis de estudio o premisa debe ser: las enfermedades
pulmonares se manifiestan independientemente de que el individuo sea fumador o no.
Recuerde que dijimos que Q trabajo bajo el supuesto de independencia.
El acto de fumar es independiente al de enfermarse.
FORMULA
Para poder aplicar la frmula nombraremos a las celdas con las letras:
A: X1, Y1
B: X1, Y2
C: X2, Y1
D: X2, Y2

Variable X
Variable X1
Variable X2
Total

Variable Y
Variable Y1
Variable Y2
A
B
C
D
A+C
B+D

Total
A+B
C+D
A+B+C+D

De esta manera expresaremos que el coeficiente Q de Yule ser:


Q = AD BC
AD + BC
Es decir: la resta de los productos de los extremos divido la suma de los productos de los
extremos.
CALCULO
Fuma
Si
No
Total

Padece enfermedades
pulmonares
Si
NO
120
67
48
39
168
106

Total
187
87
274

Q = (120.39) (67. 48) = 4680 3216 = 1464 = 0,1854


(120.39) + (67. 48)

4680 + 3216

7896

Ahora bien qu nos quiere decir este resultado?


INTERPRETACIN
El coeficiente Q puede tomar valores entre -1 y 1

Cuando Q toma valor:


-1 significa existe una perfecta relacin inversa, es decir que la presencia de una de las
variables anula o inhibe por completo la presencia de la otra variable.
Prximos a -0,75 existe una fuerte relacin inversa
Prximos a -0,50 existe una moderada relacin inversa
Prximos a -0,25 existe una dbil relacin inversa
0 no existe relacin entre las variables. Esto quiere decir la presencia de una de las variables no altera en absoluto el comportamiento de la otra variable.
Prximos a 0,25 existe una dbil relacin directa
Prximos a 0,50 existe una moderada relacin directa
Prximos a 0,75 existe una fuerte relacin directa
1 significa existe una perfecta relacin directa, es decir que la presencia de la variable
independiente afecta directamente la presencia de la otra variable.

Aclaracin:
Desde el punto de vista lgico la premisa debera ser: los fumadores son ms propensos a
enfermedades pulmonares.
Pero el coeficiente Q parte de premisas independientes, por lo que se debe suponer que el
fumar no afecta a enfermedades pulmonares, al darme un valor 0 (cero) o muy cerca de 0
(cero) quiere decir: no hay relacin entre lo que el investigador supone como independiente por lo tanto se concluye que lo que el investigador dice en el supuesto no se cumple.
La premisa de que:
Las enfermedades pulmonares nada tienen que ver con el fumar es falso.
No se cumple la premisa o hiptesis.
Al ser falsa la premisa anterior su negacin se convierte en verdadero.
No es cierto que las enfermedades pulmonares son independientes del individuo
fumador o lo que es lo mismo las enfermedades pulmonares estn relacionada con el individuo fumador.
Retomando el resultado del ejercicios cuyo valor dio 0,1854 (que lo puede redondear a
0,19), ubquelo en la grfica y
Puede observar que cae en la franja de NO EXISTE RELACIN entre las variables establecidas como premisa.
5.2 COEFICIENTE X 2 (CHI)
FUNDAMENTO
Se trata de una prueba estadstica que nos permite comparar los resultados obtenidos en
una experiencia real con los resultados tericos de acuerdo a una distribucin de hiptesis
terica. De este modo nos permite conocer con un nivel de probabilidad o significacin determinado si los resultados experimentales concuerdan o no con los esperados tericamente segn los valores asignados en la tabla de X 2. En este sentido y comparando con el valor de la tabla, lo nico que se hace es rechazar o no la hiptesis de nulidad.
Particularmente en este curso veremos X 2 como prueba de independencia. Con esto queremos decir que estudiaremos el nivel de independencia que existe entre ciertas variables
cualitativas o si existe algn grado de relacin o asociacin entre ellas que hacen variar sus
resultados.
X 2 COMO PRUEBA DE INDEPENDENCIA
Trabaja con variables cualitativas con ms de dos clasificaciones, como deporte que practica, por ejemplo.
Esta prueba nos permite comprobar si existe entre las variables total independencia o si por
el contrario es probable que estn asociadas y la presencia de una de ellas condiciona a la
otra variable.
FORMULA
Para explicar mejor su clculo volveremos a nuestro ejemplo de ocupacin de los tutores.

Sexo

Tipo de ocupacin de los tutores de la Escuela

Varones
Mujeres

Sin trabajo
187
246

Independiente
466
313

En relacin de dependencia
638
459

Total

433

779

1097

Total
1291
1018
2309

El estudio consiste en indagar si la condicin de gnero es totalmente independiente a tener


o no trabajo. Es decir nos interesa saber si el hecho de ser mujer no influye a la hora de
buscar trabajo. (Esto podramos determinarlo como la hiptesis)
La formula que utilizaremos es:
X 2 = (Fo - Ft )2
Ft
En donde:
Fo = frecuencias de los hechos observados o hallados.
Ft = frecuencia terica esperada para una determinada hiptesis o modelo de distribucin.
Las frecuencias Fo son las que estn en la tabla (las podemos obtener de encuestas realizadas a los tutotes, por ejemplo). Las frecuencias que hay que calcular son las Ft.
Y estas se calculan multiplicando ambas frecuencias marginales o (subtotales de cada celda) y se las divide por el total general
CALCULO
Ft = sub-tot marginal de columna * sub-tot marginal de fila =
Total Gral
Para la primera celda, varones sin trabajo, los subtotales son 1291 y 433 entonces:
1291*433 = 242,10
2309

Completamos (con verde) en la tabla

Continuamos calculando para las otras celdas


1291*779= 435,55
2309
Sexo

1291*1291= 613,35
2309
Tipo de ocupacin de los tutores de la Escuela

Varones
Mujeres

Sin trabajo
187 242,10
246 190,90

Independiente
466 435,55
313 343,44

En relacin de dependencia
638
613,35
459
483,65

Total

433

779

1097

Total
1291
1018
2309

Para las mujeres ser


433 * 1018 =
2309

190,90

779 * 1018 =
2309

343,44

1097 * 1018 =
2309

483,65

Luego aplicando la frmula tendremos


X 2 = (Fo - Ft )2
Ft
X2 =

(187 242,10) 2 + (466 435,55) 2 + (638 613,35) 2 +


242,10
435,55
613,35
(246 190,90) 2 + (313 343,44) 2 + (459 483,65) 2 =
190,90
343,44
483,65

X2 =

X2 =

X2 =

(-55,10) 2 + (30,45) 2 + (24,65) 2 + (55,10) 2 + (-30,44) 2 + (-24,65) 2 =


242,10
435,55
613,35 190,90
343,44
483,65
3036,01 + 927,20 + 607,62 + 3036,01 + 926,59 + 607,62 =
242,10
435,55
613,35
190,90
343,44
483,65
12,54 + 2,12 + 0,99 + 15,90 + 2,69 + 1,25 = 35,49

INTERPRETACIONES
Para saber si este valor es representativo o no tenemos que ayudarnos con una tabla, la de
Chi, que en cualquier libro de estadstica la posee en la parte de apndice del mismo.
A continuacin haremos la trascripcin de dicha tabla de sus primeras lneas.
%
Gr-lib
1
2
3
4
5

10

0.1

2.706
4.605
6.251
7.779
9.236

2.841
5.991
7.815
9.488
11.070

5.412
7.824
9.837
11.668
13.388

6.635
9.210
11.341
13.277
15.086

10.827
13.815
16.268
18.465
20.517

Esta tabla esta compuesta por:


La primera fila: muestra el porcentaje del riesgo que se est dispuesto a correr si es que se
comete error para la toma de decisin. Por ejemplo nosotros podemos elegir tomar un
riesgo de un 5%.
Luego hay que determinar los grados de libertad que tiene nuestra tabla.
Los grados de libertad se calculan segn el tamao de la tabla, las tablas pueden ser de 2x2
(dos filas y dos columnas) o 2 x 3 (2 filas y 3 columnas) que es nuestro caso u otro tamao
cualquiera.
Entonces se calcula multiplicando el nmero de columnas menos 1 por el nmero de filas
menos 1, es decir Gr-lib = (c-1) * (f-1)
Para nuestro ejemplo sera:

Gr-lib = (3 1) * (2-1) = 2 * 1 = 2
Ahora entrando por la fila y buscamos el grado de libertad 2 y por la columna del % que
elegimos 5 en la interseccin de ambos valores se obtiene el nmero 5,991.
Una vez hallado el valor en la tabla lo debemos comparar con el resultado obtenido en el
clculo:
5,991 < 35,49
Como el valor hallado por nosotros es mucho mayor podemos rechazar la hiptesis propuesta. Por lo tanto en nulo lo que se dijo en la hiptesis: el hecho de ser mujer no influye
a la hora de buscar trabajo.

IMPORTANTE
Esta forma de calcular X 2 es para averiguar la independencia entre las dos variables que
se estn estudiando, por lo tanto en la hiptesis de estudio lo que debemos manifestar es
que las variables son independientes. Luego si el valor obtenido en el clculo es muy prximo al valor que nos muestra la tabla se puede decir que s son independientes. Pero si ocurre que el valor obtenido en el clculo es superior o inferior (considerablemente) podemos
asegurar que no existe independencia entre las variables estudiadas.
Ahora bien Qu queremos decir con independencia entre las variables?.
Lo que se quiere decir es que la ocurrencia de un atributo cualitativo no se ve afectada ni
altera su presencia con la ocurrencia de la otra variable de estudio.
Por ejemplo quisiramos estudiar la independencia de que el alumno es bueno en matemticas no tiene nada que ver con que sea bueno en lengua son situaciones totalmente independiente.
O bien podramos decir el que es bueno en matemticas seguro es bueno en lengua, (aqu
estamos manifestando que hay dependencia.)
5.3 COEFICIENTE C DE CONTINGENCIA.
FUNDAMENTO.
El coeficiente de contingencia se utiliza para saber la asociacin de variables cualitativas
nominales, que tienen dos o ms categoras.
Este coeficiente requiere del clculo previo del estadstico Chi Cuadrado, dado que en su
frmula interviene este valor.
FORMULA.
La frmula de trabajo es:

CALCULO Para ello primero se debe calcular Chi cuadrado, luego hacer el cociente y por
ltimo aplicarle la raz cuadrara.

PROPIEDADES
Los valores que puede asumir C van entre 0 C

1.

Al igual que en los otros casos:


El coeficiente de contingencia, toma valores comprendidos entre cero y uno.
Cuando est prximo a cero, indica asociacin nula o muy dbil entre las variables involucradas.
Cuando est prximo a uno, indica asociacin alta, fuerte, o casi perfecta, dependiendo de
la cercana al nmero uno.
5.4 COEFICIENTE DE RO ( )DE SPEARMAN.
FUNDAMENTO
Esta medida se la utiliza para estudiar la asociacin entre variables cualitativas de tipo ordinal. Es decir aquellas que establecen un orden. Si nos interesa estudiar el grado de asociacin que existe entre dos variables cualitativas ordinales el coeficiente Ro de Sperman es
uno de los ms apropiados.
Es decir que ambas variables deber ser ordinales. Para ello se deben elegir una de las variables como la variable principal y en funcin de ellas ordenar.
Si tomamos como ejemplo una relacin entre las asignaturas matemticas y lengua, y ordenamos (de mayor a menos) en primer lugar a los alumnos segn sus calificaciones obtenidas en matemticas, luego asignamos el orden segn las calificaciones obtenidas en lengua. De esta manera obtendremos pares de nmeros, por ejemplo el alumno que obtuvo la
1 nota en matemtica, y la 4 en lengua le corresponde el par (1,4).
Nos quedara la siguiente tabla:
Alumno

Matemtica

Orden

Lengua

Orden

Ana

Beatriz

10

Carlos

Denis

10

Esteban

FORMULA
Algunos autores lo denominan coeficiente de Sperman (Cs) y otros le asignan la letra
griega de nombre rho (), usted puede utilizar la que ms le agrade.
= 1

d2

N (N2 1)
Donde
d2 = Diferencia entre el valor de la primera variable y la segunda elevados al cuadrado
N = Cantidad de elementos involucrados en nuestros ejemplo es 5.
6 es un valor constante propio de la formula.
CALCULO
Para realizar los clculos para este ejercicio nos ayudamos con la tabla anterior donde
solo tenemos los rdenes de las asignaturas
= 1

d2

N (N 1)
Alumno

Orden

Orden

Diferencia

Diferencia al

Matemtica

Lengua

(3 - 3) = 0

(0) 2 = 0

(1 4) = - 3

(-3) 2 = 9

(2 - 5) = -3

(-3) 2 = 9

(4 1) = 3

(3) 2 = 9

(5 2) = 3

(3) 2 = 9

cuadrado

d2

d2 = 36
Remplazando en la formula el valor calculado tendremos
= 1

d2

N (N 1)

1 -

6 x 36
2

5 (5 1)

1-

216
5 X 24

= 1 216 =
120

= 1 1,8 = - 0,80
= - 0,80
INTERPRETACIONES
puede tomar valores comprendidos entre -1 y 1
Cundo Cs = 0? Cuando todas las diferencia dan 0 es decir que el mismo orden que
adquieren con la variable 1 (matemtica) lo obtienen en la variable 2 (lengua).
Cundo = -1? Cuando el orden de la variables 1 es exactamente inverso en la variable 2. Es decir aquella que tena el orden 1 en la variable 1, tiene el ltimo orden en la
variable 2 y la que tiene el 2 orden en variable 1, tiene el anteltimo orden en la variable
2 y as sucesivamente.
Cundo = 1? Cuando el orden crece o decrece de igual modo en ambas variables
sin que estas tengan exactamente el mismo orden.
Por lo tanto la interpretacin en estos casos sera guardaran este tipo de relacin entre
ambas variables.

En nuestro caso y observando el resultado obtenido podemos decir que = - 0,80 quiere decir que aquellos alumnos que son buenos en matemtica no tienen igual rendimiento en lengua en un alto porcentaje.
IMPORTANTE
Puede llegar a ocurrir que haya empate es decir que dos o ms alumnos reciben el mismo
puntaje u orden al obtener la misma valoracin en esos casos se asigna el promedio de dichos valores de empate.
Ejemplo
Alumno

Matemtica

Orden

8 empate para el puesto 4

4,50

10 puesto 1

9 empate para el puesto 2

2,50

9 empate para el puesto 2

2,50

6 puesto 6

8 empate para el puesto 4

4,50

En el empate le correspondera a uno el lugar 2 y al otro el lugar 3


Entonces se calcula el promedio de ambos lugares y se asigna el promedio a los dos alumnos
Prom = 2 + 3 / 2 = 2,50
Lo mismo ocurre con el puesto 4 y 5 por lo tanto el promedio es 4,50 que asignaremos a los
individuos A y F
De igual modo se procede si ocurren empates en la variable 2.
Luego se procede exactamente de igual manera para calcular las diferencias con la asignatura lengua.

Вам также может понравиться