Академический Документы
Профессиональный Документы
Культура Документы
CONTENIDOS TEMTICOS
5. Coeficiente para variables cualitativas nominales.
5.1 Coeficiente de Q de Yule: Fundamento, Formula, Calculo, Propiedades.
5.2 Coeficiente X2: Fundamento, Formula, Calculo, Propiedades.
5.3 Coeficiente C de contingencia: Fundamento, Formula, Calculo, Propiedades
5.4 Coeficiente de asociacin para variables cualitativas ordinales: Coeficiente Ro
de Sperman. Fundamento, Formula, Calculo, Propiedades
Comencemos!
5. COEFICIENTE PARA VARIABLES CUALITATIVAS
Existe una serie de tcnicas estadsticas que nos permiten detectar:
a) la existencia de correlacin y
b) la intensidad de la correlacin.
Por correlacin se entiende el grado de relacin o asociacin entre 2 o ms variables cualitativas y la intensidad de la relacin de las mismas. Por ejemplo: muchas veces abra escuchado decir el nio estaba jugando muy bien hasta que lleg su mam y se puso molesto.
Qu quiere decir esto?, que la presencia de la madre altera el comportamiento del nio
sobre todo cuando hay algn problema de relacin madre-hijo. Lo importante es poder encontrar el grado de asociacin que hay entre estas dos variables, que no se pueden medir
con nmeros.
Desde el punto de vista estadstico estos coeficientes estudian el grado de dependencia
entre dos variables cualitativas.
Para ello nos ayudaremos con los cuadros de doble entrada. Es decir para la presentacin
de las observaciones correspondientes a dos variables se utiliza un cuadro que nos permita
colocar en la primera hilera las categoras de una de las variables y en la primera columna
las categoras de la segunda variable, ubicando en el cuerpo de la tabla, en cada una de las
celdas las observaciones correspondientes al resultado de la interseccin de ambas variables y en la ltima columna y fila se colocan los subtotales de cada sub-categora y el total
general, en el cruce de estas dos. Como lo vimos en la unidad 2.
Lo vemos con un ejemplo:
Sexo
Varones
Mujeres
Sin trabajo
187
246
Independiente
466
313
En relacin de dependencia
638
459
Total
433
779
1097
Total
1291
1018
2309
Variable Y
Variable Y1
Variable Y2
1 celda
Total
Variable X
Variable X1
Variable X2
Total
Variable Y
Variable Y1
Variable Y2
A
B
C
D
A+C
B+D
Total
A+B
C+D
A+B+C+D
Padece enfermedades
pulmonares
Si
NO
120
67
48
39
168
106
Total
187
87
274
4680 + 3216
7896
Aclaracin:
Desde el punto de vista lgico la premisa debera ser: los fumadores son ms propensos a
enfermedades pulmonares.
Pero el coeficiente Q parte de premisas independientes, por lo que se debe suponer que el
fumar no afecta a enfermedades pulmonares, al darme un valor 0 (cero) o muy cerca de 0
(cero) quiere decir: no hay relacin entre lo que el investigador supone como independiente por lo tanto se concluye que lo que el investigador dice en el supuesto no se cumple.
La premisa de que:
Las enfermedades pulmonares nada tienen que ver con el fumar es falso.
No se cumple la premisa o hiptesis.
Al ser falsa la premisa anterior su negacin se convierte en verdadero.
No es cierto que las enfermedades pulmonares son independientes del individuo
fumador o lo que es lo mismo las enfermedades pulmonares estn relacionada con el individuo fumador.
Retomando el resultado del ejercicios cuyo valor dio 0,1854 (que lo puede redondear a
0,19), ubquelo en la grfica y
Puede observar que cae en la franja de NO EXISTE RELACIN entre las variables establecidas como premisa.
5.2 COEFICIENTE X 2 (CHI)
FUNDAMENTO
Se trata de una prueba estadstica que nos permite comparar los resultados obtenidos en
una experiencia real con los resultados tericos de acuerdo a una distribucin de hiptesis
terica. De este modo nos permite conocer con un nivel de probabilidad o significacin determinado si los resultados experimentales concuerdan o no con los esperados tericamente segn los valores asignados en la tabla de X 2. En este sentido y comparando con el valor de la tabla, lo nico que se hace es rechazar o no la hiptesis de nulidad.
Particularmente en este curso veremos X 2 como prueba de independencia. Con esto queremos decir que estudiaremos el nivel de independencia que existe entre ciertas variables
cualitativas o si existe algn grado de relacin o asociacin entre ellas que hacen variar sus
resultados.
X 2 COMO PRUEBA DE INDEPENDENCIA
Trabaja con variables cualitativas con ms de dos clasificaciones, como deporte que practica, por ejemplo.
Esta prueba nos permite comprobar si existe entre las variables total independencia o si por
el contrario es probable que estn asociadas y la presencia de una de ellas condiciona a la
otra variable.
FORMULA
Para explicar mejor su clculo volveremos a nuestro ejemplo de ocupacin de los tutores.
Sexo
Varones
Mujeres
Sin trabajo
187
246
Independiente
466
313
En relacin de dependencia
638
459
Total
433
779
1097
Total
1291
1018
2309
1291*1291= 613,35
2309
Tipo de ocupacin de los tutores de la Escuela
Varones
Mujeres
Sin trabajo
187 242,10
246 190,90
Independiente
466 435,55
313 343,44
En relacin de dependencia
638
613,35
459
483,65
Total
433
779
1097
Total
1291
1018
2309
190,90
779 * 1018 =
2309
343,44
1097 * 1018 =
2309
483,65
X2 =
X2 =
X2 =
INTERPRETACIONES
Para saber si este valor es representativo o no tenemos que ayudarnos con una tabla, la de
Chi, que en cualquier libro de estadstica la posee en la parte de apndice del mismo.
A continuacin haremos la trascripcin de dicha tabla de sus primeras lneas.
%
Gr-lib
1
2
3
4
5
10
0.1
2.706
4.605
6.251
7.779
9.236
2.841
5.991
7.815
9.488
11.070
5.412
7.824
9.837
11.668
13.388
6.635
9.210
11.341
13.277
15.086
10.827
13.815
16.268
18.465
20.517
Gr-lib = (3 1) * (2-1) = 2 * 1 = 2
Ahora entrando por la fila y buscamos el grado de libertad 2 y por la columna del % que
elegimos 5 en la interseccin de ambos valores se obtiene el nmero 5,991.
Una vez hallado el valor en la tabla lo debemos comparar con el resultado obtenido en el
clculo:
5,991 < 35,49
Como el valor hallado por nosotros es mucho mayor podemos rechazar la hiptesis propuesta. Por lo tanto en nulo lo que se dijo en la hiptesis: el hecho de ser mujer no influye
a la hora de buscar trabajo.
IMPORTANTE
Esta forma de calcular X 2 es para averiguar la independencia entre las dos variables que
se estn estudiando, por lo tanto en la hiptesis de estudio lo que debemos manifestar es
que las variables son independientes. Luego si el valor obtenido en el clculo es muy prximo al valor que nos muestra la tabla se puede decir que s son independientes. Pero si ocurre que el valor obtenido en el clculo es superior o inferior (considerablemente) podemos
asegurar que no existe independencia entre las variables estudiadas.
Ahora bien Qu queremos decir con independencia entre las variables?.
Lo que se quiere decir es que la ocurrencia de un atributo cualitativo no se ve afectada ni
altera su presencia con la ocurrencia de la otra variable de estudio.
Por ejemplo quisiramos estudiar la independencia de que el alumno es bueno en matemticas no tiene nada que ver con que sea bueno en lengua son situaciones totalmente independiente.
O bien podramos decir el que es bueno en matemticas seguro es bueno en lengua, (aqu
estamos manifestando que hay dependencia.)
5.3 COEFICIENTE C DE CONTINGENCIA.
FUNDAMENTO.
El coeficiente de contingencia se utiliza para saber la asociacin de variables cualitativas
nominales, que tienen dos o ms categoras.
Este coeficiente requiere del clculo previo del estadstico Chi Cuadrado, dado que en su
frmula interviene este valor.
FORMULA.
La frmula de trabajo es:
CALCULO Para ello primero se debe calcular Chi cuadrado, luego hacer el cociente y por
ltimo aplicarle la raz cuadrara.
PROPIEDADES
Los valores que puede asumir C van entre 0 C
1.
Matemtica
Orden
Lengua
Orden
Ana
Beatriz
10
Carlos
Denis
10
Esteban
FORMULA
Algunos autores lo denominan coeficiente de Sperman (Cs) y otros le asignan la letra
griega de nombre rho (), usted puede utilizar la que ms le agrade.
= 1
d2
N (N2 1)
Donde
d2 = Diferencia entre el valor de la primera variable y la segunda elevados al cuadrado
N = Cantidad de elementos involucrados en nuestros ejemplo es 5.
6 es un valor constante propio de la formula.
CALCULO
Para realizar los clculos para este ejercicio nos ayudamos con la tabla anterior donde
solo tenemos los rdenes de las asignaturas
= 1
d2
N (N 1)
Alumno
Orden
Orden
Diferencia
Diferencia al
Matemtica
Lengua
(3 - 3) = 0
(0) 2 = 0
(1 4) = - 3
(-3) 2 = 9
(2 - 5) = -3
(-3) 2 = 9
(4 1) = 3
(3) 2 = 9
(5 2) = 3
(3) 2 = 9
cuadrado
d2
d2 = 36
Remplazando en la formula el valor calculado tendremos
= 1
d2
N (N 1)
1 -
6 x 36
2
5 (5 1)
1-
216
5 X 24
= 1 216 =
120
= 1 1,8 = - 0,80
= - 0,80
INTERPRETACIONES
puede tomar valores comprendidos entre -1 y 1
Cundo Cs = 0? Cuando todas las diferencia dan 0 es decir que el mismo orden que
adquieren con la variable 1 (matemtica) lo obtienen en la variable 2 (lengua).
Cundo = -1? Cuando el orden de la variables 1 es exactamente inverso en la variable 2. Es decir aquella que tena el orden 1 en la variable 1, tiene el ltimo orden en la
variable 2 y la que tiene el 2 orden en variable 1, tiene el anteltimo orden en la variable
2 y as sucesivamente.
Cundo = 1? Cuando el orden crece o decrece de igual modo en ambas variables
sin que estas tengan exactamente el mismo orden.
Por lo tanto la interpretacin en estos casos sera guardaran este tipo de relacin entre
ambas variables.
En nuestro caso y observando el resultado obtenido podemos decir que = - 0,80 quiere decir que aquellos alumnos que son buenos en matemtica no tienen igual rendimiento en lengua en un alto porcentaje.
IMPORTANTE
Puede llegar a ocurrir que haya empate es decir que dos o ms alumnos reciben el mismo
puntaje u orden al obtener la misma valoracin en esos casos se asigna el promedio de dichos valores de empate.
Ejemplo
Alumno
Matemtica
Orden
4,50
10 puesto 1
2,50
2,50
6 puesto 6
4,50