Вы находитесь на странице: 1из 17

COEFICIENTE DE ASOCIACIÓN " 𝑸" de Yule

TABLA DE CONTINGENCIA
El Coeficiente “Q” de Yule sirve para conocer si dos variables VARIABLE Y
medidas en escalas nominales u ordinales y ordenadas en tablas de

VARIABLE X
2x2 son independientes. El coeficiente fue desarrollado y
publicado en 1912 por el estadígrafo británico George Undy Yule
(1871 – 1951), el cual la nombró Q en honor al estadígrafo belga
Quetelet (1796-1874)
Se define el coeficiente simétrico de asociación Q de Yule como:

George Udny Yule (1871 en Morham,


Escocia- 1951 en Cambridge,
Inglaterra).
PROPIEDADES
George nació en Beech Hill, una casa en
 Está acotado entre: −1 ≤ 𝑸 ≤ 𝟏
 Si las variables X e Y son independientes, Morham, cerca de Haddington en Escocia.
Cuando cumplió dieciséis años ingresó en el
entonces 𝑸 = 𝟎
 Si 𝑸 = 𝟏, se verifica que 𝑛12 . 𝑛21 = 0 y University College de Londres para estudiar
una ingeniería.
existe una asociación completa entre las
variables (atributos) X e Y. Luego, estudió física y posteriormente Karl Pearson le ofreció
 Si 𝑸 = −𝟏, se verifica que 𝑛11 . 𝑛22 = 0 y un puesto de investigador en el University College de Londres.
existe una disociación completa entre las Su primer artículo sobre estadística apareció en 1895 “On the
variables (atributos) X e Y. correlacione of total pauperism with proportion of out-relief”,
 Si 𝑸 > 𝟎, la asociación es positiva. donde introducía la aplicación de los coeficientes de correlación
al estudio de tablas de doble entrada, y es en 1912 que publica
 Si 𝑸 < 𝟎, la asociación es negativa.
“On the Methods of Measuring Association Between Two
Attributes” en la Journal of the Royal Statistical Society.
Interpretación

El valor de Q está entre -1 y 1. Su interpretación es la siguiente:

 Si 𝑄 = 0, no hay asociación entre las modalidades o niveles der las variables, es decir, son independientes.
 Si 𝑄 = +1, hay asociación positiva perfecta.
 Si 𝑄 = −1, hay asociación negativa perfecta.
La interpretación de los resultados puede ser difícil y arbitraria con medidas de asociación. Una regla general (Knoke y
Bohrnstedt, 1991) es la siguiente:

DESVENTAJAS

Un problema con Q es que la presencia de un


cero en cualquier celda o casilla hace que el
cociente final tenga un valor de 1 o -1. Por
ejemplo:

El cálculo de Q resulta:

𝑎𝑑 − 𝑏𝑐 (25)(45) − (0)(25) 1125


𝑄= = = =1
𝑎𝑑 + 𝑏𝑐 (25)(45) + (0)(35) 1125

A pesar de Q resulta 1, la relación está lejos de ser perfecta. Hubo 35 encuestados de alto ingreso con baja participación,
una contradicción con la hipótesis. Otra medida, el coeficiente phi 𝝋, no comparte esa característica particular con Q,
por esta razón a veces se prefiere usar coeficiente a pesar de un cálculo ligeramente más complicado.
EJEMPLO

Podemos formular la pregunta: ¿Existe relación entre el sexo y el hábito de fumar cigarrillos? Los datos de 100 hombres
y 100 mujeres, son los siguientes:

Varones Mujeres
Si fuma 60 25
No fuma 40 75

En primer lugar, se estudia si X e Y son estadísticamente independientes, si


así lo fueran todos los coeficientes que se soliciten en el problema serían
igual a cero. Para ellos se prueba la condición necesaria y suficiente de
independencia estadística:

𝑛𝑖𝑗 𝑛𝑖. 𝑛.𝑗


= × 𝑖 = 1,2, … ℎ ; 𝑗 = 1,2, … , 𝑘
𝑛 𝑛 𝑛

Veamos el primer caso:


𝑛11 𝑛𝑖. 𝑛
× .𝑗 Varones Mujeres Total
𝑛 𝑛 𝑛
60 85 100 Si fuma 60 𝑛11 25 𝑛12 85 𝑛1.
200 200
× 200 No fuma 40 𝑛21 75 𝑛22 115 𝑛2.
0.3 0.425 × 0.5 Total 100 𝑛.1 100 𝑛.1 200 𝑛
0.3 0.2125

Como se observa, no se cumple para el primer caso analizado (0.3 ≠ 0.2125), por lo tanto no se cumple la independencia
estadística, y los coeficientes solicitados tendrán valores no nulos.
Aplicando la fórmula de Q de Yule, se obtiene:

60×75−25×40 4500−1000 3500


𝑸 = 60×75+25×40 = 4500+1000 = 5500 = 0.63

INTERPRETACIÓN

El coeficiente Q de Yule, 𝑸 = 0.63 indica una relación de dependencia moderada entre el sexo y el hábito de fumar
cigarrillos. Además, como dicha asociación es positiva 𝑸 = 0.63 > 0, es decir los varones están asociados al hábito de
fumar (60) y las de las mujeres a los hábitos de no fumar (75).
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
CUARTO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN 𝟐 × 𝟐 Q DE YULE

En un estudio para averiguar si los hombres altos tienden a casarse con parejas altas, se publicó la siguiente información
sobre las esposas de 134 maridos altos y 116 maridos de estatura baja. Encuentre el coeficiente de asociación entre la
estatura de esposas y esposos.

Esposos altos Esposos bajos


Esposas altas 112 26
Esposas bajas 22 90

a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atención que prestan a las noticias, cuestiones
o acontecimientos que suceden en otros países).

Estatura de Estatura de los Esposos Estatura de Estatura de los Esposos


las esposas Altos bajos Total las esposas altos bajos Total
Altas Altas
Bajas Bajas
Total Total (%) 100% 100% 100%

b. Realizar las gráficas de barras agrupadas por frecuencias absolutas (cantidad de esposas) y por porcentajes (porcentaje
de esposas) por porcentajes considerando a la estatura de los padres en el eje horizontal.

c. Realizar los cálculos necesarios para probar que no se cumple la condición necesaria y suficiente de independencia
estadística:
𝑛𝑖𝑗 𝑛𝑖. 𝑛.𝑗
== × 𝑖 = 1,2, … ℎ ; 𝑗 = 1,2, … , 𝑘
𝑛 𝑛 𝑛

d. Calcule e interprete el coeficiente Q de Yule.


En una empresa con 500 trabajadores, con estudios superiores o no, y que trabajan en oficinas o cadena de producción.
Como se muestra en la siguiente tabla de contingencia. Analizar si existe asociación entre las dos variables utilizando una
medida de asociación respectiva.

Cadena de
Oficinas
producción
Estudios
270 30
superiores
No estudios
80 120
superiores

a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atención que prestan a las noticias,
cuestiones o acontecimientos que suceden en otros países).
Tipo de trabajo Tipo de trabajo
Estudios oficinas Cadenas Total oficinas Cadenas Total
Estudios
de de
producción producción
Superiores Superiores 100%
No No 100%
superiores superiores
Total

b. Realizar las gráficas de barras agrupadas por frecuencias absolutas y por porcentajes (tipo de trabajo)
considerando al tipo de estudios en el eje horizontal.

c. Realizar los cálculos necesarios para probar que no se cumple la condición necesaria y suficiente de independencia
estadística:
𝑛𝑖𝑗 𝑛𝑖. 𝑛.𝑗
== × 𝑖 = 1,2, … ℎ ; 𝑗 = 1,2, … , 𝑘
𝑛 𝑛 𝑛

d. Calcule e interprete el coeficiente Q de Yule.


COEFICIENTE DE ASOCIACIÓN "PHI” 𝝋 TABLA DE CONTINGENCIA

El coeficiente phi o coeficiente de asociación de Mathews como VARIABLE Y


también se le suele llamar, permite calcular la asociación entre

VARIABLE X
variables medidas en escalas nominales, ordinales o de intervalo,
cuyos datos representan auténticas dicotomías. Por ejemplo:
- Si-No; Verdadero- Falso; Mujer – Hombre; Fuma- No fuma, etc.

Se define el coeficiente Asimétrico de asociación 𝝓 de Pearson


como:

Brian W. Matthews, 1938 (Edad 77–


78) Mount Barker, South Australia.

Brian W. Matthews es un bioquímico y biofísico


educado en la Universidad de Adelaida,
PROPIEDADES colaborador de la metodología cristalográfica
por rayos X en la Universidad de Cambridge y
 Se encuentra comprendido entre los valores - desde 1970 en la Universidad de Oregon como
1 y 1. Es decir: −𝟏 ≤ 𝝋 ≤ 𝟏 Profesor de Física e investigador HHMI en el
 Si las variables X e Y son independientes, Instituto De Biología Molecular.
entonces 𝝋 = 𝟎 Creó cientos de mutantes de lisozima T4 (lo que la convirtió en la
 𝝋 = 𝟏, si los valores en la diagonal principal estructura más común en el PDB), determinó su estructura mediante
son ceros (a=d=0), entonces existe una cristalografía de rayos X y midió sus temperaturas de fusión.
asociación completa entre las variables Partiendo de preguntas sobre la base de las mutaciones "sensibles a
(atributos) X e Y. la temperatura", su trabajo ha explicado mucho sobre los efectos
enérgicos y estructurales generales de las mutaciones en las
proteínas. Más allá de sus contribuciones a la bioquímica, Matthews
es también conocido en la comunidad de aprendizaje de máquina para
el coeficiente de correlación de Matthews, que él introdujo en un
papel en 1975. [3] El coeficiente se utiliza como medida de la calidad
de las clasificaciones binarias (de dos clases).

 𝝋 = −𝟏, si los valores en la diagonal


secundaria (b=c=0) son ceros, entonces
existe una disociación completa entre las
variables (atributos) X e Y.
 Si 𝑎𝑑 > 𝑏𝑐 entonces 𝝋 > 𝟎, la asociación es
positiva.
 Si 𝑎𝑑 < 𝒃𝒄 entonces 𝝋 < 𝟎 la asociación es
negativa.

Interpretación

James Davis ofreció algunas expresiones que se pueden utilizar para describir los diversos rangos de valores. En concreto,
Davis desarrolló la expresión para utilizar a la hora de interpretar Q de Yule, otra medida de asociación 𝝋.
EJEMPLO

La pregunta: ¿Deben casarse los sacerdotes? Fue respondida por 90 hombres y 90 mujeres, según aparecen clasificadas
sus respuestas en la siguiente tabla:
Podemos preguntar si existe relación entre el sexo de los sujetos y la opinión respecto al celibato de los sacerdotes
católicos.

Si No
Mujeres 70 20
Hombres 50 40

Aplicando la fórmula de phi 𝝋 o de Mathews, se obtiene:

70 × 40 − 20 × 50
𝝋= = 0.24
√90 × 90 × 120 × 60

INTERPRETACIÓN

El coeficiente phi, 𝝋 = 0.24 indica una relación de dependencia débil entre el sexo y la opinión respecto al celibato de los
sacerdotes. Además, como dicha asociación es positiva 𝝋 = 0.24 > 0, es decir las mujeres están asociados a la opinión de
estar de acuerdo con el celibato y el de los hombres al de estar en desacuerdo.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
QUINTO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN EN TABLAS 𝟐 × 𝟐 "PHI” 𝝋

En un estudio para averiguar si los hombres altos tienden a casarse con parejas altas, se publicó la siguiente información
sobre las esposas de 134 maridos altos y 116 maridos de estatura baja. Encuentre el coeficiente de asociación entre la
estatura de esposas y esposos.

Esposos altos Esposos bajos


Esposas altas 112 26
Esposas bajas 22 90

Calcule e interprete el coeficiente phi 𝝋 o de Mathews.

En una empresa con 500 trabajadores, con estudios superiores o no, y que trabajan en oficinas o cadena de producción.
Como se muestra en la siguiente tabla de contingencia. Analizar si existe asociación entre las dos variables utilizando una
medida de asociación respectiva.

Cadena de
Oficinas
producción
Estudios
270 30
superiores
No estudios
80 120
superiores

Calcule e interprete el coeficiente phi 𝝋 o de Mathews.


COEFICIENTE DE ASOCIACIÓN "CHI CUADRADO” 𝝌𝟐 DE PEARSON
TABLA DE CONTINGENCIA
VARIABLE Y

VARIABLE X
ℎ: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑜𝑑𝑎𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑋
𝑘: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑜𝑑𝑎𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑌

Una expresión alternativa a la anterior para el


cálculo de Chi Cuadrado es:

Karl Pearson, 1857-1936 (Londres 27 de


marzo de 1857- Londres, 27 de
abril de 1936)

Nace en Londres en 1857 y muere en 1936, su


PROPIEDADES
familia es originaria de Yorkshire. Hijo de un
 Ninguna frecuencia esperada es menor que 1. abogado, estudia en la University College
 Al menos el 80% de las frecuencias esperadas son Schooll. En 1873, a la edad de 16 años fue
mayores que 5. retirado de la escuela por motivos de salud, y
 Si estas condiciones no se cumplen, no se puede
pasa el año siguiente con un preceptor
aplicar el test. En tales casos debemos agrupar las
privado.
modalidades o aumentar el tamaño muestral con el En 1875 obtuvo una beca para él King´s College, en Cambridge. El
objetivo de que se cumplan las condiciones de decía que Cambridge le dio, placer en las amistades, placer en las
validez del test.
polémicas, placer en el estudio, placer en la búsqueda de nuevas
 Para tablas 2 x 2, resultan más adecuadas las
luces, tanto en las matemáticas como en la filosofía y la religión;
siguientes condiciones:
 Las frecuencias marginales son mayores que
𝑛 así como ayuda para mantener su radicalismo científico dentro de
10
 Todas las frecuencias esperadas son mayores que 5 los límites moderados y razonables. Con 22 años marcha a Alemania
 Si no se cumplen estas condiciones debe aplicarse y estudia leyes, física y metafísica. Entre 1880 y 1884 es profesor
otro test conocido como Test exacto de Fisher. de matemáticas en el King College y en el University College. En
 En el caso de independencia entre las variables 1911 fue el primer profesor de Galton de Eugenesia, la naciente
(atributos) X e Y, el valor de 𝝌𝟐 = 𝟎. parte de la Biología encargada de los estudios encaminados a
 Cuanto mayor sea el valor de Chi Cuadrado 𝝌𝟐 ,
conseguir la mejora de las especies. Era un darwinista convencido.
mayor será el grado de asociación entre las
variables X e Y.
 En la medida en que 𝜒 2 se acerque a cero, la dependencia o asociación será débil, en la medida en que se aleje, la
dependencia o asociación será más fuerte.
 El coeficiente chi cuadrado establece 𝝌𝟐 establece la existencia o ausencia de asociación entre dos variables, pero no
mide la magnitud de la asociación.

CARACTERÍSTICAS

 Indica si existe o no relación entre las variables, pero no indica el grado o intensidad de relación al aumentar el tamaño
de la muestra.
 No indica el sentido de la relación.
 Es aplicable a variables medidas en escalas nominales, ordinales, de intervalo o de razón. Simplemente, las tres últimas
escalas deben reformularse como categóricas.
 Es aplicable cuando las frecuencias teóricas (esperadas) no sean menores de cinco.
 Si calculamos el valor de 𝝌𝟐 para una tabla de contingencia de dos filas por dos columnas, se cumple la
equivalencia:
EJEMPLO

La siguiente tabla muestra los resultados de un estudio para averiguar si el consumo de drogas está muy relacionado con
el comportamiento antisocial de una muestra de jóvenes seleccionados al azar en un centro de rehabilitación.

Por tratarse de dos variables cualitativas al menos una nominal,


se puede utilizar el coeficiente de asociación (relación) "Chi
cuadrado" 𝝌𝟐 .

Para lo cual calculamos las frecuencias esperadas: 𝑒𝑖𝑗

𝑛1. 𝑛.1 (81)(88) 𝑛1. 𝑛.2 (81)(118)


𝑒11 = = = 24.41 𝑒12 = = = 32.73
𝑛 292 𝑛 292
𝑛2. 𝑛.1 (93)(88) 𝑛1. 𝑛.3 (81)(86)
𝑒21 = = = 28.03 𝑒13 = 𝑛 = 292 = 23.86 Consumo de drogas
𝑛 292 Total
Comportamiento Bajo Mediano Alto
𝑛3. 𝑛.1 (67)(88) 𝑛2. 𝑛.2 (93)(118) antisocial
𝑒31 = = = 20.19 𝑒22 = = = 37.58 Insomnio 25 38 18 81
𝑛 292 𝑛 292
Agresividad 20 38 35 93
𝑛4. 𝑛.1 (51)(88) 𝑛2. 𝑛.3 (93)(86) Psicótico 18 22 27 67
𝑒41 = = = 15.37 𝑒23 = = = 27.39
𝑛 292 𝑛 292 Normal 25 20 6 51
Total 88 118 86 292
𝑛3. 𝑛.3 (67)(86) 𝑛4. 𝑛.3 (51)(86)
…𝑒33 = = = 19.73 … 𝑒43 = = = 15.02
𝑛 292 𝑛 292

Así obtenemos, la tabla de contingencia de las frecuencias esperadas como se muestra a continuación:

Comportamiento Consumo de drogas


antisocial Bajo Mediano Alto
Insomnio 24.41 32.73 23.86
Agresividad 28.03 37.58 27.39
Psicótico 20.19 27.08 19.73
Normal 15.37 20.51 15.02

Luego, calculamos el coeficiente Chi cuadrado 𝝌𝟐 aplicando la fórmula:

Reemplazando los valores obtenidos:

[25 − 24.41]2 [20 − 28.03]2 [18 − 20.19]2 [25 − 15.37]2 [38 − 32.73]2 [38 − 37.58]2
𝝌𝟐 = + + + + + +
24.41 28.03 20.19 15.37 32.73 37.58

[22 − 27.08]2 [20 − 20.61]2 [18 − 23.86]2 [35 − 27.39]2 [27 − 19.73 ]2 [6 − 15.02]2
+ + + + + + =
27.08 20.61 23.86 27.39 19.73 15.02

𝝌𝟐 = 𝟐𝟐. 𝟎𝟓𝟗𝟑𝟎𝟒

INTERPRETACIÓN

El coeficiente Chi cuadrado 𝝌𝟐 = 𝟐𝟐. 𝟎𝟓𝟗𝟑𝟎𝟒 > 𝟎, indica que el consumo de drogas está relacionado con el comportamiento
antisocial.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
SEXTO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN TABLAS 𝒉 × 𝒌 "CHI CUADRADO” 𝝌𝟐 DE PEARSON

De una encuesta realizada a un grupo de jóvenes sobre la situación actual se han obtenido los siguientes resultados:

a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atención que prestan a las noticias,
cuestiones o acontecimientos que suceden en otros países).

Nivel de estudios Problemas más preocupante


paro delincuencia vivienda Total
Primaria 20 5 5
Secundaria 12 7 1
Superior 18 8 4
Total

b. Realizar las gráficas de barras agrupadas por frecuencias absolutas (cantidad de jóvenes) y por porcentajes
(porcentaje de jóvenes) considerando al nivel de estudios en el eje horizontal.

c. Averiguar si el nivel de estudios está relacionado con los problemas de la situación actual, utilizando el coeficiente
Chi Cuadrado. Calcúlelo e interprételo.
COEFICIENTE DE CONTINGENCIA 𝑪 DE PEARSON

El coeficiente de Contingencia C o coeficiente C de Pearson. Creado por Kart Pearson (1904), mide
el grado (magnitud) de asociación o relación entre dos conjuntos de atributos. Se aplica a datos de
escalas nominales y se calcula a partir de frecuencias ordenadas en tablas de contingencia de
cualquier número de celdas. Calculado a partir de una tabla de contingencia tendrá el mismo valor al
margen del orden de categorías en las filas y columnas.

Se define el coeficiente asimétrico de asociación 𝑪 de contingencia como:

𝝌𝟐
𝑪=√ 𝟎≤ 𝑪<𝟏
𝒏 + 𝝌𝟐

El límite superior, o el valor máximo, del coeficiente de contingencia C depende del tamaño de la tabla.

Cuando la tabla es cuadrada, es decir el número de filas 𝒉 es igual número de columnas 𝒌, el valor máximo de C se puede
calcular utilizando la siguiente ecuación:

𝒉−𝟏
𝒎á𝒙 𝑪 = √ , 𝒉=𝒌
𝒉
ℎ: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑓𝑖𝑙𝑎𝑠
𝑘: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠

Por ejemplo,
 Para tablas de contingencia 2 × 2 el valor máximo es 0.707, es decir: 0 ≤ 𝐶 ≤ 0.707
 Para tablas de contingencia 3 × 3 el valor máximo es 0.816, es decir: 0 ≤ 𝐶 ≤ 0.816
 Es sólo con tablas de contingencia más de 5 x 5, que el límite superior excede a 0.900.

Se cumple la siguiente relación

𝒉−𝟏
𝟎 ≤ 𝑪𝒎á𝒙 = √ <𝟏
𝒉

Si la tabla no es cuadrada, no es igual el número de filas y columnas 𝒉 ≠ 𝒌, entonces el valor máximo o límite superior de
C se puede calcular mediante:
𝟒 𝒉−𝟏 𝒌−𝟏
𝑪𝒎á𝒙 = √ ×
𝒉 𝒌

Donde h es el número de filas y k es el número de columnas

Se cumple la siguiente relación

𝟒 𝒉−𝟏 𝒌−𝟏
𝟎 ≤ 𝑪𝒎á𝒙 = √ × <𝟏
𝒉 𝒌
COEFICIENTE DE CONTINGENCIA C ESTANDARIZADO

Hay una solución simple al problema de la variación en los límites superiores de los coeficientes de contingencia. Ellos
pueden normalizarse o estandarizarse, dividiendo por sus límites superiores. Esto hace que todos los valores máximos,
con independencia del tamaño de la tabla o forma, sean igual a 1. Estos coeficientes estandarizados pueden ser comparados
entre tablas de cualquier tamaño, utilizando la siguiente ecuación:

𝑪
𝑪𝒆𝒔𝒕𝒂𝒏𝒅 =
𝑪𝒎á𝒙

Este coeficiente estandarizado varía entre 0 y 1, es decir:

𝟎 ≤ 𝑪𝒆𝒔𝒕𝒂𝒏𝒅 ≤ 𝟏

Criterios de clasificación de los coeficientes de C (o 𝑪𝒆𝒔𝒕𝒂𝒏𝒅 ) no son muy comunes para ser encontrados. La mayoría de los
autores citar solamente que los valores cercanos a 0 representan débil o ninguna asociación y, la asociación más fuerte es
para valores cercanos a 1, sin embargo, la magnitud de estos factores no es lineal, lo que interfiere con la interpretación.
Vamos a seguir la siguiente clasificación (www.acastat.com/Statbook/chisqassoc.htm):

PROPIEDADES

El coeficiente C tiene las siguientes propiedades:

 Se encuentra comprendido entre los valores -1 y 1. Es decir: −𝟏 ≤ 𝑪 < 𝟏


 Cuando haya una completa carencia de asociación, el coeficiente debe ser nulo.
 Cuando las variables muestren completa dependencia el coeficiente debe ser igual a la unidad.

De acuerdo a la definición del coeficiente Phi

Se puede establecer una relación con el coeficiente Chi cuadrado como:

DESVENTAS Y LIMITACIONES

Presenta algunas limitaciones el coeficiente de contingencia C:

 El coeficiente de contingencia cumple con la primera característica, pero no cumple con la segunda, es decir es igual
a cero si no existe asociación entre las dos variables o atributos, pero no puede llegar a alcanzar la unidad. Por lo
tanto:
0≤𝐶<1

 Dos coeficientes de contingencia se pueden comparar sólo si proceden de tablas del mismo tamaño, porque depende
el límite superior del número de filas y columnas.
 C no es directamente comparable con ninguna otra medida de correlación.
 Los datos deben ser usados adecuados para el cálculo de la 𝝌𝟐 ya que esta prueba sólo puede usarse si al menos el
20% de las celdas tienen una frecuencia esperada menor que 1.
 Es dificultoso su interpretación debido a que no alcanza su máximo en la unidad.
EJEMPLO

Un investigador desea encontrar la asociación entre la cantidad de estrés en 167 estudiantes de un Instituto del primer
semestre dependiendo de sus condiciones socioeconómicas.

Frecuencia y ausencia de estrés.

Calculamos primero el coeficiente Chi cuadrado 𝝌𝟐 de Pearson aplicando la fórmula:

Reemplazando los valores obtenidos:

[0 − 4]2 [6 − 8.8]2 [14 − 7.2]2 [10 − 6]2 [16 − 13.2]2 [4 − 10.8]2


𝝌𝟐 = + + + + +
4 8.8 7.2 6 13.2 10.8
𝟐
𝝌 = 𝟐𝟗. 𝟔𝟖

El coeficiente C de Contingencia es:

Reemplazando en la fórmula tenemos:

𝟐𝟗.𝟔𝟖
𝑪=√ = 𝟎. 𝟑𝟖𝟖
𝟏𝟔𝟕+𝟐𝟗.𝟔𝟖

𝑪 = 𝟎. 𝟑𝟖𝟖

A continuación, calculamos el valor máximo esperado del coeficiente de contingencia:

𝟑−𝟏
𝑪𝒎á𝒙 = √ = 𝟎. 𝟖𝟏𝟔
𝟑

Interpretación:

La asociación existente entre la frecuencia en el estrés y la condición socioeconómica es moderada, en la cual conforme
sea la clase de vida, disminuye la frecuencia del proceso del estrés de manera significativa, con un valor de coeficiente
de contingencia de 0.388.
El valor obtenido de C=0,388 es comparado con 𝑪𝒎á𝒙 = 0,816 es aproximadamente el 47.54%. L a relación por tanto
es moderada.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
SÉPTIMO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN EN TABLAS 𝒉 × 𝒌 𝑪 DE PEARSON

De una encuesta realizada a un grupo de jóvenes sobre la situación actual se han obtenido los siguientes resultados:

Calcular e interpretar el coeficiente C de Contingencia de Pearson.

Un psicólogo escolar está probando de tres métodos de lectura de niños disléxicos. Estudiando los antecedentes de estos
niños vio que la experiencia en la familia de hermanos disléxicos podría ser una causa de la ineficacia de los métodos. Con
el fin de obtener alguna evidencia, midió a sus alumnos en las dos variables y obtuvo la tabla siguiente de curación:

Calcular e interpretar el coeficiente C de Contingencia de Pearson.


COEFICIENTE V DE CRAMER

Se define el coeficiente simétrico de asociación 𝑽


El coeficiente V de Cramer, es una versión modificada del coeficiente
de Cramer como:
de asociación Phi y se utiliza en tablas más grandes que 2 x 2. En este
caso, no existe un límite superior. Este coeficiente se obtiene al ajustar 𝝌𝟐
Phi al número de filas o al número de columnas de la tabla, dependiendo 𝑽=√ 𝟎≤ 𝑽≤𝟏
𝒏[𝒎𝒊𝒏(𝒉, 𝒌) − 𝟏]
de cuál de los dos sea más pequeño, oscilando de cero a uno. Un valor
Donde:
grande de V y no de la forma en que las variables están relacionadas.
𝑛: Tamaño de la muestra.
ℎ: Número de filas
𝑘: Número de columnas

Convenciones para describir la magnitud de la asociación en tablas de contingencia (Rea & Parker, p. 203)

PROPIEDADES
Harald Cramer (Estocolmo, 25 de
El coeficiente V de Cramer tiene las
septiembre de 1893 - 5 de octubre de 1985).
siguientes propiedades:

 Se encuentra comprendido entre los Harald Cramér fue un matemático sueco que se
valores 0 y 1. Es decir: 𝟎 ≤ 𝑽 ≤ 𝟏 especializó en estadística matemática. También hizo
 Como está acotada, es el mejor de las contribuciones estadísticas a la distribución de
medidas de asociación, por ser más los números primos y primos gemelos. Enseñó de 1917 a
fácil de interpretar. 1958 como profesor en la Universidad de
 Si hay dos filas o dos columnas, los Estocolmo (hasta 1917 como profesor asistente) y fue
coeficientes φ y V de Cramer son rector de la misma de 1950 a 1961.
iguales. La chi cuadrado va desde 0 hasta un valor que varía según el número de datos y
 El coeficiente V de Cramer es el número de celdas. Eso de no contar con un máximo fijo dificulta bastante la
independiente del tamaño de la tabla y,
interpretación. No obstante, un suizo, llamado Harald Cramer (1893 – 1985),
por tanto, se puede utilizar con tablas
muy interesante en asuntos diversos del mundo de la estadística, estuvo
superiores a 2 x 2.
 Cuando las variables son totalmente razonando matemáticamente hasta llegar a la conclusión de que el valor máximo
independientes V=0. que puede tener el invento es n(m-1), donde n es el número de datos y m es el
 Cuanto mayor es la asociación mayor es número de valores o categorías de la variable que tiene menos valores. La V
el valor del coeficiente. consiste en dividir la chi-cuadrado entre su máximo, por lo que el resultado va
de 0 (no hay nada de relación) a 1 (relación máxima).

DESVENTAJAS Y LIMITACIONES
EJEMPLO
Un psicólogo escolar está probando de tres métodos de lectura de niños disléxicos. Estudiando los antecedentes de estos
niños vio que la experiencia en la familia de hermanos disléxicos podría ser una causa de la ineficacia de los métodos. Con
el fin de obtener alguna evidencia, midió a sus alumnos en las dos variables y obtuvo la tabla siguiente de curación:

Calcula e interpreta el coeficiente V de Cramer.

Calculamos las frecuencias esperadas:


FRECUENCIAS ESPERADAS
Métodos de lectura
Antecedentes familiares
Método A Método B Método C
Sin hermanos disléxicos 4 8.8 7.2
Con hermanos disléxicos 6 13.2 10.8

Calculamos el coeficiente Chi cuadrado 𝝌𝟐 aplicando la fórmula:

Reemplazando los valores obtenidos:

[0 − 4]2 [6 − 8.8]2 [14 − 7.2]2 [10 − 6]2 [16 − 13.2]2 [4 − 10.8]2


𝝌𝟐 = + + + + +
4 8.8 7.2 6 13.2 10.8
𝟐
𝝌 = 𝟏𝟖. 𝟖𝟔

Calculamos el coeficiente V de Cramer aplicando la fórmula:

𝟏𝟖. 𝟖𝟔 𝟏𝟖. 𝟖𝟔 𝟏𝟖. 𝟖𝟔


𝑽=√ == √ =√ = 𝟎. 𝟔𝟏𝟒
𝟓𝟎[𝒎𝒊𝒏(𝟐, 𝟑) − 𝟏] 𝟓𝟎[𝟐 − 𝟏] 𝟓𝟎

Interpretación:
Se puede concluir que todos los coeficientes están por encima de la mitad del rango que pueden tomar, sin llegar a ser el
máximo. Podría decirse que resulta una asociación moderada-alta.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
OCTAVO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN EN TABLAS 𝒉 × 𝒌 V DE CRAMER

EJEMPLO
El número de hogares que ven un programa de televisión, obtenido en una encuesta dirigida a una muestra de hogares de
tres comunidades, se recoge en el cuadro siguiente.
Se desea conocer el grado de asociación entre ambos factores para dichos hogares a través del coeficiente V de Cramer.

a. Realizar las gráficas de barras agrupadas por frecuencias absolutas (cantidad de hogares) y por porcentajes
(porcentaje de hogares) considerando a las comunidades en el eje horizontal.

b. Calcule e interprete el coeficiente V de Cramer.

Вам также может понравиться