Академический Документы
Профессиональный Документы
Культура Документы
TABLA DE CONTINGENCIA
El Coeficiente “Q” de Yule sirve para conocer si dos variables VARIABLE Y
medidas en escalas nominales u ordinales y ordenadas en tablas de
VARIABLE X
2x2 son independientes. El coeficiente fue desarrollado y
publicado en 1912 por el estadígrafo británico George Undy Yule
(1871 – 1951), el cual la nombró Q en honor al estadígrafo belga
Quetelet (1796-1874)
Se define el coeficiente simétrico de asociación Q de Yule como:
Si 𝑄 = 0, no hay asociación entre las modalidades o niveles der las variables, es decir, son independientes.
Si 𝑄 = +1, hay asociación positiva perfecta.
Si 𝑄 = −1, hay asociación negativa perfecta.
La interpretación de los resultados puede ser difícil y arbitraria con medidas de asociación. Una regla general (Knoke y
Bohrnstedt, 1991) es la siguiente:
DESVENTAJAS
El cálculo de Q resulta:
A pesar de Q resulta 1, la relación está lejos de ser perfecta. Hubo 35 encuestados de alto ingreso con baja participación,
una contradicción con la hipótesis. Otra medida, el coeficiente phi 𝝋, no comparte esa característica particular con Q,
por esta razón a veces se prefiere usar coeficiente a pesar de un cálculo ligeramente más complicado.
EJEMPLO
Podemos formular la pregunta: ¿Existe relación entre el sexo y el hábito de fumar cigarrillos? Los datos de 100 hombres
y 100 mujeres, son los siguientes:
Varones Mujeres
Si fuma 60 25
No fuma 40 75
Como se observa, no se cumple para el primer caso analizado (0.3 ≠ 0.2125), por lo tanto no se cumple la independencia
estadística, y los coeficientes solicitados tendrán valores no nulos.
Aplicando la fórmula de Q de Yule, se obtiene:
INTERPRETACIÓN
El coeficiente Q de Yule, 𝑸 = 0.63 indica una relación de dependencia moderada entre el sexo y el hábito de fumar
cigarrillos. Además, como dicha asociación es positiva 𝑸 = 0.63 > 0, es decir los varones están asociados al hábito de
fumar (60) y las de las mujeres a los hábitos de no fumar (75).
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
CUARTO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN 𝟐 × 𝟐 Q DE YULE
En un estudio para averiguar si los hombres altos tienden a casarse con parejas altas, se publicó la siguiente información
sobre las esposas de 134 maridos altos y 116 maridos de estatura baja. Encuentre el coeficiente de asociación entre la
estatura de esposas y esposos.
a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atención que prestan a las noticias, cuestiones
o acontecimientos que suceden en otros países).
b. Realizar las gráficas de barras agrupadas por frecuencias absolutas (cantidad de esposas) y por porcentajes (porcentaje
de esposas) por porcentajes considerando a la estatura de los padres en el eje horizontal.
c. Realizar los cálculos necesarios para probar que no se cumple la condición necesaria y suficiente de independencia
estadística:
𝑛𝑖𝑗 𝑛𝑖. 𝑛.𝑗
== × 𝑖 = 1,2, … ℎ ; 𝑗 = 1,2, … , 𝑘
𝑛 𝑛 𝑛
Cadena de
Oficinas
producción
Estudios
270 30
superiores
No estudios
80 120
superiores
a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atención que prestan a las noticias,
cuestiones o acontecimientos que suceden en otros países).
Tipo de trabajo Tipo de trabajo
Estudios oficinas Cadenas Total oficinas Cadenas Total
Estudios
de de
producción producción
Superiores Superiores 100%
No No 100%
superiores superiores
Total
b. Realizar las gráficas de barras agrupadas por frecuencias absolutas y por porcentajes (tipo de trabajo)
considerando al tipo de estudios en el eje horizontal.
c. Realizar los cálculos necesarios para probar que no se cumple la condición necesaria y suficiente de independencia
estadística:
𝑛𝑖𝑗 𝑛𝑖. 𝑛.𝑗
== × 𝑖 = 1,2, … ℎ ; 𝑗 = 1,2, … , 𝑘
𝑛 𝑛 𝑛
VARIABLE X
variables medidas en escalas nominales, ordinales o de intervalo,
cuyos datos representan auténticas dicotomías. Por ejemplo:
- Si-No; Verdadero- Falso; Mujer – Hombre; Fuma- No fuma, etc.
Interpretación
James Davis ofreció algunas expresiones que se pueden utilizar para describir los diversos rangos de valores. En concreto,
Davis desarrolló la expresión para utilizar a la hora de interpretar Q de Yule, otra medida de asociación 𝝋.
EJEMPLO
La pregunta: ¿Deben casarse los sacerdotes? Fue respondida por 90 hombres y 90 mujeres, según aparecen clasificadas
sus respuestas en la siguiente tabla:
Podemos preguntar si existe relación entre el sexo de los sujetos y la opinión respecto al celibato de los sacerdotes
católicos.
Si No
Mujeres 70 20
Hombres 50 40
70 × 40 − 20 × 50
𝝋= = 0.24
√90 × 90 × 120 × 60
INTERPRETACIÓN
El coeficiente phi, 𝝋 = 0.24 indica una relación de dependencia débil entre el sexo y la opinión respecto al celibato de los
sacerdotes. Además, como dicha asociación es positiva 𝝋 = 0.24 > 0, es decir las mujeres están asociados a la opinión de
estar de acuerdo con el celibato y el de los hombres al de estar en desacuerdo.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
QUINTO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN EN TABLAS 𝟐 × 𝟐 "PHI” 𝝋
En un estudio para averiguar si los hombres altos tienden a casarse con parejas altas, se publicó la siguiente información
sobre las esposas de 134 maridos altos y 116 maridos de estatura baja. Encuentre el coeficiente de asociación entre la
estatura de esposas y esposos.
En una empresa con 500 trabajadores, con estudios superiores o no, y que trabajan en oficinas o cadena de producción.
Como se muestra en la siguiente tabla de contingencia. Analizar si existe asociación entre las dos variables utilizando una
medida de asociación respectiva.
Cadena de
Oficinas
producción
Estudios
270 30
superiores
No estudios
80 120
superiores
VARIABLE X
ℎ: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑜𝑑𝑎𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑋
𝑘: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑜𝑑𝑎𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑌
Indica si existe o no relación entre las variables, pero no indica el grado o intensidad de relación al aumentar el tamaño
de la muestra.
No indica el sentido de la relación.
Es aplicable a variables medidas en escalas nominales, ordinales, de intervalo o de razón. Simplemente, las tres últimas
escalas deben reformularse como categóricas.
Es aplicable cuando las frecuencias teóricas (esperadas) no sean menores de cinco.
Si calculamos el valor de 𝝌𝟐 para una tabla de contingencia de dos filas por dos columnas, se cumple la
equivalencia:
EJEMPLO
La siguiente tabla muestra los resultados de un estudio para averiguar si el consumo de drogas está muy relacionado con
el comportamiento antisocial de una muestra de jóvenes seleccionados al azar en un centro de rehabilitación.
Así obtenemos, la tabla de contingencia de las frecuencias esperadas como se muestra a continuación:
[25 − 24.41]2 [20 − 28.03]2 [18 − 20.19]2 [25 − 15.37]2 [38 − 32.73]2 [38 − 37.58]2
𝝌𝟐 = + + + + + +
24.41 28.03 20.19 15.37 32.73 37.58
[22 − 27.08]2 [20 − 20.61]2 [18 − 23.86]2 [35 − 27.39]2 [27 − 19.73 ]2 [6 − 15.02]2
+ + + + + + =
27.08 20.61 23.86 27.39 19.73 15.02
𝝌𝟐 = 𝟐𝟐. 𝟎𝟓𝟗𝟑𝟎𝟒
INTERPRETACIÓN
El coeficiente Chi cuadrado 𝝌𝟐 = 𝟐𝟐. 𝟎𝟓𝟗𝟑𝟎𝟒 > 𝟎, indica que el consumo de drogas está relacionado con el comportamiento
antisocial.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
SEXTO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN TABLAS 𝒉 × 𝒌 "CHI CUADRADO” 𝝌𝟐 DE PEARSON
De una encuesta realizada a un grupo de jóvenes sobre la situación actual se han obtenido los siguientes resultados:
a. Complete la tabla de contingencia por cantidad de personas (frecuencia simple porcentual) considerando la variable
independiente X (Nivel de estudios) y la variable dependiente Y (Nivel de atención que prestan a las noticias,
cuestiones o acontecimientos que suceden en otros países).
b. Realizar las gráficas de barras agrupadas por frecuencias absolutas (cantidad de jóvenes) y por porcentajes
(porcentaje de jóvenes) considerando al nivel de estudios en el eje horizontal.
c. Averiguar si el nivel de estudios está relacionado con los problemas de la situación actual, utilizando el coeficiente
Chi Cuadrado. Calcúlelo e interprételo.
COEFICIENTE DE CONTINGENCIA 𝑪 DE PEARSON
El coeficiente de Contingencia C o coeficiente C de Pearson. Creado por Kart Pearson (1904), mide
el grado (magnitud) de asociación o relación entre dos conjuntos de atributos. Se aplica a datos de
escalas nominales y se calcula a partir de frecuencias ordenadas en tablas de contingencia de
cualquier número de celdas. Calculado a partir de una tabla de contingencia tendrá el mismo valor al
margen del orden de categorías en las filas y columnas.
𝝌𝟐
𝑪=√ 𝟎≤ 𝑪<𝟏
𝒏 + 𝝌𝟐
El límite superior, o el valor máximo, del coeficiente de contingencia C depende del tamaño de la tabla.
Cuando la tabla es cuadrada, es decir el número de filas 𝒉 es igual número de columnas 𝒌, el valor máximo de C se puede
calcular utilizando la siguiente ecuación:
𝒉−𝟏
𝒎á𝒙 𝑪 = √ , 𝒉=𝒌
𝒉
ℎ: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑓𝑖𝑙𝑎𝑠
𝑘: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠
Por ejemplo,
Para tablas de contingencia 2 × 2 el valor máximo es 0.707, es decir: 0 ≤ 𝐶 ≤ 0.707
Para tablas de contingencia 3 × 3 el valor máximo es 0.816, es decir: 0 ≤ 𝐶 ≤ 0.816
Es sólo con tablas de contingencia más de 5 x 5, que el límite superior excede a 0.900.
𝒉−𝟏
𝟎 ≤ 𝑪𝒎á𝒙 = √ <𝟏
𝒉
Si la tabla no es cuadrada, no es igual el número de filas y columnas 𝒉 ≠ 𝒌, entonces el valor máximo o límite superior de
C se puede calcular mediante:
𝟒 𝒉−𝟏 𝒌−𝟏
𝑪𝒎á𝒙 = √ ×
𝒉 𝒌
𝟒 𝒉−𝟏 𝒌−𝟏
𝟎 ≤ 𝑪𝒎á𝒙 = √ × <𝟏
𝒉 𝒌
COEFICIENTE DE CONTINGENCIA C ESTANDARIZADO
Hay una solución simple al problema de la variación en los límites superiores de los coeficientes de contingencia. Ellos
pueden normalizarse o estandarizarse, dividiendo por sus límites superiores. Esto hace que todos los valores máximos,
con independencia del tamaño de la tabla o forma, sean igual a 1. Estos coeficientes estandarizados pueden ser comparados
entre tablas de cualquier tamaño, utilizando la siguiente ecuación:
𝑪
𝑪𝒆𝒔𝒕𝒂𝒏𝒅 =
𝑪𝒎á𝒙
𝟎 ≤ 𝑪𝒆𝒔𝒕𝒂𝒏𝒅 ≤ 𝟏
Criterios de clasificación de los coeficientes de C (o 𝑪𝒆𝒔𝒕𝒂𝒏𝒅 ) no son muy comunes para ser encontrados. La mayoría de los
autores citar solamente que los valores cercanos a 0 representan débil o ninguna asociación y, la asociación más fuerte es
para valores cercanos a 1, sin embargo, la magnitud de estos factores no es lineal, lo que interfiere con la interpretación.
Vamos a seguir la siguiente clasificación (www.acastat.com/Statbook/chisqassoc.htm):
PROPIEDADES
DESVENTAS Y LIMITACIONES
El coeficiente de contingencia cumple con la primera característica, pero no cumple con la segunda, es decir es igual
a cero si no existe asociación entre las dos variables o atributos, pero no puede llegar a alcanzar la unidad. Por lo
tanto:
0≤𝐶<1
Dos coeficientes de contingencia se pueden comparar sólo si proceden de tablas del mismo tamaño, porque depende
el límite superior del número de filas y columnas.
C no es directamente comparable con ninguna otra medida de correlación.
Los datos deben ser usados adecuados para el cálculo de la 𝝌𝟐 ya que esta prueba sólo puede usarse si al menos el
20% de las celdas tienen una frecuencia esperada menor que 1.
Es dificultoso su interpretación debido a que no alcanza su máximo en la unidad.
EJEMPLO
Un investigador desea encontrar la asociación entre la cantidad de estrés en 167 estudiantes de un Instituto del primer
semestre dependiendo de sus condiciones socioeconómicas.
𝟐𝟗.𝟔𝟖
𝑪=√ = 𝟎. 𝟑𝟖𝟖
𝟏𝟔𝟕+𝟐𝟗.𝟔𝟖
𝑪 = 𝟎. 𝟑𝟖𝟖
𝟑−𝟏
𝑪𝒎á𝒙 = √ = 𝟎. 𝟖𝟏𝟔
𝟑
Interpretación:
La asociación existente entre la frecuencia en el estrés y la condición socioeconómica es moderada, en la cual conforme
sea la clase de vida, disminuye la frecuencia del proceso del estrés de manera significativa, con un valor de coeficiente
de contingencia de 0.388.
El valor obtenido de C=0,388 es comparado con 𝑪𝒎á𝒙 = 0,816 es aproximadamente el 47.54%. L a relación por tanto
es moderada.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
SÉPTIMO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN EN TABLAS 𝒉 × 𝒌 𝑪 DE PEARSON
De una encuesta realizada a un grupo de jóvenes sobre la situación actual se han obtenido los siguientes resultados:
Un psicólogo escolar está probando de tres métodos de lectura de niños disléxicos. Estudiando los antecedentes de estos
niños vio que la experiencia en la familia de hermanos disléxicos podría ser una causa de la ineficacia de los métodos. Con
el fin de obtener alguna evidencia, midió a sus alumnos en las dos variables y obtuvo la tabla siguiente de curación:
Convenciones para describir la magnitud de la asociación en tablas de contingencia (Rea & Parker, p. 203)
PROPIEDADES
Harald Cramer (Estocolmo, 25 de
El coeficiente V de Cramer tiene las
septiembre de 1893 - 5 de octubre de 1985).
siguientes propiedades:
Se encuentra comprendido entre los Harald Cramér fue un matemático sueco que se
valores 0 y 1. Es decir: 𝟎 ≤ 𝑽 ≤ 𝟏 especializó en estadística matemática. También hizo
Como está acotada, es el mejor de las contribuciones estadísticas a la distribución de
medidas de asociación, por ser más los números primos y primos gemelos. Enseñó de 1917 a
fácil de interpretar. 1958 como profesor en la Universidad de
Si hay dos filas o dos columnas, los Estocolmo (hasta 1917 como profesor asistente) y fue
coeficientes φ y V de Cramer son rector de la misma de 1950 a 1961.
iguales. La chi cuadrado va desde 0 hasta un valor que varía según el número de datos y
El coeficiente V de Cramer es el número de celdas. Eso de no contar con un máximo fijo dificulta bastante la
independiente del tamaño de la tabla y,
interpretación. No obstante, un suizo, llamado Harald Cramer (1893 – 1985),
por tanto, se puede utilizar con tablas
muy interesante en asuntos diversos del mundo de la estadística, estuvo
superiores a 2 x 2.
Cuando las variables son totalmente razonando matemáticamente hasta llegar a la conclusión de que el valor máximo
independientes V=0. que puede tener el invento es n(m-1), donde n es el número de datos y m es el
Cuanto mayor es la asociación mayor es número de valores o categorías de la variable que tiene menos valores. La V
el valor del coeficiente. consiste en dividir la chi-cuadrado entre su máximo, por lo que el resultado va
de 0 (no hay nada de relación) a 1 (relación máxima).
DESVENTAJAS Y LIMITACIONES
EJEMPLO
Un psicólogo escolar está probando de tres métodos de lectura de niños disléxicos. Estudiando los antecedentes de estos
niños vio que la experiencia en la familia de hermanos disléxicos podría ser una causa de la ineficacia de los métodos. Con
el fin de obtener alguna evidencia, midió a sus alumnos en las dos variables y obtuvo la tabla siguiente de curación:
Interpretación:
Se puede concluir que todos los coeficientes están por encima de la mitad del rango que pueden tomar, sin llegar a ser el
máximo. Podría decirse que resulta una asociación moderada-alta.
UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPA
ESCUELA PROFESIONAL DE PSICOLOGÍA
CURSO: PSICOESTADISTICA PROF.: LIC. LUIS GUERRA JORDAN
OCTAVO TALLER PARTE II COEFICIENTES DE ASOCIACIÓN EN TABLAS 𝒉 × 𝒌 V DE CRAMER
EJEMPLO
El número de hogares que ven un programa de televisión, obtenido en una encuesta dirigida a una muestra de hogares de
tres comunidades, se recoge en el cuadro siguiente.
Se desea conocer el grado de asociación entre ambos factores para dichos hogares a través del coeficiente V de Cramer.
a. Realizar las gráficas de barras agrupadas por frecuencias absolutas (cantidad de hogares) y por porcentajes
(porcentaje de hogares) considerando a las comunidades en el eje horizontal.