Вы находитесь на странице: 1из 38

MEDIDAS DE

ASOCIACIN
MG.ING.ESTAD.VILLENA ZAPATA, LUIGI
MEDIDAS DE ASOCIACIN
Las medidas no paramtricas de
correlacin estn disponibles para datos
tanto categricos como ordenados.
MEDIDAS DE ASOCIACIN
En caso de rechazar la independencia
entre los dos factores de una tabla de
contingencia, se plante la necesidad de
definir ndices que describan no solo la
intensidad de la asociacin, sino tambin
su direccin. El estudio de estos ndices,
que se conocen con el nombre genrico
de medidas de asociacin.
MEDIDAS DE ASOCIACIN DE
TIPO NOMINAL
Despus de analizar si existe relacin o no
entre las variables objeto de estudio, cabe
preguntarse cul es la intensidad de esa
relacin?. Entre las medidas utilizadas se
encuentran: Coeficiente de contingencia,
Q de Yule, Phi y C de Cramer, Lambda y el
Coeficiente de incertidumbre.
COEFICIENTE C DE CRAMER
El coeficiente C de Cramer es una medida
del grado de asociacin o relacin entre
dos series de atributos o variables. Se usa
nicamente cuando tenemos slo
informacin categrica (escala nominal).
COEFICIENTE C DE CRAMER
El coeficiente C de Cramer, al ser
calculado de una tabla de contingencia,
proporciona los mismos valores sin
considerar cmo fueron ordenadas las
categoras en las filas y columnas. (En el
SPSS podemos operacionalizar ambas
categorias sin tener en cuenta los valores 1-
2 o 2-1).
COEFICIENTE C DE CRAMER
Mientras mayor sea la discrepancia entre
los valores observados y los esperados, ms
altos es el grado de asociacin entre las
dos variables, por tanto ms grande el valor
del coeficiente de Crmer.
COEFICIENTE C DE CRAMER
El coeficiente de Cramer tiene un valor
mximo de uno y C ser igual a cero
cuando las variables o los atributos sean
independientes. A diferencia del
coeficiente de correlacin de Pearson, el
coeficiente de Cramer no puede ser
negativo. (Esto se debe a que mide la
relacin entre variable categricas que no
poseen ningn orden)
Por ltimo, est el coeficiente V de Cramer,

2
V= (5)
N (k 1)

en que k es el mnimo entre el nmero de filas y el nmero


de columnas.

Este coeficiente est acotado entre 0 y 1, y puede alcanzar


ambas cotas, por lo tanto es el mejor de las medidas de
asociacin, por ser ms fcil de interpretar.
Si hay dos filas o dos columnas, los coeficientes f y V de
Cramer son iguales.
COEFICIENTE PHI PARA TABLAS
2X2: re
El coeficiente phi es una evaluacin de la
asociacin o relacin entre dos conjuntos
de atributos medidos en una escala
nominal, cada uno de los cuales puede
tomar slo dos valores. De hecho, es
idntico en valor al coeficiente de Cramer
presentado (para tablas 2x2).
COEFICIENTE PHI PARA TABLAS
2X2: re
Una desventaja del coeficiente Phi como
ndice de asociacin para tablas ms
grandes, es que no es igual a la unidad
cuando existe una asociacin perfecta en
tablas de frecuencias no cuadradas.
La primera medida de asociacin es el coeficiente f, definido
como

f= 2 (3)
N

en que N es el total de observaciones.

El coeficiente f es mayor que 0, y aunque es mucho menor


que el estadstico ji-cuadrado, no est acotado
superiormente. Puede ser mayor que uno.
COEFICIENTE DE C
X c2
CONTINGENCIA X c2 n

Propiedades:
i) El coeficiente de contingencia es un valor
que siempre est comprendido entre 0 y 1.
Esto es C e [0,1>, asumiendo el valor de
cero, cuando no existe asociacin entre las
variables en estudio, no pudiendo alcanzar
el valor de uno (1) si hubiera una perfecta
asociacin.
COEFICIENTE DE C
X c2
CONTINGENCIA X c2 n

Propiedades:
ii) Dos coeficientes de contingencia no son
comparables a menos de que sean
resultados de tablas de contingencia del
mismo orden.
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociacin

El estadstico de Pearson nos dice si dos


variables son independientes una de otra
pero no nos dice nada acerca de la
naturaleza de la relacin.

Esto es, no sabemos cuan fuerte es la


asociacin entre las variables analizadas.

Para medir el grado de relacin entre las


variables se utiliza el denominado Coeficiente
de Contingencia (C).
PRUEBA CHI CUADRADO

Ejemplo
Supongamos que para investigar esta
relacin, el investigador toma una
muestra aleatoria de tamao n=300 de
todas aquellas familias que matricularon
a sus hijos en las escuelas de una regin.

Lasiguiente tabla provee la clasificacin


de los 300 datos:
PRUEBA CHI CUADRADO

EJEMPLO
TAMAO DE
FAMILIA

DEPENDENCIA DEL
COLEGIO 2Y3 4Y5 ms de 5 Total

PARTICULAR
PAGADO 25 37 8 70
PARTICULAR
SUBVENCIONADO 10 62 53 125
ESTATAL
5 41 59 105
Total 40 140 120 300
PRUEBA CHI CUADRADO

Ejemplo
Nuestratarea es determinar si el tamao
de la familia afecta la decisin del tipo
de colegio.

Lahiptesis nula es que las variables son


independientes (esto es, no hay relacin
entre tamao familiar y la eleccin del
colegio); la hiptesis alternativa es que las
variables no son independientes.
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociacin

Elcoeficiente de contingencia se calcula


fcilmente desde el estadstico de
Pearson:

C

2
n

donde n es el tamao muestral.


PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociacin

Del ejemplo anterior sabemos que el


nmero de miembros que tenga la familia
afecta la decisin de la eleccin del
colegio, pero esa es solamente una parte
del anlisis. En particular, cul es el grado
de relacin entre las dos variables?

58.21
C 0.403
300 58.21
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociacin

Este valor de 0.403 indica una relacin


fuerte entre las variables?

Para poder responder esta pregunta


necesitamos saber los lmites de variacin de
C.

Cuando no hay relacin entre las variables el


coeficiente C = 0. El valor mximo de C est
dado por
min( r 1, c 1)
C
max
1 min( r 1, c 1)
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociacin

En nuestro caso:

min( r 1, c 1) 2
C 0.816
max
1 min( r 1, c 1) 3
Entonces:

El valor calculado se encuentra ms o menos en la


mitad entre el valor mnimo y mximo de C por lo
que uno puede afirmar que existe una relacin
moderada entre el tamao de la familia y la
eleccin del tipo de colegio.
MEDIDAS DE ASOCIACIN DE
TIPO ORDINAL
COEFICIENTE DE CORRELACIN T DE
KENDALL DE RANGOS ORDENADOS
El coeficiente de correlacin T de Kendall
de rangos ordenados es adecuado como
una medida de correlacin con la misma
clase de datos para los cuales es til. Esto
es, si al menos se han logrado medidas
ordinales de ambas X y Y, tal que a cada
sujeto pueda serle asignado un rango tanto
en X como en Y.
COEFICIENTE DE CORRELACIN T DE
KENDALL DE RANGOS ORDENADOS
El coeficiente es particularmente
adecuado para evaluar el acuerdo entre
jueces mltiples.
EJEMPLO
Un investigador est interesado en saber si
el desarrollo mental tiene alguna relacin
con la educacin formal de su madre. As,
obtiene las calificaciones de desarrollo
mental por la escala de Gesell de ocho
nios elegidos al azar y se informe el grado
de escolaridad de las madres. Los datos se
muestran en la siguiente tabla:
EJEMPLO
X Y
Primero de primaria 80
Segundo de primaria 82
Sexto de primaria 85
Primero de secundaria 83
X= Escolaridad de la Madre.
Segundo semestre de universidad 91
Segundo de primaria 84 Y= Calificacin del desarrollo
Analfabeta 76 mental de los nios
Tercero de primaria 78
Sexto de primaria 81
Tercero de secundaria 88
Profesional 92
Egresado 90
Egresado 89
Analfabeta 75
Sexto de primaria 79
Tercero de primaria 86
Cuarto de primaria 84
Quinto de primaria 83
Primer semestre de universidad 87
Sexto de primaria 85
EJEMPLO
Planteamiento de la hiptesis estadstica

H 0 : El desarrollo mental de los hijos no se relacionan con la


educacin formal de la madre es un efecto del azar.
H1 : El desarrollo mental de los hijos se relacionan con la
educacin formal de la madre es un efecto del azar.
Nivel de significacin:
El nivel de significacin elegido para su verificacin es de
5% o 0.05, es decir alfa=0.05. Para todo valor de p<=0.05,
se rechaza la Ho.
La Tau-b y la tauc de Kendall
Estos ndices son una alternativa a la T por
kendall. En estos ya se tiene en cuenta
expresamente los empates.
La tau-b utiliza el mismo criterio que la d de
Somers simtricas, si bien utiliza la media
geomtrica en de la media aritmtica:

b
P Q
P Q Tx P Q Ty
La Tau-b y la tauc de Kendall
La tau-c utiliza el mnimo de filas y
columnas:

2 m P Q
c 2
N m 1
Donde : m mnn filas, ncolumnas