Академический Документы
Профессиональный Документы
Культура Документы
DESCRIPCIN CONJUNTA DE
DOS VARIABLES: CORRELACIN
1. INTRODUCCIN
2. REPRESENTACIN GRFICA DE UNA RELACIN
4. CUANTIFICACIN DE UNA RELACIN LINEAL
4.1. COVARIANZA (Sxy)
4.2. COEFICIENTE DE CORRELACIN DE PEARSON
(rxy)
4.2.1. CLCULO DE rxy
4.2.2. INTERPRETACIN Y PROPIEDADES DE rxy
4.2.3. VALORACIN E INTERPRETACIN DE rxy
Amn, J. (1991). Estadstica para psiclogos. Vol I. Estadstica
Descriptiva. Madrid: Pirmide.
Botella, J.; Len, O.; San Martn, R., y Barriopedro, M.I. (2001).
Anlisis de Datos en Psicologa I. Teora y Ejercicios. Madrid:
Pirmide.
De la Fuente, E.I. y Garca, J. (1998). Anlisis de datos en
Psicologa. Ejercicios de estadstica descriptiva. Granada:
Urbano.
Escobar, M. (1999). Anlisis grfico/exploratorio. Cuadernos de
Estadstica n 2. Madrid: Muralla-Hesprides.
Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J.
(1992). Anlisis Exploratorio de Datos: nuevas tcnicas
estadsticas. Barcelona: PPU.
McRae, S. (1995). Modelos y mtodos para las Ciencias del
Comportamiento. Barcelona: Ariel.
Merino, J.M; Moreno, E; Padilla, M; Rodrguez-Min, P;
Villarino, A. (2001). Anlisis de Datos en Psicologa I. Madrid:
UNED.
Palmer, A. (1995). El anlisis exploratorio de datos. Madrid:
Eudema
Prez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos
de Anlisis de Datos. Madrid: Pirmide.
Prez, F.J., Manzano, V. y Fazeli, H. (1999). Anlisis de Datos en
Psicologa. Madrid: Pirmide.
San Martn, R., Espinosa, L. y Fernndez, L. (1987).
Psicoestadstica Descriptiva. Madrid: Pirmide.
Stenberg, R.J. (1993). Investigar en Psicologa. Barcelona: Paids.
Objetivo
Intentaremos medir la posible relacin entre dos
variables. Estudiaremos bajo ttulo
correlacin los problemas referentes a la
variacin conjunta de dos variables, su
intensidad y su sentido (positivo o negativo)
1. INTRODUCCIN
Uno de los objetivos principales de la ciencia consiste en
descubrir las relaciones entre variables, y la estadstica ha
desarrollado instrumentos para ello
En el campo de la Psicologa podemos preguntarnos si el
rendimiento laboral en un determinado tipo de trabajo
guarda relacin con la personalidad del trabajador, si el
fracaso escolar es mas probable en nios con determinadas
circunstancias familiares y personales, si hay tareas en que la
prctica masiva facilita ms el aprendizaje que la prctica
distribuido o si determinados rasgos de personalidad estn
asociados a una mayor propensin al suicidio.
La observacin de relaciones claras y estables entre variables
ayuda a comprender los fenmenos y a a encontrar
explicaciones de los mismos e indica las vas probablemente
mas eficaces para intervenir sobre las situaciones
Desde el punto de vista matemtico las relaciones entre
variables pueden ser de muchos tipos (Y=1+2X; Y=X2; Y=82;
Y=1/X).
Estas funciones son conceptos matemticos y, por tanto,
tericos e ideales. Son habitualmente tiles en las ciencias
exactas, en las que las variables guardan una relacin
determinista o funcional.
Pero en las ciencias sociales, incluida la psicologa nunca se
encuentran relaciones deterministas, sino mas bien conjuntos
de observaciones que manifiestan una configuracin
concreta, y nos preguntaremos si esa configuracin (que
refleja la relacin entre variables) se parece a alguno de los
modelos tericos; en caso afirmativo diremos que ese modelo
explica bien la relacin.
Nosotros nos centraremos en el estudio de las relaciones
lineales, que son las ms sencillas.
Esto es, lo que vamos a exponer en el tema son las formas
ms habituales de observar y cuantificar las relaciones
lineales entre variables
Advertimos por tanto que aunque en el tema hablemos sobre
relaciones o correlaciones entre variables, estrictamente
hablando deberamos utilizar la expresin relacin lineal y si
no lo hacemos ser nicamente por economa de espacio.
Igualmente los ndices que vamos a describir son aplicables
exclusivamente a las variables al menos de intervalo. La
asociacin entre variables con otros niveles de medida
(nominales u ordinales) se pueden evaluar por otros
procedimientos que exceden los objetivos del temario.
2. REPRESENTACIN GRFICA DE UNA
RELACIN
Los procedimientos para determinar la existencia y grado de
relacin lineal entre dos variables deben ser tambin capaces
de discriminar entre los tres tipos de relacin lineal que hay.
Supongamos las variables X e Y:
Relacin lineal positiva o directa: cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores bajos en X
Ejemplo: motivacion y rendimiento
Relacin lineal negativa o inversa: cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores altos en X
Ejemplo: Tiempo de realizacin de una tarea y nmero de
errores
Relacin nula: cuando no hay un emparejamiento sistemtico
entre ellas en funcin de sus valores
Ejemplo: estatura y rendimiento
Xi X Yi Y
n
i 1
n
Es lo que se denomina covarianza y se representa
Sxy
a) Datos no agrupados
Xi X Yi Y
n
Cov( X , Y ) Sxy i 1
n
n
x y i i
Cov( X , Y ) Sxy i 1
X Y
n
b) Datos agrupados
n Xi X Yi Y
n
ij
Cov( X , Y ) Sxy i 1
n
n
n x y ij i i
Cov( X , Y ) Sxy i 1
X Y
n
Interpretacin:
Sxy positivo: covarianza positiva
Sxy negativo: covarianza negativa
Sxy cero: ausencia de covariacin
Propiedades
1. El ndice es capaz de discriminar entre los tres tipos de relacin
lineal
2. Problemas en la interpretacin:
a) Depende de las unidades de medida de las variables (no
permite comparar)
b) Es un valor no acotado (carece de mximos y mnimos estables)
con lo cual no tenemos informacin sobre su cuanta y es difcil su
interpretacin
rxy
z xi z yi
n
La correlacin no es, por tanto, ms que una covarianza hallada
sobre las puntuaciones tipificadas; por eso a veces se dice que la
correlacin es una covarianza estandarizada o que es una
covarianza adimensional.
La formula anterior no resulta muy prctica a la hora de hacer
clculos, pues exige la tipificacin de cada puntuacin, y para
ello hay que hallar previamente las medias y desviaciones tpicas
de cada variable.
Para facilitar el clculo se han derivado otras frmulas alternativas
equivalentes que en la mayora de casos resultan ms prcticas:
rxy
x yi i
nSxSy
Sxy
rxy
SxSy
4.2.1. CLCULO DE rxy
1. Datos no agrupados
n XiYi Xi Yi
rxy
n Xi Xi n Yi Yi
2 2 2 2
2. Datos agrupados
Donde:
nx: observaciones o frecuencias marginales de X
ny: observaciones o frecuencias marginales de Y
Nxy: observaciones dentro de las casillas interiores
de la tabla de frecuencias. Es decir, el nmero de
observaciones que pertenecen a un cierto intervalo
de la variable X y a otro de la variable Y
4.2.2. INTERPRETACIN Y PROPIEDADES DE Rxy
10 4 100 16 40 0.868
6 2 36 4 12
11 5 121 25 55
4 2 16 4 8
13 5 169 25 65
120 45 1078 169 415
Ejemplo 2: Covarianza y correlacin entre tiempo y nmero
de errores
X Y X2 Y2 XY
7 4 49 16 28
11 2 121 4 22
5 4 25 16 20
5 5 25 25 25 120 45
X 8 Y 3
6 4 36 16 24 15 15
9 4 81 16 36 319
13 1 169 1 13 Sxy 83 2,733
8 2 64 4 16
15
15319 12045
4 5 16 25 20
rxy
9 3 81 9 27 151054 120 15159 45
2 2
6 3 36 9 18
0.863
10 2 100 4 20
11 1 121 1 11
9 2 81 4 18
7 3 49 9 21
X Y X2 Y2 XY
8 3 64 9 24 56 21
10 4 100 16 40
X 8 Y 3
7 7
6 2 36 4 12
224
14 6 196 36 84 Sxy 83 8
2 0 4 0 0 7
12 5 144 25 60 7224 5621
rxy 1
4 1 16 1 4 7560 56 791 21
2 2
56 21 560 91 224
4.2.3. VALORACIN E INTERPRETACIN DE rxy
En la interpretacin de Rxy hay que separar dos aspectos distintos: su
cuanta y su sentido. La cuanta se refiere al grado en que la relacin
entre dos variables queda bien definida con un ndice de asociacin
lineal como R. Mientras que el sentido se refiere al tipo de relacin
lineal: positiva, negativa o nula.
La interpretacin de la correlacin depende del campo de estudio.
Por ejemplo si estudiamos Fiabilidad en cualquier test; Test-
retest<0.80, no sera adecuado mientras que en un test de
Personalidad; = 0.30 resulta muy importante. En cada rea de estudio
se va desarrollando un conocimiento que permite valorar los
coeficientes de correlacin en trminos muy relativos. Esta es la
razn por la que no se pueden proponer categoras generales de
valoracin. Los coeficientes de correlacin deben valorarse
comparndolos unos con otros o comparndolos con los valores que
tpicamente se suelen encontrar en el campo de estudio del que se
trate.
Una correlacin nula no indica ausencia de relacin, sino ausencia
de relacin lineal. En otras palabras, indica que el modelo lineal no
se ajusta al comportamiento de esas variables, pero puede haber
algn tipo de relacin entre ellas (ejemplo de la activacin y el
rendimiento)
X Y Diagrama de dispersin
3 9 20
N.evitaciones (Y)
15
5 12
10
4 0
5
7 18 0
1 6 0 2 4 6 8
Ansiedad social (X)
X Y X2 Y2 XY
3 9 9 81 27
5 12 25 144 60
4 0 16 0 0
7 18 49 324 126
1 6 1 36 6
20 45 100 585 219
X 20 / 5 4
Y 45 / 5 9 n XY X Y 5219 2045
rxy
n X 2 X n Y 2 Y 5100 202 5585 452
2 2
Sxy 39 / 5 7,8
Sx 20 / 5 2
1095 900 195
0.65
100 900 1030
Sy 180 / 5 6
Sxy 7.8
rxy 0.65
SxSy 26
Ejemplo 2
Relacin entre medidas neuroanatmicas e inteligencia en gemelos
monocigticos.
Los gemelos monocigticos comparten varios rasgos fsicos,
psicolgicos y patolgicos. El tratamiento de imgenes del cerebro
permite, mediante resonancia magntica y anlisis computerizados,
cuantificar determinadas medidas y parmetros neuroanatmicos.
Se disea un estudio utilizando estas tcnicas para establecer si
dichas caractersticas tienen alguna relacin con el cociente
intelectual y si existe alguna relacin entre estas medidas.
Utilizando estas tcnicas se obtuvieron el rea de la superficie del
crtex cerebral, el rea del corpus callosum sagital y el volumen de
la cabeza, medido en diferentes pares de gemelos monocigticos.
Adems, se obtuvieron medidas del peso corporal, el cociente
intelectual y la circunferencia de la cabeza.
En este estudio se desea establecer si existe relacin en las medidas
neuroanatmicas entre gemelos monocigticos y si existe relacin
entre el cociente intelectual y las medidas neuroanatmicas.
La siguiente tabla muestra la relacin entre el cociente intelectual y el rea del
crtex cerebral de 20 pares de gemelos.
X Y
9 72
10 76
6 59 Diagrama de dispersin
8 68
100
10 60
80
5 58
60
8 70
Y
40
7 65 20
4 54 0
11 83 0 2 4 6 8 10 12
X
7 64
7 66
6 61
8 66
5 57
11 81
5 59
9 71
6 62
10 75
X Y X2 Y2 XY
9 72 81 5184 648
10 76 100 5776 760
6 59 36 3481 354
8 68 64 4624 544
10 60 100 3600 600
5 58 25 3364 290
8 70 64 4900 560
7 65 49 4225 455
4 54 16 2916 216
11 83 121 6889 913
7 64 49 4096 448
7 66 49 4356 462
6 61 36 3721 366
8 66 64 4356 528
5 57 25 3249 285
11 81 121 6561 891
5 59 25 3481 295
9 71 81 5041 639
6 62 36 3844 372
10 75 100 5625 750
Yi Y
n
Xi X
n
2
86.8
1242.55 S2y i 1
4.34
S 2x i 1
62.12 n 20
n 20
Sx 62.12 7.88 n Sy 4.34 2.08
x y i i
Sxy i 1
X Y
n
10376
7.666.35 14.54
20
Sxy 14.54 14.54
rxy 0.885
SxSy 7.882.08 16.39
n XY X Y
rxy
n X X n Y Y
2 2 2 2
2010376 1521327
201242 1522 2089289 1327 2
207520 201704
24840 23104 1785780 1760929
5816 5816 5816
0.885
1736 24851 41.66157.64 6567.28