Вы находитесь на странице: 1из 39

TEMA 11.

DESCRIPCIN CONJUNTA DE
DOS VARIABLES: CORRELACIN
1. INTRODUCCIN
2. REPRESENTACIN GRFICA DE UNA RELACIN
4. CUANTIFICACIN DE UNA RELACIN LINEAL
4.1. COVARIANZA (Sxy)
4.2. COEFICIENTE DE CORRELACIN DE PEARSON
(rxy)
4.2.1. CLCULO DE rxy
4.2.2. INTERPRETACIN Y PROPIEDADES DE rxy
4.2.3. VALORACIN E INTERPRETACIN DE rxy
Amn, J. (1991). Estadstica para psiclogos. Vol I. Estadstica
Descriptiva. Madrid: Pirmide.
Botella, J.; Len, O.; San Martn, R., y Barriopedro, M.I. (2001).
Anlisis de Datos en Psicologa I. Teora y Ejercicios. Madrid:
Pirmide.
De la Fuente, E.I. y Garca, J. (1998). Anlisis de datos en
Psicologa. Ejercicios de estadstica descriptiva. Granada:
Urbano.
Escobar, M. (1999). Anlisis grfico/exploratorio. Cuadernos de
Estadstica n 2. Madrid: Muralla-Hesprides.
Freixa, M., Salafranca, L., Guardia, J., Ferrer, R. y Turbany, J.
(1992). Anlisis Exploratorio de Datos: nuevas tcnicas
estadsticas. Barcelona: PPU.
McRae, S. (1995). Modelos y mtodos para las Ciencias del
Comportamiento. Barcelona: Ariel.
Merino, J.M; Moreno, E; Padilla, M; Rodrguez-Min, P;
Villarino, A. (2001). Anlisis de Datos en Psicologa I. Madrid:
UNED.
Palmer, A. (1995). El anlisis exploratorio de datos. Madrid:
Eudema
Prez, F.J., Manzano, V. y Fazeli, H. (1998). Problemas resueltos
de Anlisis de Datos. Madrid: Pirmide.
Prez, F.J., Manzano, V. y Fazeli, H. (1999). Anlisis de Datos en
Psicologa. Madrid: Pirmide.
San Martn, R., Espinosa, L. y Fernndez, L. (1987).
Psicoestadstica Descriptiva. Madrid: Pirmide.
Stenberg, R.J. (1993). Investigar en Psicologa. Barcelona: Paids.
Objetivo
Intentaremos medir la posible relacin entre dos
variables. Estudiaremos bajo ttulo
correlacin los problemas referentes a la
variacin conjunta de dos variables, su
intensidad y su sentido (positivo o negativo)
1. INTRODUCCIN
Uno de los objetivos principales de la ciencia consiste en
descubrir las relaciones entre variables, y la estadstica ha
desarrollado instrumentos para ello
En el campo de la Psicologa podemos preguntarnos si el
rendimiento laboral en un determinado tipo de trabajo
guarda relacin con la personalidad del trabajador, si el
fracaso escolar es mas probable en nios con determinadas
circunstancias familiares y personales, si hay tareas en que la
prctica masiva facilita ms el aprendizaje que la prctica
distribuido o si determinados rasgos de personalidad estn
asociados a una mayor propensin al suicidio.
La observacin de relaciones claras y estables entre variables
ayuda a comprender los fenmenos y a a encontrar
explicaciones de los mismos e indica las vas probablemente
mas eficaces para intervenir sobre las situaciones
Desde el punto de vista matemtico las relaciones entre
variables pueden ser de muchos tipos (Y=1+2X; Y=X2; Y=82;
Y=1/X).
Estas funciones son conceptos matemticos y, por tanto,
tericos e ideales. Son habitualmente tiles en las ciencias
exactas, en las que las variables guardan una relacin
determinista o funcional.
Pero en las ciencias sociales, incluida la psicologa nunca se
encuentran relaciones deterministas, sino mas bien conjuntos
de observaciones que manifiestan una configuracin
concreta, y nos preguntaremos si esa configuracin (que
refleja la relacin entre variables) se parece a alguno de los
modelos tericos; en caso afirmativo diremos que ese modelo
explica bien la relacin.
Nosotros nos centraremos en el estudio de las relaciones
lineales, que son las ms sencillas.
Esto es, lo que vamos a exponer en el tema son las formas
ms habituales de observar y cuantificar las relaciones
lineales entre variables
Advertimos por tanto que aunque en el tema hablemos sobre
relaciones o correlaciones entre variables, estrictamente
hablando deberamos utilizar la expresin relacin lineal y si
no lo hacemos ser nicamente por economa de espacio.
Igualmente los ndices que vamos a describir son aplicables
exclusivamente a las variables al menos de intervalo. La
asociacin entre variables con otros niveles de medida
(nominales u ordinales) se pueden evaluar por otros
procedimientos que exceden los objetivos del temario.
2. REPRESENTACIN GRFICA DE UNA
RELACIN
Los procedimientos para determinar la existencia y grado de
relacin lineal entre dos variables deben ser tambin capaces
de discriminar entre los tres tipos de relacin lineal que hay.
Supongamos las variables X e Y:
Relacin lineal positiva o directa: cuando los valores altos en
Y tienden a emparejarse con valores altos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores bajos en X
Ejemplo: motivacion y rendimiento
Relacin lineal negativa o inversa: cuando los valores altos en
Y tienden a emparejarse con valores bajos en X, los valores
intermedios en Y tienden a emparejarse con valores
intermedios en X y los valores bajos en Y tienden a
emparejarse con valores altos en X
Ejemplo: Tiempo de realizacin de una tarea y nmero de
errores
Relacin nula: cuando no hay un emparejamiento sistemtico
entre ellas en funcin de sus valores
Ejemplo: estatura y rendimiento

Importante: Una correlacin nula no indica ausencia de relacin,


sino ausencia de relacin lineal. En otras palabras, indica que
el modelo lineal no se ajusta al comportamiento de esas
variables, pero puede haber algn tipo de relacin entre ellas
(ejemplo de la activacin y el rendimiento)
Veamos los siguientes conjuntos de datos que
representan las relaciones anteriores
SUJ MOTIV RENDIM SUJ TIEMPO ERROR SUJ ESTATU. INTELI.
(X) (Y) (X) ES (Y) (X) (Y)
1 9 5 1 7 4 1 7 3
2 12 5 2 11 2 2 8 1
3 6 1 3 5 4 3 5 3
4 9 4 4 5 5 4 12 3
5 7 2 5 6 4 5 8 2
6 9 2 6 9 4 6 9 4
7 5 1 7 13 1 7 7 4
8 9 3 8 8 2 8 6 4
9 7 3 9 4 5 9 6 3
10 3 1 10 9 3 10 9 2
11 10 4 11 6 3 11 9 3
12 6 2 12 10 2 12 6 2
13 11 5 13 11 1 13 10 2
14 4 2 14 9 2 14 10 4
15 13 5 15 7 3 15 8 5
La representaciones grficas conjunta de dos variables
permite observar visualmente este tipo de
relaciones.
Estas representaciones grficas se denominan
diagramas de dispersin, que constituyen nubes de
puntos donde representamos los pares de valores de
X e Y para cada uno de los sujetos y los
representamos en un eje de coordenadas
Relacin lineal positiva. Relacin lineal negativa.
Motivacin y rendimiento Tiempo en una tarea y numero
de errores

Ausencia de relacin lineal.


Estatura e Inteligencia
Destaquemos que este tipo de relacin, bien positiva o negativa
en que los puntos forman una lnea perfecta son situaciones
que no se dan nunca en relaciones reales entre variables
psicolgicas; slo podemos considerarlo como un modelo
ideal.
4. CUANTIFICACIN DE UNA RELACIN LINEAL
4.1. COVARIANZA (Sxy)
Desarrollaremos procedimientos precisos capaces de distinguir
entre los tres tipos de relacin descritos y cuantificar el grado
de relacin
Un primer procedimientos consistira en hallar el promedio de los
productos cruzados de las puntuaciones diferenciales
Al hablar de productos cruzados nos referimos al producto para
cada sujeto o caso de sus puntuaciones diferenciales en ambas
variables

Xi X Yi Y
n

i 1
n
Es lo que se denomina covarianza y se representa
Sxy
a) Datos no agrupados

Xi X Yi Y
n

Cov( X , Y ) Sxy i 1
n
n

x y i i
Cov( X , Y ) Sxy i 1
X Y
n

b) Datos agrupados

n Xi X Yi Y
n

ij
Cov( X , Y ) Sxy i 1
n
n

n x y ij i i
Cov( X , Y ) Sxy i 1
X Y
n
Interpretacin:
Sxy positivo: covarianza positiva
Sxy negativo: covarianza negativa
Sxy cero: ausencia de covariacin

Propiedades
1. El ndice es capaz de discriminar entre los tres tipos de relacin
lineal

2. Problemas en la interpretacin:
a) Depende de las unidades de medida de las variables (no
permite comparar)
b) Es un valor no acotado (carece de mximos y mnimos estables)
con lo cual no tenemos informacin sobre su cuanta y es difcil su
interpretacin

Solucin: Coeficiente de correlacin de Pearson (Rxy)


Ejemplo: Obtencin de la covarianza entre cinco pares de puntuaciones para
los mismos sujetos en ansiedad y depresin medidos en dos cuestionarios
diferentes (X, Y) y (V,W)

Ans(X) Depr(Y) XY Ans(V) Depr(W) VW


1,71 78 133,38 5,61 171,96 964,70
1,60 65 104 5,25 143,30 752,33
1,57 63 98,91 5,15 138,89 715,28
1,66 74 122,84 5,45 163,14 889,11
1,67 73 121,91 5,48 160,94 881,95
8,21 353 581,04 26,94 778,23 4203,37

X 1,624 Y 70,6 V 5,388 W 155,646


581,04
Sxy 1,62470,6 0,283
5
4203,37
Svw 5,388155,646 2,053
5
4.2. COEFICIENTE DE CORRELACIN DE
PEARSON (Rxy)
Un segundo ndice de asociacin lineal consistir en hallar
tambin un promedio de productos cruzados, pero no de las
puntuaciones diferenciales, sino de las puntuaciones tpicas.
Este ndice se denomina coeficiente de correlacin de Pearson
y se representa por la letra r (a veces puede aparecer en
maysculas). As, en teora las correlacin de Pearson entre X
e Y ser:

rxy
z xi z yi

n
La correlacin no es, por tanto, ms que una covarianza hallada
sobre las puntuaciones tipificadas; por eso a veces se dice que la
correlacin es una covarianza estandarizada o que es una
covarianza adimensional.
La formula anterior no resulta muy prctica a la hora de hacer
clculos, pues exige la tipificacin de cada puntuacin, y para
ello hay que hallar previamente las medias y desviaciones tpicas
de cada variable.
Para facilitar el clculo se han derivado otras frmulas alternativas
equivalentes que en la mayora de casos resultan ms prcticas:

rxy
x yi i

nSxSy
Sxy
rxy
SxSy
4.2.1. CLCULO DE rxy

1. Datos no agrupados

n XiYi Xi Yi
rxy
n Xi Xi n Yi Yi
2 2 2 2
2. Datos agrupados

n nxy XiYi nx Xi n yYi


rxy
n nx Xi nx Xi n n yYi n yYi
2 2 2 2

Donde:
nx: observaciones o frecuencias marginales de X
ny: observaciones o frecuencias marginales de Y
Nxy: observaciones dentro de las casillas interiores
de la tabla de frecuencias. Es decir, el nmero de
observaciones que pertenecen a un cierto intervalo
de la variable X y a otro de la variable Y
4.2.2. INTERPRETACIN Y PROPIEDADES DE Rxy

1. El coeficiente de correlacin de Pearson no puede


valer menos que -1 y mas que 1, esto es -1 0 1
Cercano a -1: correlacin lineal negativa
Cercano a 0: ausencia de correlacin lineal
Cercano a 1: correlacin lineal positiva

2. Es un valor adimensional, es invariante frente a


cualquier unidad de medida permite comparar
diferentes variables o la misma variable medida en
diferentes grupos-
3. Si hacemos transformaciones lineales de una o de las
dos variables, en que las constantes multiplicadoras
son positivas, el coeficiente de correlacin de
Pearson no se altera
Si U= aX+b y V= cY+d siendo (a y c >0)
entonces Ruv=Rxy
Ejemplo 1: Covarianza y Correlacin entre inteligencia y
rendimiento
X Y X2 Y2 XY
9 5 81 25 45
12 5 144 25 60
6 1 36 1 6
120 45
9 4 81 16 36 X 8 Y 3
7 2 49 4 14 15 15
9 2 81 4 18 415
5 1 25 1 5 Sxy 83 3,666
15
9 3 81 9 27
15415 12045
7 3 49 9 21 rxy
3 1 9 1 3 151078 120 15169 45
2 2

10 4 100 16 40 0.868
6 2 36 4 12
11 5 121 25 55
4 2 16 4 8
13 5 169 25 65
120 45 1078 169 415
Ejemplo 2: Covarianza y correlacin entre tiempo y nmero
de errores
X Y X2 Y2 XY
7 4 49 16 28
11 2 121 4 22
5 4 25 16 20
5 5 25 25 25 120 45
X 8 Y 3
6 4 36 16 24 15 15
9 4 81 16 36 319
13 1 169 1 13 Sxy 83 2,733
8 2 64 4 16
15
15319 12045
4 5 16 25 20
rxy
9 3 81 9 27 151054 120 15159 45
2 2

6 3 36 9 18
0.863
10 2 100 4 20
11 1 121 1 11
9 2 81 4 18
7 3 49 9 21

120 45 1054 159 319


Ejemplo 3: Covarianza y Correlacin entre estatura e
inteligencia
X Y X2 Y2 XY
7 3 49 9 21
8 1 64 1 8
5 3 25 9 15
12 3 144 9 36 120 45
8 2 64 4 16
X 8 Y 3
15 15
9 4 81 16 36
359
7 4 49 16 28 Sxy 83 0.067
6 4 36 16 24 15
6 3 36 9 18 15359 12045
rxy 0.035
9 2 81 4 18
151010 120 15151 45
2 2
9 3 81 9 27
6 2 36 4 12
10 2 100 4 20
10 4 100 16 40
8 5 64 25 40

120 45 1010 151 359


Ejemplo 4: Covarianza y correlacin en un ejemplo de
relacin lineal perfecta

X Y X2 Y2 XY
8 3 64 9 24 56 21
10 4 100 16 40
X 8 Y 3
7 7
6 2 36 4 12
224
14 6 196 36 84 Sxy 83 8
2 0 4 0 0 7
12 5 144 25 60 7224 5621
rxy 1
4 1 16 1 4 7560 56 791 21
2 2

56 21 560 91 224
4.2.3. VALORACIN E INTERPRETACIN DE rxy
En la interpretacin de Rxy hay que separar dos aspectos distintos: su
cuanta y su sentido. La cuanta se refiere al grado en que la relacin
entre dos variables queda bien definida con un ndice de asociacin
lineal como R. Mientras que el sentido se refiere al tipo de relacin
lineal: positiva, negativa o nula.
La interpretacin de la correlacin depende del campo de estudio.
Por ejemplo si estudiamos Fiabilidad en cualquier test; Test-
retest<0.80, no sera adecuado mientras que en un test de
Personalidad; = 0.30 resulta muy importante. En cada rea de estudio
se va desarrollando un conocimiento que permite valorar los
coeficientes de correlacin en trminos muy relativos. Esta es la
razn por la que no se pueden proponer categoras generales de
valoracin. Los coeficientes de correlacin deben valorarse
comparndolos unos con otros o comparndolos con los valores que
tpicamente se suelen encontrar en el campo de estudio del que se
trate.
Una correlacin nula no indica ausencia de relacin, sino ausencia
de relacin lineal. En otras palabras, indica que el modelo lineal no
se ajusta al comportamiento de esas variables, pero puede haber
algn tipo de relacin entre ellas (ejemplo de la activacin y el
rendimiento)

Una relacin de tipo lineal entre las variables no implica relacin de


tipo causal (X no tiene por qu causar a Y, aunque estn
relacionadas linealmente). Por ejemplo, puede existir relacin
lineal directa entre el nmero de coches por cada mil habitantes y
el nivel cultural medio de los habitantes de un pas, pero no por eso
si regalamos coches a esos habitantes se incrementar el nivel
cultural. Est claro que existe otras variables que estn actuando
conjuntamente con estas dos (nivel econmico, por ejemplo).
A veces se establecen entre las variables lo que se denominan
correlaciones espurias. Esto es, parece existir una relacin
entre dos variables y se deben al efecto de otras variables que
al tener una relacin con las otras primeras dos crea esta falsa
relacin.
Ejemplo, correlacin positiva entre el presupuesto en educacin
en Espaa y el nmero de salidas al extranjero de los
espaoles. Esto no quiere decir que al aumentar la educacin
los espaoles se vayan al extranjero, sino que hay otras
variables, como el aumento de la renta que puede estar
provocando la correlacin entre las variables anteriores.
Ejemplos del clculo de rxy
Ejemplo 1
Supongamos que queremos ver si existe correlacin lineal entre el nivel de
puntuacin obtenida por 5 pacientes en un test de ansiedad social (X) y el
nmero de evitaciones semanales ante situaciones que implican contacto
social (Y)

X Y Diagrama de dispersin

3 9 20

N.evitaciones (Y)
15
5 12
10
4 0
5
7 18 0
1 6 0 2 4 6 8
Ansiedad social (X)
X Y X2 Y2 XY

3 9 9 81 27
5 12 25 144 60
4 0 16 0 0
7 18 49 324 126
1 6 1 36 6
20 45 100 585 219
X 20 / 5 4
Y 45 / 5 9 n XY X Y 5219 2045
rxy
n X 2 X n Y 2 Y 5100 202 5585 452
2 2
Sxy 39 / 5 7,8

Sx 20 / 5 2
1095 900 195
0.65
100 900 1030
Sy 180 / 5 6

Sxy 7.8
rxy 0.65
SxSy 26
Ejemplo 2
Relacin entre medidas neuroanatmicas e inteligencia en gemelos
monocigticos.
Los gemelos monocigticos comparten varios rasgos fsicos,
psicolgicos y patolgicos. El tratamiento de imgenes del cerebro
permite, mediante resonancia magntica y anlisis computerizados,
cuantificar determinadas medidas y parmetros neuroanatmicos.
Se disea un estudio utilizando estas tcnicas para establecer si
dichas caractersticas tienen alguna relacin con el cociente
intelectual y si existe alguna relacin entre estas medidas.
Utilizando estas tcnicas se obtuvieron el rea de la superficie del
crtex cerebral, el rea del corpus callosum sagital y el volumen de
la cabeza, medido en diferentes pares de gemelos monocigticos.
Adems, se obtuvieron medidas del peso corporal, el cociente
intelectual y la circunferencia de la cabeza.
En este estudio se desea establecer si existe relacin en las medidas
neuroanatmicas entre gemelos monocigticos y si existe relacin
entre el cociente intelectual y las medidas neuroanatmicas.
La siguiente tabla muestra la relacin entre el cociente intelectual y el rea del
crtex cerebral de 20 pares de gemelos.

X Y
9 72
10 76
6 59 Diagrama de dispersin
8 68
100
10 60
80
5 58
60
8 70

Y
40
7 65 20
4 54 0
11 83 0 2 4 6 8 10 12
X
7 64
7 66
6 61
8 66
5 57
11 81
5 59
9 71
6 62
10 75
X Y X2 Y2 XY
9 72 81 5184 648
10 76 100 5776 760
6 59 36 3481 354
8 68 64 4624 544
10 60 100 3600 600
5 58 25 3364 290
8 70 64 4900 560
7 65 49 4225 455
4 54 16 2916 216
11 83 121 6889 913
7 64 49 4096 448
7 66 49 4356 462
6 61 36 3721 366
8 66 64 4356 528
5 57 25 3249 285
11 81 121 6561 891
5 59 25 3481 295
9 71 81 5041 639
6 62 36 3844 372
10 75 100 5625 750

152 1327 1242 89289 10376


152 1327
X 7. 6 Y 66.35
20 20

Yi Y
n

Xi X
n
2
86.8
1242.55 S2y i 1
4.34
S 2x i 1
62.12 n 20
n 20
Sx 62.12 7.88 n Sy 4.34 2.08
x y i i
Sxy i 1
X Y
n
10376
7.666.35 14.54
20
Sxy 14.54 14.54
rxy 0.885
SxSy 7.882.08 16.39
n XY X Y
rxy
n X X n Y Y
2 2 2 2

2010376 1521327
201242 1522 2089289 1327 2
207520 201704

24840 23104 1785780 1760929
5816 5816 5816
0.885
1736 24851 41.66157.64 6567.28

Вам также может понравиться