You are on page 1of 4

CORRELACIN.

La correlacin es la forma numrica en la que la estadstica ha podido evaluar la relacin de


dos o ms variables, es decir, mide la dependencia de una variable con respecto de otra
variable independiente.
Para poder entender esta relacin tendremos que analizarlo en forma grfica:
Si tenemos los datos que se presentan en la tabla y
consideramos que la edad determina el peso de las
personas entonces podremos observar la siguiente grfica:

peso
60
75
67
80
60
65
92

Donde los puntos


representan
cada
uno de los pares
ordenados y la lnea
podra ser una recta
que represente la
tendencia de los datos, que en otras palabras podra
decirse que se observa que a mayor edad mayor peso.

100
80
pesos

edad
15
30
18
42
28
19
31

60
40
20
0

0
20
40
60
La correlacin se puede explicar con la pendiente de
edades
esa recta estimada y de esta forma nos podemos dar
cuenta que tambin existe el caso en el que al crecer la
variable
independiente
decrezca
la
variable
dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces podremos decir
que no existe correlacin.

As en estadstica podremos calcular la correlacin para datos no agrupados con la siguiente


formula.
n

i 1

i 1

En donde:
R = coeficiente de correlacin
N = nmero de pares
ordenados
X = variable independiente
Y = variable independiente

n xi y i xi * y i
i 1

n x xi n y i2
i 1 i 1

i 1
n

2
i

Edad (x)
15
30
18
42
28
19
31

Peso (y)
60
75
67
80
60
65
92

183

499

y
i 1

X2

Ejemplo:
Y2

X* Y

225
900
324
1764
784
361
961

3600
5625
4489
6400
3600
4225
8464

900
2250
1206
3360
1680
1235
2852

5319

36403

13483

Supngase que deseamos obtener la correlacin de los datos de la tabla anterior:


Ahora podemos observar que:

n
n
n
n x y x * y
i 1 i i i 1 i i 1 i

2
2

n
n
n
n
n x 2 x n y 2 y
i 1 i i 1 i i 1 i i 1 i

7 * 13483 (183 * 499)


0.65638606
7 * 5319 (183)2 7 * 36403 ( 499)2

Se debe aclarar que el coeficiente de correlacin slo puede variar de la siguiente manera:
1 r 1 y que para entenderlo mejor se debe obtener el coeficiente de determinacin que
se obtiene con r cuadrada, ya que este representa el porcentaje que se explica y
mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya que, esta muy cerca de 1 y
que el porcentaje de datos que explican a y es (0.65638606) 2= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
Primero tendremos que pensar que se genera una matriz, ya que, ahora estamos juntando dos
tablas de distribucin de frecuencias y por ello nuestros clculos sern ms laboriosos, por lo
que les recomiendo el uso de una hoja de calculo o al menos una calculadora con regresin
para datos agrupados.
De cualquier forma aqu tambien estamos evaluando numricamente si existe relacin entre
dos variables y lo haremos con la siguiente ecuacin.
En
donde
podemos
encontrar k como el nmero
j 1 i 1
i 1
i 1
de clases para la variable
r
"y" y l para el nmero de
2
2
l
k
l
k

2
2

clases de "x".
n fx xi fx xi n fy y i fy y i
Tambin podemos observar
i 1
i 1
i 1

i 1
que hay varios tipos de "f"
es decir, la que se
encuentra sola (sin subndice) que nos habla de las frecuencias celdares (cada una de las
frecuencias que se encuentran en la interseccin entre una columna y un rengln) y las "f" con
subndices que representan las frecuencias de cada una de las variables.
k

n f x i y i fx x i * fy y i

Para entender el uso de esta formula usaremos un ejemplo:


Los resultados que se presentan en la siguiente tabla representan los pesos y las estaturas de
48 alumnos entrevistados el "da anhuac"

Marcas de clase de "x"


1.445 1.545 1.645 1.745
44.5
54.5
64.5
74.5
84.5
94.5
fx
fx x

0
0

fx x^2

marcas
de clase
de "Y"

3
5
1

1.845 1.945

1
9
2

fy

4
5
19
4
1
1
9
5
1
1
7
2
2
1
5
1
3
4
9
12
17
7
3
48
13.90 19.74 29.665 12.915 5.835 82.06
5
21.48 32.47 51.765 23.8281 11.34 140.8982
3225 23
425
75
9075

fx y

fx y^2

178
1035.5
580.5
521.5
422.5
378
3116

7921
56434.75
37442.25
38851.75
35701.25
35721
212072

f x y 5380.77

Correlacin= 0.695
La sustitucin de la frmula es la siguiente:

i 1

i 1

n f x i y i f x x i * fy y i

j 1 i 1

2
2
l
k 2 k

n
f
x

f
x
n
f
y

f
y

x i
y i
y i
l

2
x i

48 * 5380.77 - (82.06 * 3116)

((48 * 140.8982) - 82.06 2 ) * (( 48 * 212072) - 3116

Al interpretar nuestro resultado podemos concluir que si existe relacin entre el peso y la
estatura, es decir, que a mayor estatura mayor peso.
En muchas ocasiones el resultado de la correlacin es negativo y lo que debemos pensar es
que la relacin de las variables involucradas en el calculo es inverso es decir que en la medida
demandala variable dependiente decrece:
que crece la variable independiente
150
1698
100 2045
1348
50
1268
0
1000

47
15
100
120
1500

2000

Valor
-1

Significado
Correlacin negativa grande y perfecta

-0,9 a -0,99

Correlacin negativa muy alta

-0,7 a -0,89

Correlacin negativa alta

-0,4 a -0,69

Correlacin negativa moderada

-0,2 a -0,39

Correlacin negativa baja

-0,01 a -0,19

Correlacin negativa muy baja

Correlacin nula

0,01 a 0,19

Correlacin positiva muy baja

0,2 a 0,39

Correlacin positiva baja

0,4 a 0,69

Correlacin positiva moderada

0,7 a 0,89

Correlacin positiva alta

0,9 a 0,99

Correlacin positiva muy alta

Correlacin positiva grande y perfecta

Cuando la correlacin es positiva, esto nos indica que su proyeccin de


la regresin lineal va a tender a crecer conjuntamente con la contra
variable.

Cuando la correlacin es negativa, esto nos indica que su proyeccin de la regresin lineal va a tender a
decrecer conjuntamente con la contra variable.