Академический Документы
Профессиональный Документы
Культура Документы
3) Coeficientes de correlacin
Los coeficientes de correlacin son medidas que indican la situacin relativa de los
mismos sucesos respecto a las dos variables, es decir, son la expresin numrica que
nos indica el grado de relacin existente entre las 2 variables y en qu medida se
relacionan. Son nmeros que varan entre los lmites +1 y -1. Su magnitud indica el
grado de asociacin entre las variables; el valor r = 0 indica que no existe relacin entre
las variables; los valores 1 son indicadores de una correlacin perfecta positiva (al
crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o
crece Y).
No existe correlacin
Correlacin Positiva
Correlacin Negativa
Valor
-1
-0,9 a -0,99
-0,7 a -0,89
-0,4 a -0,69
-0,2 a -0,39
-0,01 a
-0,19
0
0,01 a 0,19
0,2 a 0,39
0,4 a 0,69
0,7 a 0,89
0,9 a 0,99
1
Significado
Correlacin negativa grande y
perfecta
Correlacin negativa muy alta
Correlacin negativa alta
Correlacin negativa moderada
Correlacin negativa baja
Correlacin negativa muy baja
Correlacin nula
Correlacin positiva muy baja
Correlacin positiva baja
Correlacin positiva moderada
Correlacin positiva alta
Correlacin positiva muy alta
Correlacin positiva grande y perfecta
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos das diferentes en una ciudad, determinar
el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson.
X
Y
18 17 15 16 14 12 9 15 16 14 16 18 X =180
13 15 14 13 9
10 8 13 12 13 10 8
Y= 138
Solucin:
Se calcula la media aritmtica
Para X:
Para Y:
18
17
15
16
14
12
9
15
16
14
16
18
13
15
14
13
9
10
8
13
12
13
10
8
180
138
3
2
0
1
-1
-3
-6
0
1
-1
1
3
1,5
3,5
2,5
1,5
-2,5
-1,5
-3,5
1,5
0,5
1,5
-1,5
-3,5
Se aplica la frmula:
9
4
0
1
1
9
36
0
1
1
1
9
4,5
7
0
1,5
2,5
4,5
21
0
0,5
-1,5
-1,5
-10,5
2,25
12,25
6,25
2,25
6,25
2,25
12,25
2,25
0,25
2,25
2,25
12,25
72
28
63
Borrar Serie 1, las lneas horizontales y verticales (haciendo clic y suprimir en cada
objeto).
Donde:
= nmero de datos.
= frecuencia de celda.
= frecuencia de la variable X.
= frecuencia de la variable Y.
= valores codificados o cambiados para los intervalos de la variable X, procurando
que al intervalo central le corresponda
= 0, para que se hagan ms fciles los
clculos.
= valores codificados o cambiados para los intervalos de la variable X, procurando
que al intervalo central le corresponda
= 0, para que se hagan ms fciles los
clculos.
Ejemplo ilustrativo:
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones
en una prueba de conocimiento (Y) de 50 estudiantes:
N de
estudiante
1
2
3
4
5
6
7
8
9
10
11
X
76
77
78
79
79
80
80
80
82
82
83
Y
28
24
18
41
43
45
34
18
40
35
30
N de
estudiante
26
27
28
29
30
31
32
33
34
35
36
X
88
88
88
88
89
89
90
90
90
91
92
Y
40
31
35
26
30
24
18
11
15
38
34
12
13
14
15
16
17
18
19
20
21
22
23
24
25
83
83
83
84
84
84
85
85
86
86
86
86
87
88
21
22
23
25
11
15
31
35
26
30
24
16
20
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
92
93
93
93
94
96
97
98
99
100
101
101
102
102
31
33
35
24
40
35
36
40
33
51
54
55
41
45
En la variable Y:
Calculando el Rango se obtiene:
3
3
14
11
11
8
50
Interpretacin:
- El nmero 5 es la frecuencia de la celda correspondiente al par de intervalos 86-90 en
Coeficiente Intelectual y 19-26 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 8 en la fila de fx es el total marginal o frecuencia marginal del intervalo 76-80
en Coeficiente Intelectual.
- El nmero 14 en la columna de fy es el total marginal o frecuencia marginal del intervalo
35-42 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 50 es total de frecuencias marginales y representa al nmero total de
estudiantes.
2) Realizando los clculos respectivos se obtiene la siguiente tabla:
Nota:
Los nmeros de las esquinas de cada celda en la anterior tabla representan el producto
fdxdy, as por ejemplo, para obtener el nmero el nmero -8 de los intervalos 76-80 en
X y 43-50 en Y se obtiene multiplicando 2(-2)(2) = -8. Para obtener el nmero 6 de los
intervalos 96-100 en X y 51-58 en Y se obtiene multiplicando 123 = 6.
Los nmeros de la ltima columna (24, -2, 7, 0, 5 y 12) se obtienen sumando los
nmeros de las esquinas en cada fila, as por ejemplo, para obtener el nmero 24 se
suma 6 + 18 = 24.
Los nmeros de la ltima fila (0, 5, 0, 2, 12 y 27) se obtienen sumando los nmeros de
las esquinas en cada columna, as por ejemplo, para obtener el nmero 27 se suma 18
+ 6 + 3 = 27.
Para obtener el nmero 2 de la antepenlmina columna se obtiene sumando los
resultados de fydy, es decir, representa la fydy
Para obtener el nmero 2 de la antepenlmina fila se obtiene sumando los resultados de
fxdx, es decir, representa la fydy
Para obtener el nmero 96 de la penltima columna se obtiene sumando los resultados
de
, es decir, representa
Para obtener el nmero 106 de la penltima fila se obtiene sumando los resultados de
, es decir, representa
Para obtener ltimo nmero de la ltima columna se obtiene sumando los resultados de
la ltima columna (46=24-2+7+0+5+12), es decir, representa fdxdy.
Para obtener ltimo nmero de la ltima fila se obtiene sumando los resultados de la
ltima fila (46=0+5+0+2+12+27), y tiene que ser igual al ltimo nmero de la ltima
columna como comprobacin que los clculos de la tabla han sido correctos.
Observando los datos en la tabla anterior se reemplaza los valores en la ecuacin del
Coeficiente de Correlacin de Pearson para datos agrupados, obtenindose:
rs 1
6 d 2
n n 2 1
1
2
3
4
5
6
7
8
3
4
1
5
6
2
8
7
Nota: Observar que la tabla ya describe los rangos correspondientes a cada variable.
Solucin:
El diagrama de dispersin hecho en Excel se muestra en la siguiente figura:
1
2
3
4
5
6
7
8
3
4
1
5
6
2
8
7
-2
-2
2
-1
-1
4
-1
1
4
4
4
1
1
16
1
1
Se aplica la frmula:
Por lo tanto existe una correlacin positiva moderada entre la primera y segunda
evaluacin de los 8 estudiantes.
c) Pulsar en Aceptar.
Ejemplo ilustrativo N 2
La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las
asignaturas de Matemtica y Estadstica. Calcular el coeficiente de correlacin por
rangos de Spearman y realizar el diagrama de dispersin.
N
1
2
3
4
5
6
7
8
Nota: La tabla, a diferencia del ejemplo anterior, brinda puntuaciones directas para cada
estudiante.
Solucin:
Para calcular el coeficiente de correlacin por rangos de Spearman se procede a
clasificar u ordenar los datos en rangos (X para Matemtica y Y para Estadstica)
tomando en cuenta las siguientes observaciones:
En la asignatura de Matemtica se observa:
Diana tiene la ms alta calificacin, ocupando el primer puesto, por lo que su rango es
1
Elizabeth ocupa el segundo puesto, por lo que su rango es 2
Mario se encuentra ubicado en el tercer lugar, por lo que su rango es 3
Orlando y Matas ocupan el cuarto y quinto puesto, por lo que su rango es la media
aritmtica de 4 y 5 que da por resultado 4,5
Josu y Anita ocupan el sexto y sptimo lugar, por lo que su rango es la media
aritmtica de 6 y 7 que da por resultado 6,5
Luca se encuentra ubicada en el octavo lugar, por lo que su rango es 8
X
1
2
3
4,5
4,5
6,5
6,5
8
Y
4,5
7,5
1
2,5
4,5
6
7,5
2,5
Y
4,5
7,5
1
2,5
4,5
6
7,5
2,5
d= X-Y
-3,5
-5,5
2
2
0
0,5
-1
5,5
X
1
2
3
4,5
4,5
6,5
6,5
8
d2=(X-Y)2
12,25
30,25
4
4
0
0,25
1
30,25
d2= 82
4) COEFICIENTE DE DETERMINACIN
Revela qu porcentaje del cambio en Y se explica por un cambio en X. Se calcula
elevando al cuadrado el coeficiente de correlacin.
18 17 15 16 14 12 9 15 16 14 16 18
13 15 14 13 9
10 8 13 12 13 10 8
Solucin:
Se sabe que coeficiente de Pearson es r = 0,416
Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de
determinacin.
Coeficiente de determinacin =
Esto establece que 17% de los cambios en la variable Y puede ser explicado a travs
de los cambios en la variable X.
Nota:
El valor
tiene significado slo para las relaciones lineales. Dos variables pueden tener
y sin embargo estar relacionadas en sentido curvilneo. El valor de
no se
interpreta como si la variable Y fuera causado por un cambio de la variable X, ya que la
correlacin no significa causa.
En Excel se calcula elevando al cuadrado el coeficiente de correlacin o insertando la
funcin =COEFICIENTE.R2 como muestra la siguiente figura: