Академический Документы
Профессиональный Документы
Культура Документы
Sesin N 12
ESTADISTICA
QUE ES LA CORRELACIN?
1. ANALISIS DE CORRELACION
DEFINICIN. La correlacin es el mtodo empleado para
determinar el grado de asociacin o relacionamiento entre las
variables que se estudian, para as determinar en qu medida una
relacin funcional describe o explica en una forma adecuada la
relacin entre estas variables.
TIPOS DE CORRELACIN. Atendiendo al relacionamiento entre
las variables X e Y podemos tener:
a) Correlacin Directa o Positiva. Cuando las variables X e Y presentan variaciones
en un mismo sentido, esto es, para mayores valores de X corresponde mayores
valores de Y.
b) Correlacin Inversa o Negativa. Cuando las variaciones de X e Y son en
sentidos contrarios, esto es, para mayores valores de X corresponden menores
valores de Y.
c) Sin correlacin. Cuando no existe ningn tipo de relacionamiento entre las
variables.
INTRODUCCIN
El anlisis de este relacionamiento entre dos variables (X,Y)
presenta dos aspectos diferentes:
Unas veces nuestro inters est en conocer si las dos
variables estn asociadas y medir hasta qu punto los
cambios en una pueden explicarse por los cambios que
ocurren en la otra. En tal caso tenemos un problema de
Correlacin.
DIAGRAMA DE DISPERSIN
Sea Y una variable de inters o variable
dependiente, y X una variable independiente.
( x1 , y1 )
( x , y )
2
2
...
( x n , y n )
POSIBLES RELACIONES
50
14
12
40
10
30
8
20
4
10
10
20
30
2
0
20
40
60
80
100
CORRELACIN DIRECTA
O POSITIVA
CORRELACIN INVERSA
O NEGATIVA
50
110
100
40
90
30
80
70
20
60
50
10
10
20
30
40
40
0
30
-8
-6
-4
-2
COEFICIENTE DE CORRELACION
Es un nmero que indica el grado de asociacin entre las variables
y se define del siguiente modo:
n
xi yi nxy
i 1
n
i 1
i 1
xi2 nx 2 yi2 ny 2
S xy
Sx S y
Caractersticas:
i)
1 r 1
ii) Si
r0
iii) Si
r0
iv) Si
v) Si
vi) Si
r 0
ANALISIS DE REGRESION
REGRESIN. Es un mtodo que se emplea para encontrar una
funcin que se ajusta a una nube de puntos o diagrama de
dispersin, con la finalidad de obtener una prediccin aproximada
de una de las variables a partir de la otra.
Diagrama de Dispersin
160
Y f ( X )
Ventas en Millones
140
120
100
80
60
40
20
0
10
OBJETIVOS
Mostrar la forma como la variable independiente
(X) se relaciona con la variable dependiente (Y).
Hacer pronsticos sobre los valores de la variable
dependiente, con base en el conocimiento de los
valores de la variable independiente.
Y b0 b1 X e
Donde:
b0
b1
Es el error de prediccin
ei se le llama desviacin o error que puede ser negativo o positivo, si elevamos las
Y b0 b1 X
Donde los valores de
xi yi nxy
i 1
n
2
i
b yb x
0
nx 2
i 1
Nota: Para hallar las formulas anteriores se deriva la sumatoria de errores al cuadrado con
respecto a b0 y b1 . (Investigacin del alumno)
Eficiencia (%)
y = -7,1217x + 103,67
2
R = 0,9307
10
12
14
1998
1999
2000
2001
2002
2003
2004
2005
3
5
5
6
6
7
4
8
20
40
80
120
90
125
35
135
160
140
Ventas en Millones
Ao
Diagrama de Dispersin
Gastos en
Ventas en
publicidad en
millones (Y)
millones (X)
120
100
80
60
40
20
0
0
2
4
6
8
Gastos en Publicidad (Millones)
10
Publicidad
Ventas (Y)
(X)
3
20
5
40
5
80
6
120
6
90
7
125
4
35
8
135
44
645
X
Y
n 8,
x 5.5,
XY
X2
Y2
60
200
400
720
540
875
140
1080
4015
XY
9
25
25
36
36
49
16
64
260
X2
400
1600
6400
14400
8100
15625
1225
18225
65975
Y2
y 80.625
xi yi nxy
i 1
n
i 1
i 1
xi2 nx 2 yi2 ny 2
0.932
Experiencia (X)
Ventas(miles)
13
16
30
2
8
6
31
26
33
36
16
26
19
38
2
3
4
5
6
7
Solucin:
a) Diagrama de dispersin
45
40
Ventas (Miles)
35
30
25
20
15
10
5
0
0
10
15
20
25
30
35
Experiencia
Experiencia
(X)
Ventas(miles)
(Y)
XY
X2
Y2
13
16
30
2
8
6
31
26
33
36
16
26
19
38
338
528
1080
32
208
114
1178
169
256
900
4
64
36
961
676
1089
1296
256
676
361
1444
X= 106
Y=194
XY=3478
X2=2390
Y2=5798
2
3
4
5
6
7
n 7
x 106
15.14 ;
n
194
27.71
7
b
1
xi yi nxy
i 1
n
2
i
nx 2
3478 7(15.14)(27.71)
2390 7(15.14) 2
i 1
0.688
Y 17.29 0.688X
Interpretacin:
4. COEFICIENTE DE DETERMINACION
Mide el porcentaje de variabilidad en Y que puede explicarse a travs del
conocimiento de la variable independiente X. Se calcula con la siguiente frmula:
( x x )( y y )
2
2
R
r
xi2 nx 2 yi2 ny 2
2
Caractersticas:
i) Es un valor no negativo ya que se encuentra entre 0 y 1
0 R2 1
ii) Es un valor muy importante en cualquier anlisis de regresin, ya que muestra el grado
hasta el cual estn relacionadas la variabilidad de X e Y
Ejemplo: Del ejemplo sobre la regresin entre los aos de experiencia y las ventas
tenemos:
2
r 0.939 , por lo cual R 0.939 0.883
2
Interpretacin: El 88.3% de las variaciones de las ventas (Y) son explicados por los
aos de experiencia. Existe adems un (100-88.3)% = 11.7% que no es explicado por
los aos de experiencia.
s y. x
Y Y
n2
y
i 1
2
i
i 1
i 1
a yi b x i y i
n2