Академический Документы
Профессиональный Документы
Культура Документы
Medellín, 2013
REGRESIÓN LINEAL Y CORRELACIÓN
Por ejemplo, una compañía de bienes raíces residenciales en una ciudad desea
predecir los costos mensuales del alquiler de apartamentos, basado en el área en
metros cuadrados. Se seleccionó una muestra aleatoria con los siguientes datos:
2
Tabla 1. Área y costo de alquiler de apartamentos
APARTAMENTO ÁREA (m2) COSTO MENSUAL (miles de pesos)
1 79 475
2 135 800
3 101 600
4 114 750
5 67 475
6 138 850
7 106 825
8 67 467
9 65 437
10 89 575
11 102 700
12 119 825
13 184 1150
14 127 900
15 109 700
16 114 725
17 116 550
18 117 850
19 107 600
20 83 575
21 126 800
22 97 825
23 70 600
24 93 400
25 111 875
Fuente: Adaptación del texto Estadística para administración. Berenson y otros, pág. 466.
En este caso, se busca relacionar las variables área y costo mensual; donde la
variable independiente (X) es el área, y la dependiente (Y), el costo mensual.
3
1.1. Diagrama de dispersión
Cuando se toma una muestra de dos variables o bivariada, se obtiene una serie
de pares de datos. Estas parejas son de la forma (x,y) y se pueden representar
como puntos en un plano bidimensional o plano cartesiano; la representación
gráfica de las parejas se conoce como diagrama de dispersión.
La regresión lineal pretende encontrar una recta que represente todos los puntos
que se encuentran en el plano cartesiano.
4
Gráfica 2. Diagrama de dispersión para el área y costo de alquiler de
apartamentos
5
La tarea está en determinar los parámetros b0 y b en la ecuación de regresión
“estimados” ŷi ; por tanto, la suma de los cuadrados de las desviaciones debe ser
b
n xi yi xi yi
b0
y
i b x
i
n x ( xi )
2
i y n
6
Los parámetros para el ejemplo de la tabla 30, se calculan a partir de los datos
presentados en la tabla 2.
7
De la tabla 2 se tiene que:
x i 2.636 , y i 17.329 , x y
i i 1.925.819 , x
2
i 295.132 y n = 25
por tanto,
b0
y i b x
i
17.329 (5,73804)( 2.636) 2.203,53
88,14120
n 25 25
yˆ 88,14120 5,73804 x
8
Gráfica 2. Modelo de regresión lineal para el área y costo de alquiler de
apartamentos
Interpretación de bo y b
bo = 88,1412 indica que cuando el cambio en el área es cero, el cambio esperado
en el costo de alquiler mensual es de 88,1412 miles de pesos; es decir, que el
costo de alquiler mensual aumenta 88,1412 miles de pesos. La pendiente b =
5,73804 señala que por cada incremento de 1 m 2 en el área, se pronostica que el
cambio esperado en el costo mensual de alquiler es de 5,73804 miles de pesos,
cuyo significado es que se pronostica que el costo de alquiler aumenta 5,73804
miles de pesos por cada 1 m2 de incremento en el área.
Predicciones
Con la ecuación de regresión encontrada, es posible predecir algunos valores
para la variable dependiente a partir de la variable independiente
Observación
Cuando se utiliza un modelo de regresión con propósitos de pronóstico, es
importante que se tenga en cuenta sólo el intervalo de valores que toma la
variable independiente y que fueron usados para construir el modelo. Entonces, si
9
se predice un valor de Y para un valor dado de X, es posible interpolar dentro de
este intervalo de valores de X, pero no se debe extrapolar hacia fuera de este
intervalo. Por ejemplo, cuando se usa el área en m 2 para predecir el alquiler
mensual, se observa en la tabla 29 que los metros cuadrados varían de 65 a 184.
Por tanto, las predicciones de costos de alquiler mensual deben hacerse sólo para
apartamentos con un área entre estas medidas. Cualquier pronóstico de costos
de alquiler mensual con áreas fuera de este intervalo es poco confiable.
2. CORRELACIÓN
n xy x y
r
n x 2 x * n y 2 y
2 2
Donde,
10
El coeficiente de correlación toma valores comprendidos entre –1 y +1, de tal
forma que cuando r = -1 ó r = +1 existe una correlación perfecta entre las
variables. Esto es, todos los puntos del plano cartesiano están alineados (o se
ajustan perfectamente) a la línea recta de la ecuación de regresión. Cuando r = 0,
no existe correlación entre las variables. La correlación aumenta cuando r se
acerca de 0 a +1 ó de 0 a –1.
r CALIFICACIÓN r
-0.1 0.1
-0.2 Correlación nula 0.2
-0.3 0.3
-0.4 0.4
-0.5 Correlación baja 0.5
-0.6 0.6
-0.7 0.7
-0.8 Correlación alta 0.8
-0.9 0.9
-1.0 Máxima correlación 1.0
11
Gráfica 3. Correlación entre dos variables
2.466.321 2.466.321
r 0.8489
655,59 * 4.431,18 2.905.037,296
Como r = 0,8489 y la pendiente b1 es positiva, indica que hay alta correlación entre
el área y el precio de alquiler de los apartamentos.
12
2.2. Coeficiente de determinación
r2 = (r)2 * 100
Este valor permite concluir que el 72% del aumento en el costo de alquiler del
apartamento se debe al incremento en el área, el otro 28% se debe al cambio
producido por otras variables que no fueron analizadas en el modelo (por ser
regresión lineal simple).
13
BIBLIOGRAFÍA
BIBLIOGRAFÍA FUNDAMENTAL
BIBLIOGRAFÍA RECOMENDADA
14