Вы находитесь на странице: 1из 17

ESTADSTICA

SEMANA 6


ESTE DOCUMENTO CONTIENE LA SEMANA 6
2

NDICE


REGRESIN LINEAL ........................................................................................................................ 3
APRENDIZAJES ESPERADOS ........................................................................................................... 3
DEFINICIN DE REGRESIN LINEAL .......................................................................................... 3
EJEMPLO 1 ............................................................................................................................. 4
EJEMPLO 1.1 .......................................................................................................................... 5
EJEMPLO 1.2 .......................................................................................................................... 7
COEFICIENTE DE DETERMINACIN ........................................................................................... 8
COEFICIENTE DE CORRELACIN LINEAL .................................................................................... 8
EJEMPLO 1.3 .......................................................................................................................... 9
EJEMPLO 2 ............................................................................................................................. 9
EJEMPLO 2.1 ........................................................................................................................ 11
REGRESIN LINEAL MLTIPLE ..................................................................................................... 12
EJEMPLO 3 ........................................................................................................................... 13
COMENTARIO FINAL .................................................................................................................... 16
REFERENCIAS ............................................................................................................................... 17


ESTE DOCUMENTO CONTIENE LA SEMANA 6
3
REGRESIN LINEAL


APRENDIZAJES ESPERADOS

El objetivo de esta semana es comprender el tipo de problemtica donde se puede aplicar un
modelo de regresin lineal y, adems, calcular e interpretar los resultados de los diferentes
ejemplos.

INTRODUCCIN

El termino regresin tiene sus orgenes a principio del siglo XVIII, donde se utilizaba para buscar
relaciones entre una o ms variables que pueden aportar informacin para explicar otra variable
(variables independientes) y una variable que se quiere explicar (variable dependiente), la
evolucin del estudio y la aplicacin de esta tcnica en el mundo empresarial es en base a la
capacidad que tiene de analizar tendencias de datos histricos para poder predecir
comportamientos futuros de variables tan decisivas como las ventas, la produccin o los costos.


DEFINICIN DE REGRESIN LINEAL

Considrese n puntos en un plano cartesiano (X,Y), digamos (x
1
,y
1
), (x
2
,y
2
), (x
3
,y
3
), ,(x
n
,y
n
), la idea
geomtrica de regresin lineal, es encontrar una recta de la forma , que pase lo ms cerca de los
n puntos anteriores, es decir, la distancia entre estos puntos a la recta sea lo ms pequea posible.
Si se define como e
1
, e
2
, e
3
, ,e
n
a estas distancias, se les puede escribir la funcin como:


Los parmetros de regresin son conocidos como intercepto y pendiente,
respectivamente. Las estimaciones que se obtienen al minimizar la suma
de los cuadrados de las distancias, son llamadas estimaciones del mtodo de los mnimos
cuadrados ordinarios, es decir:

ESTE DOCUMENTO CONTIENE LA SEMANA 6
4
As la recta de regresin es: son las soluciones a La
variable Y recibe el nombre de variable dependiente y la variable X de independiente.

Solucin al problema de regresin
Con un poco de conocimientos en el clculo de mnimos y mximos, la solucin a:





EJEMPLO 1:

Considrese el nmero de empleados y los gastos fijos que se generan en cuatro empresas muy
similares, se cree que existe una relacin lineal entre ambas variables.


Al graficar los valores, queda clara la relacin lineal entre ambas variables, esta conclusin se basa
en el anlisis de las variables nmero de empleados y gastos fijos, ya que a medida que aumenta el
numero de empleados (eje x) tambin aumenta el monto de los gastos fijos, esto se puede
comprobar en el grfico que se muestra a continuacin:

ESTE DOCUMENTO CONTIENE LA SEMANA 6
5


EJEMPLO 1.1: Encontrar e interpretar estimadores de segn los datos presentados
en la siguiente tabla:



De la tabla se obtiene:
ESTE DOCUMENTO CONTIENE LA SEMANA 6
6


Si se determinan los errores y se dibuja la recta de regresin, quedara como sigue:





ESTE DOCUMENTO CONTIENE LA SEMANA 6
7


EJEMPLO 1.2:
Al considerar la siguiente recta: y construir una tabla equivalente a la anterior,
se determinarn los errores de la recta, tal como sigue:

Y se obtiene que la suma de los errores al cuadrado es 2.300, claramente muy superior a la recta
obtenida (en el ejemplo anterior) con el mtodo de los mnimos cuadrados.




ESTE DOCUMENTO CONTIENE LA SEMANA 6
8
COEFICIENTE DE DETERMINACIN

Es una medida estadstica que permite evaluar el ajuste de la ecuacin de regresin a los datos.
De acuerdo al resultado del se pueden interpretar los valores cercanos a 0 como la inexistencia
del ajuste de la recta a los datos, el valor cercano a 1 se puede interpretar como la existencia de
un ajuste importante entre la variable dependiente y la(s) independiente(s).


Por lo tanto,

El coeficiente de determinacin corresponde al cuadrado del coeficiente de correlacin lineal.

COEFICIENTE DE CORRELACIN LINEAL

El coeficiente de correlacin (que es una medida de ajuste), cuantifica si el modelo lineal es
apropiado para determinar la relacin que existe entre las dos variables y se define como:

Interpretacin de resultados:
a) Para valores cercanos a 1 se puede decir que existe una alta asociacin lineal positiva, tal como
se presenta en el grfico A).
b) Para valores cercanos a -1 se puede decir que existe una alta asociacin lineal negativa, tal
como se presenta en el grfico B).
c) Para valores cercanos a 0 se puede decir que no existe asociacin lineal, sin descartar algn
otro tipo de asociacin, tal como se presenta en el grfico C).
Para la interpretacin, es mejor ocupar el valor que se obtiene de R2100 que indica el porcentaje
de la variabilidad de Y explicada por la variable X.
Grficamente, esto se interpreta a travs de los siguientes ejemplos:

ESTE DOCUMENTO CONTIENE LA SEMANA 6
9


EJEMPLO 1.3:

Para continuar con el ejemplo anterior, revisemos el resultado del clculo de R y R
2


La interpretacin de los resultados es la siguiente: un 99% de variabilidad de los gastos fijos de
estas empresas se explican por el nmero de empleados que la componen (revisar ejemplo 1)

EJEMPLO 2:

Una compaa local de energa seleccion una residencia tpica para desarrollar un modelo
emprico para el consumo de energa (en kilowatts por da) como una funcin de la temperatura
promedio diaria durante los meses de invierno. Se obtuvo la siguiente informacin durante un
periodo de 15 das.



a) Al graficar estos datos, sugiere la grfica una asociacin lineal?

ESTE DOCUMENTO CONTIENE LA SEMANA 6
10


De acuerdo al diagrama de dispersin (puntos), la grfica si sugiere una asociacin lineal negativa,
lo cual se ilustra a travs del grfico: el consumo de energa disminuye a medida que aumenta la
temperatura.

b) Para un modelo lineal simple, obtngase la ecuacin estimada de regresin y grafique esta
ecuacin sobre la grfica de la parte a) Al tabular los datos de la siguiente forma:



Se obtienen los siguientes resultados:
ESTE DOCUMENTO CONTIENE LA SEMANA 6
11

Determinando las sumas de cuadrado se calcula el intercepto y la pendiente :


Finalmente, los estimadores:


Por lo que la ecuacin estimada de regresin quedara: La grfica
representa la recta (color rojo) en el grfico de la parte a).
c) Interpretar los coeficientes de regresin estimados:
: Por cada grado de aumento de la temperatura, el consumo de energa disminuir en
aproximadamente 1,78 kW por da: o en forma equivalente por cada grado que disminuya la
temperatura, el consumo de energa aumentar en cerca de 1,78 kW por da.
: Cuando la temperatura alcanza los 0 Celsius, el consumo de energa es de aproximadamente
78,26 kW por da.
EJEMPLO 2.1:

a) Estimar los consumos individuales de energa para las siguientes temperaturas:

-10 -8 -5 -2 1 4 7 10 13

Reemplazando cada uno de los valores de x en la recta de regresin estimada, se obtiene

ESTE DOCUMENTO CONTIENE LA SEMANA 6
12


El resultado del reemplazo de cada una de las temperaturas planteadas, entrega un consumo
estimado, por lo tanto, una vez calculada la ecuacin de la recta, es posible interpolar valores de
consumo para distintas temperaturas, se obtiene a modo de ejemplo, para x = -10 se obtiene y =
78,26 1,78 (1)=96,06

b) Determinar el coeficiente de correlacin:


Se interpreta 100 R
2
= 100 (-0,88)
2
= 77,44 es decir 77,4% de la variabilidad en los consumos, se
pueden explicar por las temperaturas.

REGRESIN LINEAL MLTIPLE

Muchos de los problemas de regresin lineal no pueden ser resueltos solo con una variable
independiente, por lo tanto, es necesario ampliar la definicin anterior, incorporando 2 o ms
variables independientes, en el ejemplo nmero 3 se revisar un caso aplicado. En trminos
generales y simplificados la ecuacin quedara de la siguiente forma:

Para i = 1,2, n. Escribiendo el modelo para cada una de las observaciones, este puede ser
considerado como un sistema de ecuaciones lineales de la forma.

ESTE DOCUMENTO CONTIENE LA SEMANA 6
13
A continuacin se revisaran los resultados de un ejemplo aplicado de regresin lineal mltiple.

EJEMPLO 3:

Una determinada universidad realiz un estudio sobre la relacin que existe entre el coeficiente
intelectual (CI) con dos variables explicativas cantidad de horas de estudio semanal y el promedio
de sus calificaciones, para dicho estudio se obtuvo una muestra aleatoria de estudiantes de 8
bsico.

Alumno CI Tiempo estudio (hrs.) Promedio notas
1 110 4 55
2 115 5 63
3 128 9 68
4 112 8 47
5 121 14 68
6 111 5 49
7 126 8 67
8 130 11 50
9 125 20 66
10 117 9 65
Desarrollo:

Ci Tiempo estudio (hrs.) Promedio notas
Media 119,5 9,3 59,8
D.T 7,47 4,81 8,57
Varianza 55,83 23,12 73,51
Los resultados obtenidos en Microsoft Excel son los siguientes:
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,63552795
Coeficiente de determinacin R^2 0,40389577
Observaciones 10

Coeficientes calculados:
Parmetros ecuacin Coeficientes
Intercepto 98,5907347
TIEMPO estudio (hrs) 0,7422419
PROMEDIO notas 0,234221

Por lo tanto, la ecuacin queda de la siguiente forma:

Anlisis de residuales
Observacin Pronstico CI Residuos
ESTE DOCUMENTO CONTIENE LA SEMANA 6
14
1 114,4 -4,4
2 117,1 -2,1
3 121,2 6,8
4 115,5 -3,5
5 124,9 -3,9
6 113,8 -2,8
7 120,2 5,8
8 118,5 11,5
9 128,9 -3,9
10 120,5 -3,5

NOTA: Para realizar un anlisis de regresin en Microsoft Excel, primero se debe ir a Archivo->
Opciones -> Complementos y habilitar el complemento anlisis de datos y luego ir a la opcin
Datos->Anlisis de datos-> Regresin

Las opciones anlisis de datos se encuentran en la siguiente ventana:



Luego seleccionar Regresin y se mostrar la siguiente ventana:
ESTE DOCUMENTO CONTIENE LA SEMANA 6
15


En esta ventana se deben seleccionar dos rangos de entrada, el rango correspondiente a la
variable dependiente (Y) y uno o ms columnas con la informacin de las variables independientes
(X).

Para complementar la informacin mencionada en esta semana revisar el siguiente link:
http://goo.gl/pqXY4











ESTE DOCUMENTO CONTIENE LA SEMANA 6
16
COMENTARIO FINAL
Durante esta semana aprendimos los conceptos bsicos del mtodo de regresin lineal simple, por
lo tanto, podemos complementar nuestro conocimiento sobre la construccin de grficos de
dispersin vistos en la semana 2 y agregar la recta de la ecuacin lineal, adicionalmente tambin
estamos en condiciones de interpretar los coeficientes de correlacin que se obtienen.

ESTE DOCUMENTO CONTIENE LA SEMANA 6
17
REFERENCIAS

Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadstica para
administracin y economa (10 edicin). Cencage Learning
Canavos, George. (1988). Introduccin y estadstica descriptiva. Probabilidad y estadstica.
Mxico: McGraw-Hill/Interamericana S. A.
Pagano, Robert R. (2011). Estadstica para las ciencias del comportamiento (9 edicin).
Cencage Learning.




PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2012). Estadstica. Semana 6.

Вам также может понравиться