Вы находитесь на странице: 1из 17

Regresión Lineal Simple

Lic. César Octavio Contreras


INTRODUCCIÓN
 ORIGEN HISTORICO
 Después de estudiar cómo hay que
organizar, representar gráficamente y
analizar un conjunto de datos a partir de
algunos parámetros, nos proponemos
estudiar las relaciones entre variables.
 Queremos construir modelos que describan
la relación entre las variables con el
propósito, principalmente, de predecir los
valores de una variable a partir de los
valores de la otra. Lo haremos con el modelo
de regresión lineal simple.
2
INTERPRETACIÓN
MODERNA
 El análisis de regresión trata del
estudio de la dependencia de la
variable dependiente, respecto a una o
más variables (las variables
explicativas), con el objetivo de estimar
y/o predecir la media o valor promedio
poblacional de la primera en términos
de los valores conocidos o fijos (en
muestras repetidas) de las ultimas.
3
Regresión vs Causalidad
 Una relación estadística, sin importar
que tan fuerte y sugestiva sea, nunca
podrá establecer una conexión causal:
nuestras ideas de causalidad deben
venir de estadísticas externas y, en
último termino, de una u otra teoría.
 Una relación estadística no puede por
si misma implicar en forma lógica una
causalidad.
4
Relaciones entre dos
variables
 El objetivo es explicar el comportamiento de
una variable Y, que denominaremos variable
explicada (o dependiente o endógena), a
partir de otra variable X, que llamaremos
variable explicativa (o independiente o
exógena).
 Ejemplo Si las dos variables son los
ingresos mensuales y los gastos en
actividades de ocio
5
Las relaciones entre dos variables
pueden ser de dos tipos:

 1) Funcionales (o deterministas):
cuando hay una fórmula matemática
que permite calcular los valores de una
de las variables a partir de los valores
que toma la otra.
 2) Estadísticas (o estocásticas):
cuando no existe una expresión
matemática que las relacione de forma
exacta.
6
Ejemplo de las alturas
y los pesos

7
Recta de regresión
 Una vez que hemos hecho el diagrama
de dispersión y después de observar
una posible relación lineal entre las
dos variables, nos proponemos
encontrar la ecuación de la recta que
mejor se ajuste a la nube de puntos.
Esta recta se denomina recta de
regresión.
8
Estimación de los parámetros:
método de los mínimos cuadrados

 y = a + bx
 El método de los mínimos cuadrados
consiste en buscar los valores de los
parámetros a y b de manera que la
suma de los cuadrados de los residuos
sea mínima. Esta recta es la recta de
regresión por mínimos cuadrados.

9
Las soluciones de este
sistema de ecuaciones son:

Sxy = es la covarianza muestral de las observaciones (xi, yi).


S2x = es la varianza muestral de las observaciones xi.
10
11
EJERCICIOS
Impacto de los gastos en
publicidad
 Los datos proporcionados en la siguiente tabla se
publicaron en la edición correspondiente al primero de
marzo de 1984 del periódico Wall Street Journal. Se
refiere al presupuesto publicitario de 21 empresas para el
año de 1983 y a las veces que los clientes observan los
comerciales de los productos en una semana de dichas
compañias.
 Haga una grafica poniendo las impresiones en el eje
vertical y el gasto publicitario en el eje horizontal.
 Que se podría decir respecto a la naturaleza de la relación
entre las dos variables?
 Realiza una regresión lineal con estos datos 13
Impresion Gasto Impresi Gasto
Empresa es Pub. Empresa ones Pub.

Miller Lite 32.1 50.1 Bud Lite 10.4 45.6


Pepsi 99.6 74.1 ATT 88.9 154.9
Stroh´s 11.7 19.3 Calvin Klein 12 5
Fed´l Express 21.9 22.9 Wendy´s 29.2 49.7
Burguer King 60.8 82.4 Polaroid 38 26.9
Coca Cola 73.6 40.1 Shasta 10 5.7
McDonald´s 92.4 185.9 Meow Mix 12.3 7.6
MCI 50.7 26.9 Oscar
Meyer 23.4 9.2
Diet Cola 21.4 20.4
Crest 71.1 32.4
Ford 40.1 166.2
Kibbles ´N
Levi´s 40.8 27 14
Bits 4.4 6.1
Impacto Gasto Publicidad

120

100
veces comerciales

80

60

40

20

0
0 20 40 60 80 100 120 140 160 180 200
15
Gasto
De que depende las victorias
de un equipo de Base B
 VICTORIAS = 3.083258 + 524.4436*BATEO +
0.016592*BASESROB - 0.199310*ERRORES –
13.46487*PROMCARR + 0.095243*JONRON
-0.880311*SUPERFICIE
BATEO.- La variable del promedio de bateo del equipo resulto relacionado positivamente con el
numero de victorias del equipo lo cual resulta lógico, pues entre mas ocasiones están frente al bat se
incrementa la probabilidad de hacer mas carreras lo cual resulta en victorias.
BASESROB.- La variable del número de bases robadas resulta también con una relación positiva con
el numero de victorias del equipo, pues entre mas bases roben los jugadores realizarán mas carreras
lo cual, de nuevo, consigue mas victorias para el equipo.
ERRORES.- El número de errores cometidos se relaciona negativamente con el número de victorias,
pues entre mayor sea el numero de errores cometidos por el equipo con mayor probabilidad perderán
el partido.
PROMCARR.- El promedio de carreras del equipo se relaciona de manera negativa.
JONRON.- El numero de cuadrangulares, lógicamente tiene una relación positiva con el numero de
victorias del equipo, pues entre mas cuadrangulares anoten los jugadores será mas probable que
ganen mas partidos.
SUPERFICIE.- La variable superficie del terreno, tiene una relación negativa con el número de
16
victorias, lo que nos dice que si la cancha del equipo en estudio es artificial aumenta la probabilidad
de perder mas partidos.
Regresión Lineal Simple

Lic. César Octavio Contreras

Вам также может понравиться