Вы находитесь на странице: 1из 3

Estadstica Inferencia 2

Anlisis de regresin lineal

Estimacin de la funcin de regresin


Como ejemplo de anlisis de regresin, describiremos el caso de Pizzeras Armand, cadena de restaurantes
de comida italiana que abarca cinco estados. Los lugares donde sus establecimientos han tenido ms xito
estn cercanos a establecimientos de educacin superior. Los administradores creen que las ventas
trimestrales en esos restaurantes (representadas por y) se relacionan en forma positiva con la poblacin
estudiantil (representada por x). Esto es, que los restaurantes cercanos a centros escolares con gran
poblacin tienden a generar ms ventas que los que estn cerca de centros de poblacin pequea.
Aplicando el anlisis de regresin podremos plantear una ecuacin que muestre cmo se relaciona la
variable dependiente y con la variable independiente x.

Cada restaurante est asociado con un valor de x (poblacin estudiantil) y un valor correspondiente de y
(ventas trimestrales). La ecuacin que describe cmo se relaciona y con x y con un trmino de error se
llama modelo de regresin.

y= 0 + 1 x+
En este modelo y es una funcin lineal de x ms . 0 y 1 son los parmetros del modelo, y es una
variable aleatoria. El trmino de error explica la variabilidad en y que no se pude explicar con la relacin
lineal entre x y y.

Desafortunadamente los valores de los parmetros 0 y 1 no se conocen, en la prctica y se deben


estimar usando datos de la muestra. Se calculan estadsticos de la muestra (denotados b 0 y b1) como
estimados de los parmetros 0 y 1, respectivamente. Al sustituir los valores de los parmetros 0 y
1 por los estadsticos b0 y b1 en la ecuacin de regresin, obtenemos la ecuacin de regresin estimada o
simplemente ecuacin de regresin. En la regresin lineal simple, la ecuacin de regresin se escribe de la
siguiente forma:

y = b0 + b1 x

En la regresin lineal simple, la grfica de la ecuacin se llama lnea de regresin estimada, b 0 es la


ordenada al origen, b1 es la pendiente y y es el valor estimado de y para determinado valor de x.

Ordenada al origen
0
Lnea de regresin
Lnea de regresin

La pendiente es La pendiente es
Ordenada al origen positiva 1 negativa 1
0

Relacin lineal positiva Relacin lineal negativa

Ordenada al origen
Lnea de regresin
0
La pendiente
es cero 1

No hay relacin

Ing. Ali Perez Gomez


Instituto Tecnolgico de Minatitlan
Estadstica Inferencia 2
Anlisis de regresin lineal
El mtodo de mnimos cuadrados es un procedimiento para encontrar la ecuacin de regresin estimada
usando datos de una muestra. Para ilustrarlo en el ejemplo de Pizzeras Armand, suponga que se reunieron
datos de una muestra de 10 restaurantes ubicados cerca de centros educativos. Para i-sima observacin o
restaurante de la muestra, xi es el tamao de la poblacin estudiantil, en miles, y y i son las ventas
trimestrales (en miles de dlares). Los valores de x i y yi para los 10 restaurantes de la muestra se resumen
en la siguiente tabla. Se lee de la siguiente manera: con x 1 = 2 y y1= 58 est cerca de 2000 estudiantes y
sus ventas trimestrales son de 58 000 dlares.

Restaurante Poblacin de Ventas


estudiantes x trimestrales
(miles) (miles de dlares)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202

El diagrama de dispersin permite observar grficamente los datos y hacer conclusiones preliminares
acerca de la poblacin posible entre las variables. Los diagramas de dispersin en el anlisis de regresin
de forman con los valores de la variable independiente x en el eje horizontal, y los valores de la variable
dependiente y en el eje vertical.

Qu conclusiones preliminares se pueden obtener del diagrama de dispersin? Parece que las ventas
trimestrales son mayores en los centros con ms poblacin de estudiantes. Adems para estos datos, la
relacin entre el tamao de la poblacin de estudiantes y las ventas trimestrales al parecer se aproximan
con una lnea recta; de hecho se indica una relacin lineal positiva entre las variables. En consecuencia,
elegimos el modelo de regresin lineal simple para representar la relacin entre las ventas trimestrales y la
poblacin de estudiantes.

Ing. Ali Perez Gomez


Instituto Tecnolgico de Minatitlan
Estadstica Inferencia 2
Anlisis de regresin lineal
Dada esta opcin, nuestra siguiente tarea es calcular los valores de b0 y b1 en la ecuacin de regresin
lineal simple. Para el i- simo restaurante, la ecuacin de regresin estimada es

y = b0 + b1 x

b1 = (x media x)(y media y) / (x media x)


i i i
2

b0 = media y b1 * media x

Restaurante xi yi Xi media x yi media y (Xi media x)( yi media y) (i media)2


1 2 58 -12 -72 864 144
2 6 105 -8 -25 200 64
3 8 88 -6 -42 252 36
4 8 118 -6 -12 72 36
5 12 117 -2 -13 26 4
6 16 137 2 7 14 4
7 20 157 6 27 162 36
8 20 169 6 39 234 36
9 22 149 8 19 152 64
10 26 202 12 72 864 144
Totales 140 1300 2840 568
Medias 14 130

b1 = 2840 / 568 = 5

b0 = 130 5* 14 = 60

Por lo anterior, la ecuacin de regresin estimada, deducida con el mtodo de cuadrados mnimos, es

y = 60 + 5x

Ing. Ali Perez Gomez


Instituto Tecnolgico de Minatitlan

Вам также может понравиться