Вы находитесь на странице: 1из 36

INSTITUTO TECNOLGICO DE LA PAZ

DEPARTAMENTO DE INGENIERAS

ANLISIS DE REGRESIN.
A toda persona le puede interesar lo que va a suceder en el futuro con los
precios, los costos, las utilidades, la produccin, etc., y en base a ello planear
las estrategias a seguir.
El ANLISIS DE REGRESIN, es de gran importancia en la formulacin y
evaluacin de proyectos de inversin, ya que a travs de l se pueden
proyectar, la oferta y la demanda de un bien o un servicio, as como el
comportamiento de la poblacin, y de esta forma, el futuro inversionista se
puede dar una idea de la demanda que tiene que satisfacer y en base a ello
disear el tamao de la planta y el tipo de maquinaria que es necesaria
para producir el volumen deseado. Sin embargo, el campo de aplicacin del
anlisis de regresin es muy variado e importante en la toma de
decisiones.
El objetivo principal del anlisis de regresin, es predecir el
comportamiento a travs del tiempo, del valor de una variable
dependiente cuando se conoce el valor de una variable asociada, llamada
variable independiente.
Todo estudio de regresin, siempre se debe iniciar con el cuadro de origen o
informacin fuente, posteriormente esta informacin se grafica, esto
permitir analizar la tendencia del grfico y en base a ello seleccionar el
mtodo adecuado.
Un diagrama de dispersin es el grfico que representa el comportamiento
histrico de un conjunto de datos o la relacin que existe entre dos variables,
que sirve para determinar el mtodo de regresin apropiado, que permitir
un pronstico de la tendencia en el futuro.
1.1

REGRESIN LINEAL. Este mtodo se emplea cuando el


comportamiento de los datos en el diagrama de dispersin, es lineal.
Existen dos mtodos:

1.1.1

Mtodo libre o de Mano alzada. Llamado as porque la lnea de


regresin es trazada por la persona que realizar el clculo, por lo
tanto, es en base a la experiencia y vara de persona a persona, se
conocen dos formas para desarrollar este mtodo:

1.1.1.1 Mtodo de la pendiente. En este mtodo, se traza una lnea


procurando que las distancias verticales, de los puntos que se localizan
arriba de la lnea trazada, sean iguales a los puntos de debajo de la
misma lnea. Una vez realizado lo anterior, se localizan dos puntos
sobre esta lnea, procurando que uno de ellos est en la interseccin
del eje Y (no necesariamente), y el otro en el extremo de la lnea. Una
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

vez conocidos estos dos puntos, se determina la ecuacin de regresin


mediante la ecuacin:
Y = m (X X1) + Y1, en donde:
m = Y2 Y1/X2 X1

O tambin mediante la ecuacin:


Y = mx + b, en donde:
b = distancia del origen al punto donde la recta corta al eje Y, esto es (0, b).

1.1.1.2 Mtodo Directo. El mtodo es similar al anterior, salvo que aqu,


los dos puntos son empleados directamente en la frmula:
Y = A0 + A1X

Ejemplo 1. El cuadro siguiente muestra la produccin de garbanzo,


en el Estado de Mxico, durante los aos 1970 a 1980.
CUADRO N 1
PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS
AOS DE 1970- 1980 (EN MILES DE PESOS).
AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

Fuente: S.A.R.H.
(PASO N 1)

ESTADSTICA
MANUEL RODRGUEZ TORRES

* ESTE ES EL CUADRO DE ORIGEN

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Con la informacin anterior, se procede a graficar los datos para ver su


tendencia, lo anterior da origen al diagrama de dispersin:

Una vez graficados los datos, se procede a trazar la lnea, tal como se
describi en prrafos anteriores, localizando los dos puntos. Con el objeto de
facilitar el clculo, se cambiaron los aos por otros valores; por ejemplo:
1970 = 0; 1971 = 1; 1972 = 2; etc.
Los puntos localizados fueron: A (0, 700) y B (10, 6300), con los cuales se
procede a realizar el clculo.

PASO N 3:
Se selecciona el mtodo a emplear, en este caso se seleccion el Mtodo
de la Pendiente:
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Y = m(X X1) + Y1

PASO N 4:
CUADRO DE TRABAJO

TENDENCIA O
ESTIMACIN
Yest

1287

700

1971

925

1260

1972

1341

1820

1973

2281

2380

1974

2126

2940

1975

3011

3500

1976

3805

4060

1977

5957

4620

1978

8624

5180

1979

10384

5740

1980

10

7540

6300

AOS

1970

PRODUCCIN

PASO N 5: Se procede a realizar el clculo:


Los puntos son: A (0, 700) y B (10, 6300)
Y = m (X X1) + Y1 ---------------------------------- Ecuacin a emplear
m = Y2 Y1/ X2 X1

------------------------------ Pendiente de la recta

m = 700 6300/ 0 10 = -5600/ -10 = 560

m = 560 la pendiente, significa que el crecimiento


promedio
anual
es
de 560 toneladas.
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

En este caso, se ha tomado como:


X1 = 0 y Y1 = 700
X2 = 10 y Y2 = 6300
Sin embargo, tambin puede ser que:
X1 = 10 y Y1 = 6300
X2 = 0 y Y2 = 700
Con estos valores se tiene:
m = 6300 - 700/ 10 0 = 5600/ 10 = 560
m = 560

Como puede observarse, se obtiene el mismo valor, esto se debe a que es


una lnea recta y que todos sus puntos estn sobre ella. Con este valor se
procede a calcular la ecuacin, para lo cual se toma cualquiera de los dos
puntos: A B.
Con el punto A (0, 700), se tiene:
Y = m (X X1) + Y1
Sustituyendo:
Y = 560 (X 0) + 700
Y = 560X + 700
Y = 700 + 560X

ECUACIN DE REGRESIN BUSCADA.

Tambin se puede utilizar el punto B (10, 6300)


Y = m (X X1) + Y1
Y = 560 (X 10) + 6300
Y = 560X 5600 + 6300
Y = 560X + 700

Mismo resultado al obtenido con el otro punto.

Otra forma de obtener el mismo resultado, es empleando la ecuacin con el


punto (0, 700):
Y = mX + b

b = 700

= 560X + 700
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

= 700 + 560X

El paso siguiente, es calcular la columna de tendencia o estimacin (Yest = Y


estimada), para lo cual se sustituyen en la ecuacin, los valores de X como
son: 0, 1, 2,, 10; el resultado son puntos que estn sobre la lnea de
regresin trazada.
Clculo de la estimacin:
Y = 700 + 560X
Puntos
Y
(0)
(0, 700)

700

560

(0)

700

Y
(1)
(1, 1260)

700

560

(1)

1260

Y
(2)
(2, 1820)

700

560

(2)

1820

Y
(3)
(3, 2380)

700

560

(3)

2380

Y
(4)
(4, 2940)

700

560

(4)

2940

Y
(5)
(5, 3500)

700

560

(5)

3500

Y
(6)
(6, 4060)

700

560

(6)

4060

Y
(7)
(7, 4620)

700

560

(7)

4620

Y
(8)
(8, 5180)

700

560

(8)

5180

Y
(9)
(9, 5740)

700

560

(9)

5740

Y
(10)
(10, 6300)

700

560

(10)

6300

Como puede observarse, en los resultados anteriores, la diferencia entre


los puntos es de 560, cantidad que representa el valor de la pendiente,
que como se dijo anteriormente es el crecimiento promedio anual. En
base a lo anterior y cuando se trate de una recta, basta sumar al trmino
independiente, en este caso 700, el valor de la pendiente para obtener la
columna que muestra la tendencia, esto es:
700 + 560 = 1260; 1260 + 560 = 1820; 1820 + 560 = 2380, etc. y as se
ahorra el clculo.
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

MTODO DIRECTO. Como se mencion anteriormente, este mtodo es


similar al anterior; se siguen todos los pasos salvo que aqu, los valores de X
y de Y, de los puntos A (0, 700) y de B (10, 6300), se sustituyen en la
ecuacin:
Y = A 0 + A1X
Con el punto A (0, 700); X = 0 y Y = 700, y sustituyendo en la ecuacin
anterior, se tiene:
700 = A0 + A1 (0)
700 = A0 + 0
A0 = 700
Con el punto B (10, 6300); X = 10
ecuacin anterior:

Y = 6300 y sustituyendo en la

6300 = A0 + A1 (10)
6300 = A0 + 10 A1
A0 + 10 A1 = 6300

permutando miembros
despejando a A1

A1 = 6300 A0/ 10
Pero A0 = 700, sustituyendo se tiene:
A1 = 6300 700/ 10 = 5600/ 10 = 560
Sustituyendo A1 = 560, en Y = A0 + A1X;

Y = 700 + 560 X

que es la ECUACIN DE REGRESIN

En el caso que se deseara conocer la produccin para el ao 2007, basta


sustituir el valor de X = 37, en la ecuacin:
Y = 700 + 560 X
Y = 700 + 560 (37) = 21 420, esto quiere decir que la produccin probable
para el ao 2007, es de 20,720 toneladas, de esta forma, a esta ecuacin se
le puede llamar de planeacin, porque por medio de ella, un empresario,
conociendo la demanda probable, puede planear sus compromisos futuros,
por medio de la ecuacin de maquinaria, prstamos, polticas, etc.

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

MTODO DE MNIMOS CUADRADOS

Este mtodo se basa en el criterio de que, la lnea que mejor se ajusta, es


aquella para la cual se reduce al mnimo la suma de las desviaciones al
cuadrado, entre los valores reales y estimados de la variable dependiente,
para la informacin muestral:
Si la relacin rectilnea parece adecuada, se puede emplear la ecuacin:
Y = a0 a1 x1

en donde:

a0 = la distancia del origen al punto en donde la recta corta el eje Y,


a1 = pendiente de la recta
x = variable independiente
El problema de encontrar la ecuacin de la lnea recta de ajuste ptimo, con
el empleo del mtodo de mnimos cuadrados, consiste en determinar los
parmetros a0 y a1, de tal modo que la suma del cuadrado de las
desviaciones sea un mnimo.
A la lnea ajustada de los datos, se le llama CURVA CALCULADA o Ycalculada
(Yest); entonces, la diferencia entre los valores observados (Yobservada)
menos los valores calculados (Ycalculada), en cada uno de los puntos
correspondientes, es igual a una desviacin E, lo que se intenta es encontrar
la lnea para la cual la suma de las desviaciones E, sea un mnimo y se
ilustra en la grfica siguiente:

Se puede escribir esta condicin (de mnimo) como sigue:


Z = (Y0 YC)2 = un mnimo
Pero;

YC = A0 + A1 X, y sustituyendo:
Z = [Y0 (A0 + A1 X)] = mnimo
Z = [Y0 A0 - A1 X] = mnimo

En la formulacin de la suma Z de las desviaciones al cuadrado, los


parmetros a y b, aparecen como variable, y puesto que una de las
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

condiciones para que una funcin de dos variables, tenga un mnimo, es que
sus derivadas parciales con respecto a las variables, sean iguales a cero, y
se deben calcular sus derivadas parciales.
Z = [Y0 a0 - a1 x]2
aZ/aao = 2 [Y0 a0 - a1 x]2-1 D (y0 - a0 - a1 x)
Zao = 2 (Y0 a0 - a1 x) (-1)
Zao = -2 (Y0 a0 - a1 x)
Zao = 0
-2 (Y0 a0 - a1 x) = 0
Dividiendo entre -2, se tiene
(Y0 a0 - a1 x) = 0,

realizando la multiplicacin

Y0 a0 - a1 x = 0
Y0 n a0 - a1 x = 0
Y0 =n a0 + a1 x = 0
n a0 + a1 x = Y0
Pero Y0 = Y
n a0 + a1 x = Y
Z = [Y0 a0 - a1 x]2
az/aa1 = 2 [Y0 a0 - a1 x]2-1 D(Y0 a0 - a1 x)
Za1 = 2 [Y0 a0 - a1 x](-x)
Za1 = -2x [Y0 a0 - a1 x]
Za1 = 0
-2x [Y0 a0 - a1 x] = 0
Dividiendo entre 2, se tiene:
x [Y0 a0 - a1 x] = 0
XY0 xa0 - a1 x2
XY0 a0 x- a1 X2
XY0 = a0 x + a1 X2
XY0 + a0 x2 = a1 X
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Pero Y0 = Y:

a0X + a1 x2 = XY
Por lo que las ecuaciones encontradas son:
n A0 + A1 X = Y
A0X + A1 X2 = XY

ECUACIONES
NORMALES

Y resolviendo este sistema de ecuaciones, se obtienen los valores de a 0 y a1,


los cuales se sustituyen en la ecuacin:

Y = a0 + a1X
Para emplear el Mtodo de Mnimos Cuadrados y obtener la ecuacin de
regresin

y = a0 + a1x1,

existen varias formas de obtener la ecuacin de regresin. Aqu se


mencionarn como forma nmero uno, nmero dos, etc., ya que en la
prctica se escoge la forma que sea ms fcil para su clculo:
FORMA NMERO 1:
CUADRO N 1
PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS
AOS DE 1970- 1980 (EN MILLONES DE TONELADAS).
AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

PASO N 3:
Se escriben las ecuaciones, esto es de vital importancia ya que en base a
ellas se construye el cuadro de trabajo.
Y = a0 a1X
n a0 + a1 X = Y

ECUACIONES

a0X + a1 X2 = XY

NORMALES

PASO N 4:
Se construye el cuadro de trabajo:
(7)

(3)
(1)

(2)

AOS

PRODUCC
IN

(4)

(5)

(6)

X2

Y2

XY

TENDENCIA
O
ESTIMACI
N Yest

Y
1970

1287

1656369

-246.3

1971

925

855625

925

663.6

1972

1341

1798281

2682

1572.5

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

1973

2281

5202961

6843

2481.4

1974

2126

16

4519876

8504

3390.3

1975

3011

25

9066121

15055

4299.2

1976

3805

36

1447802
5

22830

5208.1

1977

5957

49

3548584
9

41699

6117.0

1978

8624

64

7437337
6

68992

7025.9

1979

10384

81

1078274
56

93456

7934.8

1980

10

7540

100

5685160
0

75400

8843.7

SUMA
S

55

47281

385

3121155
39

336386

Clculo de las columnas:


Columna N 4: se elevan al cuadrado los valores de la columna N 2:
(0)2 = 0; (1)2 = 1; (2)2 = 4; (3)2 = 9; (4)2 = 16; etc.
Columna N 5: se elevan al cuadrado los nmeros de la columna N 3:
(1287)2 = 1656369; (925)2 = 855625; (1341)2 = 1798281; etc.
Columna N 6: se multiplican los elementos de la columna N 2, por los
elementos de la columna N 3, esto es:
(0) (1287) = 0
(1) (925) = 925
(2) (1341) = 2682
Etc.

Columna N 7: Esta se calcula hasta que se ha obtenido la ecuacin de


regresin.
DATOS OBTENIDOS:
X = 55
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Y = 47 281
X2 = 385

Y2 = 312 115 539


XY = 336 386
n = 11
Estos datos se sustituyen en las ecuaciones normales y se resuelve el
sistema de ecuaciones:

PASO N 5:
Se obtiene el sistema de ecuaciones y se efecta el clculo:
Y = a0 + a1X
n a0 + a1 X = Y
a0X + a1 X2 = XY
11a0 + a1 (55) = 47 281
11a0 + 55 a1 = 47 281

a0 (55) + a1 (385) = 336 386


55 a0 + 385a1 = 336 386

Ecuaciones obtenidas:
11A0 + 55 A1 = 47 281
55 a0 + 385a1 = 336 386
Este sistema de ecuaciones, se puede resolver por los mtodos de:
a) Suma y resta
b) Sustitucin
c) Igualacin
d) Determinantes
e) Matrices
En este caso, se emplear el mtodo de determinantes:
A0 = a0/ D
11
D=

A1 = a1/ D

55
= (11) (385) (55) (55) = 4235 3025 = 1210

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

55

385

47 281

55

a0 =
18501230 = -298045
336 386

11

= (47 281) (385) (336 386) (55) = 18203185


385

47 281

a1 =
2600455 = 1099791
55

= (11) (336 386) (55) (47 281) = 3700246

336 386

Sustituyendo estos valores en:


A0 = a0/ D = -298045/ 1210 = -246.3
A1 = a1/ D = 1099791/ 1210 = 908.9
Sustituyendo estos valores en:
Y = a0 + a1X
Y = -246.3 + 908.9 X

ECUACIN DE REGRESIN

El valor de -246.3, significa que la recta de la regresin corta el eje Y, abajo


del origen en el punto (0, -246.3), y el valor de 908.9, es la pendiente de la
recta, valor que representa el crecimiento promedio anual.
FORMA NMERO 2:
Otra forma de llegar al mismo resultado y empleando el mismo cuadro de
trabajo, es partiendo de las ecuaciones normales:
n a0 + a1 X = Y
a0X + a1 X2 = XY
Aplicando determinantes:
n

X
= (n) ( X2) ( X) ( X) = n X2 ( X)2

D=
X
ESTADSTICA
MANUEL RODRGUEZ TORRES

X2
M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

a0 =

= ( Y) ( X2) ( XY) ( X)
XY

X2

n
a1 =

= (n) ( XY) ( X) ( Y)
X

XY

Por lo tanto:
a
= 0

a0 =

( Y) ( X2) ( XY) ( X)
n X2 ( X)2

D
a
= 1

a1 =

(n) ( XY) ( X) ( Y)
n X2 ( X)2

D
Y sustituyendo valores:
a0 =
(55)

( Y) ( X2) ( XY)
( X)
=

a0 =

n X2 ( X)2

D
=

(47 281) (385) (336 386)


(11) (385) (55)2

18203185 18501230
=

= -246.3

-298045

4235 3025

1210

a1=
(n) ( XY) (
X) ( Y)
=
3700246 2600455

a1 =

D
4235 3025

(11) (336=386) (55) (47 281)

n X2 ( X)2

(11) (385) (55) 2


1099791

= 908.9

1210

Sustituyendo estos valores, se tiene:


Y = a 0 + a1X

Y = -246.3 + 908.9 X
ESTADSTICA
MANUEL RODRGUEZ TORRES

ECUACIN DE REGRESIN
M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

PASO N 6:

Se calcula la tendencia o estimacin (Yest):


Y = -246.3 + 908.9 X

Y (0) = -246.3 + 908.9 (0)


-246.3)

= -246.3

(0,

Y (1) = -246.3 + 908.9 (1)

Y (2) = -246.3 + 908.9 (2)

= 1572.5

(2, 1572.5)

Y (3) = -246.3 + 908.9 (3)

= 2481.4

(3, 2481.4)

Y (4) = -246.3 + 908.9 (4)

= 3390.3

(4, 3390.3)

Y (5) = -246.3 + 908.9 (5)

= 4299.2

(5, 4299.2)

Y (6) = -246.3 + 908.9 (6)

= 5208.1

(6, 5208.1)

Y (7) = -246.3 + 908.9 (7)

= 6117.0

(7, 6117.0)

Y (8) = -246.3 + 908.9 (8)

= 7025.9

(8, 7025.9)

Y (9) = -246.3 + 908.9 (9)

= 7934.8

(9, 7934.8)

Y (10) = -246.3 + 908.9 (10)

= 8843.7

(10, 8843.7)

663.6

(1,

663.6)

Los puntos encontrados se grafican en el diagrama de dispersin y la recta


resultante es:
Y = -246.3 + 908.9 X
Comparando esta ecuacin con la que se obtuvo en el mtodo libre o de
mano alzada (Y = 700 + 560 X), se observa que son diferentes, esto es
normal, ya que sta es en base a la experiencia, por lo tanto no se
recomienda que se emplee, salvo que sea urgente un pronstico.
En ocasiones, se considera a X, como variable dependiente y a Y como
independiente, bajo estas condiciones la ecuacin de regresin, y las
ecuaciones normales son:
X = b0 + b 1 Y
n b0 + b1 Y = X
b0 Y + b1 Y2 = XY, y
b0 =
(336386)

b0 =

( X) ( Y2) ( XY)
( Y)
=

D
(4728112)
ESTADSTICA
MANUEL RODRGUEZ TORRES

n Y2 ( Y)2

(55) (312115539) (47281)


(11) (312115539)

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

1261688179

= 1.05

1197777968
b1=
1099791

b1 =

(n) ( XY) (
Y) ( X)
=

D
1197777968

(11) (336=386) (55)= (47 281)


0.00092

n Y2 ( Y)2

(11) (312115539) (47281) 2

Sustituyendo estos valores en:


X = b0 + b 1 Y
X = 1.05 + 0.00092 Y

ECUACIN DE REGRESIN

Cabe aclarar que este clculo se emplea en la teora de la correlacin.

FORMA NMERO 3.
CUADRO N 1
PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS
AOS DE 1970- 1980 (EN MILLONES DE TONELADAS).
AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

FUENTE: SARH

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

PASO N 3:

Ecuaciones de regresin:
Y =

XY

(X)

X2
Pero; X = X X
Y=YY

Y sustituyendo:
Y-Y =

XY

(X - X)

X2
Y= Y +

XY

(X - X)

X2
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

PASO N 4:
AOS

PRODUCCI X = X N
X

Y=YY

(X
X)2

X2

ESTIMACI
N Yest

XY

1970

1287

-5

-3011.3

25

15056.5

-246.3

1971

925

-4

-3373.3

16

13493.2

663.6

1972

1341

-3

-2957.3

8871.9

1572.5

1973

2281

-2

-2017.3

40434.6

2481.4

1974

2126

-1

-2172.3

2172.3

3390.3

1975

3011

-1287.3

4299.2

1976

3805

-497.3

-497.3

5208.1

1977

5957

1658.7

33177.1

6117.0

1978

8624

4325.7

12977.1

7025.9

1979

10384

6085.7

16

24342.8

7934.8

1980

10

7540

3241.7

25

16208.5

8843.7

110

100474.
3
-497.3

SUMA
S

55

47281

99977.0

Clculo de la columna 4:
a) Se calcula la media aritmtica de los datos de esa columna ( x ):
X =

55

11

b) Se efecta la operacin:
X = X - x = 0 5 = -5; X = 1 5 = -4; X = 2 5 = -3; X = 3 5 = -2; X =
10 5 = 5
Los valores -5, -4, -3, etc., se elevan al cuadrado, y de esta forma se obtiene
la columna nmero 6:
(-5)2 = 25; (-4)2 = 16; (-3)2 = 9; (-2)2 = 4; etc.

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Clculo de la columna nmero 5:


a) Se calcula la media Y:

Y =

47281
= 4298.3
11

b) Se calcula la operacin:
Y = Y Y = 1287 4298.3 = -3011.3; Y = 925 4298.3 = -3373.3; Y =
7540 4298.3 = 3241.7

PASO N 5:
Se obtiene la ecuacin de regresin:
DATOS:
Y = 4298.3
X=5
XY = 96659.6
X2 = 110
Y= Y +

XY
(X - X)
X2

Y = 4298.3

99977
(X - 5)
110

Y = 4298.3 908.9 (X - 5)

Y = 4298.3 908.9 X 4544.6

+
Y = -246.3 + 908.9 X

ECUACIN DE REGRESIN

Como puede observarse, se tiene el mismo resultado.


El paso siguiente es el clculo de la estimacin que ya se realiz.

FORMA NMERO 4:
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

CUADRO N 1

PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS


AOS DE 1970- 1980 (EN MILLONES DE TONELADAS).
AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

FUENTE: SARH

PASO N 3:
Seleccin del mtodo: (ecuaciones)
Y= Y +

XY

(X)

X2
PASO N 4:
Construccin del cuadro de trabajo:
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

(3)
(1)

(2)

AOS

PRODUCC
IN

(6)
(4)

(5)

XY

TENDENCIA O
ESTIMACIN
Yest

Y
1970

-5

1287

25

-6435

-246.2

1971

-4

925

16

-3700

662.7

1972

-3

1341

-4023

1571.6

1973

-2

2281

-4562

2480.5

1974

-1

2126

-2126

3389.4

1975

3011

4298.3

1976

3805

3805

5207.2

1977

5957

11914

6116.1

1978

8624

25872

7025.0

1979

10384

16

41536

7933.9

1980

7540

25

37700

8842

SUMAS

47281

120827
-20846
99981

Llenado del cuadro de trabajo:


Columna nmero 2:
Se toma la mediana (de los aos en este caso). Est en el ao 1975, por lo
que le corresponde el cero (0). A partir de este nmero hacia arriba, son
nmeros negativos (-1, -2, -3, etc.), y hacia abajo los positivos (1, 2, 3, etc.),
cuando el nmero de datos sea par, se empieza con -1, -3, -5, , y hacia
abajo con 1, 3, 5, 7, , etc., y cuando sean impares, es cero en el centro,
como puede observarse en el cuadro de trabajo.
Las otras columnas se calculan tal como se explic en los ejemplos
anteriores.
DATOS OBTENIDOS:
X2 = 110
XY = 99981
Y =

47281
= 4298.3

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

11

Sustituyendo estos valores se tiene:


Y= Y +

XY

(X) = 4298.3 +

X2

99981
110

Y = 4298.3 + 908.9 X

ECUACIN DE REGRESIN

Comparando esta ecuacin con la que se obtuvo con los otros mtodos: Y =
-246.3 + 908.9 X, nos damos cuenta que los trminos independientes:
4298.3 y -246.3, son diferentes, lo que sucede es que el origen de la
ecuacin Y = -246.3 + 908.9 X, se localiza en el ao de 1970, esto es 1970
= 0; mientras que en la ecuacin: Y = 4298.3 + 908.9 X, donde el origen
est en el ao de 1975, es decir, 1975 = 0, lo que significa que el eje Y,
sufri un desplazamiento paralelo y ahora se localiza en el ao de 1975,
esto es, que este punto est ms arriba que el (0, -246.3), (0, 4298.3), como
se puede observar en la grfica, sin embargo, la pendiente es la misma y de
ser cierta la afirmacin anterior, al sustituir los valores de X, los resultados
deben ser los mismos, esto es:
Clculo de Yest:
Y = 4298.3 + 908.9 X
Y (-5) = 4298.3 + 908.9 (-5) = -246.3
-246.3)
663.6

(-5,

Y (-4) = 4298.3+ 908.9 (-4)

(-4,

663.6)

Y (-3) = 4298.3+ 908.9 (-3)

= 1572.5

(-3, 1572.5)

Y (-2) = 4298.3+ 908.9 (-2)

= 2481.4

(-2, 2481.4)

Y (-1) = 4298.3+ 908.9 (-1)

= 3390.3

(-1, 3390.3)

Y (0) =

4298.3+ 908.9 (0)

= 4299.2

(0, 4299.2)

Y (1) =

4298.3+ 908.9 (1)

= 5208.1

(1, 5208.1)

Y (2) =

4298.3+ 908.9 (2)

= 6117.0

(2, 6117.0)

Y (3) =

4298.3+ 908.9 (3)

= 7025.9

(3, 7025.9)

Y (4) =

4298.3+ 908.9 (4)

= 7934.8

(4, 7934.8)

Y (5) =

4298.3+ 908.9 (5)

= 8843.7

(5, 8843.7)

Resultados idnticos a los obtenidos con la ecuacin:


Y = -246.3 + 908.9 X

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

PARBOLA DE MNIMOS CUADRADOS

Puede suponerse que el comportamiento de los datos no sea lineal, como


por ejemplo, el crecimiento de la poblacin, entonces, se puede emplear la
funcin:

Y = a0 + a1 X + a2 X2
Ecuaciones normales:
a0 n + a1 X + a2 X2 = Y
a0X + a1 X2 + a2 X3 = XY
a0 X2 + a1 X3 + a2 X4 = X2Y

EJEMPLO:

CUADRO N 1
PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS
AOS DE 1970- 1980 (EN MILLONES DE TONELADAS).
AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

FUENTE: SARH

En este caso, el diagrama de dispersin y la ecuacin de regresin se


graficarn hasta el final, con el objeto de hacer nfasis en la grfica final.
CUADRO DE TRABAJO
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

(6)

AO

PRODUCCI
N

X2

X3

X4

X2Y

TENDENCIA
O
ESTIMACIN
Yest

-6435

32175

769.3

XY

Y
1970

-5

1287

25

1971

-4

925

16

-64

256

-3700

14800

1068.9

1972

-3

1341

-27

81

-4023

12069

1503.9

1973

-2

2281

-8

16

-4562

9124

2074.3

1974

-1

2126

-1

-2126

2126

2780.1

1975

3011

3621.3

1976

3805

3805

3805

4597.9

1977

5957

16

11914

23828

5709.9

1978

8624

27

81

25872

27616

6957.3

1979

10384

16

64

256

41536 166144

8340.1

1980

7540

25

125

625

37700 188500

9858.3

SUMA
S

-125 625

0
0

47281

110

1958

12082
7
20846

530187

99981

DATOS OBTENIDOS:
X=0
Y = 47 281
X2 = 110
X3 = 0
X4 = 1958
XY = 99981
X2Y = 530187

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Y = a0 + a1 X + a2 X2 = Y

a0 n + a1 X + a2 X2 = Y
a0X + a1 X2 + a2 X3 = XY
a0 X2 + a1 X3 + a2 X4 = X2Y
a0 (11) + a1 + a2 =
11 a0 + + 110 a2 =
11 a0 + 110 a2 = I
a0 + a1 + a2 =
a1 + 0 = 99981
a1 = 99981
99981
a1=

908.9

II

110
a0 + a1 + a2 =
110 a0 + + 1958 a2 =
110 a0 + 1958 a2 = III
(-110) 11 a0 + 110 a2 = I
(11) 110 a0 + 1958 a2 = III
-1210 a0 -12100 a2 = - 5200910
1210 a0 + 21538 a2 = 5840010
0
a2=

9438 a2 = 639100

639100
=

67.7

9438
11 a0 + 110 a2 =
11 a0 = - 110 a2

=
39834

47281 - 110 a2
=

47281 - 110 (67.7)


=

47281 - 7447

a0
3621.3
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

11

11

11

11

Valores encontrados:
a0 =

3621.3;=a1

=
908.9;
a2

67.7

Y sustituyendo estos valores en la ecuacin:


Y = a0 + a1 X + a2 X 2 = Y

Y = 3621.3 + 908.9 X + 67.7 X2


REGRESIN

ECUACIN DE

Clculo de la estimacin:

Y = 3621.3 + 908.9 X + 67.7 X2


Y (-5) = 3621.3 + 908.9 (-5) + 67.7 (-5)2 = 769.3
(-5,

769.3)

Y (-4) = 3621.3 + 908.9 (-4) + 67.7 (-4)2 = 1068.9


1068.9)

(-4,

Y (-3) = 3621.3 + 908.9 (-3) + 67.7 (-3)2 = 1503.9


1503.9)

(-3,

Y (-2) = 3621.3 + 908.9 (-2) + 67.7 (-2)2 = 2074.3


2074.3)

(-2,

Y (-1) = 3621.3 + 908.9 (-1) + 67.7 (-1)2 = 2780.1


2780.1)

(-1,

Y (0) =
3621.3)

3621.3 + 908.9 (0) + 67.7 (0)2 = 3621.3

(0,

Y (1) =
4597.9)

3621.3 + 908.9 (1) + 67.7 (1)2 = 4597.9

(1,

Y (2) =
5709.9)

3621.3 + 908.9 (2) + 67.7 (2)2 = 5709.9

(2,

Y (3) =
6957.3)

3621.3 + 908.9 (3) + 67.7 (3)2 = 6957.3

(3,

Y (4) =
8340.1)

3621.3 + 908.9 (4) + 67.7 (4)2 = 8340.1

(4,

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Y (5) =
9858.3)

3621.3 + 908.9 (5) + 67.7 (5)2 = 9858.3

(5,

Como puede observarse, con este mtodo, la tendencia de la funcin de


regresin, es mejor que la lineal, es por eso que se recomienda siempre
graficar primero los datos, para que en base a su tendencia, se elija el
mtodo adecuado.

REGRESIN POTENCIAL
La ecuacin de la funcin potencial es igual a:

Y = axb
Donde b, puede ser positiva o negativa, pero permanece constante para
todos los valores de X. Recibe el nombre de Coeficiente de elasticidad, y se
emplea con mucha frecuencia en estudios socio-econmicos.
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Las ecuaciones normales que se deben emplear bajo el supuesto de que el


fenmeno estudiado tiene un comportamiento potencial, son (de Y = axb):

n Ln a + b Ln X = Ln Y
Ln a Ln X + b (Ln X)2 = (Ln X Ln Y)
CUADRO N 1
PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS
AOS DE 1970- 1980 (EN MILLONES DE TONELADAS).
AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

CUADRO DE TRABAJO
AOS

PRODUCCI
N
Ln X

Ln Y

Ln X Ln Y (Ln
X)2

ESTIMACI
N Yest

1970

1287

0.0

7.1601

0.0

653

1971

925

0.693
1

6.8298

4.7337

0.480
5

1304

1972

1341

1.098
6

7.2012

7.9112

1.206
9

1955

1973

2281

1.386
3

7.7324

10.7194

1.921
8

2605

1974

2126

1.609
4

7.6620

12.3312

2.590
7

3255

1975

3011

1.791
8

8.0100

14.3524

3.210
4

3905

1976

3805

1.945
9

8.2407

16.0421

3.786
6

4554

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

1977

5957

2.079
4

8.6923

18.0748

4.324
1

5203

1978

8624

2.197
2

9.0623

19.9117

4.827
8

5853

1979

10

10384

2.302
6

9.2480

21.2945

5.301
9

6502

1980

11

7540

2.397
9

8.9280

21.4048

5.749
9

7151

SUMA
S

66

47281

17.50
22

88.766
8

110146.77
94

33.40
02

DATOS OBTENIDOS:
X = 66
Y = 47 281
Ln X = 17.5022
Ln Y = 88.7668
Ln X Ln Y = 146.7794
(Ln X)2 = 33.4002

Y = axb
n Ln a + b Ln X = Ln Y
Ln a Ln X + b (Ln X)2 = (Ln X Ln Y)
11 Ln a + b (17.5022) = 88.7668
11 Ln a + 17.5022 b = 88.7668

Ln a (17.5022) + b (33.4002) = 146.7794


17.5022 Ln a + 33.4002 b = 146.7794

(-17.5022)
(11)

11 Ln a + 17.5022 b = 88.7668

17.5022 Ln a + 33.4002 b = 146.7794

- 192.5242 Ln a 306.3270 b = - 1553.6160


192.5242 Ln a + 367.4022 b = 1614.5734
61.0752 b = 60.9574
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

b=

60.9574
=

0.9981

61.0752
11 Ln a + 17.5022 b = 88.7668
11 Ln a = 88.7668 - 17.5022 b
Ln =

88.7668 17.5022 (0.9981)

88.7668 17.4689

11

11

71.2979
A

6.4816
11

a = anti Ln (6.4816) = 653.03

Y = axb

Sustituyendo en la funcin:

Y = 653.03 X

0.99881

ECUACIN DE REGRESIN

Clculo de la estimacin:
Y (1)
= 653.03 (1)0.9981
653.03)

= 653.03

(1,

Y (2)
= 653.03 (2)0.9981
1304.34)

= 1304.34

(2,

Y (3) = 653.03 (3)0.9981


1955.00)

= 1955.00

(3,

Y (4) = 653.03 (4)0.9981


2605.25)

= 2605.25

(4,

= 653.03 (5)0.9981

= 3255.18

Y (6) = 653.03 (6)0.9981


3904.86)

= 3904.86

(6,

Y (7) = 653.03 (7)0.9981


4554.34)

= 4554.34

(7,

Y (8) = 653.03 (8)0.9981


5203.64)

= 5203.64

(8,

Y (9) = 653.03 (9)0.9981


5852.79)

= 5852.79

(9,

Y (5)

Y (10) = 653.03 (10)0.9981 = 6501.79


6501.79)
ESTADSTICA
MANUEL RODRGUEZ TORRES

(5, 3255.18)

(10,

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Y (11) = 653.03 (11)0.9981 = 7150.68


7150.68)

(11,

REGRESIN EXPONENCIAL

Cuando el comportamiento de los datos se ajusta a una tasa creciente de


incremento, bajo tal situacin se emplea la funcin exponencial:

Y = abx

Serie que vara en una progresin geomtrica, en donde b es la razn de


progresin, conocido tambin como Coeficiente de Crecimiento. Por lo tanto:
Y = abx
n Ln a + Ln b X = Ln Y
Ln a X + Ln b X2 = X Ln Y

CUADRO N 1
PRODUCCIN DE GARBANZO EN EL ESTADO DE MXICO DURANTE LOS
AOS DE 1970- 1980 (EN MILLONES DE TONELADAS).
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

AO

PRODUCCIN

AO

PRODUCCIN

1970

1287

1976

3805

1971

925

1977

5957

1972

1341

1978

8624

1973

2281

1979

10384

1974

2126

1980

7540

1975

3011

CUADRO DE TRABAJO
AOS

X2

PRODUCCI
N

Ln Y

X Ln Y

ESTIMACIN
Yest

Y
1970

1287

7.1601

7.1601

954

1971

925

6.8298

13.6596

1241

1972

1341

7.2012

21.6036

1546

1973

16

2281

7.7324

30.9296

1968

1974

25

2126

7.6620

38.3100

2505

1975

36

3011

8.0100

48.0600

3189

1976

49

3805

8.2407

57.6849

4059

1977

64

5957

8.6923

69.5384

5168

1978

81

8624

9.0623

81.5607

6578

1979

10

100

10384

9.2480

92.4800

8374

1980

11

121

7540

8.9280

98.2080

10660

SUMA
S

66

47281

88.7668

559.1949

506

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

DATOS OBTENIDOS:
X = 66
X2 = 506
Y = 47 281
Ln Y = 88.7668

X Ln Y = 559.1949

Y = abx
n Ln a + Ln b X = Ln Y
Ln a X + Ln b X2 = X Ln Y
11 Ln a + Ln b (66) = 88.7668
11 Ln a + 66 Ln a = 88.7668

Ln a (66) + Ln b (506) = 559.1949


66 Ln a + 506 Ln b = 559.1949

II

Por lo tanto, las ecuaciones son:


- (66)
(11)

11 Ln a + 66 Ln a = 88.7668

66 Ln a + 506 Ln b = 559.1949

II

- 726 Ln a 4356 Ln b = -5858.6088


726 Ln a + 5566 Ln b = 6151.1439
210 Ln b = 292.5351
292.5331
Ln b =

= 0.241763
1210

b = 1.273
11 Ln a + 66 Ln a = 88.7668
11 Ln a = 88.7668 66 Ln b
88.7668 66 Ln b
88.7668 66 (0.2417)
15.9564
Ln a =
=
11
11

88.7668
=
11

72.81034
ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

Ln a =

= 6.6191

11
a = anti Ln (6.6191) = 749.29

Por lo tanto, la funcin de regresin exponencial es:

Y = abx
Y = 749.29 (1.273)x
DE REGRESIN

ECUACIN

Clculo de la estimacin:
Y (1)
= 749.29 (1.273)1
953.8)

= 953.8

(1,

Y (2)
= 749.29 (1.273)2
1214.2)

= 1214.2

(2,

Y (3) = 749.29 (1.273)3


1545.7)

= 1545.7

(3,

Y (4) = 749.29 (1.273)4


1967.7)

= 1967.7

(4,

Y (5) = 749.29 (1.273)5


2504.9)

= 2504.9

(5,

Y (6) = 749.29 (1.273)6


3188.7)

= 3188.7

(6,

Y (7) = 749.29 (1.273)7


4059.3)

= 4059.3

(7,

Y (8) =
5167.5)

749.29 (1.273)8

= 5167.5

(8,

Y (9) =
6578.2)

749.29 (1.273)9

= 6578.2

(9,

Y (10) = 749.29 (1.273)10


8374.0)

= 8374.0

(10,

Y (11) = 749.29 (1.273)11


10660.1)

= 10660.1

(11,

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

INSTITUTO TECNOLGICO DE LA PAZ


DEPARTAMENTO DE INGENIERAS

ESTADSTICA
MANUEL RODRGUEZ TORRES

M.C. JUAN

Вам также может понравиться