Академический Документы
Профессиональный Документы
Культура Документы
Modelos de
regresin
Modelos de regresin
Una cosa es ajustar un modelo a una serie de tiempos;
otra, totalmente diferente, es proponer otras variables
que se relacionen a la serie de datos de inters y
desarrollar un modelo que exprese la forma en que se
relaciona diversas variables.
Modelos de regresin
Regresin simple
El anlisis de regresin simple es una herramienta
estadstica que nos permite estimar la relacin
matemtica existente entre una variable dependiente
(denominada generalmente Y) y una nica variable
independiente (expresada comnmente X).
La variable dependiente es aquella que queremos
realizar una previsin.
Si a la relacin entre las dos variables (X Y) es una
lnea, estamos hablando de modelos de regresin
lineal, que son los que se utilizan con mayor
frecuencia.
Regresin simple
El modelo matemtico que se ajusta a una recta, es el
siguiente:
Y = bo + b1 X + e
b1 seala la tasa de cambio de Y por unidad de X.
La interseccin bo es el valor que adquiere la variable
dependiente Y cuando X es cero.
e del modelo representa un trmino de error.
Regresin simple
Nuestro problema es determinar los valores de bo y b1
de manera que la ecuacin resultante se ajusten a los
datos de la mejor manera posible.
La tcnica que se utiliza con mayor frecuencia es MCO
(mnimos cuadrados ordinarios).
bo y b1 son parmetros de la poblacin que se estiman
tpicamente
mediante
datos
muestrales.
Los
estadsticos muestrales son bo y b1, en consecuencia el
modelo muestral es:
Y = bo + b1 X
Ejemplo
CONJUNTO A
CONJUNTO B
CONJUNTO C
CONJUNTO D
X
10
8
13
9
11
14
6
4
12
7
5
X
10
8
13
9
11
14
6
4
12
7
5
X
10
8
13
9
11
14
6
4
12
7
5
X
8
8
8
8
8
8
8
19
8
8
8
Y
8.04
6.95
7.58
8.81
8.33
9.96
7.24
4.26
10.84
4.82
5.68
Y
9.14
8.14
8.74
8.77
9.26
8.1
6.13
3.1
9.13
7.26
4.74
Y
7.46
6.77
12.74
7.11
7.81
8.84
6.08
5.39
8.15
6.42
5.73
Y
6.58
5.76
7.71
8.84
8.47
7.04
5.25
12.5
5.56
7.91
6.89
Regresin simple
Y = 3 + 0.5 X
ES POSIBLE ESTO?
Veamos la representacin grafica de cada uno de
ellas
12
12
10
10
Conjunto
A
Regresin simple
Conjunto
0
0
10
15
14
14
12
12
10
10
15
Conjunto
Conjunto
10
X
4
4
2
2
0
0
10
X
15
0
0
10
X
Qu opinan ahora?
15
20
Regresin simple
Calcular el coeficiente
determinacin.
de
Prueba de significancia
correlacin.
del
Anlisis de regresin.
Error estndar de estimacin
correlacin
coeficiente
y
de
Ejemplo
Suponga que el Sr. Juan observa el precio y volumen de
galones de leche de 10 semanas elegidas en forma
aleatoria. Podr el seor Jun pronosticar el volumen de
ventas a partir del precio de galn de la leche?
SEMANA
VENTAS
1
10
2
6
3
5
4
12
5
10
6
15
7
5
8
12
9
17
10
20
Ventas en miles de galones
Precio de venta por galon
PRECIO
1.3
2
1.7
1.5
1.6
1.2
1.6
1.4
1
1.1
Lo resuelven?
Ejemplo 20
El seor Juan se enfrenta al
problema de formular un
pronstico que no es del todo
preciso. El puede explicar casi
el 75% de la varianza total del
volumen de ventas de galones
de leche vendidos mediante el
uso
de
una
variable
independiente. Para ser mas
preciso, debe encontrar otra
variable de prediccin que le
permita explicar mas la
varianza total.
SEMANA
VENTAS
PRECIO
1
10
1.3
2
6
2
3
5
1.7
4
12
1.5
5
10
1.6
6
15
1.2
7
5
1.6
8
12
1.4
9
17
1
10
20
1.1
Ventas en miles de galones
Precio de venta por galon
Publicidad en ciento de dolares
MEJORO SU PRONOSTICO?
PUBLICIDAD
9
7
5
14
15
12
6
10
15
21
de
Prueba de significancia
correlacin.
del
correlacin
coeficiente
y
de
Anlisis de regresin.
Error estndar de estimacin.
Prueba de significancia de los coeficientes de
regresin.
Observe usted, el
grafico de dispersin
mltiple
Model Summary
Model
1
R
R Square
.965 a
.932
Adjus ted
R Square
.912
Std. Error of
the Es tim ate
1.507
ANOVAb
Model
1
Regress ion
Res idual
Total
Sum of
Squares
217.699
15.901
233.600
df
2
7
9
Mean Square
108.849
2.272
F
47.917
Sig.
.000 a
Model
1
(Cons tant)
precio
publicidad
Uns tandardized
Coefficients
B
Std. Error
16.406
4.343
-8.248
2.196
.585
.134
Standardized
Coefficients
Beta
-.490
.571
t
3.778
-3.756
4.377
Sig.
.007
.007
.003
Model
1
R
R Square
.965a
.932
Adjust ed
R Square
.912
Std. Error of
the Estimate
1. 507
ANOVAb
Model
1
Regress ion
Res idual
Tot al
Sum of
Squares
217.699
15. 901
233.600
df
2
7
9
Mean Square
108.849
2. 272
F
47. 917
Sig.
.000a
t
3. 778
-3.756
4. 377
Sig.
.007
.007
.003
Model
1
(Const ant)
precio
public idad
Uns tandardized
Coef f icients
B
Std. Error
16. 406
4. 343
-8.248
2. 196
.585
.134
Standardized
Coef f icients
Beta
-. 490
.571
Ejemplo
Caso A - Elecciones en Florida
En las elecciones presidenciales norteamericanas
de Noviembre 2000 los contendientes principales,
George Bush y Al Gore, resultaron casi empatados
en trminos de votos electorales, por lo que el
resultado dependa crucialmente de los comicios
en el estado de Florida, donde el escrutinio inicial
no dio un resultado definitivo a favor de ninguno
de los candidatos. A medida que prosegua el
conteo, surgieron varias anomalas, una de las
cuales tuvo que ver con el condado de Palm
Beach.
Entre otras cosas, se aleg que en este condado muchos votantes que deseaban
votar por Gore se confundieron, debido al diseo de la papeleta electoral, y
votaron por error por un candidato marginal, Pat Buchanan, del Reform Party.
(El condado de Palm Beach tena una papeleta electoral un tanto confusa y con
un formato diferente a la de los dems condados en el estado.)
El cuadro adjunto muestra la votacin obtenida por Buchanan en todos los
condados del estado de Florida, y se aprecia claramente que la cantidad de votos
obtenidos por ese candidato en Palm Beach fue exageradamente grande en
comparacin al resto del estado. Presumiblemente, muchos de estos fueron
efectivamente votos errneos (y probablemente con la intencin de votar por
Gore, debido al diseo de la papeleta). La pregunta es si se puede obtener una
estimacin aproximada de la cantidad de estos votos errneos.
Como una primera aproximacin, se esperara que la votacin obtenida por Buchanan en
un condado determinado estara positivamente relacionada con la cantidad de personas
afiliadas al Reform Party residentes en ese condado. Este dato tambin se muestra en el
cuadro adjunto.
Con esta informacin,
(a) Construya un diagrama de dispersin, relacionando las dos variables.
(b) Calcule la lnea de regresin (excluyendo la observacin para Palm Beach), y con los
resultados obtenidos, haga una estimacin de la "votacin excedente" obtenida por
Buchanan en Palm Beach.
(c) Tomando en cuenta que segn los resultados oficiales, Bush gan a Gore en Florida por
una diferencia de 537 votos (sobre un total de ms de 6,100,000 votos emitidos),
comente sobre las implicaciones de este anlisis para el resultado final de las elecciones
presidenciales de ese ao.
Registrados
Votos por
Reform Party
Buchanan
Alachua
Baker
Bay
Bradford
Brevard
Broward
Calhoun
Charlotte
Citrus
Clay
Collier
Columbia
Dade
Desoto
Dixie
Duval
Escambia
Flagler
Franklin
Gadsden
Gilchrist
Glades
Gulf
Hamilton
Hardee
Hendry
Hernando
Highlands
91
4
55
3
148
332
2
41
44
40
118
35
217
7
0
150
130
30
0
11
6
2
3
3
4
10
43
24
263
73
248
65
570
788
90
182
270
186
122
89
560
36
29
652
502
83
33
38
29
9
71
23
30
22
242
127
Hillsborough
Holmes
Indian River
299
2
66
8
2
0
Condado
Jackson
Jefferson
Lafayette
Registrados
Votos por
Reform Party
Buchanan
Lake
Lee
Leon
Levy
Liberty
Madison
Manatee
Marion
Martin
Monroe
Nassau
Okaloosa
Okeechobe
Orange
Osceola
Pasco
Pinellas
Polk
Putnam
Santa Rosa
Sarasota
Seminole
St.Johns
St.Lucie
Sumter
Suwannee
Taylor
Union
80
113
80
17
0
2
140
108
48
62
13
96
27
199
62
167
425
119
27
55
154
81
59
25
21
7
3
1
289
305
282
67
39
29
271
563
112
47
90
267
43
446
145
570
1013
532
148
311
305
194
229
124
114
108
27
37
847
76
105
Volusia
Wakulla
Walton
176
7
22
496
46
120
102
29
10
Washington
88
337
3407
Condado
PALM BEACH
Fuentes:
Florida Dept. of State, Division of Elections,
"County Voter Registration by Party," Oct 10, 2000
http://election.dos.state.fl.us/pdf/2000voterreg/20
00genparty.pdf
ABC News, "Florida: Real-Time County
Returns"
(www.abcnews.go.com/sections/politics/2000vote/
general/FL_county.html), visited June 15, 2001.