Академический Документы
Профессиональный Документы
Культура Документы
Contents
1 Tablas 2
1.1 Tabla 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Tabla 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Tabla 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3 Preguntas 5
3.1 Ejercicio 01 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 Ejercicio 02 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Ejercicio 03 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.4 Ejercicio 04 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.5 Ejercicio 05 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.6 Ejercicio 06 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.7 Ejercicio 07 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.8 Ejercicio 08 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.9 Ejercicio 09 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4 Referencias 15
1
1 Tablas
1.1 Tabla 1
y x
10 9.3
20 17.4
30 26.7
40 36.1
1.2 Tabla 2
y x
1 5
2 20
3 45
4 80
5 125
1.3 Tabla 3
xi yi
0 455
1 402
2 356
3 315
4 278
5 246
6 218
7 193
8 171
9 151
10 133
2
2 Desarrollo teórico previo:
La regresión lineal simple (o con una variable explicativa) consiste en generar un modelo de regresción
(ecuación de una recta) que permita explicar la relación lineal que existe entre dos variables. Normalmente,
diremos que x es la variable independiente, (predictora, regresora o explicativa) e y es la variable dependiente
(predicha, regresada o explicada).
El modelo de regresión lineal simple se describe de acuerdo a la ecuación:
yi = β0 + β1 xi + εi ; i = 1, 2, ..., n
Siendo β0 la ordenada en el origen (intercepto del modelo), β1 la pendiente y εi el error aleatorio. En nuestro
modelo, β0 representa el efecto de todas aquellas variables que influyen (sistemáticamente) en y, mientras
que el término de error aleatorio (εi ) es la diferencia ente el valor ajustado por la recta (de regresión) y el
valor real y recoge el efecto de todas aquellas variables que influyen (no sistemáticamente) en y, pero que no
se incluyen en el modelo (no fueron considerados como variables predictoras).
Normalmente, β0 y β1 poblacionales son desconocidos, por lo que, a partir de una muestra, debemos obtener
los valores estimados de los parámetros (o coeficientes) del modelo, es decir: βˆ0 y βˆ1 . En ese sentido, nuestro
modelo empírico será:
Para calcular los coeficientes del modelo podemos usar el método de los Mínimos Cuadrados Ordinarios
(M CO)1
Consiste en un método derivado de la minimización de la suma de los errores cuadrados de los residuos
(“SCR”). Se trata, por tanto, de seleccionar valores de los coeficientes βˆ0 y βˆ1 que resuelven el siguiente
problema:
X
M inβ̂ SCR = û2i
0 ,β̂1
Donde los residuos del modelo estimado (ûi ) es el estimador del error aleatorio εi y puede expresarse como:
X n
X
M inβ̂ SCR = ûi 2
= (yi − β̂0 − β̂1 xi )2
0 ,β̂1
i=1
n
dSCR X
= −2 (yi − β̂0 − β̂1 xi ) = 0
dβ0 i=1
1 También llamado Ordinary Least Square (OLS) en ingles.
3
n
dSCR X
= −2 (yi − β̂0 − β̂1 xi )xi = 0
dβ1 i=1
Resolviendo la primera derivada encontramos que los coeficientes optimos que minimizan la suma de errores
al cuadrado estan dados por:
Pn P
yi − β̂1 xi
β̂0∗ = i
= y − β̂1 x
n
Pn Pn Pn
yi xi − n1 ( i=1 xi )( i=1 yi )
Pn
(x − y)(yi − y)
β̂1∗ = i=1
= Pn i
i=1
i=1 (xi − x)
Pn 2 − 1( n
) 2
P 2
i=1 ix n i=1 ix
Dichos valores óptimos de los coeficientes del modelo de regresión nos porporcionan directamente las esti-
maciones M CO. Se recomineda primero calcular β̂1 y, luego, se obtiene β̂0 = y − β̂1 x.
4
3 Preguntas
3.1 Ejercicio 01
Tomando en cuenta la tabla 1 de un experimento que involucra dos variables: x (variable independiente) e
y (variable independiente). Confeccionar una gráfica en papel milimetrado. ¿Qué tipo de función es?
Solución
En primer lugar debemos incorporr los datos de la tabla 1, para luego realizar el modelo de regresión simple
y encontrar la recta que se ajuste mejor al modelo.
data1 <- data.frame("y" = c(10, 20, 30, 40), "x" = c(9.3, 17.4, 26.7, 36.1))
Posterior a elo, procedemos a graficar la recta de regresión que minimiza el error aleatorio. Así, obtenemos
lo siguiente.
library(ggplot2)
ggplot(data1, aes(x= x, y= y)) + geom_point() + ggtitle("Gráfica del modelo 1") +
xlab("Variable explicativa x") +
ylab("Variable explicada x") +
geom_smooth(method=lm, se = FALSE)
30
20
10
10 20 30
Variable explicativa x
Tal como podemos observar, el gráfico de regresión lineal nos muestra que el modelo es lineal.
5
3.2 Ejercicio 02
• De forma manual
Tenemos los datos de la tabla 1 y completaremos los cálculos para calcular los coeficientes del modelo de
regresión simple. De ese modo, y realizando los cálculos, obtenemos el siguiente cuadro:
Pn
y x y i xi xi 2 ( i=1 xi ) 2
10 9.3 93 86.49
20 17.4 348 302.76
30 26.7 801 712.89
P 40 36.1 1,444 1,303.21
100 89.5 2,686 2,405.35 8,010.25
Ahora, procedemos a reemplazar en las formulas derivadas anteriormente. En ese sentido, tenemos:
Pn Pn Pn
yi xi − n1 ( i=1 xi )( i=1 yi ) 2, 686 − 41 (89.5)(100)
β̂1∗ = i=1
Pn n = = 1.11349
i=1 xi − n ( i=1 xi ) 2, 405.35 − 14 (8, 010.25)
1
2
P 2
Luego,
Pn
100 − 1.11349(89.5)
P
yi − β̂1 xi
β̂0∗ = i
= = 0.08565
n 4
Finalmente, el modelo puede representarse como:
yi = 0.08565 + 1.11349xi
• Utilizando software
data1 <- data.frame("y" = c(10, 20, 30, 40), "x" = c(9.3, 17.4, 26.7, 36.1))
modelo1 <- lm(y ~ x, data = data1)
print(modelo1)
##
## Call:
## lm(formula = y ~ x, data = data1)
##
## Coefficients:
## (Intercept) x
## 0.08565 1.11349
6
Como podemos observar, el coeficiente del intercepto es 0.08565 y la pendiente del modelo es 1.11349, por
lo que el modelo represnetado es el mismo que obtuvimos manualmente, es decir:
yi = 0.08565 + 1.11349xi
3.3 Ejercicio 03
En la tabla 1, mediante el método de ajuste por mímimos cuadrados, halle la ecuación del modelo empírico
que relaciona y con x.
Solución
Como ya se había calculado, el modelo viene dado por la siguiuente ecuación que relaciona y con x:
yi = 0.08565 + 1.11349xi
Donde 0.08565 representa el efecto sistemático de las variables que afectan a y, los cuales no fueron incopo-
rados en el modelo. En ese sentido, 1.11349 es el cambio que sufre la variable explicada y, ante un cambio
en una unidad en la variable explicartiva x.
3.4 Ejercicio 04
Tomando en cuenta la tabla 2 de un experimento que involucra dos variables x e y. Confeccione una gráfica
en papel milimetrado de las variables. ¿Qué tipo de función es?
Solución
En primer lugar debemos incorporar los datos de las variables que serán graficados.
data2 <- data.frame("x" = c(1, 2, 3, 4, 5), "y" = c(5, 20, 45, 80, 125))
Posterior a ello, es recomendable realizar el gráfico con los valores sin transformar. En ese sentido procedemos
a graficarlo en R.
library(ggplot2)
ggplot(data2, aes(x= x, y= y)) + geom_point() + ggtitle("Gráfica del modelo 2") +
xlab("Variable explicativa x") +
ylab("Variable explicada y") +
geom_smooth(se = FALSE)
7
Gráfica del modelo 2
125
100
Variable explicada y
75
50
25
0
1 2 3 4 5
Variable explicativa x
Como podemos observar en el gráfico el comportamiento de la gráfica nos sugiere que la relación no es lineal
y que no podemos realizar la estimación de los parámetros del modelo sin antes realizar una transformación
al modelo. En ese sentido, viendo el comportamiendo de la gráfica anterior, nos sugiere un modelo de
potencia, digamos de la siguiente forma:
yi = β̂0 xβ̂i 1
Ahora, tomando logaritmo tenemos:
library(ggplot2)
ggplot(data2, aes(x= log(x), y= log(y))) + geom_point() + ggtitle("Gráfica del modelo 2'") +
xlab("Log de la variable explicativa x") +
ylab("Log de la variable explicada y") +
geom_smooth(method = lm, se = FALSE)
8
Log de la variable explicada y Gráfica del modelo 2'
Donde claramente observamos una relación lineal entre las variables transformadas en logaritmos.
3.5 Ejercicio 05
Con los datos de la tabla 2 y usando el papel logarítmico hallar la ecuación del modelo empírico que relaciona
x e y.
Solución
De la tabla 2 podemos observar claramente que:
x y Desarrollo
1 5 y1 = 5x21 = 5(1)1 = 5
2 20 y2 = 5x21 = 5(2)2 = 20
3 45 y3 = 5x21 = 5(3)2 = 45
4 80 y4 = 5x21 = 5(4)2 = 80
5 125 y5 = 5x21 = 5(5)2 = 125
yi = 5x2i
9
3.6 Ejercicio 06
En la tabla 2, mediante el método de ajuste por mínimos cuadrados halle la ecuación del modelo empírico
que relaciona y con x.
Solución
• De forma manual
Tenemos los datos de la tabla 2 y completaremos los cálculos para calcular los coeficientes del modelo de
regresión simple. De ese modo, y realizando los cálculos, obtenemos el siguiente cuadro:
2 Pn
x y x0 = log(x) y 0 = log(y) yi0 x0i x0i ( i=1 x0i )2
1 5 0.0 1.6 0.0 0.0
2 20 0.7 3.0 2.1 0.5
3 45 1.1 3.8 4.2 1.2
4 80 1.4 4.4 6.1 1.9
P 5 125 1.6 4.8 7.8 2.6
15 275 4.8 17.6 20.1 6.2 22.9
Ahora, procedemos a reemplazar en las formulas derivadas anteriormente. En ese sentido, tenemos:
Pn Pn Pn
∗ yi0 x0i − n1 ( i=1 x0i )( i=1 yi0 ) 20.1 − 51 (4.8)(17.6)
β̂ 0 1 = i=1
= =2
6.2 − 51 (22.9)
Pn 02 n
i=1 xi − n ( i=1 xi )
1 0 2
P
Luego,
Pn
yi0 − β̂10 x0i 17.6 − 2(4.8)
P
β̂00∗ = i
= = 1.609
n 5
Finalmente, el modelo puede representarse como:
yi = 5x2i
• Utilizando software
##
## Call:
## lm(formula = log(y) ~ log(x), data = data2)
10
##
## Coefficients:
## (Intercept) log(x)
## 1.609 2.000
Como podemos observar, el coeficiente del intercepto es 1.609 y la pendiente del modelo es 2, por lo que el
modelo representado es el mismo que obtuvimos manualmente, es decir:
yi = 5x2i
Pues, yi0 = log(yi ), x0i = log(xi ) y log(5) = 1.609, tal como se obtuvo de foman manual.
3.7 Ejercicio 07
Tomando en cuenta la tabla 3, de un experimento que involucra dos variables x e y. Confeccionar una gráfica
en papel milimetrado. ¿Qué tipo de función es?
Solución
Tal como en los casos anteriores, en principio colocamos los datos de la tabla 3.
library(ggplot2)
ggplot(data3, aes(x = x, y = y)) + geom_point() + ggtitle("Gráfica del modelo 3") +
xlab("Variable explicativa x") +
ylab("Variable explicada y") +
geom_smooth(se = FALSE)
11
Gráfica del modelo 3
400
Variable explicada y
300
200
Como podemos observar, el gráfico parece sugerir una función exponecial. En ese sentido, la función
propuesta es la siguiente:
yi = β̂0 eβ̂1 xi
library(ggplot2)
ggplot(data3, aes(x = log(x), y = y)) + geom_point() + ggtitle("Gráfica del modelo 3'") +
xlab("Variable explicativa x") +
ylab("Logaritmo natural de la variable explicada y") +
geom_smooth(se = FALSE)
12
Logaritmo natural de la variable explicada y Gráfica del modelo 3'
400
300
200
3.8 Ejercicio 08
Con los datos de la tabla 3, halle la ecuación del modelo empírico que relaciona x e y utilizando el papel
semilogarítmico.
Solución
De la pregunta anterior, obtuvimos que la función que mejor representa el modelo original sin una transfor-
mación es una función exponecial como:
yi = β̂0 eβ̂1 xi
13
3.9 Ejercicio 09
Emplee el métodfo de ajuste por mínimos cuadrados de la tabla 3 para encontrar la ecuación del modelo
empírico que relaciona y con x.
Solución
• De forma manual
Tenemos los datos de la tabla 2 y completaremos los cálculos para calcular los coeficientes del modelo de
regresión simple. De ese modo, y realizando los cálculos, obtenemos el siguiente cuadro:
Pn
xi yi yi0 = ln(yi ) yi0 xi xi 2 ( i=1 xi )2
0 455 6.12 0.00 0
1 402 6.00 6.00 1
2 356 5.87 11.75 4
3 315 5.75 17.26 9
4 278 5.63 22.51 16
5 246 5.51 27.53 25
6 218 5.38 32.31 36
7 193 5.26 36.84 49
8 171 5.14 41.13 64
9 151 5.02 45.16 81
P 10 133 4.89 48.90 100
55 2,918 60.57 289.38 385 3,025
Ahora, procedemos a reemplazar en las formulas derivadas anteriormente. En ese sentido, tenemos:
Pn Pn Pn
∗ yi0 xi − n1 ( i=1 xi )( i=1 yi0 ) 289.38 − 11
1
(55)(60.57)
β̂ 0 1 = i=1
Pn n = = −0.123
i=1 xi − n ( i=1 xi ) 385 − 11 (3, 025)
1 1
2
P 2
Luego,
Pn
yi0 − β̂10 60.57 − (−0.123)(55)
P
xi
β̂00∗ = i
= = 6.120
n 11
Finalmente, el modelo puede representarse como:
yi = 455e−0.123xi
• Utilizando software
14
modelo3 <- lm(log(y) ~ x, data = data3)
print(modelo3)
##
## Call:
## lm(formula = log(y) ~ x, data = data3)
##
## Coefficients:
## (Intercept) x
## 6.1198 -0.1226
Como podemos observar, el coeficiente del intercepto es 6.1198 y la pendiente del modelo es −0.1226, por lo
que el modelo representado es similar al que obtuvimos manualmente, es decir:
yi = 455e−0.1226xi
Pues, yi0 = ln(yi ) y log(455) ' 6.1198, el cual es similar a lo calculado de forma manual.
4 Referencias
• Material de clase. Representación gráfica de resultados experimentales (relacionales no-lineales.
15