Академический Документы
Профессиональный Документы
Культура Документы
Clase 6: Solemne
Curso Unidad 2: Análisis de Varianza Clase 7: Validación de supuestos del análisis de varianza
Analiza la validez y
significancia de la regresión
lineal simple
¿Por qué es importante este tema?
𝑛 𝑛 𝑛
𝑦𝑖 − 𝑦ത 2 = 𝑦ො𝑖 − 𝑦ത 2 + 𝑦𝑖 − 𝑦ො𝑖 2
𝑆𝑇𝐶𝐶 = 𝑦𝑖 − 𝑦ത 2
𝑖=1
Análisis de Varianza para la regresión
𝑆𝐶𝑅 representa la suma cuadrado de la regresión y refleja la cantidad de
variación de 𝑦 que se explica con el modelo
𝑛
𝑆𝐶𝑅 = 𝑦ො𝑖 − 𝑦ത 2
𝑖=1
𝑆𝐶𝐸 representa la variación alrededor de la recta e regresión
𝑛
𝑆𝐶𝐸 = 𝑦𝑖 − 𝑦ො𝑖 2
𝑖=1
𝑆𝐶𝑅/1
𝑓=
𝑆𝐶𝐸/ 𝑛 − 2
Nivel de Nivel de
hidrocarburos Pureza hidrocarburos Pureza
0,99 90,01 1,19 93,54
1,02 89,05 1,15 92,52
1,15 91,43 0,98 90,56
1,29 93,74 1,01 89,54
1,46 96,73 1,11 89,85
1,36 94,45 1,2 90,39
0,87 87,59 1,26 93,25
1,23 91,77 1,32 93,41
1,55 99,42 1,43 94,98
1,4 93,65 0,95 87,33
Solución
Dado que de la información se puede obtener 𝑆𝐶𝑅 = 152,13 y 𝑆𝐶𝐸 = 21,25
Cumpliendo la identidad
𝑆𝑇𝐶𝐶 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸
𝑆𝑇𝐶𝐶 = 152,13 + 21,25
1 𝑥0 − 𝑥ҧ 2
𝑦ො0 −𝑡𝛼,𝑛−2 𝑠 2 1+ + ≤ 𝑦0
2 𝑛 𝑆𝑥𝑥
1 𝑥0 − 𝑥ҧ 2
≤ 𝑦ො0 +𝑡𝛼,𝑛−2 𝑠2 1+ +
2 𝑛 𝑆𝑥𝑥
Evaluando la adecuación del modelo
• Uno de los supuestos del modelo de regresión lineal es que los errores 𝜀𝑖
son 𝑁𝐼𝐷 0, 𝜎 2 .
• Las pruebas de hipótesis y estimación de los intervalos requieren que los
errores se distribuyan normal.
Análisis de los residuales
2
SCR SCE
𝑅 = =1−
STCC 𝑆𝑇𝐶
0 ≤ 𝑅2 ≤ 1
𝑛𝑝𝑢𝑟𝑜 = 𝑛𝑖 − 1 = 𝑛 − 𝑚
𝑖=1
𝑆𝐶𝐸𝐿𝑂𝐹
𝑚 − 2 𝐶𝑀𝐸𝐿𝑂𝐹
𝐹0 = =
𝑆𝐶𝐸𝑝𝑢𝑟𝑜 𝐶𝑀𝐸𝑝𝑢𝑟𝑜
𝑛−𝑚
Prueba de falta de ajuste
• La prueba de hipótesis de que el modelo se ajusta adecuadamente a los datos se
rechazaría si 𝑓0 > 𝑓𝛼,𝑚−2,𝑚−𝑛
Fuente de Suma de Grados de Cuadrado 𝑓
Variación cuadrados libertad medio
Regresión 𝑆𝐶𝑅 1 𝑆𝐶𝑅 𝑆𝐶𝑅
𝑠2
Error 𝑆𝐶𝐸 𝑛−2 𝑆𝐶𝐸
𝑠2 =
𝑛−2
Falta de 𝑆𝐶𝐸 − 𝑆𝐶𝐸𝑝𝑢𝑟𝑜 𝑚−2 𝑆𝐶𝐸𝐿𝑂𝐹 𝐶𝑀𝐸𝐿𝑂𝐹
ajuste 𝑚−2 𝐶𝑀𝐸𝑝𝑢𝑟𝑜
Error puro 𝑆𝐶𝐸𝑝𝑢𝑟𝑜 𝑛−𝑚 𝑆𝐶𝐸𝑝𝑢𝑟𝑜
𝑛−𝑚
Total 𝑆𝑇𝐶𝐶 𝑛−1
Prueba de Falta de ajuste
Prueba de falta de ajuste: Ejemplo
• Considérense los siguientes datos. Ajuste un modelo de regresión lineal
simple y haga una prueba de ajuste a un 𝛼 = 0,05
x y x y
1,0 2,3; 1,8 5,6 3,5; 2,8; 3,1
2,0 2,8 6,0 3,4; 3,2
3,3 1,8; 3,7 6,5 3,4
4,0 2,6; 2,6; 2,2 6,9 5,0
5,0 2,0
Solución
Considerando la Anova y descomponiendo la 𝑆𝐶𝐸
Fuente de Suma de Grados de Cuadrado 𝑓
Variación cuadrados libertad medio
Regresión 3,493 1 3,493 6,66
Total 10,83 15
Transformaciones lineales
Transformaciones lineales
Transformación: Ejemplo
Densidad, x Rigidez, y Densidad, x Rigidez, y
9,50 14814,00 8,40 17502,00
9,80 14007,00 11,00 19443,00
8,30 7573,00 9,90 14191,00
8,60 9714,00 6,40 8076,00
7,00 5304,00 8,20 10728,00
17,40 43243,00 15,00 25319,00
15,20 28028,00 16,40 41792,00
16,70 49499,00 15,40 25312,00
15,00 26222,00 14,50 22148,00
14,80 26751,00 13,60 18036,00
25,60 96305,00 23,40 104170,00
24,40 72594,00 23,30 49512,00
19,50 32207,00 21,20 48218,00
22,80 70453,00 21,70 47661,00
19,80 38138,00 21,30 53045,00
Salida R
lm(Rigidez..y ~ Densidad..x)
20000 40000
4
26 26
Standardized residuals
3
11 11
Residuals
2
1
0
0
-20000
-1
13
13
4
26
Standardized residuals 26 1
Standardized residuals
3
1.5
11 0.5
2
1.0 13 11
1
0
0.5
-1
27
Cook's distance
0.0
-2
0 20000 40000 60000 0.00 0.04 0.08 0.12
11.5
100000
11.0
80000
10.5
Rigidez..y
60000
Ln.y.
10.0
40000
9.5
20000 9.0
8.5
10 15 20 25 10 15 20 25
Densidad..x Densidad..x
Modelo transformado
lm(Ln.y. ~ Densidad..x)
2
16 8 8 16
Standardized residuals
0.2
1
Residuals
0
-0.2
-1
-2
-0.6
5
5
1.5
5
2
Standardized residuals
16
Standardized residuals
16 8
26
1
1.0
0
0.5
-1
-2
Cook's distance 5 0.5
0.0
9.0 9.5 10.0 10.5 11.0 11.5 0.00 0.04 0.08 0.12
Análisis de varianza,
Validación de los supuestos de la regresión,
Prueba de falta de ajuste y
Transformación de datos