Академический Документы
Профессиональный Документы
Культура Документы
en Ingeniería
4-Regresión lineal por
Mínimos Cuadrados
(Dr. Ricardo Quintero)
1
Introducción
3
Interpolación curvilínea
Regresión lineal
El ejemplo más simple es aproximar por
mínimos cuadrados buscando ajustar una
línea recta a un conjunto de observaciones
(x1,y1)…(xn,yn).
La expresión para la línea recta sería:
y=a0+a1x+e
Donde a0 y a1 son, respectivamente, la
ordenada al origen y la pendiente de la recta, e
el error entre el modelo y las observaciones.
4
Regresión lineal
Despejando, el error estaría dado por:
e = y - a 0 - a 1x
5
Criterio para un “mejor” ajuste
6
Obteniendo los coeficientes de la recta
Ecuaciones normales
7
Obteniendo los coeficientes de la
recta
La solución del sistema de ecuaciones
normales es el siguiente:
n xi yi xi yi
a1
n xi ( xi ) 2
2
a0 y a1 x
8
Ej-Regresion lineal
Ajuste a una línea recta los valores x e y de la tabla:
xi yi (yi-ym)2 (yi-a0-a1xi)2
1 0.5 8.5765 0.1687
2 2.5 0.8622 0.5625
3 2.0 2.0408 0.3473
4 4.0 0.3265 0.3265
5 3.5 0.0051 0.5896
6 6.0 6.6122 0.7972
7 5.5 4.2908 0.1993
S 24.0 22.7143 Sr=2.9911
11
Cuantificación del error
Es posible demostrar que si se cumplen:
1. Que la dispersión de los puntos alrededor de la
línea es de magnitud similar en todo el rango de
datos y
2. Que la distribución de estos puntos cerca de la
línea es normal
Entonces la regresión por mínimos cuadrados
proporcionará la mejor estimación para a0 y a1.
Esto se conoce como el principio de máxima
verosimilitud.
12
Cuantificación del error
14
Bondad de ajuste
15
Coeficiente de determinación y
correlación
Determina la mejora o reducción del error por describir
los datos en términos de línea recta en vez de un valor
promedio:
St S r
r
2
Coeficiente de determinación
St
r2 Coeficiente de correlación
St es la sumatoria de los cuadrados de los errores
respecto la media ym =S(yi-ym)2
Sr es la sumatoria de los cuadrados de los errores con la
regresión lineal = S(yi-a0-a1xi)2.
16
Coeficiente de determinación y
correlación
En un ajuste perfecto, Sr=0 y r=r2=1. “La línea explica al
100% la variabilidad de los datos”.
Si r=r2=0, Sr=St, el ajuste no representa alguna mejora.
Una representación alternativa para implementar en
computadora es:
n xi yi ( xi )( yi )
r
n xi2 ( xi ) 2 n yi2 ( yi ) 2
17
Ej.- Estimación de errores en ajuste
lineal por mínimos cuadrados
Calcule la desviación estándar, el error
estándar estimado y el coeficiente de
correlación para los datos del ejemplo
anterior:
Desviación estándar (Sy):
22.7143
Sy 1.9457
7 1
18
Ej.- Estimación de errores en ajuste
lineal por mínimos cuadrados
Error estándar del estimado (Sy/x):
2.9911
Sy/x 0.7735
72
19
Algoritmo para regresión lineal 1/2
SUB Regress(x,y,n,a1,a0,syx, r2)
sumx=0:sumy=0:st=0
sumy=0:sumx2=0:sr=0
DOFOR i=1,n
sumx=sumx+xi
sumy=sumy+yi
sumxy=sumxy+xi*yi
sumx2=sumx2+xi*xi
END DO
xm=sumx/n
ym=sumy/n
a1=(n*sumxy-sumx*sumy)/(n*sumx2-sumx*sumx)
a0=ym-a1*xm
20
Algoritmo para regresión lineal 2/2
DOFOR i=1,n
st=st+(yi-ym)2
sr=sr+(yi-a1*xi-a0)2
END DO
syx=(sr/(n-2))0.5
r2=(st-sr)/st
END Regress
21
Regresión polinomial
i 1
23
Extendiendo el procedimiento de
mínimos cuadrados a polinomios
Después de calcular las derivadas parciales de Sr
respecto a ai y reordenando los términos se obtienen las
ecuaciones normales:
Sr
Sy/ x
n (m 1)
Se han perdido m+1 grados de libertad.
Además se calcula un coeficiente de determinación y
de correlación para la regresión polinomial con la
ecuación:
St S r
r
2
St
r2
26
Ejercicio
Ajustar un polinomio de segundo grado los datos de las
dos primeras columnas de la tabla:
xi yi (yi-ymedia)2 (yi-a0-a1xi-a2xi2)
0 2.1 544.44 0.14332
1 7.7 314.47 1.00286
2 13.6 140.03 1.08158
3 27.2 3.12 0.80491
4 40.9 239.22 0.61951
5 61.1 1272.11 0.09439
S 152.6 2513.39 3.74657
27
Solución
A partir de los datos:
ymedia=25.433 Sxi3=225
28
Solución
29
Solución
Y de correlación: r=0.99925
30
Algoritmo para la regresión
polinomial
1. Introduzca el grado del polinomio sujeto a ajuste, m
2. Introduzca el número de datos, n
3. Si n<m+1, imprima un mensaje de error “la regresión
no es posible” y termine; en caso contrario continue.
4. Calcule los elementos de la ecuación normal en la
forma de una matriz aumentada.
5. Usando la matriz aumentada determine los coeficientes
a0, a1,…,am, por medio de un método de eliminación
6. Imprima los coeficientes.
31
Tarea
Será individual.
Elabore un Jupyter Notebook que resuelva
el problema 17.3. Incluya la graficación
de valores y el modelo de regresión
obtenido.
Entregue un document Word con el
Jupyter Notebook y la liga donde lo
publicó en Internet.
32