Вы находитесь на странице: 1из 9

MÉTODO DE MÍNIMOS CUADRADOS

Camilo Andrés Zorro Mendoza


cazorrom@unal.edu.co
Facultad de ingeniería
Departamento de mecánica y mecatrónica
Universidad Nacional de Colombia

Resumen-

A partir de la toma de datos experimentales se busca hacer un ajuste de la


distribución que se describe. En el presente informe se pretende mostrar el
uso de un de los muchos métodos presentes para encontrar la función que
describa de forma adecuada un distribución dada haciendo uso de muchos
de las herramientas aportadas por el cálculo.

1. Introducción

A medida que la ciencia ha avanzado se puede dar cuenta que, a manera general,
siempre un factor variable dependerá de otra condición que varía de forma
independiente, mostrando un relación gráfica entre estas variables que puede ser
representada a partir de una función lineal, exponencial, parabólica, logarítmica o
de otro tipo, pero estos tipos de relaciones no son cien por ciento ideales debido a
que la toma de datos experimentales muestra una distribución de datos que puede
no corresponder a algún tipo de función, sino que muestre una tendencia a
describir dicha función, en estos casos se procede a encontrar una función que
sirva como ajuste a la descripción de los datos tomados, para esto se pueden
encontrar varios métodos, dentro de los cuales está la regresión lineal o ajuste
lineal a partir del ingenioso método de los mínimos cuadrados, principalmente
usado para distribuciones de tipo lineal.

El surgimiento de este método se remonta al siglo XIX, tiempo en el cual se había


descubierto el cuerpo celeste Ceres por el astrónomo italiano G. Piazzi en el año
de 1801. En este mismo año un astrónomo alemán, conocido por Carl F. Gauss,
llamado Xavier Von Zach, publica las posiciones orbitales de dicho cuerpo, pero
luego de 40 días se perdió su rastro, alcanzando a observar 9 grados de su órbita.
Luego de esto, el astrónomo alemán hace una serie de predicciones dentro de las
cuales se encuentra una formulada mediante el método de mínimos cuadrados
propuesto por Gauss, siendo este cálculo suficientemente preciso para
reencontrar el cuerpo celeste.

Ahora bien, el objetivo de este informe es el de mostrar cómo se aplica este


ingenioso método a una distribución lineal y los pasos a seguir, de esta manera,
en futuras prácticas de laboratorio será más fácil hallar la relación entre dos
variables de forma matemática. Para esto explicaremos como se define este
método y la forma en que se construyen las ecuaciones a utilizar.

Este método consiste en ver el comportamiento de la desviación de todos los


puntos con respecto a la recta a la cual van a ser ajustados y transforma la
desviación de todos los puntos de la desviación lo más pequeño posible, es decir,
hallar un recta que este lo más cerca posible a dichos puntos, para esto debemos
tener en cuenta el principio de mínimos cuadrados el cual dice lo siguiente “la
desviación vertical del punto (𝑥𝑖 , 𝑦𝑖 ) de la recta 𝑦 = 𝑏0 + 𝑏1 ∗ 𝑥” [1] siendo 𝑏0 el
punto de corte con el eje 𝑦, 𝑏1 la pendiente que tendrá dicha recta y (𝑥𝑖 , 𝑦𝑖 ) unos
puntos cualesquiera que pertenecen a la distribución. Expresada la anterior cita en
leguaje matemático, haría referencia a lo siguiente:

𝑎𝑙𝑡𝑢𝑟𝑎 𝑑𝑒𝑙 𝑝𝑢𝑛𝑡𝑜 − 𝑎𝑙𝑡𝑢𝑟𝑎 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 = 𝑦𝑖 − (𝑏0 + 𝑏1 ∗ 𝑥𝑖 ) (1)

A partir de esto, la sumatoria de todas las desviaciones verticales al cuadrado, de


los puntos a la recta es
𝑛

𝑓(𝑏0 , 𝑏1 ) = ∑(𝑦𝑖 − 𝑏0 − 𝑏1 ∗ 𝑥𝑖 )2 (2)


𝑖=1

Posterior a esto se hallan las estimaciones de mínimos cuadrados (𝛽̂0 , 𝛽̂1 ) que
minimizan los valores de la función anteriormente dada, es decir, 𝑓(𝛽̂0 , 𝛽̂1 ) ≤
𝑓(𝑏0 , 𝑏1 ) y quedándonos la recta de mínimo cuadrados de la siguiente forma

𝑦 = 𝛽̂0 + 𝛽̂1 ∗ 𝑥 (3)

Para el cálculo de estas estimaciones, se deriva parciamente 𝑓(𝑏0 , 𝑏1 ) con


respecto a 𝑏0 𝑦 𝑏1 , posteriormente se igualan a cero y de esta forma se pueden
hallar las llamadas ecuaciones normales que permiten hacer mínima la desviación
entre los puntos y la recta de mínimos cuadrados. Este proceso se muestra a
continuación.
𝑛
𝜕𝑓(𝑏0 , 𝑏1 )
= ∑ −2 (𝑦𝑖 − 𝑏0 − 𝑏1 ∗ 𝑥𝑖 ) = 0 (4)
𝜕𝑏1
𝑖=1

𝑛
𝜕𝑓(𝑏0 , 𝑏1 )
= ∑ −2 ∗ 𝑥𝑖 (𝑦𝑖 − 𝑏0 − 𝑏1 ∗ 𝑥𝑖 ) = 0 (5)
𝜕𝑏0
𝑖=1
Luego de esto, se aplican algunas propiedades de las sumatoria y se cancela el
factor −2 quedando las ecuaciones normales. [2]

𝑛 𝑛

∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 ∑ 𝑥𝑖 (6)
𝑖=1 𝑖=1

𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 = 𝑏0 ∑ 𝑥𝑖 + 𝑏1 ∑ 𝑥 2 𝑖 (7)
𝑖=1 𝑖=1 𝑖=1

Observando la ecuación 6 se puede ver que ∑𝑛𝑖=1 𝑥𝑖 = 𝑛𝑥̅ y ∑𝑛𝑖=1 𝑦𝑖 = 𝑛𝑦̅, posterior
a esto, se divide entre n, quedando de la siguiente forma.

𝑦̅ − 𝑥̅ 𝑏1 = 𝑏0 (8)

Posteriormente hacemos uso de la segunda ecuación normal para hallar la


ecuación que permite calcular 𝑏1 . Primero debemos reemplazar la ecuación 8 en
la número 7, luego se reemplaza ∑𝑛𝑖=1 𝑥𝑖 por 𝑛𝑥̅ y por último despejamos 𝑏1 ,
formándose la siguiente igualdad.

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
𝑏1 = 𝑛 2 (9)
∑𝑖=1 𝑥 𝑖 − 𝑛𝑥̅ 2

Luego de estos, se puede deducir que ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅ y
que ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = ∑𝑛𝑖=1 𝑥 2 𝑖 − 𝑛𝑥̅ 2 , quedando finalmente la ecuación que
permitirá calcular la pendiente de la recta.

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝑏1 = (10)
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2

Finalmente los valores de 𝛽̂0 𝑦 𝛽̂1 son 𝑏0 𝑦 𝑏1 respectivamente quedando las


ecuaciones como: [3].

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝛽̂1 = (11) 𝑦 𝑦̅ − 𝑥̅ 𝛽̂1 = 𝛽̂0 (12)
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2

Por último, se debe calcular los errores que estos dos valores tiene y la
confiabilidad que puede tener este resultado. Estos serían los errores de
propagación de estos valores y el coeficiente de correlación lineal que están dadas
por las siguientes ecuaciones.
𝑛 𝑓(𝛽̂0 , 𝛽̂1 )
𝜎 2𝛽̂1 = ( ) ( ) (13)
𝑛 ∑𝑛𝑖=1 𝑥 2 𝑖 𝑛
− (∑𝑖=1 𝑥𝑖 )2 𝑛−2

(∑𝑛𝑖=1 𝑥𝑖 )2 𝑓(𝛽̂0 , 𝛽̂1 )


𝜎 2𝛽̂0 = ( 𝑛 2 ) ( ) (14)
𝑛 ∑𝑖=1 𝑥 𝑖 − (∑𝑛𝑖=1 𝑥𝑖 )2 𝑛−2

𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − (∑𝑛𝑖=1 𝑥𝑖 ∗ ∑𝑛𝑖=1 𝑦𝑖 )


𝑟= (15)
√𝑛 ∑𝑛𝑖=1 𝑥 2 𝑖 − (∑𝑛𝑖=1 𝑥𝑖 )2 ∗ √𝑛 ∑𝑛𝑖=1 𝑦 2 𝑖 − (∑𝑛𝑖=1 𝑦𝑖 )2
( )

Teniendo esto en cuenta, en el presente informe procederemos a mostrar un


ejemplo donde se haga uso de este método con las ecuaciones anteriormente
planteada.

2. Datos y resultados

Para la demostración de cómo se aplica dicho método se hará uso de un una tabla
de datos en la cual se describe como un gas, a diferentes temperaturas, aumenta
su volumen de forma lineal.

1- Datos experimentales y gráfica de la distribución

Para saber si los datos experimentales tomados son apropiados para aplicar el
método, se debe hacer su gráfica y observar si este posee una distribución
lineal. Como vemos a continuación, los datos de la tabla No 1 y su
correspondiente gráfica cumplen con lo requerido.
Tabla No 1. Datos experimentales tomados. [4]

i T(°C) V(104cm3)
1 62,3 2,7073
2 68,6 2,8492
3 81,4 2,93
4 87,4 2,92
5 98,6 3,0849
6 104,5 3,15
7 116,9 3,21
8 121,2 3,2
9 135 3,35
Grafico No 1. Distribución de los datos encontrados en la tabla No 1.

T versus V
3.4

3.3

3.2

3.1
V(*104 cm3)

3
(T,V)
2.9

2.8

2.7

2.6
60 70 80 90 100 110 120 130 140
T(°C)

2- Planteamiento de la recta de mínimo cuadrados.

Como el ajuste que vamos a hacer es una recta, entonces el planteamiento de


la ecuación de los mínimos cuadrados se debe ajustar a estas características,
quedando la siguiente ecuación:

𝑉 = 𝛽̂0 + 𝛽̂1 ∗ 𝑇

3- Calculo de ∑𝑛𝑖=1 𝑇𝑖 ; ∑𝑛𝑖=1 𝑇𝑖 𝑉𝑖 ; ∑𝑛𝑖=1 𝑉𝑖 ; ∑𝑛𝑖=1 𝑇 2 𝑖 ; ∑𝑛𝑖=1 𝑉 2 𝑖 ; 𝑉̅ y 𝑇̅

Antes de hallar las sumatorias debemos calcular, a partir de cada par de


puntos, la multiplicación de la temperatura y el volumen y sus respectivos
cuadrados.
Tabla No 2. Tabla de datos y cálculos
i T(°C) V(104cm3) T2(°C2) T*V (104cm3*°C) (V-b1*T-b0) 2 V 2(104cm3) 2
1 62,3 2,71 3881,29 168,83 7,3441 7,3441
2 68,6 2,85 4705,96 195,51 8,1225 8,1225
3 81,4 2,93 6625,96 238,5 8,5849 8,5849
4 87,4 2,92 7638,76 255,21 8,5264 8,5264
5 98,6 3,08 9721,96 303,69 9,4864 9,4864
6 104,5 3,15 10920,25 329,18 9,9225 9,9225
7 116,9 3,21 13665,61 375,25 10,3041 10,3041
8 121,2 3,2 14689,44 387,84 10,24 10,24
9 135 3,35 18225 452,25 11,2225 11,2225

Posterior a esto efectuamos las respectivas sumatorias y el promedio del


volumen y temperatura para poder calcular los parámetros de ajuste
(pendiente y punto de corte) de la recta de mínimos cuadrados.

Tabla No 3. Sumatorias de ∑𝑛 𝑛
𝑖=1 𝑇𝑖 ; ∑𝑖=1 𝑇𝑖 𝑉𝑖 ; ∑𝑛𝑖=1 𝑉𝑖 ; ∑𝑛𝑖=1 𝑇 2 𝑖 y ∑𝑛𝑖=1 𝑉 2 𝑖
(°C) (104cm3) (104cm3)2 (°C2) ( 104 °C *cm3)
875,9 27,4 83,7534 90074,23 2706,26

Tabla No 4. Promedio de volumen y temperatura.


(°C) (104cm3)
97,32 3,04

4- Calculo de los parámetros de ajuste (𝛽̂0 , 𝛽̂1 ), la sumatoria de todas las


desviaciones verticales al cuadrado y sus respectivos errores

Para hallar los parámetros de ajuste haremos uso de las ecuaciones número 11
y 12

∑𝑛𝑖=1(𝑇𝑖 − 𝑇̅)(𝑉𝑖 − 𝑉̅ ) 39,62 ∗ 104 °𝐶 ∗ 𝑐𝑚3 0,0082 ∗ 104 𝑐𝑚3


𝛽̂1 = = =
∑𝑛𝑖=1(𝑇𝑖 − 𝑇̅)2 4829,69 °𝐶 2 °𝐶

0,0082 ∗ 104 𝑐𝑚3


𝛽̂0 = 𝑉̅ − 𝑇̅𝛽̂1 = 3,04 ∗ 104 𝑐𝑚3 − 97,32 °𝐶 ∗ = 2,24 ∗ 104 𝑐𝑚3
°𝐶
Antes de calcular los errores de estos parámetros debemos calcular la sumatoria
de todas las desviaciones verticales al cuadrado a partir de la ecuación No 2.
Tabla No 5. Desviaciones verticales.

i ((*104cm3) 2)
1 0,00221
2 0,0017
3 0,00026
4 0,00185
5 0,00063
6 0,00218
7 0,00002
8 0,00163
9 0,00001
𝑛
2
𝑓(𝛽̂0 , 𝛽̂1 ) = ∑(𝑉𝑖 − 𝛽̂0 − 𝛽̂1 ∗ 𝑇𝑖 ) = 0,01049 ∗ (104 𝑐𝑚3 )2
𝑖=1

Posterior a esto, se halla el error de propagación que tiene cada uno de estos
parámetros y estos se calculan mediante las ecuaciones 13 y 14 que fueron
mencionadas con anterioridad.

𝑛 𝑓(𝛽̂0 , 𝛽̂1 )
𝜎𝛽̂1 = √( ) ( )
𝑛 ∑𝑛𝑖=1 𝑇 2 𝑖 − (∑𝑛𝑖=1 𝑇𝑖 )2 𝑛−2

9 0,01049 ∗ (104 𝑐𝑚3 )2


=√ ∗
((9 ∗ 90074,23℃2 ) − ((875,9)2 ℃2 )) 7
0,0005 ∗ 104 𝑐𝑚3
=

(∑𝑛𝑖=1 𝑇𝑖 )2 𝑓(𝛽̂0 , 𝛽̂1 )


𝜎𝛽̂0 = √( 𝑛 𝑛 ) ( )
𝑛 ∑𝑖=1 𝑇 2 𝑖 − (∑𝑖=1 𝑇𝑖 )2 𝑛−2

(875,9)2 ℃2 0,01049 ∗ (104 𝑐𝑚3 )2


= √ ∗
((9 ∗ 90074,23℃2 ) − ((875,9)2 ℃2 )) 7
= 1,6 ∗ 104 𝑐𝑚3

5- Calculo del coeficiente de correlación

Con este coeficiente podemos calcular cuanta precisión tuvieron estos cálculos
y esto a partir de la ecuación No 15, dándonos como resultado lo siguiente
𝑛 ∑𝑛𝑖=1 𝑇𝑖 𝑉𝑖 − (∑𝑛𝑖=1 𝑇𝑖 ∗ ∑𝑛𝑖=1 𝑉𝑖 )
𝑟= ( )
√𝑛 ∑𝑛𝑖=1 𝑇 2 𝑖 − (∑𝑛𝑖=1 𝑇𝑖 )2 ∗ √𝑛 ∑𝑛𝑖=1 𝑉 2 𝑖 − (∑𝑛𝑖=1 𝑉𝑖 )2
(9 ∗ 2706,26 ∗ 104 ∗ ℃ 𝑐𝑚3 ) − [(875,9 ℃) ∗ (27,4 ∗ 104 𝑐𝑚3 )]
=
√[9 ∗ 90074,23 ℃2 ] − [(875,9)2 ∗ ℃2 ] ∗ √[9 ∗ 83,7534 ∗ (104 ∗ 𝑐𝑚3 )2 ] − [(27,4 ∗ 104 )2 ∗ (𝑐𝑚3 )2 ]
= 0,98

6- Ecuación de la recta de mínimos cuadrados

Con los cálculos anteriormente hechos se puede mostrar que la recta que se
ajusta a esta distribución lineal es la siguiente.

104 𝑐𝑚3
𝑉 = (2,24 ± 1,60) ∗ 104 𝑐𝑚3 + (0,0082 ± 0,0005) ∗ ( )∗𝑇
°𝐶

7- Grafica de mínimos cuadrados y distribución de los datos experimentales

T versus V
3.4

3.3

3.2

3.1
V(*104 cm3)

(T,V)
3

2.9
V = (2,24*10^4
2.8 cm^3)+(0,0082*10^4
(cm^3/°C))*T
2.7

2.6
60 80 100 120 140
T(°C)

Gráfico No 2. Distribución lineal y recta de mínimos cuadrados

Como vemos, la ecuación hallada describe la recta más apropiada para ser
el ajuste de la distribución lineal.
3. Conclusiones

A partir de todo el trabajo redactado en este informe se pudo observar la


manera en que un distribución de tipo lineal se puede ajustar a una recta
que recibe el nombre de recta de mínimos cuadrados, la cual posee un
pendiente y un punto de corte que son calculado mediante la diferencia
vertical encontrada entre un punto (x,y) cualquiera, perteneciente a la
distribución lineal, y la recta de mínimos cuadrados; con la ayuda de la
sumatoria y las derivadas de las funciones.

Por otro lado se observa que los cálculos no serán cien por ciento
confiables, por lo tanto se busca el error asociado al punto y a la pendiente
además de hacer uso del coeficiente de correlación lineal que brinda
información sobre la confiabilidad de los resultados.

4. Referencias

[1] Jay L. Devore. Probabilidad y estadística para ingeniería y ciencias,


México, Thomson editores, 2005, P. 506.

[2] Jay L. Devore. Probabilidad y estadística para ingeniería y ciencias,


México, Thomson editores, 2005, P. 506-509.

[3] Departamento de agricultura y recursos económico (Kyle J. Emerick).


Derivation of OLS Estimator , Publicación en línea,
http://are.berkeley.edu/courses/EEP118/current/derive_ols.pdf, citado
el 11 de marzo de 2013.

[4] Fernando Cristancho. Fundamentos de física experimental y mecánica,


Bogotá, 2008, P.12.