Вы находитесь на странице: 1из 8

Mtodo cuadrados mnimos

Algunas veces cuando obtenemos una serie de mediciones y la representamos grficamente, podemos observar que los puntos siguen una determinada tendencia, como puede ser que esten alineados,
formando una parabola o cualquier otro tipo de curva. Esto hace sospechar que entre esas mediciones
existe una relacin o ley. Otras veces, sabemos de antemano, o a lo mejor queremos corroborar, que
las mediciones cumplen con una determinada relacin. Por ejemplo, si medimos la posicin x para
diferentes instantes de tiempo t de un mvil moviendose a velocidad constante y representamos esas
mediciones en un grfico de x vs t, espararamos ver que los puntos estn alineados formando una
recta. La pendiente de esta recta ser la velocidad con la que el mvil se desplaza, y la ordenada al
orign la posicin inicial de donde parti. Se ve entonces la utilidad de conocer la ecuacin de la recta,
ya que nos permite obtener informacin sobre el experimento o problema que estamos estudiando.
El problema es que dado que los datos provienen de mediciones que estn sujetas a incertezas su
alineacin no ser perfecta, y entonces no exite una recta que pase por todos los puntos medidos.
En realidad, existen infinidad de rectas que pasan cerca de cada punto. Nos preguntamos, Cmo
hacemos para conocer la ecuacin de la ley que relaciona nuestras variables? Bueno, no podemos
saber cul es exactamente, pero podemos estimarla y para eso necesitamos un criterio. Vamos a buscar aquella recta que minimice las distancia entre todos los puntos, o dicho de otra manera, aquella
que pase ms cerca de todos los puntos. El mtodo de cuadrados mnimos nos permite encontrar esa
recta. De hecho, el mtodo de cuadrados mnimos nos permite hallar cualquier otra curva adems
de la recta, que pasa ms prximamente a los datos que tenemos.
Si formalizamos el problema, podemos decir que tenemos una serie de datos (xi , yi ), con i = 1, , N ,
que estn relacionados a travs de una funcin y = f (x), la cual no conocemos. La funcin f va a
ser aquella que pase ms cercanamente a todos los puntos (xi , yi ), es decir, aquella que minimice
la distancia entre la curva terica y = f (x) y la serie de datos (xi , yi ). Llamamos 2 a la suma del
cuadrado de la distancia entre los datos y la curva terica,
2 = (y1 f (x1 ))2 + (y2 f (x2 ))2 + . . . + (yN f (xN ))2
=

N
X

(1)

(yi f (xi ))2 .

i=1
2

La funcin nos da informacin de que tan distantes estn los puntos (xi , yi ) de la curva y = f (x),
as vemos que mientras ms pequeo sea su valor, ms cerca pasarn los puntos de f , lo que podemos
apreciar en la FIG. 1. La mejor curva y = f (x) ser la que tenga el valor ms pequeo de 2 . Es por
esto que el mtodo de cuadrados mnimos consiste en minimizar la funcin 2 .

Figura 1: La funcin 2 mide la distancia de los puntos a la curva. Mientras ms pequeo sea su valor mejor ser la
curva hallada.

Muchas veces tambin se suele llamar ajuste, fiteo o regresin a esta tarea de encontrar la funcin
y = f (x) que mejor relacione una serie de datos.
NOTA. El mtodo de cuadrados mnimos, no mide la distancia entre los puntos y la
funcin de la manera convencional, donde la distancia est definida como aquella entre
el punto y el punto ms cercano de la curva. En cambio, mide la distancia en lnea
vertical entre los puntos y la funcin f , d2i = (yi f (xi ))2 , ver FIG. 2. sta forma de
medir distancia nos dice que implicitamente estamos asumiendo que si los puntos no
estn contenidos en la curva de la funcin, es porque su valor yi est mal determinado,
mientras que xi est bien determinado. Es decir, el error o la incerteza de los puntos slo
proviene de la variable del eje y, y por lo tanto la variable del eje x no pose incerteza.
En los experimentos sto no es lo que sucede, dado que todas las mediciones tienen
incertezas, tanto las de la variable del eje y como las de la variable del eje x. Para ser lo
ms consistente posible con el mtodo, debemos elegir la variable con menor error
para el eje x. OJO!: Cmo comparamos errores de dos magnitudes distintas?

Figura 2: La distancia entre los puntos y la funcin f en el mtodo de cuadrados mnimos se mide solamente sobre el
eje vertical.

Caso de una recta


Para el caso de que la relacin entre las variables sea lineal, la funcin f debe ser una recta
f (x) = ax + b. Si reemplazamos en la ecuacin (1) nos queda,
2

N
X

(yi axi b)2

(2)

i=1

Debemos encontrar el valor mnimo para 2 . Recordando lo que sabemos de clculo en una
variable, para encontrar el valor mnimo de una funcin, debemos derivarla y luego igualarla a cero.
Derivarla respecto de quin? Bueno, respecto de las variables que queremos determinar. En nuestro
caso, queremos conocer la pendiente, a, y la ordenada al origen, b. Ellas sern nuestras variables.
Entonces tenemos que derivar la ecuacin (2) respecto de a y de b. Pero, Cmo se deriva una funcin
que depende de ms de una variable? No es dficil, pero se necesita el concepto de derivadas parciales
que todava no hemos visto. Por ello, no vamos a seguir con el desarrollo de la cuenta, sino que
vamos a pasar al resultado, pero dejando en claro que el procedimiento a seguir consiste en derivar
la funcin 2 respecto de a y b y luego igualando a cero. Si estas interesado en el desarrollo de la

cuenta, podes preguntarle al profe como se hace.

(yi axi b)2 = 0

i=1

(3)

(yi axi b)2 = 0


b
i=1

Para simplificar las expresiones definimos las siguientes constantes, que a su vez son de gran
ayuda cuando debemos hacer las cuentas.
1 =

N
X
i=1

xi ,

2 =

N
X
i=1

x2i ,

3 =

N
X

yi ,

4 =

i=1

N
X

yi2 ,

5 =

i=1

N
X

xi y i .

(4)

i=1

Entonces, finalmente llegamos a las expresiones de la pendiente de la recta y su ordenada al


origen.
P
PN
PN
N N
N 5 1 3
i=1 xi yi
i=1 xi
i=1 yi
a=
,
=


2
PN 2
PN
N 2 12
N i=1 xi
i=1 xi
PN
PN
PN 2 PN
(5)
xi yi
x
y

x
2 3 5 1
i
i
i
i=1
b = i=1 P i=1
=
.
i=1
P
2
N 2 12
N
2
N N
i=1 xi
i=1 xi
Como se mencion anteriormente, la recta que hallamos es una estimacin de la relacin que exite
entre las variables x e y, y, como en toda estimacin, debemos determinar que tan buena es. Para
eso debemos obtener los errores de la pendiente, a, y la ordenada al origen, b.
s
r
2
N 2
2
2
,
b
=
a
a =
,

=
.
(6)
N 2 12
N
N 2

Otro valor importante que podemos calcular con el mtodo de cuadrados mnimos, es el coeficiente
de correlacin R.
N 5 1 3
.
(7)
R= p
(N 2 12 )(N 4 32 )
Este nmero nos indica el grado de correlacin que hay entre las variables x e y. Es decir, nos dice
que tan linealmente estn relacionadas x e y. R puede tomar valores entre 1 r 1.
Si R . 1 decimos que x e y estn correlacionadas positivamente.
Si R 0 decimos que x e y no estn correlacionadas.
Si R & 1 decimos que x e y estn correlacionadas negativamente.
El coeficiente de correlacin R, lo usamos para ver que tan buena es nuestra estimacin. Si las
variables siguen una relacin lineal, entonces el coeficiente de correlacin ser |R| 1. Cuando
|R| 0 entonces las variables no siguen una relacin lineal y nuestra estimacin no fue buena.

Ejemplo
Como ejemplo, veamos nuevamente el problema del resorte y la determinacin de su constante
elstica, que se resolvi en la seccin de medias ponderadas del apunte de errores. Recordemos que
tenamos un resorte de constante elstica k desconocida, al que se le sujetaban pequeas pesas de
~ ser
50g y se meda el estiramiento. La ley de Hooke establece que el estiramiento del resorte, x,
~
proporcional a la fuerza al que se encuentra sometido el resorte, F , y que la constante de proporciona~ o directamente
lidad es la constante elstica, k. Matemticamente la expresamos como, |F~ | = k|x|,
F = kx. Dado que existe una relacin lineal entre ambas variables, usamos cuadrados mnimos
para determinar k. Hay que elegir que variable asignar a cada eje. La eleccin ms natural es tomar
a la fuerza como eje y y el desplazamiento como eje x, de manera que la pendiente de la recta que
forman es k, pero no es la correcta. Lo correcto es asignar los ejes teniendo en cuenta que en el eje x
debe ir la variable con menor error relativo. En este ejemplo, a fuerza F tiene menor error relativo
que el desplazamiento x, dado que podemos medir la masa de cada pesa con una balanza que tiene
una apreciacin de ap = 0,01g. Entonces debemos asignar la fuerza al eje x y el desplazamiento al
eje y. Finalmente usamos cuadrados mnimos para estimar la recta x = k1 F , donde la pendiente es k1 .
Para ayudarnos a calcular la pendiente y la ordenada al origen de la recta, usamos los valores
medidos de F y x y los reemplazamos en las ecuaciones (4) para calcular 1 , 2 , 3 , 4 y 5 , cmo
se puede ver en la Tabla 1.
x2i [N 2 ]
yi2 [m2 ]
xi yi [N m]
xi = F [N ] yi = x[m]
0, 49
0, 016
0, 2401
0, 000256
0, 00784
0, 98
0, 029
0, 9604
0, 000841
0, 02842
1, 47
0, 044
2, 1609
0, 001936
0, 06468
0, 060
3, 8416
0, 003600
0, 11760
1, 96
1 = 4, 90 3 = 0, 1490 2 = 7, 2030 4 = 0, 006633 5 = 0, 21854
Tabla 1: Con los datos medidos calculamos los distintos que nos ayudarn para encontrar la ecuacin de la recta.

Reemplazamos los valores obtenidos en la ecuacin (5) para obtener la pendiente y la ordenada
al origen, y tambin en la ecuaciones (6) y (7) para hallar sus respectivos errores y el coeficiente de
correlacin, que se muestran en la Tabla 2.
a
b
2
a
b
r

0, 03 m/N
5, 00 104 m
1, 15 106 m2
9, 79 104 m/N
1, 31 103 m
0, 9989

Tabla 2: Los valores de la pendiente y ordenada al origen con sus respectivos errores que encontramos usando el
mtodo de cuadrados mnimos.

De los resultados obtenidos vemos que el coeficiente de correlacin es muy cercano a 1 indicando
que la relacin lineal entre las variables es muy fuerte, lo cual es lo esperado por lo que sabemos
de la ley de Hooke. Es decir, corrobaramos que existe una relacin lineal entre la fuerza F a la que
se somete el resorte y el desplazamiento x que realiza, sin necesidad de grficarla. El valor de la
pendiente es k1 = (0, 030 0, 001)m/N y la ordenada al origen b = (0, 001 0, 001)m. En la FIG 3
podemos ver la recta junto con los datos medidos. Del valor de la ordenada vemos que el punto
4

(0; 0) est contenido en el intervalo, lo que nos dice que la recta pasa por el origen, confirmando lo
esperado por la ley de Hooke. La constante elstica la calculamos de la pendiente, k = a1 , y usando
propagacin de errores determinamos su error.
1
1
= 33, 3333
k= =
a
0, 03m/N

N
,
m

a
9, 79 104 m/N
k = 2 =
= 1, 09
a
(0, 03 m/N )2

N
,
m

Finalmente llegamos al valor de la constante elstica por el mtodo de cuadrados mnimos, k =


(33 1) N
. Si lo comparamos con el valor hallado por medias ponderadas, que se clculo en el apunte
m
), vemos que son consistentes, es decir, sus intervalos se superponen.
de errores (k = (32, 8 0, 4) N
m
De todas formas, podemos decir que el resultado hallado por cuadrados mnimos tiene una precisin
menor que el hallado por medias ponderadas. Calculando los errores relativos y haciendo su cociente
vemos que la precisin es 2, 8 veces mayor en el caso de las medias ponderadas. Porqu creen que
las medias ponderadas da un resultado ms preciso? En cuadrados mnimos todos los puntos son
tratados por igual, mientras que las medias ponderadas favorecen aquellos puntos que estn mejor
determinados.

Figura 3: Representamos los datos medidos junto con la recta hallada.

Cuadrados mnimos en Excel


Para realizar una regresin lineal por cuadrados mnimos en EXCEL usamos la funcin ESTIMACIO.LINEAL (o LINEST en ingls). sta funcin nos devuelve varios valores, entre esos la pendiente
y la ordenada al origen, con sus respectivos errores, el valor de 2 , el coeficiente de correlacin y otros
valores que no nos van a interesar. A continuacin vemos un ejemplo de como se usa detallando los
pasos a seguir.

Ingresamos los datos en hoja de clculo:

Seleccionamos varias celdas y luego hacemos click en el botn de funciones.

Buscamos y seleccionamos la funcin ESTIMACION.LINEAL.

Ingresamos los datos como muestra la figura: (En los campos Constante y Estadstica se puede
el valor 1, 0 = 0, o completarlo de manera que el resultado sea VERDADERO ).

IMPORTANTE. No hagan click en ACEPTAR. Tenemos que apretar la siguiente combinacin


de teclas SHIFT + CTRL + ENTER:

Finalmente la funcin nos devuelve un montn de valores, de los cuales nos interesan los que
estn resaltados en la figura.

Podemos ver que los resultados son idnticos a los que obtuvimos en el ejemplo anterior.

Вам также может понравиться