Вы находитесь на странице: 1из 49

Ajuste de Curvas

Prof. Carlos Araujo


Ajuste de Curvas
En este captulo nos enfocaremos al ajuste de curvas con el
objeto de poder estimar el comportamiento de una variable en
especfico.
Existen dos formas bsicas para el ajuste de curvas.

Cuando los datos exhiben un grado elevado de dispersin, la estrategia
consiste en obtener una curva que represente la tendencia general
(Regresin).

Cuando los datos son muy precisos, la estrategia consiste en pasar una
curva o serie de curvas por cada uno de los puntos (Interpolacin).
Tres intentos para ajustar una curva
con cinco puntos dados.
Caracterizacin de la tendencia
(Regresin)
Unin de
puntos con
lneas rectas
Unin de
puntos con
curvas suaves
Fundamentos Estadsticos
Los procedimientos para obtener una
Regresin de los datos requiere de
informacin procedente del campo de la
Estadstica.

Los procedimientos para obtener una
Interpolacin de los datos requieren del
conocimiento de la Serie de Taylor y las
Diferencias Finitas Divididas.
Algunos conceptos fundamentales de
la Estadstica:
La media aritmtica: la suma del valor de los datos en
cada punto (y
i
), entre el nmero de puntos totales (n)



La desviacin estndar: medida ms utilizada para
estimar la dispersin de los datos.
n , , i
n
y
y
i
1 = =

=

=
2
) (
1
y y S
n
S
S
i t
t
y
Algunos conceptos fundamentales
son:
Varianza: representacin de la dispersin, desviacin
estndar al cuadrado



Coeficiente de Variacin: Cuantifica una dispersin
normalizada de los datos, es semejante a un error
relativo.
1
2
2

=

n
) y y (
s
i
y
% 100 . .
y
S
v c
y
=
( ) ( )
1
/
2
2
2

=

n
n y y
S
i i
y
Problema 17.1
Problema 17.1
i yi (yi-yb)^2
1 6,395 0,042025
2 6,435 0,027225
3 6,485 0,013225
4 6,495 0,011025
5 6,505 0,009025
6 6,515 0,007225
7 6,555 0,002025
8 6,555 0,002025
9 6,565 0,001225
10 6,575 0,000625
11 6,595 2,5E-05
12 6,605 2,5E-05
13 6,615 0,000225
14 6,625 0,000625
15 6,625 0,000625
16 6,635 0,001225
17 6,655 0,003025
18 6,655 0,003025
19 6,665 0,004225
20 6,685 0,007225
21 6,715 0,013225
22 6,715 0,013225
23 6,755 0,024025
24 6,775 0,030625
sum 158,4 0,217
Problema 17.1
6 6
24
4 158
.
.
y = =
097133 0
1 24
217 0
.
.
s
y
=

=
0097133 0
2
. s
y
=
% . %
.
.
. v . c 47 1 100
6 6
097133 0
= =
Caracterstica de la distribucin
Si se tiene un conjunto muy grande de datos,
el histograma puede definir una curva suave,
cuya forma puede ser de campana simtrica
(Campana de Gauss), conocida como
Distribucin normal.
El intervalo:

Abarca de forma aproximada el 68 %
de las mediciones totales.

El intervalo:

Abarca aproximadamente el 95 % de
las mediciones totales
y
s y
y
s y 2
Inferencia Estadstica


2 2
o

y
s
y
, entonces n Si
Muestra Poblacin
Intervalos de confianza
{ } o = s s 1 U L P
La probabilidad de que la media real de y, , este dentro de los lmites
de L a U es 1-o
Teorema de lmite central
Sea y1, y2, y3, , yn, una muestra aleatoria de
tamao n tomada de una distribucin de media y
varianza o2. Entonces, para n grandes, la media de la
muestra es aproximadamente normal con media y
varianza o2/n. Adems, para n grande, la variable Z es
aproximadamente normal estndar.
|
.
|

\
|

=
n
y
z
o

y
Distribucin normal estndar
Si una distribucin del diagrama de frecuencia presenta
un comportamiento normal, entonces puede ser llevado
a una forma normalizada estndar.


|
.
|

\
|

=
n
y
z
o

es un estimador normalmente distribuido con media 0 y varianza 1.
Adems:
z
{ } o = s s 1 U z L P
Intervalos de confianza
o
o

o

o o
de ad probabilid la con
z
n
y
o z
n
y
2 2
>

<

2
o
o
z
n
y L =
2
o
o
z
n
y U + =
{ } o = s s 1 U L P
Tabla de distribucin normal estndar
Tabla de distribucin normal estndar
Tabla de distribucin normal estndar
Tabla de distribucin normal estndar
Estimacin de los Intervalos de
confianza
Como es frecuente el valor de
2
no se conoce, una
alternativa para superar este inconveniente es definir a
la variable aleatoria normalizada t:
n
s
y
t
y

=
2
o
t
n
s
y L
y
=
2
o
t
n
s
y U
y
+ =
Tablas de Distribucin Student o t
Problema 2
Determinar la media y el correspondiente intervalo de confianza
del 95% de los datos de la tabla, para n=8, n=16 y n=24
Para 8:
364623 2
1 8 2 05 0
. t
, .
=

089921 0
1 8
8 72 52 4814 347
2
.
. .
s
y
=

=
5148 6 364623 2
8
089921 0
59 6 . .
.
. L = =
6652 6 364623 2
8
089921 0
59 6 . .
.
. U = + =
59 6
8
72 52
.
.
y = =
Problema 2
Determinar la media y el correspondiente intervalo de confianza
del 95% de los datos de la tabla, para n=8, n=16 y n=24


Tema 17- Regresiones
Regresiones Lineales
Es el caso ms simple de una regresin, en
el que se trata de ajustar una recta a la
data.



Donde el residuo es la diferencia entre el
valor verdadero y el valor aproximado.
e x a a y + + =
1 0
x a a y e
1 0
=
Regresiones Lineales
Ajuste polinomial (oscila
por encima de los datos
de la muestra)
Ajuste de una recta por
mnimos cuadrados
Data con un
error
significativo
Cmo minimizar el error?

= =
=
n
i
i o i
n
i
i
x a a y e
1
1
1
) (
Minimizar la suma de los residuos



Minimizar la suma de los valores
absolutos de los residuos



Minimizar el error mximo de cualquier
punto individual

= =
=
n
i
i i
n
i
i
x a a y e
1
1 0
1
Cmo minimizar el error?
Minimizar la suma de los cuadrados de los residuos

Esta alternativa ofrece una nica lnea para un conjunto de
datos

= = =
= = =
n
i
n
i
i i i i
n
i
i r
x a a y y y e S
1 1
2
1 0
2
1
2
) ( ) model , measured , (
Procedimiento para el ajuste lineal
| |

=
=
= =
c
c
= =
c
c
2
1
0
1
0
1
1
1
0
0
0 2
0 2
i i i i
i i
i i o i
r
i o i
o
r
x a x a x y
x a a y
x ) x a a y (
a
S
) x a a y (
a
S
( )
( ) ( )
( )
x a y a
x x n
y x y x n
a
y x a x a x
y a x na
na a
i i
i i i i
i i i i
i i
1 0
2
2
1
1
2
0
1 0
0 0
=

=
= +
= +
=




= = =
= = =
n
i
n
i
i i i i
n
i
i r
x a a y y y e S
1 1
2
1 0
2
1
2
) ( ) model , measured , (
Problema 3
xi yi xiyi xi^2 (yi-yp)^2 (yi-a0-a1xi)^2
1 0,5 0,5 1 8,577 0,169
2 2,5 5 4 0,862 0,563
3 2 6 9 2,041 0,347
4 4 16 16 0,327 0,327
5 3,5 17,5 25 0,005 0,590
6 6 36 36 6,612 0,797
7 5,5 38,5 49 4,291 0,199
sum 28 24 119,5 140 22,714 2,991
Xp= Yp=
4 3,42857143
x . . y + = 8392857 0 07142857 0
( )
07142857 0
8392857 0
1 0
2
2
1
. x a y a
.
x x n
y x y x n
a
i i
i i i i
= =
=

=


Qu se entiende por error de la
regresin?

= =
= =
n
i
i i
n
i
i r
) x a a y ( e S
1
2
1 0
1
2
2 2
=

=

n
regresin la a base en errores
n
S
S
r
x y
Desviacin estndar para la lnea de
regresin (Error estndar estimado)
Desviacin Estndar Error Estndar
del Estimado
Otros estadsticos
Coeficiente de determinacin (r
2
)



Coeficiente de correlacin (r)

) o normalizad (
S
S S
r
t
r t

=
2
2
r r =
Si S
r
=0, r=r
2
=1, la regresin
explica el 100% de las
variables (datos)
Si S
r
=S
t
y r=r
2
=0, la
regresin no representa una
mejora.

=

=
2
) (
1
y y S
n
S
S
i t
t
y
Otros estadsticos
xi yi xiyi xi^2 (yi-yp)^2 (yi-a0-a1xi)^2
1 0,5 0,5 1 8,577 0,169
2 2,5 5 4 0,862 0,563
3 2 6 9 2,041 0,347
4 4 16 16 0,327 0,327
5 3,5 17,5 25 0,005 0,590
6 6 36 36 6,612 0,797
7 5,5 38,5 49 4,291 0,199
sum 28 24 119,5 140 22,714 2,991
Xp= Yp=
4 3,42857143
7735 0
2 7
9911 2
.
.
S
x y
=

=
9457 1
1 7
7143 22
.
.
S
y
=

=
868 0
7143 22
9911 2 7143 22
2
.
.
. .
r =

=
932 0. r =
Los resultados indican que el modelo lineal explico el 86.8% de la
incertidumbre original
Problema 17.2
( )
( )
( )
t m c
e
c
gm
t v

= 1
( )
|
.
|

\
|
+
=
t .
t
c
gm
t v
75 3
r > 0.99
Pseudocdigo
Linealizacin de regresiones no
lineales
Regresin lineal por mnimos
cuadrados.
Parbola
Linealizacin de regresiones no
lineales
Ec. Exponencial Ec. de Potencia Ec. Razn de crecimiento
de los incisos
Ln y = ln(a)+b1x*Ln(e) Log y = b2log(x)+Log(a2)
(1/ y) = (b3/a3)(1/x)+1/a3
Regresin Polinomial
Algunas veces, la data no es representada
adecuadamente por una lnea recta, para estos
casos una curva sera ms apropiada. Esto se
hace tal y como se describe a continuacin para
un polinomio orden 2.

Regresin Polinomial
( )
| |
| |
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )


= + +
= + +
= + +
= =
c
c
= =
c
c
= =
c
c
=
+ + + =
=
i i i i i
i i i i i
i i i
i o i i
r
i o i i
r
i o i
o
r
n
i
r
y x a x a x a x
y x a x a x a x
y a x a x a n
________ __________ __________
) x a x a a y ( x
a
S
) x a x a a y ( x
a
S
) x a x a a y (
a
S
_______ __________ __________
x a x a a y S
e x a x a a y
2
2
4
1
3
0
2
2
3
1
2
0
2
2
1 0
2
2 1
2
2
2
2 1
1
2
2 1
1
2
2
2 1 0
2
2 1 0
0 2
0 2
0 2
Regresin Polinomial
2
2 1 0
x a x a a y + + =
( )
| |
| |
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )


= + +
= + +
= + +
= =
c
c
= =
c
c
= =
c
c
=
+ + + =
=
i i i i i
i i i i i
i i i
i o i i
r
i o i i
r
i o i
o
r
n
i
r
y x a x a x a x
y x a x a x a x
y a x a x a n
________ __________ __________
) x a x a a y ( x
a
S
) x a x a a y ( x
a
S
) x a x a a y (
a
S
_______ __________ __________
x a x a a y S
e x a x a a y
2
2
4
1
3
0
2
2
3
1
2
0
2
2
1 0
2
2 1
2
2
2
2 1
1
2
2 1
1
2
2
2 1 0
2
2 1 0
0 2
0 2
0 2
) m ( n
regresin la a base en errores
) m ( n
S
S
r
x y
1 1 +
=
+
=

(Error estndar estimado)

Algoritmo para implementar la
regresin polinomial y lineal mltiple.
Regresiones lineales mltiples
( )
| |
| | 0 2
0 2
0 2
2 2 1 1 2
2
2 2 1 1 1
1
2 2 1 1
1
2
2 2 1 1 0
2 2 1 1 0
= =
c
c
= =
c
c
= =
c
c
=
+ + + =

=
) x a x a a y ( x
a
S
) x a x a a y ( x
a
S
) x a x a a y (
a
S
_______ __________ __________
x a x a a y S
e x a x a a y
i , i , o i i ,
r
i , i , o i i ,
r
i , i , o i
o
r
n
i
i , i , i r
Regresiones lineales mltiples
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )



= + +
= + +
= + +
i i , i , i , i , i ,
i i , i , i , i , i ,
i i , i ,
y x a x a x x a x
y x a x x a x a x
y a x a x a n
2 2
2
2 1 2 1 0 2
1 2 2 1 1
2
1 0 1
2 2 1 1 0
Caractersticas comunes entre las
regresiones
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )



= + +
= + +
= + +
i i , i , i , i , i ,
i i , i , i , i , i ,
i i , i ,
y x a x a x x a x
y x a x x a x a x
y a x a x a n
2 2
2
2 1 2 1 0 2
1 2 2 1 1
2
1 0 1
2 2 1 1 0


= +
= +
i i i i
i i
x y x a x a
y x a a
2
1
0
1
0
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )



= + +
= + +
= + +
i i i i i
i i i i i
i i i
y x a x a x a x
y x a x a x a x
y a x a x a n
2
2
4
1
3
0
2
2
3
1
2
0
2
2
1 0
Formula general de una matriz para
mnimos cuadrados lineales
e z a ... z a z a z a y
m m
+ + + + + =
2 2 1 1 0 0
{ } | |{ } { } E A Z Y + =

= =
|
|
.
|

\
|
=
n
i
m
j
ji j i r
z a y S
1 0
Al minimizar
| | | | | |{ } | | { } { } Y Z A Z Z
T T
=
Formula general de una matriz para
mnimos cuadrados lineales

= =
=
n
i
i o i
n
i
i
x a a y e
1
1
1
) (

+
)
`

(
(
(
(
(

n
n
n
e
:
e
e
a
a
x
:
x
x
y
:
y
y
2
1
1
0
2
1
2
1
1
1
1
1
{ } | |{ } { } E A Z Y + =
Como las ecuaciones normales no son diagonalmente dominantes, no
se debe usar Gauss-Seidel
Formula general de una matriz para
mnimos cuadrados lineales
Draper y Smith en 1981 demostraron que los trminos en la diagonal y
fuera de la diagonal de [[Z]T[Z]]-1 dan respectivamente la varianza y la
covarianza de las a
( )
2 ,
2
0 0

=
n
t a s a
L
U
o
( )
2 ,
2
1 1

=
n
t a s a
L
U
o
Alternativas para la solucin del
problema
Descomposicin LU
Mtodo de Cholesky
Mtodo de la matriz inversa

Вам также может понравиться