Вы находитесь на странице: 1из 9

AJUSTE DE CURVAS - MÍNIMOS QUADRADOS

INTRODUÇÃO

Nas aulas anteriores estudamos alguns métodos que determinam um polinômio interpolador. Entretanto,
existem casos em que o polinômio interpolador não se ajusta satisfatoriamente aos valores conhecidos e, assim,
devemos utilizar métodos alternativos.

O ajuste de curvas é muito utilizado para, a partir de dados conhecidos, fazer-se extrapolações. Por exemplo,
conhece-se os dados de consumo anual de carga elétrica de uma cidade. A partir destes dados conhecidos, pode-
se fazer projeções para o futuro e com isso, fazer-se um planejamento para que a cidade seja suprida de forma
adequada nos anos subsequentes. A ideia é ajustar uma curva que melhor se ajusta aos dados disponíveis.

Assim, o método dos mínimos quadrados é necessário quando:

1- É preciso obter um valor aproximado da função em algum ponto fora do intervalo tabelado, ou seja,
quando se quer extrapolar.

2- Os valores tabelados são resultados de algum experimento físico ou de alguma pesquisa. Em geral esses
valores poderão conter erros inerentes que, em geral, não são previsíveis. Essa situação é justificada pois
ao realizar medidas, os erros são evidentes. Sejam eles devido à precisão do aparelho (menor divisão),
defeitos no aparelho (dilatação), interferência de efeitos externos (ação de campos magnéticos, elétricos,
temperatura, pressão, etc) bem como a erros cometidos pelo próprio experimentador.

3- Substituição de uma função conhecida por outras funções, como ajustar os pontos distribuídos em uma
reta (regressão linear).

O método dos mínimos quadrados é um dos processos alternativos para determinar a função, não
necessariamente polinomial, que se adapte ao conjunto de valores conhecidos.

Este método é também usado quando, dada uma função se quer obter uma outra que “mais se aproxima” da
função dada.

No método dos mínimos quadrados é essencial que se plotem (marquem), em um sistema de eixos cartesianos,
os valores (x, f(x)) conhecidos. A partir da distribuição dos pontos no gráfico procura-se a função ou
combinação de funções que mais se adapte a esta distribuição.

Ao aplicar o método dos mínimos quadrados devemos levar em conta duas possibilidades:

1- DOMÍNIO DISCRETO - quando a função referente a distribuição dos pontos não é conhecida. Ou seja,
quando a função f é dada por uma tabela de valores.

Neste caso o número de pontos é finito e a função de referência é estabelecida a partir de um modelo
matemático suposto para as relações existentes entre as grandezas.

2- DOMÍNIO CONTÍNUO – procedimento usado quando a função é conhecida e se deseja uma nova função
que se aproxima suficientemente da função conhecida.

Neste caso, o número de pontos é então infinito pois podem ser obtidos a partir da própria função.

Vamos iniciar pelo caso discreto.


MÉTODO DOS MÍNIMOS QUADRADOS

1- CASO DISCRETO

Neste caso, temos os dados tabelados, com x1 , x 2 , x3 , ...., x n �[ a ,b ].

x x1 x2 x3 x4 ...... xn
f(x) f ( x1 ) f ( x2 ) f ( x3 ) f ( x4 ) ...... f ( xn )

A partir dos dados disponíveis, pode-se construir um diagrama de dispersão, que é a representação em gráfico
dos dados disponíveis.

Os gráficos dos dados disponíveis podem ser de diversas forma: retas, curvas, etc

O objetivo é encontrar uma função  ( x ) que seja uma boa aproximação para os valores tabelados de f (x) e
que nos permita extrapolar com uma certa margem de segurança. Ou seja, a partir de uma análise do diagrama
de dispersão deve-se ajustar uma curva que melhor se aproxima dos dados gerados por f(x).

Assim, escolhidas n funções contínuas g1 (x), g 2 (x), g3 (x),...., g n ( x) , contínuas em [a. b], obter n constantes
a1 , a2 , a3 ,...., an tais que a função

 ( x) = a1 .g1 (x) + a2 . g2 (x) + a3 . g3 (x) + .... + an .g n ( x)

se aproxime ao máximo de f ( x ).

Este modelo matemático é linear pois os coeficientes que devem ser determinados a1 , a2 , a3 ,...., an aparecem
linearmente, embora as funções g1 (x), g 2 (x), g3 (x),...., g n ( x) possam ser não lineares.

Surge então a primeira pergunta: Como escolher as funções contínuas g1 (x), g 2 (x), g3 (x),...., g n ( x) de modo que
 (x ) seja uma boa aproximação de f(x)?

CASO 1 - Esta escolha pode ser feita observando o gráfico dos pontos tabelados (diagrama de dispersão).

Ou seja, dada uma tabela de pontos ( x1 , f1 (x)), ( x2 , f 2 (x)), ( x3 , f 3 (x)),....., ( xn , f n (x)) , deve-se, em
primeiro lugar colocar estes pontes num gráfico
cartesiano e a partir daí pode-se visualizar a curva que
melhor se ajusta aos dados. Por exemplo, o diagrama de
dispersão abaixo mostra que esse diagrama se assemelha
muito a uma parábola com centro na origem.

Portanto, nesse caso, é natural escolhermos apenas uma função


g1 (x) = x 2 e procurarmos então
 ( x) = a1 .g1 (x) = a1 .x 2 (equação geral de uma parábola passando pela origem).

CASO 2 - Ou baseando-se em fundamentos teóricos do experimento que forneceu a tabela.

Por exemplo, se considerarmos uma experiência onde foram medidos vários valores de corrente elétrica
(i) que passa por uma resistência (R) submetida a várias tensões (V), colocando os valores
correspondentes de corrente elétrica e tensão em um gráfico podemos ter a figura abaixo:

Neste caso, existe uma fundamentação teórica relacionando a corrente com a tensão (V= R i; Lei de Ohm), isto
é, V é uma função linear (reta) de i. Assim, g1 (i) = i e  (i ) = a1 .i .

Assim, considerando os dois casos acima, surge uma segunda pergunta:

qual parábola com equação  ( x ) = a1 .x melhor se ajusta (ou se aproxima) ao diagrama do caso 1 e
2

 qual reta, passando pela origem, melhor se ajusta ( ou se aproxima) ao diagrama do caso 2?

No caso geral, escolhidas as funções g1 (x), g 2 (x), g 3 (x),...., g n ( x) temos que estabelecer o conceito de
proximidade entre as funções  ( x ) e f(x) para obter as constantes a1 , a2 , a3 ,...., an .

Uma maneira de estabelecer proximidade é impor que o desvio d k = f ( xk ) -  ( xk ) seja mínimo, para k = 1, 2, ...,
n. Ou seja, a distância entre cada ponto da tabela e os pontos da curva  (x ) seja a menor possível.

Existem várias formas de impor que os desvios sejam mínimos. O método dos mínimos quadrados é um deles.

Vamos iniciar com um ajuste linear, que é o modelo mais simples que relaciona duas variáveis x e y: a reta.
Os casos seguintes seguem o mesmo raciocínio.

AJUSTE LINEAR PELO MÉTODO DOS MÍNIMOS QUADRADOS

Dada uma tabela com n valores ( x1 , f1 (x)), ( x2 , f 2 (x)), ( x3 , f 3 (x)),....., ( xn , f n (x)) , queremos encontrar a reta que
melhor ajusta a estes pontos. Como o ajuste será feito por uma reta, tomaremos g1 (x) =1 e g 2 (x) = x e assim,

 ( x) = a1 .g1 (x) + a2 .g 2 (x) �  ( x) = a1 + a2 .x

Assim, pelo método dos quadrados mínimos devemos procurar a1 e a2 tal que a soma de todos os desvios
n
d k = f ( xk ) -  ( xk ) seja mínima, ou seja, minimizar �d
k =1
k .
Observe que o valor de cada d k pode ser positivo ou negativo, assim, o somatório não seria representativo dos
desvios, pois poderíamos ter soma igual a zero. Uma primeira solução seria utilizar o somatório dos valores
m
absolutos de d k , ou seja d
k =1
k , entretanto o manuseio de expressões que aparecem valor absoluto é
extremamente complexo. A solução mais fácil é a utilização da soma dos desvios ao quadrado, definido por:

n n 2

D = � d k = � [ f ( xk ) -  ( x k ) ]
2

k =1 k =1

Substituindo  ( x ) = a1 + a2 x na equação acima, tem-se:


n n 2 n 2

D = �d k = �[ f ( xk ) -  ( xk ) ] = ��
2
�f ( xk ) - ( a1 + a2 xk ) �

k =1 k =1 k =1

Observe que o valor de D depende de a1 e a2 . Neste caso, D é uma função de duas variáveis.

Do Cálculo I e II, a condição necessária para que D seja um mínimo é que as derivadas parciais de D em relação
a a1 e a2 sejam zero. Derivando em relação a a1 e a2 e igualando a zero, temos:

�D n n


a1
= 2.�� �f ( xk ) - ( a1 + a2 xk ) �
.1 = 0
� � �f ( x ) - ( a
�� k 1 + a 2 xk ) �
�= 0 (I )
k =1 k =1

�D n n


a2
= 2.�� �f ( xk ) - ( a1 + a2 xk ) �
.x k = 0
� � �f ( x ) - ( a
�� k 1 + a2 xk ) �
.x k = 0
� ( II )
k =1 k =1

Rearranjando as equações chega-se:

n n n n n
(I) �f ( xk ) - �a 1 - �a2 xk = 0
k =1 k =1 k =1
� �f ( xk ) - n.a 1 -�a2 xk = 0
k =1 k =1

n n n
(II) �f ( x
k =1
k ) xk - �a 1 xk - �a2 xk 2 = 0
k =1 k =1

Isolando as variáveis a1 e a2 dos termos constantes, tem-se:


n
�n �
(I) n
�n �
� f ( xk ) - �

� xk �

a2
n.a1 = �f ( xk ) - �� k =1 k =1
xk �
a2 � a1 =
k =1 �k =1 � n

�n � �n 2 � n
(II) ��xk
�k =1
a +
�1 � �k �
� �k =1
x a

2 = �
k =1
xk f ( xk )

Substituindo a1 em (II) e isolando a2 , temos:


n
�n �
n � f ( xk ) - �

� xk a2

� +� x 2 �
n n


k =1
xk . k =1

n
k =1
��
�k =1
k �

a 2 = �
k =1
xk f ( xk )

n n n
�n �
� xk �
. f ( xk ) - � x .
k � � xk �
.a2
�k =1 � + � x 2 �
n n
k =1 k =1

n
k =1
��
�k =1
k �

a2 = �
k =1
xk f ( xk )

n n n n
�n 2 � n


k =1
xk �
.
k =1
f ( xk ) - �
k =1
x k �k 2
.
k =1
x .a + n. ��k �
�k =1
x a

2 = n �
k =1
xk f ( xk )

2
n n
�n � �n 2 � n


k =1
xk .�f ( xk ) - �
k =1
� xk . �a2 + n. �
�k =1 �

�k =1
a2 = n�xk f ( xk )
xk �
� k =1

� n 2 �n �� n
2 n n

�� �k � � � k �f ( xk )
a2 . �n. xk -� x . �= n x f ( x ) - x .
�k =1 ��
k k
� k =1 � k =1 k =1 k =1

n n n
n�xk f ( xk ) - �xk .�f ( xk )
a2 = k =1 k =1 k =1
2
n
� �n
n.�xk - �
2
� xk . �
k =1 �k =1 �

Apenas para melhorar o visual, vamos trocar f ( xk ) por yk , já que y = f(x).

Logo, a reta que melhor se ajusta aos pontos do diagrama de dispersão é reta  ( x ) = a1 + a2 .x , onde a1 e a2 são
constantes definidas pelas fórmulas acima.

EXEMPLO 1 – Dado a tabela abaixo, faça um ajuste linear que melhor se aproxima dos pontos (x, f(x)).

x 14 6 3 6 7 6 7 4 8 7 6 4
f(x) 10 26 41 29 27 27 19 28 19 31 29 33

- Solução-

Para montar a reta  ( x ) = a1 + a2 .x temos que encontrar os valores de a1 e a2 , segundo as fórmulas acima.
Para facilitar os cálculos fica melhor colocar os dados como na tabela abaixo e calcular os termos necessários
para montar a1 e a2 .
x y x.y x2
14 10 140 196
6 26 156 36
3 41 123 9
6 29 174 36
7 27 189 49
6 27 162 36
7 19 133 49
4 28 112 16
8 19 152 64
7 31 217 49
6 29 174 36
4 33 132 16
 x = 78 �y = 319 �x. y = 1864 �x = 592
2

O que precisamos está na última linha, que representa as somas de cada coluna.

Vamos calcular sempre a2 primeiro, já que a1 depende de a2

n n n
n �xk yk - �xk .�yk
12 �1864 - 78 �319 22368 - 24882
a2 = k =1 k =1 k =1
= = = - 2, 46
12 �592 - ( 78 ) 7104 - 6084
2 2
n
�n �
n.�xk 2
-�� xk . �
k =1 �k =1 �

Substituindo em a1 , temos:

n
�n �

k =1
yk - �


k =1
xk �a2
� = 319 - ( 78 ) ( -2, 46) = 319 + 191,88 = 42, 57
a1 =
n 12 12

Assim, a reta que melhor se ajusta aos dados da tabela é:

 ( x) = 42,57 - 2, 46 x

Observe que, conhecendo a equação da reta que melhor se ajusta aos pontos da tabela, podemos calcular o valor
da função f(x) para qualquer valor dentro (interpolação) ou fora (extrapolação) da tabela. Por exemplo,
podemos querer saber o valor da função f(x) quando x = 5, que está entre os valores, mas não está na tabela ou
quando x = 20, que está fora dos valores tabelados. Basta calcular:

f (5) =  (5) = 42,57 - 2, 46 �5 = 30, 27 e f (20) =  (20) = 42,57 - 2, 46 �20 = - 6, 63

EXEMPLO 2 – Uma empresa está avaliando se existe uma relação entre o investimento em propaganda (em
milhares de reais) e as vendas (em milhares de reais) da empresa. Para isso foram coletados os dados da tabela
abaixo.

GASTO COM 2,4 1,6 2,0 2,6 1,4 1,6 2,0 2,2
PROPAGANDA (X)
VENDAS 75 34 70 90 30 34 36 65
(Y)
Através do Método de Mínimos Quadrados determine a equação da reta  ( x) = a1 + a2 .x que melhor se ajusta os
pontos dados.

-Solução-

Construindo a tabela abaixo, temos:

PROPAGANDA VENDAS x. y x2
(X) (Y)
2,4 75 180 5,76
1,6 34 54,4 2,56
2,0 70 140 4
2,6 90 234 6,76
1,4 30 42 1,96
1,6 34 54,4 2,56
2,0 36 72 4
2,2 65 143 4,84
 x =15,8  y = 434  x.y = 919,8  x 2
= 32,44

O que precisamos está na última linha, que representa as somas de cada coluna.

Calcular a2 .

n n n
n�xk yk - �xk .�yk
8 �919,8 - (15,8) �(434) 7358, 4 - 6857, 2
a2 = k =1 k =1 k =1
= = = 50, 73
8 �32, 44 - ( 15,8 ) 259,52 - 249, 64
2 2
n
�n �
n.�xk 2
-�� xk . �
k =1 �k =1 �

Substituindo em a1 , temos:

n
�n �

k =1
y k - �


k =1
xk �a2
� = 434 - ( 15,8 ) �50, 73 = 434 - 801, 53 = - 45,94
a1 =
n 8 8

Assim, a reta que melhor se ajusta aos dados da tabela é:

 ( x) = - 45,94 + 50, 73 x
Aqui já podemos calcular qual as vendas caso o investimento seja de 3 (em milhares de reais):

 (3) = - 45,94 + 50,73 �3 = 106, 25 milhares de reais

EXERCÍCIOS

1- Octanagem é a medida de resistência do combustível à pressão que ele sofre dentro da câmara de combustão do
motor. Ou seja, é a capacidade que ele tem de resistir, em mistura com o ar, ao aumento de pressão e de
temperatura sem detonar (isso sem que a faísca de vela tenha sido disparada pelo sistema de ignição). Quanto maior a
octanagem, maior será a resistência do combustível à detonação. Assim, com maior octanagem é possível que os
motores operem com maiores taxas de compressão.

Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição de um aditivo
(X). Para isto, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo. Os resultados
seguem na tabela abaixo:
QUANTIDADE % DE OCTANAGEM DA
ADITIVO (X) GASOLINA (Y)
1 80,5
2 81,6
3 82,1
4 83,7
5 83,9
6 85

(a) Através do Método de Mínimos Quadrados determine a equação da reta  ( x) = a1 + a2 .x que melhor se
ajusta os pontos dados, onde seja possível verificar a relação entre a adição de aditivos e a octanagem.
(b) Se houver uma adição de 8% de aditivos, qual será a octanagem?
(c) Qual a quantidade de aditivos adicionados para uma octanagem de 85?

Resposta: (a) Y = 0,886.x + 79,7 (b) 86,79 (c) 5,98

2- Uma construtora dispõe dos seguintes dados: a renda média familiar da população de várias cidades e a
quantidade de imóveis vendidos em cada cidade.

Cidade Renda média (em R$ 1000) Vendas de Imóveis


X (Y)
A 5 27
B 10 46
C 20 73
D 8 40
E 4 30
F 6 28
G 12 46
H 15 59

(a) Através do Método de Mínimos Quadrados determine a equação da reta  ( x) = a1 + a2 .x que melhor se
ajusta os pontos dados, onde seja possível verificar a relação entre a renda e a venda de imóveis.

Com essa equação da reta, é possível fazer a projeção de valores para outras cidades, verificando a
possibilidade de estabelecer novas vendas de imóveis nelas.

(b) Se houver uma cidade com renda 18 (mil reais), qual será a venda esperada?
(c) Qual a renda esperada de uma cidade que tenha 50 imóveis vendidos?

Resposta: (a) Y = 2,9.x + 14,58 (b) 66,78 imóveis (c) R$ 12200,00


3- Uma obra está sendo construída em uma área de 1000 m². Pensando em aumentar a área construída, em no
mínimo mais 10 m², o dono da obra deseja verificar qual o custo a mais para aumentar 1 m² de construção, até
15 m². A tabela abaixo mostra a quantidade área a mais construída (em m²) e o custo (em milhares de reais).
(a) Através do Método de Mínimos Quadrados determine a equação da reta  ( x) = a1 + a2 .x que melhor se
ajusta os pontos dados, onde seja possível verificar a relação entre a área a mais construída e custo que
esse aumento acarreta.

(b) Se ele decidir aumentar em 20 m², qual será o custo esperado?


(c) Quanto ele deve aumentar a área construída, se o custo for de 160 (em milhares de reais)?

Resposta: (a) Y = 8,63.x + 15,79 (b) 188,39 (milhares de reis a mais) (c) R$ 16,71 m² a mais.

4-Uma agência da ONU pretende verificar se existe uma relação linear entre a despesa per capita em educação
e o grau de criminalidade (assassinatos por mês) numa lista de cinco países.

Através do Método de Mínimos Quadrados determine a equação da reta  ( x) = a1 + a2 .x que melhor se ajusta os
pontos dados, onde seja possível verificar a relação entre investimento em educação e taxa de criminalidade.

PAIS DESPESAS ASSASSINATOS/MES


(U. MILHAO) (Y)
A 5 18
B 8 12
C 12 8
D 13 4
E 15 5

(a) Através do Método de Mínimos Quadrados determine a equação da reta  ( x) = a1 + a2 .x que melhor se
ajusta os pontos dados, onde seja possível verificar a relação entre despesas em educação e taxa de
criminalidade.

(b) Se 10 (Unidades de milhão) forem gastos, quanto se espera de taxa de criminalidade?

Resposta: (a)  ( x) = 23,9 - 1,37x (b) 10,2 assassinatos por mês

Вам также может понравиться