Академический Документы
Профессиональный Документы
Культура Документы
MÉTODOS QUANTITATIVOS
(NOTAS DE AULA)
2016.1
1
Notas de aula – Professor Azamor Cirne
MÉTODOS QUANTITATIVOS
INTRODUÇÃO
Os métodos quantitativos são uma ferramenta que utilizam a matemática e as técnicas estatísticas
para investigação, análise e síntese de um fenômeno. Esses métodos quantitativos tem se tornado cada
vez mais frequente não só por aqueles que fazem ciência, mas também por todos os que desejam fazer
previsão ou apenas verificar o comportamento de determinado fenômeno através da utilização de
dados. A utilização desses métodos tem se tornado frequente devido ao auxílio da tecnologia da
informação e do processamento de dados em microcomputadores.
Essa ferramenta tem auxiliado outras ciências como a engenharia, a economia a agronomia, a
administração e nas ciências contábeis essa ferramenta tem auxiliado na transformação de dados em
modelos contábeis que permitem a tomada de decisões referentes à previsão ao planejamento fazendo
com que a contabilidade se aproxime mais dos processos de decisão auxiliando na minimização de
perdas e maximizando os lucros.
Entre os principais objetivos no uso do método quantitativo aplicados à Contabilidade podem ser
úteis nos seguintes assuntos:
a) gestão de custos (alocações de custos e transferências interdivisionais, intersetoriais e
interempresariais)
b) formação de preços
c) no tratamento de dados de um modo geral
d) no tratamento de dados de pesquisa
2
Notas de aula – Professor Azamor Cirne
a) Planejamento do problema:
• definição da importância do problema que se pretende estudar.
• determinação do objetivo e finalidade do estudo.
c) Formulação de hipóteses:
• em toda pesquisa, exceto naquelas meramente descritivas ou exploratórias, é necessária à
formulação de uma hipótese estatística que poderá ser comprovada ou rejeitada.
d) Verificação da hipótese:
• consistem da coleta de dados, análise estatística e apresentação dos resultados.
3
Notas de aula – Professor Azamor Cirne
MÉTODO CIENTÍFICO
Pesquisa: Uma pesquisa é um processo de construção do conhecimento que tem como metas
principais gerar novos conhecimentos e/ou corroborar ou refutar algum conhecimento pré-existente. É
basicamente um processo de aprendizagem tanto do indivíduo que a realiza quanto da sociedade na
qual esta se desenvolve. A pesquisa como atividade regular também pode ser definida como o conjunto
de atividades orientadas e planejados pela busca de um conhecimento.
Neste método é possível manter constantes todas as causas (fatores), menos uma, e variar esta
causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.
4
Notas de aula – Professor Azamor Cirne
indispensável no estudo de certos aspectos da realidade social, onde quer que se pretendam medir o
grau de correlação entre dois ou mais fenômenos.
O método Estatístico fundamenta-se na aplicação da teoria estatística da probabilidade e
constitui importante auxílio para a investigação. Porém, as explicações obtidas mediante a utilização
do método estatístico não podem ser consideradas absolutamente verdadeiras, mas dotadas de boa
probabilidade de serem verdadeiras.
Mediante a utilização de testes estatísticos, torna-se possível determinar, em termos numéricos, a
probabilidade de acerto de determinada conclusão, bem como a margem de erro de um valor obtido.
Portanto, o método estatístico passa a caracterizar-se por razoável grau de precisão, o que o torna
bastante aceito por parte dos pesquisadores com preocupação de ordem quantitativa.
Neste método é impossível manter as causas constantes (nas ciências sociais), admitem todas
essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma
mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter
constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros
produtos, etc.
a) Direta: quando feita sobre elementos informativos de registro obrigatório ou coletados pelo
próprio pesquisador. Essa coleta pode ser: contínua, periódica ou ocasional.
b) Indireta: quando é feita com base em elementos já pesquisados (revista, jornal, livros, etc.)
II – Crítica dos Dados → nesta fase os dados são contados e recontados, em busca de possíveis falhas
(omissões, repetições, etc), sendo:
a) Externa: informante
b) Interna: pesquisador
III – Apuração dos Dados → é a soma e o processamento dos dados obtidos. Pode ser manual,
eletromecânica ou eletrônica.
5
Notas de aula – Professor Azamor Cirne
IV – Apresentação dos Dados → os dados devem ser apresentados sob a forma de tabelas e gráficos.
V – Análise dos Resultados → o objetivo último da Estatística é tirar conclusões sobre o todo a partir
de informações fornecidas por uma parte representativa, através de técnicas apropriadas.
6
Notas de aula – Professor Azamor Cirne
REVISÃO DE ESTATÍSTICA
Definição 1 → “É a ciência que se preocupa com a coleta, organização, análise e interpretação dos
dados”.
Definição 2 → “É o conjunto de métodos e processos quantitativos que serve para medir e estudar os
fenômenos coletivos”.
Definição 3 → “A estatística é uma ciência da tomada de decisão diante de incertezas”.
Divisão da Estatística
A estatística pode ser classificada em:
• Estatística Descritiva (Dedutiva) → São a parte da estatística que trata da coleta, organização e
descrição dos dados (tabelas, gráficos, medidas). A Estatística Descritiva está relacionada com a
organização e descrição de dados associada a cálculos de médias, variâncias, estudo de gráficos, tabelas,
etc..
7
Notas de aula – Professor Azamor Cirne
• Amostragem → A Amostragem é o ponto de partida (na prática) para todo um Estudo Estatístico. O
estudo de qualquer fenômeno, seja ele natural, social, econômico, exige a coleta e a análise de dados
estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa.
A amostragem é uma técnica para obter uma amostra representativa, suficiente e que possa ser
generalizada para a população. A amostragem pode ser realizada dos seguintes modos:
Modelos
Um dos objetivos da análise e interpretação de dados é buscar um modelo para as observações.
Estes modelos podem ser essencialmente determinísticos ou não determinísticos (probabilísticos ou
estocásticos).
Nos modelos determinísticos as condições sob as quais um experimento é executado determinam
o resultado do experimento. Ex.: As leis da física.
Nos modelos não determinísticos usa-se uma Distribuição de Probabilidade.
8
Notas de aula – Professor Azamor Cirne
DEFINIÇÕES
10
Notas de aula – Professor Azamor Cirne
• Variáveis Quantitativas → são aquelas cujas características podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser: Discretas ou
Contínuas.
• Variáveis Discretas → características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente é o resultado
de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros
fumados por dia.
• Variáveis Contínuas → características mensuráveis que assumem valores em uma escala contínua
(na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através
de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial,
idade.
•Variáveis Qualitativas (ou categóricas) → são aquelas cujas características não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias que representam uma classificação
dos indivíduos. Podem ser: Nominais ou Ordinais.
11
Notas de aula – Professor Azamor Cirne
•Variáveis Nominais → não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos,
fumante/não fumante, doente/sadio.
•Variáveis Ordinais → existe uma ordenação entre as categorias. Exemplos: escolaridade (1º, 2º, 3º
graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,...,
dezembro).
Quadro Resumo
Tipo de
Subtipo Característica
variável
Categorias, sendo que cada categoria é independente, sem relação
Categórica com as outras, Ex: raça (com categoria como caucasiana; negra, etc.),
nominal nacionalidade (brasileira, argentina, etc.), gênero (masculino,
Qualitativa feminino).
Categorias, sendo que cada categoria mantém uma relação de ordem
Categórica
com as outras que pode ser ou não regular. Ex: escolaridade com
ordinal
categorias como nível (1, 2, 3), classe social (A, B, C,...).
Números inteiros, sem frações, como em contagens. Ex: número de
Discreta
filhos, idade (em anos completos).
Quantitativa Números que podem assumir valores fracionários. Normalmente têm
Contínua intervalo de valores conhecido, mas um conjunto infinito de valores
possíveis. Ex: estatura, peso.
12
Notas de aula – Professor Azamor Cirne
Média
Medidas de Posição Moda
Mediana
• Media Aritmética
A média e o numero total de valores de um conjunto de dados dividido pelo numero de valores.
Para populações, a média e normalmente representada pela letra grega μ, enquanto que para amostras,
usamos o símbolo x . O processo usado para determinarmos o valor da média de um conjunto de dados
x1, x2, x3,..., xn, depende da maneira como os dados estiverem agrupados. Se não houver qualquer
agregação, a média e dada por:
n
1
Para amostra → x xi , n = número de elementos da amostra
n i1
1 N
Para população → xi , N = número de elementos da população
N i1
Ex 01) Seja a amostra contendo o peso de 10 crianças de 5 anos de idade em kg: 23, 20, 22, 19, 25, 28,
24, 21, 27, 21.
13
Notas de aula – Professor Azamor Cirne
1 n 23 20 22 19 25 28 24 21 27 21
x xi = = 23 kg
n i1 10
b) Média Para Dados Tabelados Sem Intervalo de Classe: é a média é a média aritmética ponderada.
Os pesos são as frequências de cada valor.
n
xi f(xi )
i1 1 n
x = xi f(xi ) ; sendo:
n n i1
f(xi )
i1
n
xi f(xi )
i1 7,8 2 8,3 3 9,2 2 5,8 3
x = = 76,3/10 = 7,6
n 10
f(xi )
i1
c) Média Para dados Tabelados Com Intervalos de Classe: é a média é a média aritmética ponderada.
O valor da variável usado é o valor médio de cada classe e os pesos são os valores das frequências de
cada classe.
Altura (cm) X fi Xi ∙ fi
150 |--- 158 153,5 18 2763
158 |--- 166 161,5 25 4037,5
166 |--- 174 169,5 20 3390
174 |--- 182 177,5 52 9230
182 |--- 190 185,5 30 5565
190 |--- 198 194,5 15 2917,5
Σ= 160 = n 27.903
14
Notas de aula – Professor Azamor Cirne
n
xi f(xi )
i1 153,5 18 161,5 25 169,5 20 177,5 52 185,5 30 194,5 15
X = = 174,4
n 160
f(xi )
i1
Ex 03) Uma companhia tem cem empregados e um diretor. Cinquenta dos empregados ganham
$500,00 por mês, outros cinquenta ganham $600,00 e o diretor ganha $20.000,00. Para descrever a
distribuição dos salários, é melhor usar a média ou a mediana?
Este número dá uma ideia falsa da distribuição dos salários, pois ele é maior que os salários de
100 dos 101 funcionários. Esta distorção é devida ao salário do diretor, que é muito maior que a média
dos outros salários. Aqui a mediana, que é $600,00 fornece uma ideia melhor da distribuição de
salários. De fato, ela é próxima da média quando é descartado o salário do diretor, que neste caso é:
50 500 50 600
$550 ,00 , ou seja, aproximadamente $550,00.
100
A ideia a ser usada é que a mediana aproxima a média desde que sejam descartados valores
“atípicos”, isto é, valores isolados próximos dos extremos do intervalo de variação dos dados.
Equivalentemente, na presença de valores atípicos, a mediana fornece uma informação melhor do que
a média sobre a distribuição dos dados.
• Moda
É o valor que ocorre com maior frequência em uma distribuição.
Ex 01) Sejam as seguintes amostras com as suas respectivas medidas de tendência central:
15
Notas de aula – Professor Azamor Cirne
• Mediana (Md)
É o valor que divide uma distribuição ao meio.
A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma
da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores
extremos). A mediana é empregada quando
a) quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
b) quando há valores extremos que afetam de forma acentuada a média aritmética.
c) quando a variável em estudo for salários.
Observe que as medidas de tendência central pouco ou nada informam a respeito da dispersão
(variabilidade) dos dados.
Amplitude total
Variância
Medidas de Posição
Desvio Padrão (Erro Padrão)
Coeficient e de Variação
16
Notas de aula – Professor Azamor Cirne
Variância
A Variância é uma medida muito é mais utilizada para quantificar a variabilidade dos dados da
amostra (mede a dispersão desses valores em torno da média), pois ela é obtida usando-se todos os
dados da amostra e quanto menor o seu valor mais próximo os dados estão do seu valor médio.
A variância é representada por dois símbolos: 2 (letra grega sigma) para população e S2 para uma
amostra. As fórmulas para a variância da população e da amostra são apresentadas abaixo.
SQD 1 N
a) Para a População: 2 (xi )2
N N i1
SQD = soma dos quadrados dos desvios (diferença entre cada valor e a média)
2
N
1 N
(Xi ) N xi
2
1 N
2
1 N 1 N
i1 i 1
2
Ou: 2 (xi )2 xi (xi )2 x
N N i1 N i 1 N i 1
2
n
xi
n n i 1
( (xi )2 )
SQD 1 1
b) Para a Amostra: S2 (xi x)2
GL n 1 i 1 n 1 i 1 n
Graus de Liberdade (GL): de uma maneira geral, o número de graus de liberdade associados a uma
estatística é o número de elementos da amostra n, menos o número de parâmetros já estimados.
Existem n-1 desvios independentes (número de somas independentes lineares numa soma de
quadrados), e, é possível demonstrar que se utilizando o denominador n-1, obtém-se um estimador de
17
Notas de aula – Professor Azamor Cirne
medidas de dispersão quantificam de algum modo à variabilidade dos dados, geralmente utilizando
como referência uma medida de posição.
Desvio Padrão
Sendo a variância é uma medida que expressa um desvio quadrático médio. A unidade da
variância é a unidade dos dados originais ao quadrado. Para dados expressos em centímetros a
variância será expressa em centímetros quadrados. Para dados são medidos em R$ (Real), a variância é
dada em Real ao quadrado (R$2). Como medida de dispersão a variância tem a desvantagem de
apresentar unidade de medida igual ao quadrado da unidade dos dados observados. O Desvio padrão
vem contornar essa situação, pois sendo ele definido como a raiz quadrada da variância a sua unidade
de medida de variabilidade é a mesma unidade de medida original. Os desvios padrão da população e
da amostra são representados, respectivamente por σ (sigma) e S.
SQD
a) Para a População: 2
N
2
N
xi
N N i 1 N N
2
(xi )2
(xi ) N
2
(xi ) xi
2
i1 i1 i1 i 1
N N N N
2
N
xi
i1 2
Observe que o termo N corresponde à média ao quadrado ( X ) .
18
Notas de aula – Professor Azamor Cirne
2
n
xi
n n i 1
(xi x)2 (xi )2 n
SQD i1 i1
b) Para a Amostra: S S2 S
GL n 1 n 1
Ex 01) Considerando os dados da variância do exemplo anterior. Os desvios padrão das amostras M e
N são:
escolhido ao acaso ele terá uma grande chance de se encontrar no intervalo: X S X X S . Como
exemplo, se os dados da amostra M seguem uma distribuição normal 68,26% deles encontra-se no
intervalo: 5 1,8 X 5 1,8 , ou seja, entre os valores: 4,2 X 6,8 . Observe o gráfico de uma
distribuição normal e as porcentagens dos dados entre desvios padrão.
b) as amostras M e N tem médias iguais, mas como o desvio padrão da amostra M é menor do que o da
amostra N os valores da amostra M estão mais concentrados em torno do seu valor médio do que os da
amostra N.
19
Notas de aula – Professor Azamor Cirne
FÓRMULAS
a) Para dados dispostos sem distribuição de freqüência.
b) Para dados dispostos com distribuição de freqüência (fi) com ou sem intervalos de classe.
20
Notas de aula – Professor Azamor Cirne
Esse tipo de variável assume um número finito ou infinito numerável de valores distintos.
Sejam: “E” um experimento e “S” o espaço associado ao experimento. Uma função X, que
associe a cada elemento “s” “S” um número real X(s) é denominada Variável Aleatória (VA).
21
Notas de aula – Professor Azamor Cirne
Função de probabilidade
Em uma distribuição discreta de probabilidade é a função que associa a cada valor assumido pela
variável aleatória a probabilidade do evento correspondente, isto é:
Distribuição de probabilidade
Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabilidades
correspondentes.
O conjunto das variáveis e das probabilidades correspondentes é denominado distribuição de
probabilidades, isto é:
{ ( x i , p (x i), I = 1, 2,…,n }
a) Valor Esperado (Esperança Matemática) E(X) → O valor esperado ou esperança de uma variável
aleatória X é um número real que representa uma média aritmética. E(X) (lê-se: valor esperado da
variável aleatória X)
b) E(x) x p( x )
A esperança matemática é somatório dos produtos de cada valor assumido pela variável aleatória pela
sua respectiva probabilidade.
22
Notas de aula – Professor Azamor Cirne
E[( x x)2 ] . A simbologia E[( x x)2 ] significa: o valor esperado da variável aleatória ( X X ) 2 .
Matematicamente a variância é definida como:
Observação: A variância de uma variável qualquer mede a sua dispersão em torno de seu valor médio.
1
a) VAR(x) E[(x x)2 ]
N
(x x)2 , ou:
1
b) VAR(X) (x)2 (x)2
N
A fórmula acima pode ser interpretada como: o somatório dos produtos da probabilidade de cada
variável aleatória pela diferença entre o valor dessa variável e a média das variáveis. A variância de
uma variável aleatória unidimensional também pode ser obtida a partir a equação abaixo:
sendo: E(X2 ) X2 P( X ) (somatório do valor esperado da variável aleatória ao quadrado pela sua
respectiva probabilidade).
Demonstração:
Var( X ) E[( x x )2 ] E[ ( x 2 2 x x x 2 ]
Var( X ) E[( x x )2 ] E[ ( x 2 2 x E(x) (E(x))2 ]
Var( X ) E( x 2 ) E( 2 X E(x) ) E[ (E(x) )2 ]
Var( X ) E( x 2 ) 2E( X) E(x) ) (E(x) )2
Var( X ) E( x 2 ) 2 (E(x) )2 (E(x) )2
Var( X ) E( x 2 ) (E(x) )2
DP(X) Var(X)
Propriedades da Variância:
Para a e b denotando constantes e X uma VA,
1) Var(X) não pode ser negativa
2) Var (X + a) = Var(X)
3) Var (b·X) = b2·Var(X)
4) Var (a + b·X) = b2·Var(X)
Ex 01) Calcule a média e a variância e o desvio padrão utilizando as diversas fórmulas: para a VA:
X = {2, 3, 3, 4}.
Solução: primeiramente vamos montar um quadro de distribuição (variável aleatória e respectiva
probabilidade):
X P(X)
2 1/4
3 2/4 = 1/2
4 1/4
Σ=1
• Cálculo da Média:
1
E(X) X x = 1/4 (2 + 3 + 4) = 3 ; Ou
N
24
Notas de aula – Professor Azamor Cirne
● Cálculo da Variância:
• primeiro modo:
1 1
Var(X)
N
(x x)2 4 [(2 3)2 (3 3)2 (3 3)2 (4 3)2 ] = 1/4(1+0+0+1) = 2/4 =1/2 = 0,5
• segundo modo:
1 1 1
Var(X) (x)2 (x)2 [22 3 2 3 2 4 2 ] 3 2 [4 9 9 16] 9 = 1/4(38) – 9 = 9,5-9 = 0,5
N 4 4
Observação: calcular a variância através dos dois primeiros modos só é possível se soubermos N (o
número total de vezes que todas as variáveis aparecem).
X P(X) (X X ) 2 ( X X ) 2 · P(X)
0 1/4 1 1·1/4 = 1/4
1 1/2 0 0·1/2 = 0
2 1/4 1 1·1/4 = 1/4
Σ 1 1/2 = 0,5
2 Var(X) E( X2 ) (E( X ))2 = [(0)2 (1/4) + (1)2 (1/2) + (2)2 (1/4)] – 12 = 0,5
25
Notas de aula – Professor Azamor Cirne
Ex 03) Uma seguradora paga $30.000,00 em caso de acidente de carro e cobra uma taxa de $1.000,00.
Sabe-se que a probabilidade de que um carro sofra um acidente é de 3%. Quando espera a seguradora
ganhar por cada carro segurado?
Solução: Seja X: “lucro” por carro e E(X) = lucro médio por carro
X P(X) X · P(X)
1000 0,97 970
-29000 0,03 - 870
Σ=1 E(X) = Σ x · P(x) = 100
Ex 05) A tabela abaixo mostra a distribuição de freqüência de um teste realizado com 150 indivíduos
para avaliar uma determinada característica. Calcule o valor esperado, a variância e o desvio padrão da
variável aleatória X.
Característica X 1 2 3 4 5
Frequência f(X) 24 33 42 30 21
Solução:
Distribuição de probabilidade é:
X 1 2 3 4 5
P(X) 0,16 0,22 0,28 0,20 0,14
Ex 06) O retorno mensal de certo investimento de risco é mostrado na tabela abaixo. Calcule o retorno
esperado em (%) do investimento, sua variância e seu desvio padrão.
X -5% 0% 5% 10% 15%
P(X) 0,40 0,15 0,25 0,15 0,05
Ex 07) Calcule a média variância e desvio padrão para cada um dos investimentos a e B e calcule a
covariância entre esses investimentos.
Retorno por cada $1.00,00
Condição Econômica P(X)
Investimento A Investimento B
Recessão 0,2 - $100,00 - $200,00
Estável 0,5 $100,00 $50,00
Expansão 0,3 $250,00 $350,00
•Para A:
E(A) = 0,2(-100) + 0,5(100) + 0,3(250) = $105,00
Var(A) = σ2A = (0,2)(-100-105)2 + (0,5)(100-105)2 + (0,3)(250-105)2 = 14.725,00 ; σA = 121,35
•Para B:
E(B) = 0,2(-100) + 0,5(100) + 0,3(250) = $90,00
Var(B) = σ2B = (0,2)(-200-90)2 + (0,5)(50-90)2 + (0,3)(350-90)2 = 37900,00 ; σB = 194,67
Ex 09) A tabela abaixo mostra a distribuição de probabilidade, calcule: o valor esperado, a variância e
o desvio padrão.
X 0 1 2 3 4 5 6 7
P(X) 0,210 0,367 0,275 0,115 0,029 0,004 0,000 0,000
Solução:
X P(X) X · P(X) X2 X2 · P(X)
0 0,210 0,000 0 0,000
1 0,367 0,367 1 0,367
2 0,275 0,550 4 1,100
3 0,115 0,345 9 1,035
4 0,029 0,116 16 0,464
5 0,004 0,020 25 0,100
6 0,000 0,000 36 0,000
7 0,000 0,000 49 0,000
Σ 1 1,398 --- 3,066
E(X) = 1,398
σ2 = Var(X) = E[(X – E(X))2] = E[(X)2] – [E(X)]2 = 3,066 – (1,398)2 = 1,112
σ = DP = (1,112)1/2 = 1,054
28
Notas de aula – Professor Azamor Cirne
Ex 01) Considere que o tempo t, em minutos, necessário para um funcionário processar operação,
sendo ‘T’ uma variável aleatória discreta com a sua respectiva (tabela abaixo), calcule o tempo médio
e a variância de processamento.
T 2 3 4 5 6 7
P(T = t) 0,1 0,1 0,3 0,2 0,15 0,15
Esse tipo de variável assume um número infinito não numerável de valores distintos. Através do
histograma e possível ter uma ideia da distribuição de probabilidade associada a uma variável aleatória
continua X. Se subdividirmos o histograma em barras de largura = 1 unidade, a probabilidade P(c ≤ x
≤ d) e dada pela área abaixo do histograma entre X = c e X = d.
A variável aleatória X e uma variável aleatória contínua e f(x) e sua função densidade de
probabilidade. Veja o exemplo abaixo.
Ex 01) Uma pesquisa revelou a seguinte distribuição de probabilidades para o aluguel de um carro em
função da sua idade.
29
Notas de aula – Professor Azamor Cirne
O histograma desta distribuição, a esquerda na figura abaixo, sugere uma curva como a que e
apresentada na figura da direita. Esta curva e a chamada “função densidade de probabilidade”.
Observando a figura seguinte, nota-se que poderíamos obter o mesmo resultado somando as
áreas correspondentes as barras desde que estas tenham 1 unidade de largura.
A curva de densidade de probabilidade deve ser tal que a área por ela delimitada para 0 x 4 seja
igual a:
4
P(0 x 4) f ( x ) dx 0,83
0
Poderíamos estimar o valor pretendido tomando metade do retângulo entre 0 e 4 (ver figura).
30
Notas de aula – Professor Azamor Cirne
7
No caso acima: P ( 0 x 7) f ( x ) dx 1
0
3,5
Ou então: P ( 2 x 3,5) f ( x ) dx 1
0
31
Notas de aula – Professor Azamor Cirne
Ex 01) O quadro abaixo faz referência ao tempo de serviço (Y) e ao respectivo salário (X) de dez
operários. Determinar a distribuição conjunta de probabilidade. (exemplo do livro:?)
Operário A B C D E F G H I J
X 5 6 6 8 8 8 7 7 7 6
Y 6 5 6 4 6 6 5 6 6 5
Y Para X
4 5 6
X Probabilidade Marginal
5 0 0 1/10 0 + 0 + 1/10 = 1/10
6 0 2/10 1/10 0 + 2/10 + 1/10 = 3/10
7 0 1/10 2/10 0 + 1/10 + 2/10 = 3/10
8 1/10 0 2/10 1/10 + 0 + 2/10 = 3/10
Para Y
1/10 3/10 6/10 1
Probabilidade Marginal
P(X=50 , Y=4) = 0 ; P(X = 60 , Y = 5) = 2/10 (2 dentre 10 que ganham $60,00 e tem 5 anos)
32
Notas de aula – Professor Azamor Cirne
•Para X
1 1
Var(X)
N
(x x)2 10 [1 (5 6,8)2 3 (6 6,8)2 3 (7 6,8)2 3 (8 6,8)2 ] →
1
Var(X) [3,24 1,92 0,12 4,32] → σ2X = 1/10 (96) = 9,6 ; DPx 9,6 = 0,9798
10
Ou:
1 3 3 3 2
E[( X X )2 ] E( X2 ) [E(X)]2 = Var(X) [52 62 72 82 ] - 6,8 = 47,20 – 46,24 = 0,960
10 10 10 10
•Para Y
1 1
Var(Y)
N
(y y)2
10
[1 (4 5,5)2 3 (5 5,5)2 6 (6 5,5)2 ] →
1
Var(Y) [2,25 0,75 1,5] → σ2Y= 1/10 (4,5) = 0,45 ; DPx 0,45 = 0,6708
10
Ou:
1 3 6 2
E[( Y Y )2 ] E( Y 2 ) [E(Y)]2 = Var(Y) [42 52 62 ] - 5,5 = 30,70 – 30,25 = 0,45
10 10 10
Covariância
O grau de dispersão conjunta e de associação linear entre duas variáveis aleatórias podem ser
avaliados pela covariância e pelo coeficiente de correlação.
A covariância e a correlação são instrumentos estatísticos utilizados para verificar a dependência
entre variáveis aleatórias.
A covariância é uma medida estatística que serve para avaliar se duas séries se movem juntas.
Quando covariância é positiva, as variáveis se movem juntas (se uma aumenta a outra também
aumenta) e, quando é negativa se movem em direções opostas (se uma aumenta a outra diminui).
A covariância é uma esperança sendo ela o valor esperado da variável aleatória [
(X E(X)) (Y E(Y)) ].
33
Notas de aula – Professor Azamor Cirne
1 X Y , ou:
b) Cov(X,Y)
N
(X Y)
N
c) Cov(X,Y)
1
(X Y)
X Y
1
(X Y) X Y , ou
N N N N
Demonstração:
1 N 1 N
Cov (X,Y) = [(x x) (y y)] → Cov (X,Y) = [x y x y x y x y]
N i 1 N i 1
1 N N N N 1 N N N
Cov (X,Y) = ( x y x y x y x y ) → Cov (X,Y) = ( x y y x x y N x y)
N i 1 i 1 i 1 i 1 N i 1 i 1 i 1
1 N 1 N
Cov (X,Y) = [( x y) y N x x N y N x y] → Cov (X,Y) = [( x y) 2 N x y N x y]
N i 1 N i 1
1 N 1 N
Cov (X,Y) = [( x y) N x y] → Cov (X,Y) = [( x y) x y
N i 1 N i 1
● Quando se dispõe das probabilidades conjuntas P(X,Y), a covariância pode ser calculada como:
Demonstração:
Cov(X,Y) = E[(X – E(X))· (Y - E(Y))] = E[(X Y – X·E(Y)) – E(X)·Y + E(X)·E(Y)]
Cov(X,Y) = E(X·Y) – E(X)·E[E(Y)] – E[E(X)]·E(Y) + E[E(X)·[E(Y)]
Cov(X,Y) = E(X·Y) – E(X)·E(Y) – E(X)·E(Y) + E(X)·E(Y)
Cov(X,Y) = E(X·Y) – E(X)·E(Y)
34
Notas de aula – Professor Azamor Cirne
Observação: Duas variáveis aleatórias são independentes se para todo par (xi,yi) a probabilidade
conjunta é igual ao produto das probabilidades marginais:
P(X = xi, Y= yi) = P(X = xi) · P(Y = yi)
Ex 01) A partir da distribuição conjunta (abaixo) de duas variáveis aleatórias discretas X e Y, pede-se:
a) probabilidade conjunta de X = 1 e Y = 2 ; b) probabilidade marginal de X = 1
c) probabilidade condicional de Y = 2 dado que X = 1 ; d) covariância entre essas variáveis
X
0 1 2
Y
1 3/20 3/20 2/20
2 1/20 1/20 2/20
3 4/20 1/20 3/20
Solução:
X
0 1 2 P(Y) marginais Y · P(Y)
Y
1 3/20 3/20 2/20 8/20 8/20
2 1/20 1/20 2/20 4/20 8/20
3 4/20 1/20 3/20 8/20 24/20
P(X) marginais 8/20 5/20 7/20 1 E(Y) = Σ = 40/20 = 2
X · P(X) 0 5/20 14/20 E(X) = Σ = 19/20
35
Notas de aula – Professor Azamor Cirne
19 3 19 3 19 2
Cov (X, Y) (0 ) (1 2) (1 ) (1 2) (2 ) (1 2)
20 20 20 20 20 20
19 1 19 1 19 2 19 4
( 0 ) ( 2 2) (1 ) (2 2) (2 ) (2 2) (0 ) (3 2)
20 20 20 20 20 20 20 20
19 1 19 3
(1 ) (3 2) (2 ) (3 2) 0
20 20 20 20
i) cálculo de E(XY). Deve-se para cada valor do quadro (para cada dupla de valores de X e Y)
calculamos o valor do produto XY e multiplicar pela respectiva probabilidade conjunta.
E(XY) = (0) (1) (3/20) + (1) (1) (3/20) + (2) (1) (2/20) + (0) (2) (1/20) + (1) (2) (1/20) +
+ (2) (2) (2/20) + (0) (3) (4/20) + (1) (3) (1/20) + (2) (3) (3/20) = 1,9
Y
0 1 2 3
X
0 1/8 2/8 1/8 0
1 0 1/8 2/8 1/8
Solução:
36
Notas de aula – Professor Azamor Cirne
Y
0 1 2 3 P(X) X · P(X) X2 · P(X)
X
0 1/8 2/8 1/8 0 4/8 0 0
1 0 1/8 2/8 1/8 4/8 4/8 4/8
2
P(Y) 1/8 3/8 3/8 1/8 1 E(X) = 0,5 E(X ) = 0,5
Y · P(Y) 0 3/8 6/8 3/8 E(Y) = 1,5
Y2 · P(Y) 0 3/8 12/8 9/8 E(Y2) = 3
P(X = 0, Y = 0) = 1/8
P(X = 0) = 4/8 e P(Y = 0) = 1/8
P(X = 0, Y = 0) ≠ P(X = 0) · P(Y = 0) = não são independentes.
a) E(X) = 0,5
b) Var(X) = E(X)2 – [E(X)]2 = 0,5 – (0,5)2 = 0,25
c) E(Y) = 1,5
d) Var(Y) = E(Y)2 – [E(Y)]2 = 3 – (1,5)2 = 0,75
e) Cov(X,Y) = E(X·Y) – E(X) · E(Y) = 1 – (0,5) · (1,5) = 0,25
Solução:
37
Notas de aula – Professor Azamor Cirne
Observação: Se todos os valores de probabilidade conjunta forem iguais aos produtos das
probabilidades marginais significa que as variáveis são independentes (equação abaixo).
P(X xi , Y yj) P( xi ) P( yj)
Se pelo menos um valor de probabilidade conjunta for diferente do produto das probabilidades
marginais, caracteriza dependência entre as variáveis. No exemplo todos os produtos foram diferentes.
Ex 05) Calcule: média, variância, desvio padrão para cada um dos investimentos a e B e calcule a
covariância entre esses investimentos.
Retorno por cada $1.00,00
Condição Econômica P(X)
Investimento A Investimento B
Recessão 0,2 - $100,00 - $200,00
Estável 0,5 $100,00 $50,00
Expansão 0,3 $250,00 $350,00
38
Notas de aula – Professor Azamor Cirne
a) as distribuições marginais de X e Y
b) E(X), E(Y) e E(XY) Resposta: 1,4 ; 1,0 ; 0,9
a) as distribuições marginais de X e Y
Resposta: P(X=0) = 0,50; P(X=1) = 0,32; P(X=2) = 0,18;
Resposta: P(Y=0) = 0,20; P(Y=1) = 0,33; P(Y=2) = 0,47;
b) E(X), E(Y) e E(XY) Resposta: 1,27 ; 0,68 ; 0,86
c) covariância entre X e Y Resposta: -0,0036
d) variância de X e de Y Resposta: 0,5975 ; 0,5776
e) Desvios padrão de X e de Y Resposta: 0,7727 ; 0,76
e) verifique se as variáveis são independentes
39
Notas de aula – Professor Azamor Cirne
a) as distribuições marginais de X e Y
b) E(X), E(Y) e E(XY)
c) variância de X e de Y
d) covariância entre X e Y
e) verifique se as variáveis são independentes
a) as distribuições marginais de X e Y
b) E(X), E(Y) e E(XY)
c) variância de X e de Y
d) covariância entre X e Y
e) verifique se as variáveis são independentes
Correlação
Em diversas investigações deseja-se avaliar a relação entre duas medidas quantitativas. Por
exemplo: alturas de filhos relacionadas com as alturas dos seus pais; receita e despesa; salário e
consumo; renda e poupança, aquecimento global e desgelo; taxa de financiamento e volume de venda;
investimento em propagando e volume de venda.
40
Notas de aula – Professor Azamor Cirne
c) para descrever a relação entre variáveis. (dado um aumento específico numa variável, qual o
crescimento médio esperado para a segunda variável?)
A covariância não é muito utilizada para medir a associação linear entre variáveis, pois o
universo de valores que pode assumir é imenso podendo assumir valores negativos ou positivos e a sua
unidade é de difícil compressão. Para contornar essa situação estabeleceu-se o coeficiente de
correlação linear (r para amostra e para população) para medir a associação entre variáveis. Esse
fator tem a vantagem de ser adimensional (sem unidade) situar no intervalo: 1 r 1 . Esse fator é
definido matematicamente como:
Ex 01) A partir a tabela de distribuição conjunta, calcule o coeficiente de correlação entre as variáveis
X e Y.
X
5 10 15 P(Y)
Y
5 1/10 2/10 1/10 4/10
10 2/10 3/10 1/10 6/10
P(X) 3/10 5/10 2/10 1
41
Notas de aula – Professor Azamor Cirne
• Cálculo da Covariância:
Cov (X, Y ) E[( X X ) (Y Y )] (X X ) (Y Y )) P(X, Y)
= (5 – 9,5) (5-8) (1/10) + (10 – 9,5) (5-8) (2/10) + ...+ (15 – 9,5) (10-8) (1/10) = – 1
Ou ainda:
Cov (X, Y) E(X Y) E(X) E(Y) (X Y) P(X, Y) E(X) E(Y)
= [(5) (5) (1/10) + (5) (10) (2/10) + (5) (15) (1/10) + (10) (5) (2/10) + (5) (10) (3/10) +
+ (10) (1) (1/10)] – (9,5) (8) = – 1
42
Notas de aula – Professor Azamor Cirne
01) Seja (X,Y) uma variável aleatória bidimensional discreta com a distribuição conjunta dada na
tabela abaixo. Pede-se:
a) E(X); b) Var(X); c) σ(X); d) E(Y); e) Var(Y); c) σ(Y); d) Cov(X,Y); e) ρ(X,Y)
X
-3 2 4
Y
1 0,1 0,2 0,2
3 0,3 0,1 0,1
02) Calcular o coeficiente de correlação das questões 01, 02, 03 e 04 do item anterior referente a
covariância.
43
Notas de aula – Professor Azamor Cirne
FUNÇÕES
As funções servem para relacionar grandezas. Por grandeza entendemos tudo que pode ser
medido pesado ou contado. Observamos assim que estamos rodeados por grandezas e vivemos num
mundo de grandezas.
Em todas as ciências e no nosso cotidiano procura-se sempre saber como uma grandeza varia em
função de outra grandeza. Por exemplo:
a) qual o preço P a ser pago pela quantidade de litros (L) de combustível que um caro foi abastecido.
b) o preço P a ser pago em restaurante em função da quantidade (Q) de comida colocada no prato.
c) em uma viagem desejamos saber o tempo gasto (t) em função da velocidade (v).
d) o custo de produção (C) de um determinado produto é função da quantidade (q) de unidades
produzidas.
e) a quantidade de produtos vendidos (quantidade demandada) é uma função do preço (p) do produto.
f) pacotes turísticos vendidos para o exterior é uma função do dólar.
As funções são representadas por equações matemáticas que expressam quantitativamente como
uma grandeza varia em função de outra. Por exemplo:
a) y = 2 ∙ x. Esta equação está mencionando que a grandeza y corresponde a duas vezes a grandeza x.
b) P = 2,5 ∙ L. P é o preço pago pela quantidade de litros L colocados no tanque. O preço por cada litro
$2,50. Observe que se não colocarmos nenhum litro pagaremos: P = 2,5 ∙ 0 = $0,0. Se colocarmos um
litro, pagaremos: P = 2,5 ∙ 1 = $2,5 e assim por diante. O preço pago é uma função da quantidade de
litros.
Outro exemplo que podemos citar é a função custo total (Ct). Essa função é composta de duas
partes, a saber: a primeira é o custo fixo e a segunda é o custo variável que está ligado ao número de
unidades produzidas. A equação do custo total é representada analiticamente da seguinte forma:
Ct = a + b ∙ x
a = representa o custo fixo
b = representa o custo para produzir uma unidade
x = representa a quantidade de peças produzidas
44
Notas de aula – Professor Azamor Cirne
Sendo o custo total uma função da quantidade de peças produzidas, observe que, quanto maior a
quantidade de unidades produzidas maior o custo total.
Este tipo de função em que quando se aumenta o valor de uma grandeza o correspondente valor
da outra grandeza também aumenta é chamada de função crescente.
Uma função que relaciona a quantidade demandada e preço de uma mercadoria é denominada
função demanda. A função demanda pode ser representada como:
D=a-b∙P
a e b são valores
P representa o preço do objeto ou serviço
Como exemplo dessa função, podemos citar: D = 80 - 5 ∙ P. Nesta equação observe que, quanto maior
for o preço do produto menor será a quantidade demandada, ou seja, quando se aumenta o valor de P o
correspondente valor de D diminui. Este tipo de função em que quando se aumenta o valor de uma
grandeza o correspondente valor da outra grandeza diminui é chamada de função decrescente.
Gráficos de Funções
O termo variável significa uma grandeza que varia, assumindo diversos valores. O termo
constante significa valores fixos.
45
Notas de aula – Professor Azamor Cirne
A função oferta relaciona o preço e quantidade oferecida de uma mercadoria e essa função
reflete o comportamento do produtor, pois quanto mias o preço sobe, existem mais produtores
interessados em colocar no mercado quantidades cada vez maiores de seu produto, no entanto se o
preço cai a oferta diminui. A função oferta é uma função crescente, pois, na medida em que a
quantidade Q aumenta o preço P também aumenta.
46
Notas de aula – Professor Azamor Cirne
A função demanda é uma função decrescente, pois, na medida em que a quantidade Q aumenta o
preço P diminui e vice-versa.
Interseção de Retas
Considere a função linear receita total: RT = 2.q e a função custo total: CT = 2 + q, definida no
intervalo: 0 ≤ q ≤ 4. A representação gráfica dessas duas funções está na figura abaixo. Observe que
ambas as funções são crescentes e que elas se cruzam e m um determinado ponto. Esse ponto é
chamado de interseção, pois elas se interceptam nesse ponto. Para essas duas curvas esse ponto é
denominado ponto de nivelamento (alguns autores denominam ponto de equilíbrio), ou seja, onde a
receita se nivela (equilibra) com a despesa.
47
Notas de aula – Professor Azamor Cirne
pelas equações das duas retas. Se a receita é igual à despesa, então, para acharmos o valor de “qe”
basta igualar as duas equações.
Rt 2 q
Ct 2 q
No equilíbrio tem-se: Rt = Ct → 2q = 2 + q → 2q – q = 2 → q = 2 = qe
Para se determinar o valor “pe" basta substituirmos o valor de “qe” em qualquer uma das duas
equações:
Rt = 2 (2) = 4 ou
Ct = 2 + 2 = 4
assim, as coordenadas do ponto de nivelamento são: (2,4).
48
Notas de aula – Professor Azamor Cirne
Uma das preocupações para quem analisa variações entre grandezas como as exemplificadas
acima é a de criar modelos matemáticos que explicitem estruturas do fenômeno em observação, ou
seja, como uma grandeza varia em função de outras.
A análise de regressão e de correlação é uma técnica estatística que tem objetivo estudar o
comportamento entre duas ou mais variáveis relacionadas de forma não determinística. Essas análises
estudam a forma como uma variável aleatória Y (chamada variável dependente, variável resposta ou
variável explicada) se comporta na presença de outras variáveis X (chamadas variáveis independentes,
explicativas ou regressores).
49
Notas de aula – Professor Azamor Cirne
Tanto a análise regressão como a de correlação analisam dados amostrais com o intuito de
verificar como duas ou mais variáveis estão relacionadas uma e alastrar essa informação para a
população. A análise de regressão pode ter os seguintes propósitos:
a) o propósito explicativo tenta demonstrar uma relação matemática que pode indicar, mas não prova
uma relação de causa-efeito.
b) o propósito preditivo tenta estimar ou predizer valores futuros da variável dependente atribuindo
valores a(s) variável(eis) independente(s). Em áreas, como administração, economia, pesquisa médica,
agronomia e engenharias o interesse maior está na predição.
Se suspeitarmos a existência uma relação de causa e efeito entre duas variáveis, os modelos de
regressão tentam explicar valores de uma variável em termos de outra. Portanto, a análise de regressão
apenas indica qual relacionamento matemático pode existir, se existir algum. Em outras palavras, nem
a regressão nem a correlação podem mostrar que uma variável tenda a "causar" certos valores de outra
variável. A explicação de uma relação causal deve ser proveniente das teorias referentes ao fenômeno
em estudo e não da estatística.
A análise de regressão é uma ferramenta que pode ser aplicada a qualquer área do conhecimento
tais como: administração, economia, agricultura, pesquisa médica etc. Algumas aplicações da análise
de regressão são:
a) nos processos de gestão de custos e preços, análise de regressão e correlação possibilita uma série de
insights úteis no processo de geração de informações e tomada de decisões.
50
Notas de aula – Professor Azamor Cirne
b) pode-se, por exemplo, analisar o comportamento volumétrico dos custos – identificando custos
fixos e variáveis – sem, necessariamente, ser preciso efetuar uma classificação de cada gasto.
c) utilização conjunta de técnicas de regressão e correlação nas análises relativas aos orçamentos,
como, por exemplo, estimativa de vendas, custos e preços futuros.
Modelos de Regressão
Os modelos e regressão expressam o relacionamento entre variáveis e vários são os possíveis
tipos de relacionamentos entre elas. A figura abaixo mostra alguns tipos de comportamento entre
variáveis.
O relacionamento pode ser do tipo linear e não linear. Um modelo é dito linear nas variáveis se
os expoentes das variáveis forem do primeiro grau. A equação representativa do modelo linear é:
Y 1X1 2 X 2 3 X 3 ... n Xn
Y = variável dependente (explicada, resposta, prevista: regressando, saída, efeito).
X = variável independente (explicativa, de controle, preditor, regressor, entrada, causa).
= erro (ruído, distúrbio).
Obs.: a variável é dita explicativa por tentar explicar as variações de Y.
O modelo é dito linear simples quando envolve apenas duas variáveis. A sua representação é:
51
Notas de aula – Professor Azamor Cirne
O caso mais simples do modelo linear múltiplo é o caso de uma variável dependente e duas
variáveis independentes, a sua representação é:
Y = + b1X1 + 2X2 + , (equação de um plano)
Os modelos não lineares (múltipla) são representados por equações: exponencial, geométrica,
parabólica, hiperbólica, etc.). Esses modelos também podem ser do tipo simples quando envolve
apenas duas variáveis ou múltipla quando envolve uma variável dependente de duas ou mais variáveis
independentes.
52
Notas de aula – Professor Azamor Cirne
(Observações Iniciais)
REGRESSÃO LINEAR SIMPLES
O estudo aqui realizado sobre Regressão Linear Simples (RLS) não aborda a problemática em
toda a sua complexidade, pelo fato de apresentar-se este material como tópico de um curso introdutório
aos Métodos Quantitativos. Os conceitos e exemplos aqui estudados dão uma boa noção do assunto,
porém, um estudo mais aprofundado escaparia aos objetivos do programa e comprometeria o
ensinamento de outros tópicos.
Em um estudo mais completo sobre Análise de Regressão Simples, os pressupostos do Modelo
(abaixo descritos) deveriam ser validados, bem como a avaliação do modelo.
O erro “e” é diferença entre o valor Yi da amostra e o valor Yi estimado pela regressão. O erro é uma
variável aleatória e é matematicamente definido como:
e (Yi Yi ) =
Y = variável explicada
X = variável explicativa
• Pressuposto 2 – O termo erro “e” tem média zero:
E(e) 0 E(Y) E( x ) E( x) E() x 0
53
Notas de aula – Professor Azamor Cirne
• Pressuposto 6 – (não necessário) – O erro tem distribuição normal com média zero e variância 2 :
55
Notas de aula – Professor Azamor Cirne
Nos modelos de regressão linear simples procura-se determinar uma equação do tipo
Y a b X . Sendo Y é a variável dependente e X a variável independente responsável pela variação
de Y.
A utilização do método dos mínimos quadrados (MMQ) permite determinar os valores dos
parâmetros “a” e “b”. São modelos matemáticos que relacionam o comportamento de uma variável Y
com outra X. Para isso suponha que se tenha coletado “n” pares de valores das variáveis:
{(x1,y1), (x2,y2), ...(xn, yn)}, desejando-se obter uma equação de Y em função de x. Passos a serem
seguidos:
a) plotar esses pares de pontos em um sistema gráfico e verificar a tendência do comportamento desses
pares de pontos. A nuvem de pontos (x,y) disposta no gráfico é chamada de diagrama de dispersão. O
Diagrama de Dispersão é uma maneira simples de se verificar a tendência de uma correlação caso ela
exista.
b) neste caso escolhe-se a regressão como sendo linear, pois, observa-se que uma reta seria a melhor
forma para representar a variação de Y em função de X (Y F( x ) ) (gráfico abaixo).
O erro amostral é uma variável aleatória não observáve, e é estimado pelçosa resíduos, ous seja, pela
diferença entre o valor observado e o o valor estimado pela regressão.
56
Notas de aula – Professor Azamor Cirne
c) observa-se que existe uma diferença entre o valor de Y fornecido pela equação da reta (calculado) e
o valor observado correspondente a um Xi qualquer - essa diferença é chamada de erro (em
econometria seria chamada de ruído) e representamos como ε.
O Método dos Mínimos Quadrados (MMQ) fornece o procedimento de obtenção dessa reta de
regressão de modo que esses erros sejam os mínimos possíveis.
O erro “ε” pode ser definido como a diferença entre o valor calculado ( Y ) e o valor obtido nas
observações (no experimento ou na amostra) (Y). Esse erro pode ser negativo ou positivo e
matematicamente pode ser representado como:
YY
Y = valor observado
Y = valor calculado através da reta
Yi Yi i
O método dos mínimos quadrados (MMQ) preconiza que a soma de todos esses erros seja
mínima. Como a reta de regressão passa pelos pontos médios, a soma dos valores dos erros dos pontos
que estão acima da reta é numericamente igual à soma dos erros dos pontos que estão abaixo da reta,
porém com sinal contrário. Se efetuarmos a soma algébrica o resultado seria zero e não
57
Notas de aula – Professor Azamor Cirne
conseguiríamos constituir equações de modo a poder obter os parâmetros da reta, ou seja, o coeficiente
angular e o coeficiente linear (intercepto). A solução encontrada foi minimizar a soma dos quadrados
dos erros.
Procedimento (formulação) para obtenção dos parâmetros da reta. Suponha que a reta seja
( i ) 2 [Y i (a b Xi )] 2
n n
( i )2 [Yi (a b Xi)]2
i1 i1
n
Chamemos ( i ) 2 de Qe para facilitar o desenvolvimento. Observemos que Qe depende de a e de
i 1
Qe
2 X( Y a b X)
b
Qe Qe
Para que Qe seja mínimo devemos fazer e iguais à zero, então:
a b
0 2 ( Y a b X ) ( Y a b X ) 0
0 2 X( Y a b X) X( Y a b X) 0
Ou equivalente,
Y n a b X (I)
X Y a X b X2 ( II )
O passo seguinte será resolver o sistema formado pelas equações (I) e (II) para obter as expressões
para a e para b:
58
Notas de aula – Professor Azamor Cirne
Na equação (I) dividiremos ambos os membros por n (número de pontos) e lembrando que:
Y Y
n
b X
bX
n
Então:
Y
n a b X
Y a b X , ou
n n n
a Y bX (III)
X Y (Y b X) X b X2
X Y Y X b X X b X2
Y X
XY n
X b n
X b X2
Y 2 ( X)
2
XY X b X
n n
YX
XY n n XY Y X
b
( X)2 n X2 ( X)2
X2
n
Denominando:
( X)2
Sxx (X X)2 X2 n
YX
Sxy (X X) (Y Y) X Y n
A partir dos resultados acima os valores de “a” (intercepto) e “b” (coeficiente angular) são obtidos
como:
Sxy
b (IV)
Sxx
a Y bX (V)
Ŷ a b X (VI)
59
Notas de aula – Professor Azamor Cirne
Coeficiente de Correlação
O coeficiente de correlação é um número que expressa uma medida numérica do grau de relação
linear encontrada. Esse tipo de análise é muito útil em trabalhos exploratórios em várias áreas do
conhecimento, quando se procura determinar as variáveis potencialmente importantes. Para
calcularmos a correlação utilizaremos a seguinte fórmula:
Cov(X,Y)
x y
( X) ( Y)
XY n
rx,y , ou
2 ( X)
2 2 ( Y)
2
X Y
n n
n X Y ( X) ( Y)
rx,y
[n X2 ( X)2 ] [n Y 2 ( Y)2 ]
a) quanto mais próximo r estiver de + 1, mais próximo estarão os pontos de ajuste integral de uma reta
crescente;
b) quanto mais próximo r estiver de -1, mais próximos estarão os pontos de ajuste integral a uma reta
decrescente;
c) se r = 0, não existe nenhuma relação numérica linear para os pares de valores da amostra analisada.
60
Notas de aula – Professor Azamor Cirne
Correlação Positiva
Quando o valor do coeficiente de correlação estiver no intervalo: 0 < r < 1.
Correlação Negativa
Quando o valor do coeficiente de correlação estiver no intervalo: -1 < r < 0.
Correlação Nula
A correlação é nula quando não há relação ente x e y. As variáveis são independentes e o r = 0.
61
Notas de aula – Professor Azamor Cirne
62
Notas de aula – Professor Azamor Cirne
(Y Y)2 = (SQE) = soma dos quadrados dos erros (variação não explicada)
(Y Y)2 = (SQR) = soma dos quadrados da regressão (variação explicada pela regressão)
O coeficiente de determinação para a Regressão Linear Simples (RLS) pode ser calculado como:
R2
SQR
(Y Y)2
SQT (Y Y)2
( X)2
b2 X2
n b2 (n X2 ( X)2 )
2) R2 =
2 ( Y)
2 n Y 2 ( Y)2 )
Y
n
Se R 2 r 2 → r R2
n = quantidade de dados
k = quantidade de variáveis independentes
64
Notas de aula – Professor Azamor Cirne
Ex 01) Considere o conjunto de pares ordenados (X,Y) na tabela abaixo. Através do método dos
mínimos quadrados (MMQ).Pede-se:
a) gráfico de dispersão b) equação de regressão c) coeficiente de correlação e de determinação
n X Y
1 1 1
2 2 1,5
3 3 3,5
4 4 4
• gráfico de Dispersão:
X
X = 10/4 = 2,5; Y
Y =10/4 = 2,5
n n
65
Notas de aula – Professor Azamor Cirne
• cálculo de a (intercepto):
10 10
a Y b X = 1,1 = - 0,25
4 4
n X Y ( X) ( Y)
primeiro modo: rx,y
[n X2 ( X)2 ] [n Y 2 ( Y)2 ]
4 30,5 10 10
rx,y = 0,9648
[4 (30) 102 ] [4 (31,5) 10 2
66
Notas de aula – Professor Azamor Cirne
Ex 02) A tabela abaixo mostra a relação entre os gastos como publicidade e vendas nos últimos anos.
Os dados coletados (todos em mil reais) estão apresentados na tabela seguinte.
Y X
n
vendas (X·1.000) gastos com publicidade (X·1.000)
1 7 3
2 14 4
3 15 8
4 28 12
5 32 14
Σ = 10 Σ = 41
• Primeiro Passo: representando o gráfico de dispersão dos valores de Y em função dos valores de X.
• Segundo Passo: observe o tipo de tendência dos pontos e estabelecer a melhor função para
representar essa tendência. Observa-se que uma reta seria uma função adequada:
• Terceiro Passo: obter os coeficientes da reta de regressão (MMQ) e para isso é aconselha-se a
construção de uma tabela para auxiliar no processo.
n Y X X2 Y2 X·Y
1 7 3 9 49 21
2 14 4 16 256 64
3 15 8 64 225 120
4 28 12 144 784 336
5 32 14 196 1024 448
Σ = 96 Σ = 41 Σ = 429 Σ = 2278 Σ = 981
• cálculo de b:
67
Notas de aula – Professor Azamor Cirne
• cálculo de a:
a Y b X
( X)2 (41)2
b2 X2 (2,0884)2 429
2 n
5
R = = 0,9308 ou 93,08%
2 ( Y)
2 (96)2
Y 2278
n 5
Interpretação: noventa e três por cento das variações de Y são explicadas pela variável X.
Ex 03) A tabela abaixo mostra dados médios de popança (X) em função da renda (Y). Pede-se:
a) gráfico de dispersão ; b) equação de RLS ; c) coeficientes de correlação e de determinação
Y ($) 430 335 520 490 470 210 195 270 400 480
X ($) 30 21 35 42 37 20 8 17 35 25
68
Notas de aula – Professor Azamor Cirne
Solução:
a) diagrama de dispersão
Solução:
a) Primeiro modo:
n Ano = X SELIC = Y X2 Y2 X·Y
1 1995 41,22 3.980.025 1.699,0884 82.233,90
2 1996 23,94 3.984.016 573,1236 47.784,24
3 1997 39,79 3.988.009 1.583,2441 79.460,63
4 1998 31,24 3.992.004 975,9376 62.417,52
5 1999 18,99 3.996.001 360,6201 37.961,01
6 2000 16,16 4.000.000 261,1456 32.320,00
7 2001 19,05 4.004.001 362,9025 38.119,05
8 2002 23,03 4.008.004 530,3809 46.106,06
9 2003 23,37 4.012.009 546,1569 46.810,11
10 2004 16,24 4.016.016 263,7376 32.544,96
11 2005 19,12 4.020.025 365,5744 38.335,60
Σ = 22.000 Σ = 272,15 Σ = 44.000.110 Σ = 7.521,9117 Σ = 544.093,08
69
Notas de aula – Professor Azamor Cirne
( Y)2 (272,15)2
Syy Y2 n
= 7.521.9117
11
= 788,6733
XY = (22.000)(272,15)
Sxy (X Y) n
544.093,08
11
= – 206,92
= 206,92 = -1,8811;
Sxy 272,15 22000
b a Y b X= ( 1,8811) = 3786,9227
Sxx 110 11 11
• previsão:
para x = 2006 → Y = 3786,9227 – (1,8811) (2006) = 13,4361
Sxy 206,92
R2 b = (1,8811) = 0,4935
Syy 788,6733
Sxy 206,92
r = = - 0,7025
Sxx Syy 110 788,6733
b) Segundo modo: arbitrando o ano médio (2000) como sendo o ano zero:
n Ano = X SELIC = Y X2 Y2 X·Y
1 -5 41,22 25 1.699,0884 - 206,10
2 -4 23,94 16 573,1236 - 95,76
3 -3 39,79 9 1.583,2441 - 119,37
4 -2 31,24 4 975,9376 - 62,48
5 -1 18,99 1 360,6201 - 18,99
6 0 16,16 0 261,1456 0,00
7 1 19,05 1 362,9025 19,05
8 2 23,03 4 530,3809 46,06
9 3 23,37 9 546,1569 70,11
10 4 16,24 16 263,7376 64,96
11 5 19,12 25 365,5744 95,60
Σ=0 Σ = 272,15 Σ = 110 Σ = 7.521,9117 Σ = - 206,92
70
Notas de aula – Professor Azamor Cirne
( Y)2 (272,15)2
Syy Y2 n
= 7.521.9117
11
= 788,6733
X Y = (0)(272,15)
Sxy (X Y) n
206,92
11
= – 206,92
= 206,92 = -1,8811;
Sxy 272 ,15
b a Y b X= ( 1,8811 )(0) = 24,7409
Sxx 110 11
• previsão:
para x = 2006 → X = 6 → Y = 24,7409 – (1,8811) (6) = 13,4543
Sxy 206,92
r = = - 0,7025
Sxx Syy 110 788,6733
Observação: Quando a variável X tem o zero como valor médio os cálculos se tornam mais simples,
pois x i é igual a zero.
( X)2 (0)2
Sxx X2 n
X2 n
X2
X Y 0Y
Sxy (X Y) n
(X X) n
(X Y)
a Y b X Y b0 Y
71
Notas de aula – Professor Azamor Cirne
( Y)2 (272,15)2
Syy Y2 n
= 7.521.9117
11
= 788,6733
X Y = (0)(272,15)
Sxy (X Y) n
206,92
11
= - 206,92
• previsão:
para x = 2006 → X = 12 → Y = 36,0275 – (1,8811) (12) = 13,4543
Sxy 206,92
r = = - 0,7025
Sxx Syy 110 788,6733
72
Notas de aula – Professor Azamor Cirne
Observação: A única diferença que ocorre nos três modos é apenas no valor do intercepto a.
Solução:
a) Primeiro modo:
Ano (X) Produção (Y) X2 Y2 X·Y
1957 30542 3.829.849 932.813.764 59.770.694
1958 60983 3.833.764 3.718.926.289 119.404.714
1959 96114 3.837.681 9.237.900.996 188.287.326
1960 133041 3.841.600 17.699.907.681 260.760.360
1961 145584 3.845.521 21.194.701.056 285.490.224
1962 191194 3.849.444 36.555.145.636 375.122.628
1963 174191 3.853.369 30.342.504.481 341.936.933
1964 183707 3.857.296 33.748.261.849 360.800.548
1965 185187 3.861.225 34.294.224.969 363.892.455
Σ = 17649 Σ = 1.200.543 Σ = 34.609.749 Σ = 187.724.386.721 Σ = 2.355.465.882
( X) 2 (17649 ) 2
Sxx X 2
n
= 34609749
9
= 60
( Y) 2 1200543
Syy Y 2
n
= 1877243867 21
9
= 27.579.553.960
X Y (17649 )(1200543 )
Sxy (X Y) n
= 2355465882
9
= 1.201.059
• previsão:
para o ano 1966 → Y = -39.121.217,9833 + 20017,65 (1966) = 233.481,9167
Sxy 1201059
r = = 0,9336
Sxx Syy 60 27 .579 .553 .960
b) Segundo modo: arbitrando o ano médio (1961) como sendo o ano zero:
Ano (X) Produção (Y) X2 Y2 X·Y
-4 30542 16 932.813.764 - 122.168
-3 60983 9 3718.926.289 - 182.949
-2 96114 4 9237.900.996 - 192.228
-1 133041 1 17.699.907.681 - 133.041
0 145584 0 21.194.701.056 0,00
1 191194 1 36.555.145.636 191.194
2 174191 4 30.342.504.481 348.382
3 183707 9 33.748.261.849 551.121
4 185187 16 34.294.224.969 740.748
Σ=0 Σ = 1.200.543 Σ = 60 Σ = 187.724.386.721 Σ = 1.201.059
( X) 2 (0) 2
Sxx X 2
n
60
9
= 60
( Y) 2 1200543
Syy Y2 n
= 1877243867 21
9
= 27.579.553.960
X Y = 1201059 (0)(1200543 )
Sxy (X Y) n
9
= 1.201.059
74
Notas de aula – Professor Azamor Cirne
• cálculo de a e de b:
Sxy
b = 20017,65; a Y b X = 133.393,6667
Sxx
• equação de regressão: Y = 133393,6667 + (20017,65)X
• previsão:
para o ano 1966 → X = 5: Y = 133393,6667 + 20017,65(5) = 233.481,9167
Observação: Caso tivéssemos um número par de anos como exemplo: {1957, 1958, 1959, 1960, 1961,
1962}, pode-se arbitrar os dois anos centrais como sendo -1 e 1, ou seja, 1959 corresponde a -1 e 1960
corresponde a 1. A diferença entre um ano e outro é de duas unidades. Os correspondentes valores
seriam: {-5, -3 -1, 1, 3, 5}.
( X) 2 ( 45 ) 2
Sxx X2 n
= 285
9
= 60
( Y) 2 1200543
Syy Y 2
n
= 1877243867 21
9
= 27.579.553.960
• previsão:
para o ano 1966 → X = 10: Y = 33305,4167 + 20017,65 (10) = 233.481,9167
Sxy 1201059
r = = 0,9336
Sxx Syy 60 27 .579 .553 .960
Observação: A única diferença que ocorre nos três modos é apenas no valor do intercepto a.
76
Notas de aula – Professor Azamor Cirne
Ex 06)
SQT SSR SQE
erro
(VT) (VR) (VE)
n X Y XY X2 Y2 Y-Ym (Y-Ym)2 Yc (Yc-Ym)2 Y-Yc (Y-Yc)2
1 1 3 3 1 9 -3,20 10,24 2,30 15,21 0,70 0,49
1 2 3 6 4 9 -3,20 10,24 3,60 6,76 -0,60 0,36
1 4 7 28 16 49 0,80 0,64 6,20 0,00 0,80 0,64
1 5 6 30 25 36 -0,20 0,04 7,50 1,69 -1,50 2,25
1 8 12 96 64 144 5,80 33,64 11,40 27,04 0,60 0,36
Soma 5 20 31 163 110 247 0,00 54,80 31,00 50,70 0,00 4,10
Média 4,0 6,2
Estimações:
Sxx Syy Sxy b a r R2 S
30,000 54,800 39,000 1,300 1,000 0,962 0,925 1,169
b2 Sxx b Sxy VE
R 2 r2 ; (0,962)2 = (1,3)2·30/54,80 = (1,3)·39/54,80 = 50,70/54,80 = 0,925
Syy Syy VT
S = erro padrão (ou desvio padrão) da estimativa pela regressão:
77
Notas de aula – Professor Azamor Cirne
01) Os volumes de exportação em toneladas nos respectivos anos estão mostrados na tabela abaixo.
Pede–se:
a) ajustar os dados se uma reta de mínimos quadrados
b) estimar o valor das importações em 2003
c) avaliar o ano que não haverá importações.
02) Os dados abaixo se referem ao rendimento de um determinado capital em cada mês. Pede-se:
a) determinar a equação de regressão linear de Y em X;
b) determinar e interpretar os coeficientes de correlação e de determinação
c) estimar o valor de Y para os dois meses seguintes
Mês (X) 1 2 3 4 5 6 7
Rendimento (Y) 60 64 65 71 75 77 83
03) A tabela abaixo mostra dados de volume de exportação em toneladas nos correspondentes anos.
Pede-se:
a) A equação de regressão linear da quantidade sobre o tempo
b) os coeficientes de correlação linear e de determinação
c) A quantidade estimada para a exportação em 2010
78
Notas de aula – Professor Azamor Cirne
Muitas vezes apenas uma variável independente não consegue explicar as variações de uma
variável dependente. Então parte-se para a tentativa de explicar as variações em função de duas ou
mais variáveis. Se suspeitarmos que uma variável dependente Y é função linear de duas ou mais
variáveis independentes, pode-se usar a Regressão Linear Múltipla para obter o equacionamento do
fenômeno.
A Regressão Linear Múltipla é semelhante à Regressão Linear Simples no objetivo e nos
conceitos. Abaixo estão mencionados alguns casos em que a regressão linear múltipla poderia ser
utilizada.
Variável Dependente Variáveis Independentes
(explicada) (explicativa)
venda atendimento, localização, serviço de troca, preço, propaganda
safra fertilizantes, irrigação, qualidade do solo
salário tempo de serviço, escolaridade, experiência
poupança renda, número de filhos
Uma relação linear entre uma variável dependente Y e duas ou mais variáveis independentes Xi
(i=1,2,3,...,n) é matematicamente representada por uma equação do tipo:
O caso mais simples de uma regressão linear múltipla corresponde a uma relação de dependência
Y e duas variáveis independentes X1 e X2 (equação abaixo). Uma equação como esta representa um
plano no espaço tornando-se então extremamente complicada a confecção do diagrama de dispersão
sem auxílio de computador.
Y a b1X1 b 2X2 i
Semelhante a regressão linear simples, na regressão linear múltipla deseja-se determinar os
coeficientes βi (i=1,2,3,...,n) da variáveis independentes. Os valores de βi podem ser interpretados
como sendo a taxa de variação de Y por unidade de variação de Xi.
79
Notas de aula – Professor Azamor Cirne
n n
( i )2 (Y a b1 X1 b2 X2 )2
i1 i1
n
Chamemos ( i ) 2 de Qe para facilitar o desenvolvimento. Observemos que Qe depende de “a” e de
i 1
b1 e b2.
Pelo cálculo diferencial, o mínimo de Qe é obtido derivando Qe em relação a: “a”, “b1”, e “b2” e
igualando todas as derivadas a zero:
Qe
2 (Y a b1 X1 b2 X2 ) 0 (i)
a
Qe
2 X1(Y a b1X1 b2 X2 ) 0 (ii)
b1
Qe
2 X2 (Y a b1 X1 b2 X2 ) 0 (iii)
b2
Y n a b1 X1 b2 X2 (iv)
Y X2 a X2 b1 X1 X 2 b2 X 22 (vi)
Y a b1 X1 b2 X2 , ou
a Y b1X1 b2 X2 (vii)
Substituindo o valor (vii) em (ii) tem-se:
80
Notas de aula – Professor Azamor Cirne
X1 Y b X1
2
X1 X2 b
Y X1 n
1
n
b2
n
1 X12 b2 X1 X 2
X1 2
X1 Y b1 X 12
X1 X2
Y X1
b2 X 1 X 2
n
n
n
Fazendo:
SY1 Y X1
Y X1
n
X1 2
S11 X12 n
S12 S21 X 1 X 2
X1 X2 , então:
n
As equações (viii) e (ix) formam um sistema de duas equações e duas incógnitas e a sua
resolução permite obter “b1” e “b2”. O valor de “a” pode ser obtido através de (vii), então:
SY1 b1 S11 b2 S12
SY2 b1 S21 b2 S22
a Y b1 X1 b 2 X 2
Os valores de b1 e b2 extraídos do sistema são:
SY2 SY1
S21 S11 SY2 S22
b2 ; b1 b2
S22 S1 2 S21 S21
S12 S11
81
Notas de aula – Professor Azamor Cirne
O coeficiente de determinação para a regressão linear múltipla pode ser calculado como:
R2
SQR
(Y Y)2
SQT (Y Y)2
O coeficiente de determinação para a regressão linear múltipla também pode ser calculado como:
b S b2 S Y2
R2 1 Y1 , sendo:
S YY
( Y)2
S YY Y 2 = (Y Y)2
n
82
Notas de aula – Professor Azamor Cirne
Ex 01) A tabela abaixo mostra o volume de vendas (Y) em função de gastos com TV (X1) e gasto com
jornal (X2). Através do MMQ determine a equação de regressão linear múltipla.
Y 6 12 10 7 3
X1 80 110 90 60 60
X2 120 60 60 30 180
Solução:
Y
Y 38 = 7,6; X1
X1 400 = 80; X2
X2
450
= 90
n 5 n 5 n 5
SY1 YX1
Y X1 = 3300
38 400
= 260
n 5
SY2 YX2
Y X2 = 2790
38 450
= - 630
n 5
( X1)2 (400)2
S11 X12 n
= 33800
5
= 1800
( X2 )2 (450)2
S22 X22 = 54900 = 14400
n 5
83
Notas de aula – Professor Azamor Cirne
• cálculo de a, b1 e b2:
SY2 SY1 630 260
b2
S21 S11
= 1800 1800 = - 0,0294
S22 S12 14400 1800
S12 S11 1800 1800
Ex 02) O quadro abaixo mostra o volume de vendas Y, em função dos gastos com TV (X1) e com
jornal (X2).
n Y X1 X2 Y·X1 Y·X2 X1·X2 X12 X22 Y2
1 6 3 1 18 6 3 9 1 36
2 7 4 2 28 14 8 16 4 49
3 15 8 3 120 45 24 64 9 225
4 18 8 5 144 90 40 64 25 324
5 20 10 8 200 160 80 100 64 400
6 23 11 6 253 138 66 121 36 529
84
Notas de aula – Professor Azamor Cirne
Y
Y 89 = 14,8333; X1
X1 44 = 7,3333; X2
X2
25
= 4,1667
n 6 n 6 n 6
• Cálculo das variações (SY1, SY2, S11, S22, S12, Syy) e das covariâncias e variâncias:
SY1 YX1
Y X1 763 89 44 = 110,3333 → Cov(Y,X1) = SY1/n = 110,3333/6 = 18,3888
n 6
SY2 YX2
Y X2 453
89 25
= 82,1667 → Cov(Y,X2) = SY1/n = 82,1667/6 = 13,6944
n 6
( X1 )2 (44)2
S11 X12 n
374
6
= 51,3333 → Cov(X1,X1) = Var(X1) = 51,3333/6 = 8,5555
( X2 )2 (25)2
S22 X22 139 = 34,8333 → Cov(X2,X2) = Var(X2) = 34,8333/6 = 5,8055
n 6
( Y)2 89
Syy Y 2
1563 = 242,8333 → Cov(X1,X2) = 242,8333/6 = 40,4722
n 6
Y a b X1 → Y = – 0,9286 + 2,1494 X1
Y a b X 2 → Y = – 9,8285 + 2,3589 X2
86
Notas de aula – Professor Azamor Cirne
Como muitos processos econômicos são mais bem explicados com funções matemáticas não
lineares, foram desenvolvidos modelos não lineares que se tornam lineares depois de uma
transformação com logaritmos naturais ln, como mostra a tabela seguinte.
1) Modelo Polinomial → Y a n x n a n 1 x n 1 a n 2 x n 2 a 2 x 2 v a1 x a 0
2) Modelo Exponencial → Y A eB x
3) Modelo Exponencial → Y A Bx
Y a 0 a1 X a 2 X 2 e
e Y (a 0 a 1 X a 2 X 2 )
De igual modo ao mostrado na regressão linear simples o somatório dos quadrados dos erros é:
2 (Y Y) 2
( i ) 2 [Y i ( X i )] 2
n n
( i )2 (Yi Yi ) 2
i1 i1
n n
Qe ( i )2 [Y i ( X i)] 2
i1 i1
n
Chamemos ( i ) 2 de Qe para facilitar o desenvolvimento. Observemos que Qe depende de α e de β.
i 1
87
Notas de aula – Professor Azamor Cirne
Qe
2 ( Y i a 0 a1 X i a 2 X i 2 )
a0
Qe
2 [ X i ( Y i a 0 a1 X i a 2 X i 2 ) ]
a1
Qe
2 [ X 2 i ( Y i a 0 a1 X i a 2 X i 2 ) ]
a1
Qe Qe Qe
Para que Qe seja mínimo devemos fazer ; e iguais à zero, então:
a 0 a1 a2
As três equações abaixo formam um sistema de três equações e três incógnitas:
n a 0 (X i ) a1 (X i 2 ) a 2 Yi
(X i ) a 0 (X i 2 ) a1 (X i 3 ) a 2 Yi X i
(X i 2 ) a 0 (X i 3 ) a1 (X i 4 ) a 2 Yi X i2
88
Notas de aula – Professor Azamor Cirne
S XY X Y
X Y = 54 – (12 ∙ 13)/3 = 2
n
S XX2 X3
X2 X = 288 – (56 ∙ 12)/3 = 64
n
S X2 Y X2 Y
X2 Y = 252 - (56 ∙ 13)/3 = 9,3333
n
( X ) 2 2
S X2 X2 X 4 = 1568 - (56)2/3 = 522,6666
n
( X Y)( X2 X2 ) ( X2 Y)( X X2 )
b1 = = {[2∙22,6666] – [9,333∙64]}/{[8∙522,6666]–(64)2}= 5,25
( X X)( X X ) ( X X )
2 2 2 2
a = b1 b2
Y X X2
Y b1 X b2 X2 = (13/3) – (5,25)∙12/3 – (0,625)∙56/3 = 5,0003
n n n
8 y = -0,625x2 + 5,25x - 5
6 R² = 1
4
2
0
0 2 4 6 8
89
Notas de aula – Professor Azamor Cirne
Observação: Nos casos em que o somatório de X é zero a fórmulas para “a”, “b1” “b2” são:
( Y)( X4 ) ( X2 Y)( X2 )
a=
n X4 ( X2 )2
XY n X2 Y ( Y)( X2 )
b1 = ; b2 =
X2 n X 4 ( X2 )2
n Y X X2 X3 X4 X·Y X2·Y
1 3,2 -4 16 -64 256 -12,8 51,2
2 3,6 -3 9 -27 81 -10,8 32,4
3 4,0 -2 4 -8 16 -8,4 16,8
4 4,5 -1 1 -1 1 -4,7 4,7
5 4,8 0 0 0 0 0 0
6 5,3 1 1 1 1 5,6 5,6
7 6 2 4 8 16 12,2 24,4
8 6,5 3 9 27 81 19,8 59,4
9 7,5 4 16 64 256 32,4 129,6
Σ Σ = 47,3 Σ=0 Σ = 60 Σ=0 Σ = 708 Σ = 33,3 Σ = 324,1
90
Notas de aula – Professor Azamor Cirne
• Equação:
Y = 4,844 + (0,511)X + (0,03)X2
b) cálculo do R2:
Y
Y2
= 47,3 / 9 = 5,0222
n
2 var iaçâo explicada (Y Y)2
R = = 16,6200 / 16,7356 = 0,993 = 99,30%
var iação total
(Y Y)2
91
Notas de aula – Professor Azamor Cirne
Observação 1: Se a regressão não for linear simples (RLS) o coeficiente de determinação deve ser
calculado como: variação explicada dividida pela variação total.
Observação 2: Quando a variável X tem como valor mediano o zero os cálculos se tornam um pouco
mais simples. Observe que no conjunto de equações os valores dos termos X e X 3 são zero e o
conjunto de equações fica simplificado para:
n a 0 (X 2 ) a 2 Y
(X 2 ) a1 Y X
(X 2 ) a1 (X 4 ) a 2 X 2 Y
92
Notas de aula – Professor Azamor Cirne
Y 190 210 270 330 310 370 420 470 490 520
X 9 15 19 23 26 28 33 36 39 40
93
Notas de aula – Professor Azamor Cirne
• cálculo de b:
YX (58,2829) (268)
XY n
1594
10
b = = 0,0331
( X)2 (268)2
X 2
8162
n 10
• Cálculo de a:
a Y bX
94
Notas de aula – Professor Azamor Cirne
A Pesquisa Operacional (PO) é uma ciência que reúne um conjunto de métodos que tem como
propósito a procura das melhores decisões que devam ser tomadas por quem lida com otimização de
processos que envolvem: transporte, materiais, finanças, sistemas de produção, recurso humanos,
matéria prima. A PO é uma ferramenta que pode ser utilizada em diversas áreas do conhecimento tais
como: administração contabilidade, engenharia, saúde economia, entre outras.
a) controle de estoque
b) escolha da melhor alternativa entre rotas
c) determinação da receita máxima
d) determinação do custo mínimo
e) determinação da quantidade de unidades a serem produzidas de determinado produto
f) problemas de alocação
95
Notas de aula – Professor Azamor Cirne
a) Programação Linear;
b) Programação Dinâmica;
c) Programação Inteira;
d) Teoria dos Estoques;
d) Teoria das Filas;
e) Simulação;
f) Teoria dos Jogos;
g) Teoria dos Grafos;
• Programação Linear → tem sido usada com sucesso na solução de problemas relativos à alocação de
pessoal, mistura de materiais, distribuição, transporte, carteira de investimento. A programação tem o
significado de planejamento e ela é dita linear porque todas as variáveis componentes do modelo são
lineares, ou seja, do primeiro grau
• Teoria das Filas → É uma técnica utilizada na solução de problemas relativos a congestionamento de
tráfego, máquinas de serviços sujeitas a quebra, determinação do nível de uma força de serviço,
programação do tráfego aéreo, projetos de represas, programação de produção e operação de hospitais.
• Teoria dos Jogos → Teoria dos Jogos é o estudo das tomadas de decisões entre indivíduos quando o
resultado de cada um depende das decisões dos outros, numa interdependência similar a um jogo.
96
Notas de aula – Professor Azamor Cirne
Já a Teoria dos Jogos estuda cenários onde existem vários interessados em otimizar os próprios
ganhos, às vezes em conflito entre si. Por exemplo, imagine que em sua empresa você tem dúvidas
sobre qual ação tomar para aumentar o seu lucro: reduzir o preço, lançar outro produto ou fazer uma
campanha de marketing?
• Teoria dos Grafos → grafo é um conjunto de pontos, chamados nós, conectados entre si por linhas
chamadas arcos (ver figura abaixo).
Com o propósito de redução de custo, as empresas de transporte procuram minimizar essas despesas
relacionando custo de transporte, condições da rodovia custo do frete etc. e procuram em função
dessas variáveis a melhor rota: “aquela que minimiza o custo”. Este problema consiste em obter o
trajeto de custo mínimo entre os vértices de um grafo que neste exemplo representam as cidades.
PL - Formulação do Modelo
Em programação linear o objetivo é otimizar (maximizar ou minimizar) uma função linear de
uma variável dependente de outras variáveis independentes. Essa função é denominada “função
objetivo” porque a variável dependente é o objetivo que se deseja otimizar.
O processo de otimização envolve situações de limitações e dependências inerentes ao próprio
problema. Essas limitações são formuladas matematicamente por um conjunto de inequações
envolvendo as variáveis independentes são chamadas de “restrições”.
A modelagem para a otimização de um problema em programação linear deve seguir alguns passos:
• Primeiro: Definir o objetivo a ser otimizado. Como exemplo tem-se: maximização do lucro,
minimização da despesa. Definir a função objetivo.
97
Notas de aula – Professor Azamor Cirne
• Segundo: verificar e listar quais as variáveis envolvidas no processo para compor a função objetivo.
Essas variáveis são chamadas de variáveis de decisão e como exemplo tem-se: quantidades de peças
serem produzidas, disponibilidade e salário, disponibilidade de horas de fabricação, limitação de
mercado. Essas são as variáveis componentes das inequações (<, ≤, >, ≥) de restrição e todas elas
devem ser do primeiro grau.
• Terceiro: Tendo-se definido o objetivo e tendo-se conhecimento das variáveis de decisão pode-se
modelar a equação que representa a função objetivo a ser otimizada.
Definição do Problema:
A definição do problema baseia-se em três aspectos principais:
• descrição exata dos objetivos do estudo;
• identificação das alternativas de decisão existentes;
• reconhecimento das limitações, restrições e exigências do sistema.
Construção do Modelo:
A escolha apropriada do modelo é fundamental para a qualidade da solução fornecida. Se o
modelo elaborado tem a forma de um modelo conhecido, a solução pode ser obtida através de métodos
matemáticos convencionais. Por outro lado, se as relações matemáticas são muito complexas, talvez se
faça necessária a utilização de combinações de metodologias.
98
Notas de aula – Professor Azamor Cirne
Solução do Modelo:
O objetivo desta fase é encontrar uma solução para o modelo proposto. Ao contrário das outras
fases, que não possuem regras fixas, a solução do modelo é baseada geralmente em técnicas
matemáticas existentes.
No caso de um modelo matemático, a solução é obtida pelo algoritmo mais adequado, em termos
de rapidez de processamento e precisão da resposta. Isto exige um conhecimento profundo das
principais técnicas existentes. A solução obtida, neste caso, é dita "ótima".
Validação do Modelo:
Nessa etapa é necessário verificar a validade do modelo. Um modelo é válido se, levando-se em
conta sua inexatidão em representar o sistema, ele for capaz de fornecer uma previsão aceitável do
comportamento do sistema.
Um método comum para testar a validade do sistema é analisar seu desempenho com dados
passados do sistema e verificar se ele consegue reproduzir o comportamento que o sistema apresentou.
É importante observar que este processo de validação não se aplica a sistemas inexistentes, ou seja, em
projeto. Nesse caso, a validação é feita pela verificação da correspondência entre os resultados obtidos
e algum comportamento esperado do novo sistema.
Implementação da Solução:
Avaliadas as vantagens e a validação da solução obtida, esta deve ser convertida em regras
operacionais. A implementação, por ser uma atividade que altera uma situação existente, é uma das
etapas críticas do estudo. É conveniente que seja controlada pela equipe responsável, pois,
eventualmente, os valores da nova solução, quando levados à prática, podem demonstrar a necessidade
de correções nas relações funcionais do modelo conjunto dos possíveis cursos de ação, exigindo a
reformulação do modelo em algumas de suas partes.
Formulação de Modelos
O problema geral de programação linear pode ser definido por Maximizar ou Minimizar uma
função objetivo.
Função Objetivo
Z c1x1 c 2 x 2 c3 x 3 ... c n x n
99
Notas de aula – Professor Azamor Cirne
a11x1 a1 2 x 2 a1 3 x 3 ... a 1 n x n b1
a 2 1x1 a 2 2 x 2 a 2 3 x 3 ... a 2 n x n b 2
Restrições
a m 1x1 a m 2 x 2 a m 3 x 3 ... a m n x n b m
PL – Resumo:
A PL está inserida dentro da PO e consiste de uma técnica matemática que objetiva determinar a
melhor solução de um problema de otimização condicionado a restrições (limitações) existentes. A
Programação Linear é uma ferramenta que auxilia na solução de modelos matemáticos para a
otimização dos resultados. O modelo matemático é composto de dois tipos equações, a saber: função-
objetivo e as restrições. A função objetivo é uma função que representa o lucro ou o custo e é
dependente das variáveis de decisão do problema. As restrições são as limitações características do
problema. Estas restrições podem ser tempo, material, financeira etc. Um problema de PL pode ser
solucionado de três formas:
a) Solução gráfica
b) Solução pelo método SIMPLEX (solução algébrica)
A PL é uma técnica de planejamento da PO com objetivo de apresentar uma solução ótima para
problemas em muitas áreas como: alocação de recursos e utilização de matéria-prima, transporte,
localização de instalações, composição de carteira de investimentos, redução de custos e aumento de
lucro.
101
Notas de aula – Professor Azamor Cirne
1) Certa empresa fabrica dois produtos P1 e P2. O lucro unitário do produto P1 é de $1.000,00 e o
lucro unitário de P2 é de $1.800,00. A empresa precisa de 20 horas para fabricar uma unidade de P1 e
de 30 horas para fabricar uma unidade de P2. O tempo anual de produção disponível para isso é de
1.200 horas. A demanda esperada para cada produto é de 40 unidades anuais de P1 e 30 unidades de
anuais de P2. Qual é o plano de produção para que a empresa maximize o seu lucro nesses itens?
Construa o modelo de programação linear para esse caso.
Resposta:
x1 → quantidade a produzir de P1
x2 → quantidade a produzir de P2
Max. Lucro = 1.000x1 + 1.800x2
Sujeito a (as): R1: 20x1 + 30x2 ≤ 1.200 ; R2: x1 ≤ 40 ; R3: x2 ≤ 30 ; x1 ≥ 0 , x2 ≥ 0
2) Para uma boa alimentação, o corpo necessita de vitaminas e proteínas. A necessidade mínima de
vitaminas é de 32 unidades por dia e de proteínas é de 36 unidades por dia. Uma pessoa tem disponível
carne e ovos para se alimentar. Cada unidade de carne contém 4 unidades de vitaminas e 6 unidades de
proteína. Cada unidade de ovo contém 8 unidades de vitaminas e 6 de proteínas. Qual a quantidade
diária de carne e ovos que deve ser consumida para suprir as necessidades de vitaminas e proteínas
com o menor custo possível? Cada unidade de carne custa $3,00 e cada unidade de ovo custa $2,50.
Resposta:
x1 → quantidade de carne a consumir por dia
x2 → quantidade de ovos a consumir no dia
Min. C = 3x1 + 2,5x2
sa: R1: 4x1 + 8x2 ≥ 32 ; R2: 6x1 + 6x2 ≥ 36 ; x1 ≥ 0 , x2 ≥ 0
3) Um sapateiro faz 6 sapatos por hora, se fizer somente sapatos, e 5 cintos por hora, se fizer somente
cintos. Ele gasta 2 unidades de couro para fabricar uma unidade sapato e 1 unidade de couro para
fabricar uma unidade de cinto. Sabendo-se que o total disponível de couro é de 6 unidades e que o
lucro unitário por sapato é de $5,00 e o do cinto é de $2,00. Pede-se: o modelo do sistema de produção
do sapateiro, se o objetivo é maximizar o seu lucro por hora.
Resposta:
x1 → nº de sapatos por hora
x2 → nº de cintos por hora
102
Notas de aula – Professor Azamor Cirne
4) Certa empresa fabrica 2 produtos P1 e P2. O lucro por unidade de P1 é de $100,00 e o lucro unitário
de P2 é de $150,00. A empresa necessita de 2 horas para fabricar uma unidade de P1 e 3 horas para
fabricar uma unidade de P2. O tempo mensal disponível para essas atividades é de 120 horas. As
demandas esperadas para os 2 produtos levaram a empresa a decidir que os montantes produzidos de
P1 e P2 não devem ultrapassar 40 unidades de P1 e 30 unidades de P2 por mês. Construa o modelo do
sistema de produção mensal como objetivo de maximizar o lucro da empresa.
Resposta:
x1 → quantidade a produzir de P1
x2 → quantidade a produzir de P2
Max. Lucro = 100x1 + 150x2
sa: R1: 2x1 + 3x2 ≤ 120 ; R2: x1 ≤ 40 ; R3: x2 ≤ 30 ; x1 ≥ 0 , x2 ≥ 0
5) Um vendedor de frutas pode transportar 800 caixas de frutas para sua região de vendas. Ele
necessita transportar 200 caixas de laranjas a $20,00 de lucro por caixa, pelo menos 100 caixas de
pêssego a $10,00 de lucro por caixa, e no máximo 200 caixas de tangerinas a $30,00 de lucro por
caixa. De que forma deverá ele carregar o caminhão para obter o lucro máximo? Construa o modelo do
problema.
Resposta:
x1 → quantidade de caixas de pêssego
x2 → quantidade de caixas de tangerinas
Max. Lucro = 10x1 + 30x2 + 4.000
sa: R1: x1 + x2 ≤ 600 ; R2: x1 ≥ 100 ; R3: x2 ≤ 200 ; x1 ≥ 0 , x2 ≥ 0
6) Uma empresa fabrica 2 modelos de cinto de couro. O modelo M1, de melhor qualidade, requer o
dobro do tempo de fabricação em relação ao modelo M2. Se todos os cintos fossem do modelo M2, a
empresa poderia produzir 1.000 unidades por dia. A disponibilidade de couro permite fabricar 800
cintos de ambos os modelos por dia. Os cintos empregam fivelas diferentes, cuja disponibilidade diária
é de 400 para o modelo M1 e 700 para o modelo M2. Os lucros unitários são de $4,00 para M1 e $3,00
para M2. Qual o programa ótimo de produção que maximiza o lucro total diário da empresa? Construa
o modelo do sistema descrito.
Resposta:
103
Notas de aula – Professor Azamor Cirne
x1 → quantidade a produzir de M1
x2 → quantidade a produzir de M2
Max. Lucro = 4x1 + 3x2
sa: R1: 2x1 + x2 ≤ 1.000 ; R2: x1 + x2 ≤ 800 ; R3: x1 ≤ 400 ; R4: x2 ≤ 700 ; x1 ≥ 0 , x2 ≥ 0
7) Uma rede de televisão tem o seguinte problema: foi descoberto que o programa “A” com 20
minutos de música e 1 minuto de propaganda chama a atenção de 30.000 telespectadores, enquanto o
programa “B” com 10 minutos de música e 1 minuto de propaganda chama a atenção de 10.000
telespectadores. No decorrer de uma semana, o patrocinador insiste no uso de no mínimo, 5 minutos
para sua propaganda e que na há verba para mais de 80 minutos de música. Quantas vezes por semana
cada programa deve ser levado ao ar para obter o número máximo de telespectadores? Construa o
modelo do sistema.
Resposta:
x1 → frequência semanal do programa A
x2 → frequência semanal do programa B
Max. T = 30.000x1 + 10.000x2
Sujeito a (sa): R1: 1x1 + 1x2 ≥ 5 ; R2: 20x1 + 10x2 ≤ 80 ; x1 ≥ 0 , x2 ≥ 0
Que produção mensal de P1 e P2 traz o maior lucro para a empresa? Construa o modelo do sistema.
Resposta:
x1 → quantidade a produzir de P1
x2 → quantidade a produzir de P2
104
Notas de aula – Professor Azamor Cirne
9) Um fazendeiro está estudando a divisão de sua propriedade nas seguintes atividades produtivas:
A (Arrendamento) – Destinar certa quantidade de alqueires para a plantação de cana-de-açúcar, a uma
usina local, que se encarrega da atividade e paga aluguel da terra $300,00 por alqueire por ano.
P (Pecuária) – Usar outra parte para a criação de gado de corte. A recuperação das pastagens requer
adubação (100 kg/Alq) e irrigação (100.000 litros de água/Alq) por ano. O lucro estimado nessa
atividade é de $400,00 por alqueire no ano.
S (Plantio de Soja) – Usar uma terça parte para o plantio de soja. Essa cultura requer 200 kg por
alqueire de adubos e 200.000 litros de água/Alq para irrigação por ano. O lucro estimado nessa
atividade é de $500,00 / Alqueire no ano. Disponibilidade de recursos por ano: 12.750.000 litros de
água; 14.000 kg de adubo; 100 alqueires de terra. Quantos alqueires deverá destinar a cada atividade
para proporcionar o melhor retorno? Construa o modelo de decisão.
Resposta:
x1 → alqueires para arrendamento; x2 → alqueires para pecuária; x3 → alqueires para soja
Max. Lucro = 300x1 + 400x2 + 500x3
sa: R1: x1 + x2 + x3 ≤ 100 ; R2: 100x1 + 200x3 ≤ 14.000 ; R3: 100.000x1 + 200.000x3 ≤ 12.750.000
x1 ≥ 0 , x2 ≥ 0, x3 ≥ 0
10) Uma rede de depósitos de material de construção tem 4 lojas que devem ser abastecidas com 50m 3
(loja 1), 80m3 (loja 2), 40m3 (loja 3) e 100m3 (loja 4) de areia grossa. Essa areia pode ser carregada em
3 pontos P1, P2 e P3, cujas distâncias estão no quadro (em km):
L1 L2 L3 L4
P1 30 20 24 18
P2 12 36 30 24
P3 8 15 25 20
11) O caminhão pode transportar 10m3 por viagem. Os pontos têm areia para suprir qualquer demanda.
Estabelecer um plano de transporte que minimize a distância total percorrida entre os pontos e as lojas
e supra as necessidades das lojas. Construa o modelo linear do problema.
Resposta:
x11 → número de viagens do P1 a L1 ; x12 → número de viagens do P1 a L2
x13 → número de viagens do P1 a L3 ; x21 → número de viagens do P2 a L1 etc.
105
Notas de aula – Professor Azamor Cirne
objetivo: minimizar C
C = 30x11 + 20x12 + 24x13 + 18x14 + 12x21 + 36x22 + 30x23 + 24x24 + 8x31 + 13x32 + 25x33 + 30x34
Sujeito a (sa):
R1: x11 + x21 + x31 = 5 ; R2:x12 + x22 + x32 = 8 ; R3: x13 + x23 + x33 = 4 ; R4: x14 + x24 + x34 = 10
xij ≥ 0 , i = 1,2,3 , j=1,2,3
12) O departamento de marketing de uma empresa estuda a forma mais econômica de aumentar em
30% as vendas de seus dois produtos P1 e P2.
As alternativas são:
a) Investir em um programa institucional com outras empresas do mesmo ramo. Esse programa requer
um investimento mínimo de $3.000,00 e deve proporcionar um aumento de 3% nas vendas de cada
produto, para cada $1.000,00 investidos.
b) Investir diretamente na divulgação dos produtos. Cada $1.000,00 investidos em P1 retornam um
aumento de 4% nas vendas, enquanto que para P2 o retorno é de 10%.
A empresa dispõe de $10.000,00 para este empreendimento. Quanto deverá destinar a cada atividade?
Construa o modelo do sistema descrito.
Resposta:
x1 → quantidade em $1.000,00 para programa institucional
x2 → quantidade em $1.000,00 diretamente em P1
x3 → quantidade em $1.000,00 diretamente em P2
Objetivo minimizar o custo C: C = 1.000x1 + 1.000x2 + 1.000x3
Sujeito a (sa): R1: x1 ≥ 3 ; R2: 3x1 + 4x2 ≥ 30 ; R3: 3x1 + 10x3 ≥ 30 ; R4: x1 + x2 + x3 ≤ 10
x1 ≥ 0 , x2 ≥ 0, x3 ≥ 0
14) Uma companhia de transporte tem dois tipos de caminhões: O tipo “A” tem 2m3 de espaço
refrigerado e 3m3 de espaço não refrigerado; o tipo “B” tem 2 m3 de espaço refrigerado e 1m3 de
espaço não refrigerado. O cliente quer transportar um produto que necessitará 16 m3 de área
refrigerada e 12m3 de área não refrigerada. A companhia calcula em 1.100 litros o combustível para
uma viagem com o caminhão “A” e 750 litros para o caminhão “B”. Quantos caminhões de cada tipo
deverão ser usados no transporte do produto, com o menor consumo de combustível?
Resposta:
Caminhão Tipo A: 2 viagens
Caminhão Tipo B: 6 viagens
Gasto e combustível = 6.700 litros
106
Notas de aula – Professor Azamor Cirne
Ex 01) Para construir uma casa por mês uma construtora necessite de 2 pedreiros e 4 serventes. Para
construir um apartamento no mesmo intervalo de tempo, a construtora necessita de 3 pedreiros e 8
serventes. A construtora possui um 30 pedreiros e 70 serventes. A construtora obtém um lucro de
$3.000,00 na venda de cada casa e de $5.000,00 na venda de cada apartamento e toda "produção" da
construtora é vendida. Qual a quantidade de casas e apartamentos que a construtora deve construir para
que obtenha lucro máximo?
Sejam:
x1 = quantidade de casas construídas;
x2 = quantidade de apartamentos construídos.
A Função Objetivo deve expressar o lucro total (LT) em função da quantidade (x 1) de casas e da
quantidade (x2) de apartamento que devem ser construídos. A função LT é:
107
Notas de aula – Professor Azamor Cirne
2(x1) + 3(x2) ≤ 30
Serventes: a construtora necessita de 4 serventes para cada casa construída e 8 serventes para
cada apartamento construído. A construtora só dispõe de 70 serventes contratados. Esta restrição pode
ser representada como:
4(x1) + 8(x2) ≤ 70
Satisfazendo as restrições, a região delimitada mostra que a maior quantidade de casas (zero
apartamento) que a construtora pode construir é 15. A região também mostra que a maior quantidade
de apartamento que a construtora pode construir (zero casa) é 9.
O passo seguinte é colocar a função objetivo dentro da região delimitada pelas restrições de modo que
a composição dos valores de x1 e de x2 produza o lucro total máximo. Isso é feito da seguinte maneira:
108
Notas de aula – Professor Azamor Cirne
Resolvendo a Questão:
Seja a função objetivo: Z = 3(x1) + 5(x2)
Se na função LT, continuássemos a atribuir valores cada vez maiores para o lucro e
construíssemos o gráfico de cada uma das situações, verificaríamos que esse procedimento iria gerar
uma família de retas paralelas e quanto maior o lucro, mais alta se encontraria a reta (maior coeficiente
linear).
Quanto maior o lucro, mais alta se encontra a reta do LT, então para se obter o lucro máximo
deve-se colocar a reta no ponto extremo da região permissível. Nessas condições a reta LT só cruzará
um ponto que se situa em um dos vértices do polígono. Esse ponto contém os valores de (x 1,x2) que
maximizam o lucro total.
A figura abaixo mostra as retas paralelas de lucro total com o ponto máximo situado à interseção
da curva de restrição de pedreiros com a curva de restrição de serventes. Esse ponto denominado de A
tem coordenadas (7,5;5) e a função objetivo nesse ponto valerá:
Ex 02) Suponha que para construir uma casa por mês uma construtora necessite de 2 pedreiros, 4
serventes e 1 carpinteiro. Para se construir um apartamento no mesmo intervalo de tempo, a mesma
construtora necessita de 3 pedreiros, 8 serventes e 3 carpinteiros. A construtora possui um efetivo total
de 30 pedreiros, 70 serventes e 20 carpinteiros contratados. A construtora obtém um lucro de
$3.000,00 na venda de cada casa popular e de $5.000,00 na venda de cada apartamento e toda
"produção" da construtora é vendida. Qual é a quantidade ótima de casas populares e apartamentos que
a construtora deve construir para que obtenha lucro máximo.
Solução: Da mesma maneira que procedemos no exemplo 1, vamos inicialmente representar este
problema em forma de tabela.
Observação: não negatividade significa que não existem quantidades negativas nem de casa nem de
apartamento.
Com as cinco equações de restrição delimita-se no plano uma região de solução. Ver figura abaixo.
Através do mesmo procedimento, ou seja, atribuindo valores ao lucro total e construindo as retas
observamos que o ponto de lucro total máximo é à interseção das retas de restrição de pedreiro e
restrição de carpinteiro. A coordenada do ponto de interseção vale: (10; 3,33).
A lucro máximo é: Z = 3(10) + 5(3,33) = $46,65
111
Notas de aula – Professor Azamor Cirne
Ex 03) Uma empresa fabrica dois produtos A e B. Cada um deste produtos requer certa quantidade de
tempo na linha de montagem e ainda mais algum para a sua finalização. Cada produto do tipo A
necessita de 5 horas na linha de montagem e de 2 horas para a finalização. Cada produto de tipo B
necessita de 3 horas na linha de montagem e de 4 horas para a finalização. Numa semana, a empresa
dispõe de 108 horas para a linha de montagem e 60 horas para a finalização. Toda a produção é
vendida. O lucro de cada produto é de $120,00 para o produto A e de $210,00 para o B. Quantas
unidades, por semana, dos produtos A e B se devem produzir, de modo a que o lucro seja máximo?
Solução: construindo uma tabela com os dados:
Seja “x” o número de unidades que a empresa produz, por semana, do produto A e “y” o número de
unidades que a empresa produz, por semana, do produto B.
Em Resumo:
• variáveis de decisão (que pretendemos determinar): x e y (número de unidades)
• objetivo (o que se pretende otimizar) maximizar o lucro: L = 120x + 210y
• Restrições (que têm de ser satisfeitas):
R1: 5x + 3y ≤ 108 ; R2: 2x + 4y ≤ 60 ; x ≥ 0 , y ≥ 0
Habitualmente escreve-se na seguinte forma:
Maximizar o lucro L: L = 120x + 210y
Sujeito a (sa): R1: 5x + 3y ≤ 108 ; R2: 2x + 4y ≤ 60 ; x ≥ 0 e y ≥ 0
Após a colocação das restrições no sistema cartesiano resultou na área hachurada ver figura abaixo.
Assim sendo a um maior valor de L/210 corresponde a um maior valor de L e assim sendo a resolução
do nosso problema consiste em encontrar a reta com declive –4/7 de maior ordenada na origem e que
tenha algum contato com o polígono.
113
Notas de aula – Professor Azamor Cirne
Das várias retas de mesmo declive (-4/7) a que tem maior ordenada na origem e tem pontos de contato
com o domínio, é a que passa no vértice B. Este ponto é a solução do sistema. Para encontrar o valor
exato basta resolver o sistema que é composto pelas retas que intersectam o ponto B.
R1: 5x + 3y = 108 ; R2: 2x + 4y = 60
Solução: x = 18 ; y = 6
Assim para que a empresa, que produz o produtos A e B, tenha o maior lucro possível, deve produzir
semanalmente 18 unidades do produto A e 6 unidades do produto B.
O lucro máximo L é:
L = (120)18 + (210)6 = $3.420,00 semanais.
114
Notas de aula – Professor Azamor Cirne
Resposta: x1 = 30 ; x2 = 20 ; Z = 60,00
Ex 09) Resolva: Minimize C = - x1 - 3x2
Sujeito a (sa): R1: x1 + x2 ≤ 6 ; R2: -x1 + 2x2 ≤ 8 ; x1, x2 ≥ 0
Resposta: x1 = 1,33 ; x2 = 4,67 ; C = -15,33.
Ex 01) Uma empresa de mobiliário pretende lançar um modelo de cadeiras e de estantes. O mercado
absorve toda a produção de estantes, mas aconselha-se que a produção mensal de cadeiras não
ultrapasse as 160 unidades. Ambos os produtos são processados na unidade de estampagem (UE) e na
unidade de montagem e acabamento (UMA).
• A disponibilidade mensal em cada uma destas unidades é de: 720 horas-máquina (h·m) na UE e 880
horas-homem (h·h) na UMA.
• Cada cadeira necessita de 2 h-m na UE e de 4 h·h na UMA. • Cada estante necessita de 4 h-m na UE
e de 4 h·h na UMA. • As margens de lucro unitárias estimadas são de 6 contos para as secretárias e de
3 contos para as estantes.
• Qual o plano de produção mensal para as secretárias e estantes que maximiza a margem de lucro.
Resposta: x1 = 160 ; x2 = 60 ; Z = 1.140
116
Notas de aula – Professor Azamor Cirne
PL - Método Simplex
O método Simplex é um algoritmo que permite resolver problemas de Programação Linear. Esse
método Simplex tem como objetivo procurar as diversas soluções de um sistema de equações de modo
a encontrar a solução ótima (maximizar lucro ou minimizar custo).
117
Notas de aula – Professor Azamor Cirne
Ex 01) Uma marcenaria deseja estabelecer uma programação diária de produção. A oficina produz
dois produtos: mesa e armário. A marcenaria tem limitações em dois recursos: madeira e mão-de-obra,
cujas disponibilidades diárias são mostradas na tabela a seguir.
Recurso Disponibilidade
Madeira 12 m2
Mão-de-obra 8 H.h
No processo de produção para fazer uma mesa a fábrica gasta 2m2 de madeira e 2H·h de mão-de-obra.
Para fazer um armário, a fábrica gasta 3m2 de madeira e 1H·h de mão de obra. Cada mesa dá lucro de
$4 e cada armário de $1. Encontre o programa de produção que maximize o lucro.
Solução:
As variáveis de decisão envolvidas no problema são:
x1: quantidade a produzir de mesas e x2: quantidade a produzir de armários
A função objetivo é: Lucro: Z = 4x1 + x2 (na forma explicita)
Para as restrições, a relação lógica existente é: Utilização de recurso ≤ Disponibilidade
Assim tem-se:
Madeira: 2x1 + 3x2 ≤ 12 e Mão-de-obra: 2x1 + x2 ≤ 8
x1 , x 2 ≥ 0
O modelo completo é:
Maximizar: Z = 4x1 + x2
Sujeito a: R1: 2x1 + 3x2 ≤ 12 ; R2: 2x1 + x2 ≤ 8 ; x1, x2 ≥ 0
118
Notas de aula – Professor Azamor Cirne
Para que tenha solução única deve-se o sistema o número de equações igual ao número de incógnitas e
para isso duas variáveis devem ser eliminadas. As variáveis que devem ser eliminadas de início são as
variáveis de decisão, no caso x1 e x2. As variáveis que foram inicialmente eliminadas são
denominadas: Variáveis Não Básicas (VNB) e as variáveis que permaneceram são denominadas
variáveis básicas (VB).
VB: x3 e x4 VNB: x1 e x2
•Construir a tabela (abaixo): Colocar os coeficientes de cada variável para cada restrição como também
os coeficientes da função objetivo Z em cada uma das linhas da tabela.
VB
Linha x1 x2 x3 x4 b
↓
L0 x3 2 3 1 0 12
L1 x4 2 1 0 1 8
L2 Z -4 -1 0 0 0
• A primeira solução é:
-variáveis não básicas estão fora do sistema e tem valor zero: x1 = 0 ; x2 = 0
- interpretando cada equação de cada linha tem-se: x3 = 12 ; x2 = 8 ; Z = 0
Z – 4x1 – x2 + 0x3 + 0x4 = 0 → Z = 0 + 4x1 + x2 – 0x3 – 0x4
Segundo Passo:
•Z pode ser melhorado, pois x1 e x2 que compõem Z estão de fora e uma dessas duas variáveis deve
entrar e se tornar uma variável básica. A que deve entrar é a que contribui mais para o aumento do
valor de Z que no caso é a variável x1, pois o valor que essa variável assumir será multiplicado por 4.
Se uma variável entra outra deve sair para que o sistema tenha solução única. A atual variável básica
que deve sair será aquela que tiver o menor quociente entre o termo “b” e o coeficiente da variável que
entra.
Para x3: 12/2 =6
Para x4: 8/2 = 4 → x4 sai
• Construir uma nova tabela com as variáveis básicas atualizadas (x3 e x1) de modo que:
Em cada linha o coeficiente da respectiva VB seja 1 (um) e das outras VB seja 0 (zero) e o coeficientes
das VNB podem assumir qualquer valor.
119
Notas de aula – Professor Azamor Cirne
• De início deve-se atender a observação acima para a variável que entra (x 1). Observe que seu valor é
2 e deve ser 1 e o valor de x3 nessa linha deve ser zero e essa condição já é atendida.
Para que o coeficiente de x2 na L4 seja 1 deve-se dividir a L1 por dois, ou seja: L4 = L1/2
• Na L0 que será a L3 o coeficiente de x3 já é 1 mas o coeficiente de x1 não é zero. Essa condição pode
ser atendida usando a linha modificada da variável quem entrou x1. L3 = 2L4 – L0
• Os coeficientes das variáveis básicas na função objetivo Z devem ser zero. Observe que o coeficiente
de x3 já é zero, mas o de x1 não é. Essa condição pode ser atendida com o uso da equação da variável
básica que entrou x1. L5 = 4L1 + L2
VB
Linha x1 x2 x3 x4 b
↓
L3 x3 0 -2 -1 1 -4
L4 x1 1 1/2 0 1/2 4
L5 Z 0 1 0 2 16
Solução:
Primeiro Passo:
•Igualar a Função Objetivo a zero: Z - 3x1 - 5x2 = 0
•Acrescentar variáveis de folga nas restrições.
R1: 2x1 + 4x2 + x3 = 10 ; R2: 6x1 + x2 + x4 = 20 ; R3: x1 - x2 + x5 = 30
120
Notas de aula – Professor Azamor Cirne
121
Notas de aula – Professor Azamor Cirne
Todos os coeficientes das variáveis que fazem parte da função objetivo Z na linha L11 são positivos,
significa que nenhuma dessas variáveis contribui para o aumento de Z e o problema está terminado. A
solução final é:
x2 = 0,91 ; x1 = 3,18 ; x5 = 27,73 ; x4 = 0 ; x3 = 0 ; Z = 14,09.
Ex 03) Maximizar a função objetivo Z sob as restrições R1, R2 e R3. (questão retirada do livro:
Pesquisa Operacional – Livro de Ermes)
Primeiro Passo:
• Escreve-se Z na forma implícita (abaixo).
Z - 2x1 - 4x2 - 6x3 = 0
Observação: Os coeficientes negativos das variáveis da função Z na forma implícita correspondem a
positivos na forma explícita (forma inicialmente dada).
• Acrescenta-se as variáveis de folga nas inequações (R1), (R2) e (R3) para transformá-las e equações.
R1: x1 + x2 + x3 + x4 = 100 ; R2: 2x1 – x2 – 5x3 + x5 = 50 ; R3: 3x1 + x3 + x6 = 200
x1 ≥ 0; x2 ≥ 0; x3 ≥ 0; x4 ≥ 0; x5 ≥ 0; x6 ≥ 0
Segundo Passo:
• Construção da tabela auxiliar colocando os coeficientes das variáveis e o termo independente b.
• Escolher inicialmente como variáveis básicas as variáveis de folga.
122
Notas de aula – Professor Azamor Cirne
• Observe no sistema que em cada linha a respectiva variável básica deve ter coeficiente igual a 1. As
outras variáveis básicas nesta mesma linha deve ter coeficeinte igual a zero. As variáveis não básicas
não tem importância os seus coeficientes.
• A função Z deve estar escrita em função das variáveis não básicas.
• O sistema abaixo atende esses requisitos.
Linha x1 x2 x3 x4 x5 x6 b
L0 Z -2 -4 -6 0 0 0 0
L1 x4 1 1 1 1 0 0 100
L2 x5 2 -1 5 0 1 0 50
L3 x6 3 0 1 0 0 1 200
Terceiro Passo:
Constõe-se outra tabela com as novas variáveis básicas e resolve-se o sistema de modo a atender os
requisitos do segundo passo.
Linha x1 x2 x3 x4 x5 x6 b operações
L4 Z 2/5 - 26/5 0 0 6/5 0 60 6L6 + L0
L5 x4 3/5 6/5 0 1 -1/5 0 90 L1 - L6
L6 x3 2/5 -1/5 1 0 1/5 0 10 L2 / 5
L7 x6 13/5 1/5 0 0 -1/5 1 190 L3 - L6
123
Notas de aula – Professor Azamor Cirne
Observação: o sinal negativo em -50 em problemas como este em que as variáveis não podem assumir
vaores negativos significa que a variável x2 assumindo valores a partir de -50 até infinito que não afeta
x3 .
para x6: 190/(1/5) = 900
Logo, x4 deve sair.
Quarto Passo:
Constõe-se outra tabela com as novas variáveis básicas e resolve-se o sistema de modo a deixar em
cada linha apenas uma variável básica com coeficiente igual a 1 e a função Z escrita em termos das
variáveis não básicas.
Linha x1 x2 x3 x4 x5 x6 b operações
L8 Z 3 0 0 26/6 1/3 0 450 (26/5) L9 + L4
L9 x2 1/2 1 0 5/6 -1/6 0 75 L5 (5/6)
L10 x3 1/2 0 1 1/6 1/6 0 25 (1/5) L9 + L6
L11 x6 25/10 0 0 -1/6 -1/6 1 175 (-1/5) L9 + L6
124
Notas de aula – Professor Azamor Cirne
Observe que Z está escrita em função das variáveis-não-básicas x1, x4, e x5. As variáveis básicas tem
coeficiente zero. Os coeficientes positivos das variáveis-não-básicas de Z na forma implicita
significam que se as variáveis fizerem parte da função Z irão diminuir o seu valor.
Essa observação é facilmente vista quando escrevemos Z explicitamente (abaixo):
• Solução básica inicial → a solução inicial para o problema será sempre obtida fazendo as variáveis
originais do modelo (no caso x1 e x2) iguais a zero e achando o valor das demais.
x1 = x2 = 0 (variáveis não básicas)
f1 = 12; f2 = 8; Z = 0
b) Observa-se no quadro acima que se a variável x1 (que está de fora) entrar melhora o valor de Z. Se
x1 entra alguma deve sair:
125
Notas de aula – Professor Azamor Cirne
Para saber quem deve sair, divide-se o termo b de cada linha pelo coeficiente da variável que entra:
Linha 1) 12/2 = 6; Linha 2) 8/2 = 4
Quanto maior o valor de x1 maior o valor de Z. Observa-se que a variável f2 é a que suporta o menor
valor de x1, logo ela deve sair:
c) As variáveis básicas agora são: f1 e x1 e as não básicas são: f2 e x2.
O coeficiente da VB de cada linha da tabela deve ter valor igual a 1 e as outras VB que se
encontram na mesma linha deve ter coeficiente igual a zero. A função Z deve estar escrita em função
das VNB:
10) Para fazer x1 igual a um na primeira linha:
Dividir a segunda linha por 2 (L2 atual = L2 / 2)
Linha Base x1 x2 f1 f2 b
L1 f1 2 3 1 0 12
L2 x1 1 1/2 0 1/2 4
L3 Z -4 -1 0 0 0
Linha Base x1 x2 f1 f2 b
L1 f1 0 2 1 -1 4
L2 x1 1 1/2 0 1/2 4
L3 Z 0 1 0 2 16
Como os coeficientes das variáveis na função Z são todos positivos nenhum contribui para o aumento
de Z, logo essa solução é a solução ótima:
Solução Ótima:
126
Notas de aula – Professor Azamor Cirne
x1 = 4; x2 = 0; f1 = 4; f2 = 0 e Z = 16
• Solução básica inicial → a solução inicial para o problema será sempre obtida fazendo as variáveis
originais do modelo (no caso x1 e x2) iguais a zero e achando o valor das demais.
x1 = x2 = 0 (variáveis não básicas)
x3 = 2; x4 = 2; x5 = 3 (variáveis básicas)
Z=0
127
Notas de aula – Professor Azamor Cirne
• Observa-se no quadro acima que se a variável x2 (quê está de fora) entrar melhora o valor de Z. Se x2
entra alguma deve sair:
Para saber quem deve sair, divide-se o termo b de cada linha pelo coeficiente da variável que entra:
Testando x3 (linha 1) → 2/0 = infinito (não sai)
Testando x4 (linha 2) → 2/1 = 2
Testando x5 (linha 3) → 3/1 = 3
Quanto maior o valor de x2 maior o valor de Z. Observa-se que a variável x4 é a que suporta o menor
valor de x2, logo ela deve sair:
C) As variáveis básicas agora são: {x2; x3; x5} e as não básicas são: {x1; x4}.
O coeficiente da VB de cada linha da tabela deve ter valor igual a 1 e as outras VB que se encontram
na mesma linha deve ter coeficiente igual a zero. A função Z deve estar escrita em função das VNB:
Procedimentos:
L3 atual = - L2 + L3
L4 atual = 2 L2 + L4
Linha x1 x2 x3 x4 x5 b
L1 x3 1 0 1 0 0 2
L2 VB x2 0 1 0 1 0 2
L3 x5 1 0 0 -1 1 1
L4 Z -1 0 0 2 0 4
• Solução básica:
x1 = x4 = 0 (variáveis não básicas)
x3 = 2; x2 = 2; x5 = 1 (variáveis básicas)
Z=4
A variável não básica x1 se fizer parte da equação Z contribui para seu aumento, se x1 entrar alguma
tem de sair e sairá a que suportar o menor valor de x1:
• Solução básica:
x4 = x5 = 0 (variáveis não básicas)
x3 = 1; x2 = 2; x1 = 1 (variáveis básicas) ; Z = 5
129
Notas de aula – Professor Azamor Cirne
L6 x1 1 0 -3 -1 30 L6 = L3/(1/3)
L7 x2 0 1 -2 1 70 L7 = L4 -2L3
L8 Z 0 0 6 2 1140 L6 = L5 + 2L6
L4 x3 1 1 1 1 0 0 100 L4 = L0
L5 x5 2 1 0 0 1 0 210 L5 = L1
L6 x6 1 0 0 0 0 1 80 L6 = L2
L7 Z 2 1 0 4 0 0 400 L7 = L3 + 4L4
Ex 09) Uma refinaria destila óleo cru, proveniente de duas fontes: Arábia Saudita e Venezuela, e
produz três produtos: gasolina, querosene e lubrificantes. Os óleos têm diferentes composições
químicas e fornecem diferentes quantidades de destilados por barril processado. Cada barril da Arábia
dá 0,3 barril de gasolina, 0,4 de querosene e 0,2 de lubrificante. Para o barril proveniente da Venezuela
estas quantidades são respectivamente: 0,4; 0,2 e 0,3. Em ambos os casos há 10% de resíduos. Os
óleos diferem em custo e disponibilidade. A refinaria pode comprar até 9000 barris da Arábia a $20,00
o barril e até 6000 barris da Venezuela a $15,00 o barril. Contratos da refinaria com distribuidores
130
Notas de aula – Professor Azamor Cirne
exigem que ela produza 2000 barris por dia de gasolina, 1500 de querosene e 500 de lubrificantes.
Como cumprir os contratos gastando o mínimo?
Solução:
Formulação do Problema: As variáveis de decisão são obviamente as quantidades de óleo cru a
serem adquiridas da Arábia Saudita e Venezuela. Sejam estas variáveis x1 e x2 em número barris/dia,
respectivamente. Os dados deste problema podem ser esquematicamente escritos na Tabela V.
Quantidade de óleo cru Quant. ser produzida
Gasolina 0,3 0,4 2000
Querosene 0,4 0,2 1500
Lubrificantes 0,2 0,3 500
Compra possível 9000 6000
Custo 20 15
131
Notas de aula – Professor Azamor Cirne
Ex 11) Alocação de Recursos: Uma fábrica produz dois tipos de produtos: Standard e Luxo. Cada
modelo Standard requer 4 horas de corte e 2 horas de polimento; cada Luxo requer de 2 horas de corte
e 5 horas de polimento. A fábrica possui 2 cortadoras e 3 polidoras. Sabendo-se que a semana de
trabalho da fábrica é de 40 horas e que cada modelo Standard dá um lucro de $3,00 e cada modelo
Luxo $4,00 e que não há restrições de demanda, pede-se qual deve ser a produção da fábrica que
maximize o lucro.
Solução:
Z = 3x1 + 4x2
SA: R1 = 4x1 + 2x2 ≤ 80 ; R2 = 2x1 + 5 X2 ≤ 120 ; x1 e x2 ≥ 0
Resposta: x1 = 10 ; x2 = 20 ; Z = $110,00
Ex 12) Um fazendeiro tem 200 unidades de área de terra, onde planeja cultivar trigo, arroz e milho. A
produção esperada é de 1.800kg por unidade de área plantada de trigo, 2.100kg por unidade de área
plantada de arroz e 2.900kg por unidade de área plantada de milho. Para atender o consumo interno de
sua fazenda, ele deve plantar pelo menos 12 unidades de área de trigo, 16 unidades de área de arroz e
20 unidades de área de milho. Ele tem condições de armazenar no máximo 700.000kg. Sabendo que o
trigo dá um lucro de 0,20$/kg, o arroz 0,15$/kg e o milho 0,11$/kg, quantas unidades de área de cada
produto ele deve plantar para que seu lucro seja o maior possível?
Z = 360x1 + 315x2 + 319x3
SA: R1 = x1 + x2 + x3 ≤ 200 ; R2 = 1,8x1 + 2,1x2 + 2,9x3 ≤ 700;
R1 ≥ 12 ; R2 ≥ 16 ; R3 ≥ 20 ; x1 e x2 ≥ 0
Resposta: x1 = 164 ; x2 = 16 ; x3 = 20 ; Z = $70,460
132
Notas de aula – Professor Azamor Cirne
1 2 3 4 5 6
X Y X Y
Ano Dados SM de 3 anos MM de 3 anos Ano MM de 3 anos
1969 63,2 ― ― ― ―
1970 71,9 193,6 64,53 1970 64,53
1971 58,5 203,2 67,73 1971 67,73
1972 72,8 209,6 69,87 1972 69,87
1973 78,3 226,7 75,57 1973 75,57
1974 75,6 231,3 77,10 1974 77,10
1975 77,4 223,8 74,60 1975 74,60
1976 70,8 221,6 73,87 1976 73,87
1977 73,4 215,7 71,90 1977 71,90
1978 71,5 216,6 72,20 1978 72,20
1979 71,7 218,8 72,93 1979 72,93
1980 75,6 ― ― ― ―
• Regressão para curva de tendência linear com dados brutos (colunas 1 e 2).
100
80
60
40
20
0
• Regressão para curva de tendência linear com dados da média móvel (MM) (colunas 1 e 6). Observe
que os dados estão suavizados (amplitude das oscilações em torno da reta são menores).
100
80
60
y = 0,6632x - 1237,5
40
20
0
133
Notas de aula – Professor Azamor Cirne
Ex 02) Determinação da curva de tendência pelo Método dos Mínimos Quadrados (MMQ). (ex pg 145
- livro Jairo Simon).
Dados para regressão linear simples (MMQ)
1 2 3 4 5 6 7 8
n X Y XY X2 Yc (Y - Ym)2 (Yc - Ym)2
1 -4 3,2 -12,80 16 3,04 4,2253 4,93
2 -3 3,6 -10,80 9 3,59 2,7409 2,77
3 -2 4,2 -8,40 4 4,15 1,1142 1,23
4 -1 4,7 -4,70 1 4,70 0,3086 0,31
5 0 5,2 0,00 0 5,26 0,0031 0,00
6 1 5,6 5,60 1 5,81 0,1186 0,31
7 2 6,1 12,20 4 6,37 0,7131 1,23
8 3 6,6 19,80 9 6,92 1,8075 2,77
9 4 8,1 32,40 16 7,48 8,0909 4,93
Σ 0 47,30 33,30 60 --- 19,12 18,48
Méd 0 5,26 --- --- --- --- ---
Observe que a média de X está centrada no zero e as formulas para a e para b ficam simplificadas.
a = ΣY/n = (47,30) / (9) = 5,26; b = (ΣXY) / (ΣX2) = (33,30) / (60) = 0,55;
R2 = Σ(Yc-Ym)2 / Σ(Y-Ym)2 = (18,48) / (19,12) = 0,96
9
8
7
6
5
4
3 y = 0,555x + 5,2556
2 R² = 0,9665
1
0
-6 -4 -2 0 2 4 6
134
Notas de aula – Professor Azamor Cirne
2
a
Y X X2 Y X = 5,07;
4
b1
XY = 0,56;
n x ( X2 )
4 2
X2
n X2 Y Y X (Yc Ym )
2 2
b2 = 0,03; R2 = 0,98
(Y Ym )
2 2
n x ( X2 )
4
9
8
7
6
5
2
4 y = 0,0285x + 0,555x + 5,0658
R² = 0,9795
3
2
1
0
-6 -4 -2 0 2 4 6
135
Notas de aula – Professor Azamor Cirne
Ex 03) Construir a média móvel de 3 anos e as equações de Tendência linear e quadrática. Fazer
previsão para os anos de 1981 e 1983. (ex pg 154 – livro Jairo Simon.)
1 2 3 4 5 6 7
n Ano Ano Dados Soma Móvel Média Móvel MM de 3 anos
X X Y 3 anos 3 anos Y
1 1970 -4 121 ― ― ―
2 1971 -3 147 418 139,33 139,33
3 1972 -2 150 477 159,00 159,00
4 1973 -1 180 515 171,67 171,67
5 1974 0 185 565 188,33 188,33
6 1975 1 200 600 200,00 200,00
7 1976 2 215 665 221,67 221,67
8 1977 3 250 725 241,67 241,67
9 1978 4 260 ― ― ―
300
250
200
150
y = 16,917x + 189,78
100 R² = 0,9778
50
0
-6 -4 -2 0 2 4 6
300
250
200
150
y = 0,3972x2 + 16,917x + 187,13
100 R² = 0,9806
50
0
-6 -4 -2 0 2 4 6
136
Notas de aula – Professor Azamor Cirne
300
250
200
150 y = 16,452x + 188,81
100 R² = 0,9934
50
0
-4 -2 0 2 4
n X Y X2 X·Y X2·Y X4
Y (Y Y)2 (Y Y)2
1 -3 139,33 9 -418 1254 81 141,63 56,53 27,22
2 -2 159,00 4 -318 636 16 155,90 147,58 81,96
3 -1 171,67 1 -171,66 171,66 1 171,05 615,78 585,44
4 0 188,33 0 0 0 0 187,06 1720,71 1616,98
5 1 200,00 1 200 200 1 203,95 2824,73 3260,47
6 2 221,67 4 443,33 886,66 16 221,71 5597,26 5604,38
7 3 241,67 9 725 2175 81 240,35 8989,85 8741,76
Σ = 0 1321,67 28 460,66 5323,33 196 Σ = 19952,43 19918,19
Méd = 0 146,85 --- --- --- --- --- --- ---
137
Notas de aula – Professor Azamor Cirne
2
Y X X2 Y X = 187,06; XY = 16,45;
4
a b1
n x ( X2 )
4 2
X2
n X2 Y Y X (Yc Ym )
2 2
b2 = 0,44; R2 = 0,998
(Y Ym )
2 2
n x ( X2 )
4
300
250
200
150
y = 0,4365x2 + 16,452x + 187,06
100 R² = 0,9955
50
0
-4 -2 0 2 4
ST – Exercícios Propostos
Porcentagem da Média
Mês 1980 1981 1982
Jan 205 186 212
Fev 200 178 199
Mar 220 212 138
Abr 264 225 256
Mai 259 248 278
Jun 277 273 285
Jul 264 264 271
Ago 254 267 265
Set 239 249 247
Out 241 253 270
Nov 234 246 266
Dez 304 312 334
138
Notas de aula – Professor Azamor Cirne
FIM
139