Academico - Campi I e IV - 2018-2 - Republicado

Notas de aula – Professor Azamor Cirne
UNIVERSIDADE FEDERAL DA PARAÍBA

CENTRO DE CIÊNCIAS SOCIAIS APLICADAS
DEPARTAMENTO DE FINANÇAS E CONTABILIDADE
MÉTODOS QUANTITATIVOS
(NOTAS DE AULA)
ESTE MATERIAL, AINDA EM DESENVOLVIMENTO, NÃO SUBSTITUI A

BIBLIOGRAFIA CITADA NO PROGRAMA DA DISCIPLINA, APRESENTANDO-
SE COMO UM SUPORTE PARA OS ESTUDOS.
PROFESSOR: AZAMOR CIRNE DE AZEVEDO FILHO
2016.1
1
MÉTODOS QUANTITATIVOS
INTRODUÇÃO
Os métodos quantitativos são uma ferramenta que utilizam a matemática e as técnicas estatísticas
para investigação, análise e síntese de um fenômeno. Esses métodos quantitativos tem se tornado cada
vez mais frequente não só por aqueles que fazem ciência, mas também por todos os que desejam fazer
previsão ou apenas verificar o comportamento de determinado fenômeno através da utilização de
dados. A utilização desses métodos tem se tornado frequente devido ao auxílio da tecnologia da
informação e do processamento de dados em microcomputadores.
Essa ferramenta tem auxiliado outras ciências como a engenharia, a economia a agronomia, a
administração e nas ciências contábeis essa ferramenta tem auxiliado na transformação de dados em
modelos contábeis que permitem a tomada de decisões referentes à previsão ao planejamento fazendo
com que a contabilidade se aproxime mais dos processos de decisão auxiliando na minimização de
perdas e maximizando os lucros.
Entre os principais objetivos no uso do método quantitativo aplicados à Contabilidade podem ser
úteis nos seguintes assuntos:
a) gestão de custos (alocações de custos e transferências interdivisionais, intersetoriais e
interempresariais)
b) formação de preços
c) no tratamento de dados de um modo geral
d) no tratamento de dados de pesquisa
De um modo geral a disciplina de Métodos Quantitativos Aplicados À Contabilidade tem como

objetivo iniciar à aplicação de métodos, técnicas e ferramentas de análise, previsão e de problemas
relacionados com Contabilidade. Portanto, a utilização de métodos quantitativos no tratamento de
dados produz informações que se constituem de extrema valia à tomada de decisões informações estas
indispensáveis no processo de gestão e condição vital de sobrevivência.
2
PESQUISA CIENTÍFICA E ESTATÍSTICA
Fases do planejamento de pesquisa
a) Planejamento do problema:
• definição da importância do problema que se pretende estudar.
• determinação do objetivo e finalidade do estudo.
b) Avaliação da informação existente:

• revisão bibliográfica.
c) Formulação de hipóteses:
• em toda pesquisa, exceto naquelas meramente descritivas ou exploratórias, é necessária à
formulação de uma hipótese estatística que poderá ser comprovada ou rejeitada.
d) Verificação da hipótese:
• consistem da coleta de dados, análise estatística e apresentação dos resultados.
Relação entre a Pesquisa Científica e a Estatística
3
MÉTODO CIENTÍFICO
Método: é um meio mais eficaz para atingir determinada meta.
Ciência: Investigação racional ou estudo da natureza, direcionado à descoberta da verdade. Tal

investigação é normalmente metódica, ou de acordo com o método científico – um processo de avaliar
o conhecimento empírico;
Pesquisa: Uma pesquisa é um processo de construção do conhecimento que tem como metas
principais gerar novos conhecimentos e/ou corroborar ou refutar algum conhecimento pré-existente. É
basicamente um processo de aprendizagem tanto do indivíduo que a realiza quanto da sociedade na
qual esta se desenvolve. A pesquisa como atividade regular também pode ser definida como o conjunto
de atividades orientadas e planejados pela busca de um conhecimento.
Métodos Científicos: destacamos o método experimental e o método estatístico.
• Método Experimental → Neste tipo de pesquisa o investigador analisa o problema, constrói

suas hipóteses e trabalha manipulando os possíveis fatores, as variáveis, que se referem ao fenômeno
observado. A manipulação na quantidade e qualidade das variáveis proporciona o estudo da relação
entre causas e efeitos de um determinado fenômeno, podendo-se controlar e avaliar os resultados
dessas relações.
A pesquisa experimental procura entender de que modo ou por que causas o fenômeno é
produzido. Para atingir os resultados o pesquisador faz uso de aparelhos e de instrumentos que a
técnica moderna coloca ao seu alcance ou de procedimentos apropriados e capazes de tornar
perceptíveis as relações existentes entre as variáveis envolvidas no objeto de estudo.
Neste método é possível manter constantes todas as causas (fatores), menos uma, e variar esta
causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.
• Método Estatístico → A estatística é um método que se aplica ao estudo dos fenômenos

aleatórios e, praticamente, todos os fenômenos que ocorrem na natureza são aleatórios. Esse método se
fundamenta nos conjuntos de procedimentos apoiados na teoria da amostragem. E, como tal, é
4
indispensável no estudo de certos aspectos da realidade social, onde quer que se pretendam medir o
grau de correlação entre dois ou mais fenômenos.
O método Estatístico fundamenta-se na aplicação da teoria estatística da probabilidade e
constitui importante auxílio para a investigação. Porém, as explicações obtidas mediante a utilização
do método estatístico não podem ser consideradas absolutamente verdadeiras, mas dotadas de boa
probabilidade de serem verdadeiras.
Mediante a utilização de testes estatísticos, torna-se possível determinar, em termos numéricos, a
probabilidade de acerto de determinada conclusão, bem como a margem de erro de um valor obtido.
Portanto, o método estatístico passa a caracterizar-se por razoável grau de precisão, o que o torna
bastante aceito por parte dos pesquisadores com preocupação de ordem quantitativa.
Neste método é impossível manter as causas constantes (nas ciências sociais), admitem todas
essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado
final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma
mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter
constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros
produtos, etc.
Fases do Método Estatístico
I – Coleta de Dados → pode ser direta ou indireta.
a) Direta: quando feita sobre elementos informativos de registro obrigatório ou coletados pelo
próprio pesquisador. Essa coleta pode ser: contínua, periódica ou ocasional.
b) Indireta: quando é feita com base em elementos já pesquisados (revista, jornal, livros, etc.)
II – Crítica dos Dados → nesta fase os dados são contados e recontados, em busca de possíveis falhas
(omissões, repetições, etc), sendo:
a) Externa: informante
b) Interna: pesquisador
III – Apuração dos Dados → é a soma e o processamento dos dados obtidos. Pode ser manual,
eletromecânica ou eletrônica.
5
IV – Apresentação dos Dados → os dados devem ser apresentados sob a forma de tabelas e gráficos.
V – Análise dos Resultados → o objetivo último da Estatística é tirar conclusões sobre o todo a partir
de informações fornecidas por uma parte representativa, através de técnicas apropriadas.
6
REVISÃO DE ESTATÍSTICA
A Estatística pode ser definida como:
Definição 1 → “É a ciência que se preocupa com a coleta, organização, análise e interpretação dos
dados”.
Definição 2 → “É o conjunto de métodos e processos quantitativos que serve para medir e estudar os
fenômenos coletivos”.
Definição 3 → “A estatística é uma ciência da tomada de decisão diante de incertezas”.
Divisão da Estatística
A estatística pode ser classificada em:
• Estatística Descritiva (Dedutiva) → São a parte da estatística que trata da coleta, organização e
descrição dos dados (tabelas, gráficos, medidas). A Estatística Descritiva está relacionada com a
organização e descrição de dados associada a cálculos de médias, variâncias, estudo de gráficos, tabelas,
etc..
• Estatística Inferencial (Indutiva) → É a parte da estatística que trata da análise, interpretação e

tomada de decisão. Nesse tipo de análise os dados de uma amostra são usados para fazer estimativas
(inferência) e para testar hipóteses sobre as características de uma população. A Estatística Indutiva é o
objetivo básico da ciência e está associada, Estimação de Parâmetros, Testes de Hipóteses, Modelamento,
etc..
7
• Amostragem → A Amostragem é o ponto de partida (na prática) para todo um Estudo Estatístico. O
estudo de qualquer fenômeno, seja ele natural, social, econômico, exige a coleta e a análise de dados
estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa.
A amostragem é uma técnica para obter uma amostra representativa, suficiente e que possa ser
generalizada para a população. A amostragem pode ser realizada dos seguintes modos:
Modelos
Um dos objetivos da análise e interpretação de dados é buscar um modelo para as observações.
Estes modelos podem ser essencialmente determinísticos ou não determinísticos (probabilísticos ou
estocásticos).
Nos modelos determinísticos as condições sob as quais um experimento é executado determinam
o resultado do experimento. Ex.: As leis da física.
Nos modelos não determinísticos usa-se uma Distribuição de Probabilidade.
8
DEFINIÇÕES
Algumas definições úteis:
•Amostra → É um subconjunto de membros selecionados de uma população

•Análise exploratória de dados → técnicas para resumir, organizar e interpretar os dados, de uma
amostra ou da população, para obter informações.
•Censo → É um conjunto de dados obtidos de todos os membros da população;
•Dados → São observações coletadas (ex. idade, sexo e outros);
•Dados de seção transversal → São coletados ao mesmo tempo ou aproximadamente no mesmo ponto
do tempo.
•Dados de série histórica → São aqueles coletados em um longo período de tempo. Ex. variação
cotação do dólar nos últimos seis anos.
•Desvio-padrão → é a raiz quadrada da variância.
•Estatística → é a medida numérica que descreve a característica da amostra.
•Estimador → Um estimador de parâmetro θ é qualquer função das observações da amostra aleatória.
A partir dos estimadores se obtém valores denominados de estimativa.
•Inferência estatística → técnicas para generalizar estatisticamente os resultados de uma amostra para
a população.
•Média → Valor igual à soma dos números de uma lista dividida pela quantidade de números.
•Mediana → Valor tal que a metade dos números em uma relação está acima dele e metade abaixo.
•Moda - é o valor que ocorre com maior freqüência em uma lista de números.
•Observação → Conjunto de medidas obtidas para um único elemento.
• Parâmetro → É a medida numérica que descreve a característica da população.
•Parâmetro → É uma medida numérica que descreve uma característica de uma população. São
valores fixos, geralmente desconhecidos e usualmente representados por caracteres gregos.
•População → É a coleção completa de todos os elementos a serem estudados;
•Probabilidade → técnicas que permitem calcular a confiabilidade das conclusões de Inferência
Estatística.
•Variância → É uma medida de dispersão para uma relação de números. Simbolizas e por δ² (Sigma
ao quadrado).
•Variável → Uma ou mais características dos elementos a serem analisadas.
•µ (média populacional), π (proporção populacional), σ2 (variância populacional), σ (desvio-padrão
populacional).
9
Relação Entre Amostra e População
n = número de elementos da amostra N = número de elementos da população

(tamanho) (tamanho)
x = média da amostra μ = média da população
S2 = variância da amostra σ2 = variância da população
S = desvio padrão da amostra σ = desvio padrão da população
P = proporção estimada na amostra π = proporção na população
10
TIPOS DE VARIÁVEIS (DADOS)
Variável é o que se investiga, ou seja, é o objeto da pesquisa. As variáveis podem ser

classificadas como:
• Variáveis Quantitativas → são aquelas cujas características podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser: Discretas ou
Contínuas.
• Variáveis Discretas → características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente é o resultado
de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros
fumados por dia.
• Variáveis Contínuas → características mensuráveis que assumem valores em uma escala contínua
(na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através
de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial,
idade.
•Variáveis Qualitativas (ou categóricas) → são aquelas cujas características não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias que representam uma classificação
dos indivíduos. Podem ser: Nominais ou Ordinais.
11
•Variáveis Nominais → não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos,
fumante/não fumante, doente/sadio.
•Variáveis Ordinais → existe uma ordenação entre as categorias. Exemplos: escolaridade (1º, 2º, 3º
graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,...,
dezembro).
Quadro Resumo
Tipo de
Subtipo Característica
variável
Categorias, sendo que cada categoria é independente, sem relação
Categórica com as outras, Ex: raça (com categoria como caucasiana; negra, etc.),
nominal nacionalidade (brasileira, argentina, etc.), gênero (masculino,
Qualitativa feminino).
Categorias, sendo que cada categoria mantém uma relação de ordem
Categórica
com as outras que pode ser ou não regular. Ex: escolaridade com
ordinal
categorias como nível (1, 2, 3), classe social (A, B, C,...).
Números inteiros, sem frações, como em contagens. Ex: número de
Discreta
filhos, idade (em anos completos).
Quantitativa Números que podem assumir valores fracionários. Normalmente têm
Contínua intervalo de valores conhecido, mas um conjunto infinito de valores
possíveis. Ex: estatura, peso.
12
MEDIDAS EM UMA DISTRIBUIÇÃO
No estudo de uma distribuição é importante conhecer algumas medidas em função de suas

tendências, pois essas medidas fornecem informações que caracterizam a distribuição. A obtenção
dessas medidas é em função de suas próprias tendências características e através delas podem-se obter
informações de extrema valia da distribuição, ou seja, com alguns poucos valores pode-se ter uma
compreensão da distribuição que servirá para tomada de decisões.
a) Medidas de Tendência Central

Uma medida de tendência (medida de posição) central é um valor “intermediário” em torno do
qual a série se concentra e os outros elementos da série estão distribuídos. As principais medidas de
tendência central são: média, mediana e moda.
Média

Medidas de Posição  Moda
Mediana

• Media Aritmética
A média e o numero total de valores de um conjunto de dados dividido pelo numero de valores.
Para populações, a média e normalmente representada pela letra grega μ, enquanto que para amostras,
usamos o símbolo x . O processo usado para determinarmos o valor da média de um conjunto de dados
x1, x2, x3,..., xn, depende da maneira como os dados estiverem agrupados. Se não houver qualquer
agregação, a média e dada por:
n
1
Para amostra → x    xi , n = número de elementos da amostra
n i1
1 N
Para população →     xi , N = número de elementos da população
N i1
a) Média Para Dados não Tabelados: é a média é a média aritmética simples
Ex 01) Seja a amostra contendo o peso de 10 crianças de 5 anos de idade em kg: 23, 20, 22, 19, 25, 28,
24, 21, 27, 21.
13
1 n 23  20  22  19  25  28  24  21  27  21
x   xi = = 23 kg
n i1 10
b) Média Para Dados Tabelados Sem Intervalo de Classe: é a média é a média aritmética ponderada.
Os pesos são as frequências de cada valor.
n
 xi  f(xi )
i1 1 n
x  =   xi  f(xi ) ; sendo:
n n i1
 f(xi )
i1
f (xi) = frequência simples ou absoluta (quantidade de vezes em o valor aparece)
Ex 02) Seja o conjunto de dados da tabela abaixo

Notas = Xi Pesos = (fi) Xi ∙ fi
7,8 2 15,6
8,3 3 24,9
9,2 2 18,4
5,8 3 17,4
Σ 10 76,3
n
 xi  f(xi )
i1 7,8  2  8,3  3  9,2  2  5,8  3
x  = = 76,3/10 = 7,6
n 10
 f(xi )
i1
c) Média Para dados Tabelados Com Intervalos de Classe: é a média é a média aritmética ponderada.
O valor da variável usado é o valor médio de cada classe e os pesos são os valores das frequências de
cada classe.
Altura (cm) X fi Xi ∙ fi
150 |--- 158 153,5 18 2763
158 |--- 166 161,5 25 4037,5
166 |--- 174 169,5 20 3390
174 |--- 182 177,5 52 9230
182 |--- 190 185,5 30 5565
190 |--- 198 194,5 15 2917,5
Σ= 160 = n 27.903
14
n
 xi  f(xi )
i1 153,5  18  161,5  25  169,5  20 177,5 52 185,5 30 194,5  15
X = = 174,4
n 160
 f(xi )
i1
Ex 03) Uma companhia tem cem empregados e um diretor. Cinquenta dos empregados ganham
$500,00 por mês, outros cinquenta ganham $600,00 e o diretor ganha $20.000,00. Para descrever a
distribuição dos salários, é melhor usar a média ou a mediana?
A média dos salários da companhia é:
50  500  50  600  1  20000

 $743 ,00
101
Este número dá uma ideia falsa da distribuição dos salários, pois ele é maior que os salários de
100 dos 101 funcionários. Esta distorção é devida ao salário do diretor, que é muito maior que a média
dos outros salários. Aqui a mediana, que é $600,00 fornece uma ideia melhor da distribuição de
salários. De fato, ela é próxima da média quando é descartado o salário do diretor, que neste caso é:
50  500  50  600
 $550 ,00 , ou seja, aproximadamente $550,00.
100
A ideia a ser usada é que a mediana aproxima a média desde que sejam descartados valores
“atípicos”, isto é, valores isolados próximos dos extremos do intervalo de variação dos dados.
Equivalentemente, na presença de valores atípicos, a mediana fornece uma informação melhor do que
a média sobre a distribuição dos dados.
• Moda
É o valor que ocorre com maior frequência em uma distribuição.
Ex 01) Sejam as seguintes amostras com as suas respectivas medidas de tendência central:
• Amostragem A: {1, 2, 5, 10, 10, 18, 19}

Média = 10; mediana = 10; moda = 10 (unimodal)
15
• Amostragem B: {8, 8, 9, 10, 11, 12, 12}

média = 10; mediana = 10; moda = bimodal (8, 12)
• Amostragem C: {5, 6, 8, 10, 12, 14, 15}

média = 10; mediana = 10; moda = amodal (sem moda)
• Mediana (Md)
É o valor que divide uma distribuição ao meio.
A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma
da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores
extremos). A mediana é empregada quando
a) quando desejamos obter o ponto que divide a distribuição em duas partes iguais.
b) quando há valores extremos que afetam de forma acentuada a média aritmética.
c) quando a variável em estudo for salários.
Observe que as medidas de tendência central pouco ou nada informam a respeito da dispersão
(variabilidade) dos dados.
b) Medidas de Variabilidade (Dispersão)

É possível ter conjuntos diferentes de dados com mesmas medidas de tendência central. Portanto
essas medidas não são suficientes para diferenciar uma amostra da outra. As medidas de tendência
central fornecem um resumo parcial das informações de um conjunto de dados, necessita-se, portanto
de uma medida que expresse a variabilidade dos dados.
As principais medidas de variabilidade (dispersão) são:
Amplitude total
Variância

Medidas de Posição  
Desvio Padrão (Erro Padrão)
Coeficient e de Variação
16
Variância
A Variância é uma medida muito é mais utilizada para quantificar a variabilidade dos dados da
amostra (mede a dispersão desses valores em torno da média), pois ela é obtida usando-se todos os
dados da amostra e quanto menor o seu valor mais próximo os dados estão do seu valor médio.
A variância é representada por dois símbolos: 2 (letra grega sigma) para população e S2 para uma
amostra. As fórmulas para a variância da população e da amostra são apresentadas abaixo.
SQD 1 N
a) Para a População: 2     (xi   )2
N N i1
SQD = soma dos quadrados dos desvios (diferença entre cada valor e a média)
2
N
1  N 
 (Xi )  N    xi 
2
1 N 
2
1 N 1 N
i1 i  1 

2
Ou: 2     (xi )2     xi     (xi )2  x
N N i1 N i 1  N i 1
 
2
 n 
  xi 
n n i  1 
 (  (xi )2    )
SQD 1 1
b) Para a Amostra: S2     (xi  x)2 
GL n 1 i  1 n 1 i  1 n
SQD = soma dos quadrados os desvios.

GL = grau de liberdade
Graus de Liberdade (GL): de uma maneira geral, o número de graus de liberdade associados a uma
estatística é o número de elementos da amostra n, menos o número de parâmetros já estimados.
Existem n-1 desvios independentes (número de somas independentes lineares numa soma de
quadrados), e, é possível demonstrar que se utilizando o denominador n-1, obtém-se um estimador de
melhor qualidade da variância populacional  2 pela variância da amostra.
Em Resumo: Caracterizar um conjunto de dados por medidas de posição é inadequado, pois

conjuntos com medidas de posição semelhantes podem apresentar características muito diferentes com
relação à variabilidade do conjunto de valores. As medidas de variabilidade avaliam o grau de variação
ou heterogeneidade dos dados. Portanto essas medidas informam o grau de dispersão ou afastamento
dos valores observados em torno de um valor central (representativo) chamado media. Informa se um
conjunto de dados é homogêneo (pouca variabilidade) ou heterogêneo (muita variabilidade). As
17
medidas de dispersão quantificam de algum modo à variabilidade dos dados, geralmente utilizando
como referência uma medida de posição.
Ex 01) Sejam os seguintes conjuntos de dados:

M: {3, 4, 5, 6, 7} (média 5), os desvios (xi – x), são: {-2, -1, 0, 1 ,2}
N: {1, 3, 5, 7, 9} (média 5), os desvios (xi – x), são: {-4, -2, 0, 2, 4}
É fácil observar que a soma dos desvios é igual a zero.
Variâncias de M e de N:
S12 = [ (3-5)2 + (4-5)2 + (5-5)2 + (6-5)2 + (7-5)2 ] / 4 S12 = 2,5
S22 = [ (1-5)2 + (3-5)2 + (5-5)2 + (7-5)2 + (9-5)2 ] / 4 S22 = 10
Conclusão: A amostra “M” é mais homogênea (possui menor variância).
Desvio Padrão
Sendo a variância é uma medida que expressa um desvio quadrático médio. A unidade da
variância é a unidade dos dados originais ao quadrado. Para dados expressos em centímetros a
variância será expressa em centímetros quadrados. Para dados são medidos em R$ (Real), a variância é
dada em Real ao quadrado (R$2). Como medida de dispersão a variância tem a desvantagem de
apresentar unidade de medida igual ao quadrado da unidade dos dados observados. O Desvio padrão
vem contornar essa situação, pois sendo ele definido como a raiz quadrada da variância a sua unidade
de medida de variabilidade é a mesma unidade de medida original. Os desvios padrão da população e
da amostra são representados, respectivamente por σ (sigma) e S.
SQD
a) Para a População:    2   
N
2
 N 
  xi 
N N i  1  N  N 
2
 (xi  )2
 (xi )   N 
2
 (xi )   xi 
2
i1 i1 i1 i 1 
    
N N N N 
 
 
 
2
 N 
  xi 
i1  2
Observe que o termo  N  corresponde à média ao quadrado ( X ) .
 
 
 
18
2
 n 
  xi 
n n i  1 
 (xi  x)2  (xi )2   n 
SQD i1 i1
b) Para a Amostra: S  S2  S   
GL n 1 n 1
Ex 01) Considerando os dados da variância do exemplo anterior. Os desvios padrão das amostras M e
N são:
• para a amostra M → S  2,5  1,58
• para a amostra N → S  10  3,16
O desvio padrão pode ser interpretado como:

a) a maioria dos valores da amostra está compreendida no intervalo X  S , ou seja, se um valor for
escolhido ao acaso ele terá uma grande chance de se encontrar no intervalo: X  S  X  X  S . Como
exemplo, se os dados da amostra M seguem uma distribuição normal 68,26% deles encontra-se no
intervalo: 5  1,8  X  5  1,8 , ou seja, entre os valores: 4,2  X  6,8 . Observe o gráfico de uma
distribuição normal e as porcentagens dos dados entre desvios padrão.
b) as amostras M e N tem médias iguais, mas como o desvio padrão da amostra M é menor do que o da
amostra N os valores da amostra M estão mais concentrados em torno do seu valor médio do que os da
amostra N.
19
Gráficos de distribuição de freqüência
Várias são as formas dos gráficos de uma distribuição de frequências.
FÓRMULAS
a) Para dados dispostos sem distribuição de freqüência.
i) Variância e Desvio Padrão (DP para população):

N N
 (xi  )2  (xi   )2
i1 i1
2  ; 
N N
ii) Variância e Desvio Padrão (DP) para amostra:

N N
 (xi  x)2  (xi  x)2
i1 i1
S2  ; S
n 1 n 1
b) Para dados dispostos com distribuição de freqüência (fi) com ou sem intervalos de classe.
i) Variância e Desvio Padrão (DP) para população:

N N
 (xi   )2  f i  (xi  )2  fi
2 i1 i1
  ; 
N N
ii) Variância e Desvio Padrão (DP) para amostra:

N N
 (xi  x)2  fi  (xi  x)2  fi
i1 i1
S2  ; S
n 1 n 1
20
VARIÁVEL ALEATÓRIA (VA)
Muitos experimentos aleatórios produzem resultados não numéricos. Antes de analisá-los, é

conveniente transformar seus resultados em números, o que é feito através da variável aleatória, que é
uma regra de associação de um valor numérico a cada ponto do espaço amostral.
Uma variável aleatória discreta é uma função definida sobre o espaço amostral e assumindo
valores num conjunto enumerável de pontos do conjunto real, é dita.
Uma variável aleatória X discreta estará bem caracterizada se indicarmos os possíveis valores x 1,
x2,..., xk que ela pode assumir e as respectivas probabilidades P(x1), P(x2), …, P(xk), ou seja, conhecer a
função de probabilidade (X; P(X)), sendo: P(X) = P(X = x)
Variável Aleatória é uma função que associa a todo evento pertencente a uma partição do espaço
amostral um único número real. Essas variáveis são usadas em modelos probabilísticos e podem ser:
Contínua ou Discreta.
Variável aleatória Discreta
Esse tipo de variável assume um número finito ou infinito numerável de valores distintos.
Sejam: “E” um experimento e “S” o espaço associado ao experimento. Uma função X, que
associe a cada elemento “s”  “S” um número real X(s) é denominada Variável Aleatória (VA).
Ex 01) E: lançamento de duas moedas e X uma variável aleatória:

X: nº de caras obtidas nas duas moedas;
S = { (c,c), (c,r), (r,c),(r,r) }
X = 0  corresponde ao evento (r,r) com probabilidade 1/4.
X = 1  corresponde ao evento (r,c), (c,r) com probabilidade 2/4.
X = 2  corresponde ao evento (c,c) com probabilidade 1/4.
21
A distribuição de probabilidade está representada abaixo:
Função de probabilidade
Em uma distribuição discreta de probabilidade é a função que associa a cada valor assumido pela
variável aleatória a probabilidade do evento correspondente, isto é:
P(X = x i) = P(A i), i = 1, 2,..., n
Distribuição de probabilidade
Uma vez definida a variável aleatória, existe interesse no cálculo dos valores das probabilidades
correspondentes.
O conjunto das variáveis e das probabilidades correspondentes é denominado distribuição de
probabilidades, isto é:
{ ( x i , p (x i), I = 1, 2,…,n }
Valor Esperado (Esperança), Variância e Desvio Padrão de uma VA

Existem características numéricas que são muito importantes em uma distribuição de
probabilidades de uma variável aleatória discreta. São os parâmetros das distribuições, a saber:
a) Valor Esperado (Esperança Matemática) E(X) → O valor esperado ou esperança de uma variável
aleatória X é um número real que representa uma média aritmética. E(X) (lê-se: valor esperado da
variável aleatória X)
A esperança matemática (expectância, ou média ou ainda valor esperado) da variável aleatória X é

simbolicamente representada por E(X). Matematicamente o valor E(X) pode ser obtido como:
1
a) E(x)   x , ou
N
b) E(x)   x  p( x )
A esperança matemática é somatório dos produtos de cada valor assumido pela variável aleatória pela
sua respectiva probabilidade.
22
b) Variância Var(x) → É a medida que dá o grau de dispersão (ou de concentração) de probabilidade

em torno da média. O fato de conhecermos a média de uma distribuição de probabilidades já nos ajuda
bastante, porém precisamos de uma medida que nos dê o grau de dispersão de probabilidade em torno
dessa média.
A variância de uma variável aleatória X é definida é representada simbolicamente por Var(X) ou
E[( x  x)2 ] . A simbologia E[( x  x)2 ] significa: o valor esperado da variável aleatória ( X  X ) 2 .
Matematicamente a variância é definida como:
Observação: A variância de uma variável qualquer mede a sua dispersão em torno de seu valor médio.
1
a) VAR(x)  E[(x  x)2 ] 
N
 (x  x)2 , ou:
1
b) VAR(X)   (x)2  (x)2
N
c) VAR(X)  E[(x  x)2 ]   (x  x)2  P( x )
A fórmula acima pode ser interpretada como: o somatório dos produtos da probabilidade de cada
variável aleatória pela diferença entre o valor dessa variável e a média das variáveis. A variância de
uma variável aleatória unidimensional também pode ser obtida a partir a equação abaixo:
d) Var( X )  E[( x  x )2 ]  E( x2 )  [E(x)]2
sendo: E(X2 )   X2  P( X ) (somatório do valor esperado da variável aleatória ao quadrado pela sua
respectiva probabilidade).
Demonstração:
Var( X )  E[( x  x )2 ]  E[ ( x 2  2  x  x  x 2 ]
Var( X )  E[( x  x )2 ]  E[ ( x 2  2  x  E(x)  (E(x))2 ]
Var( X )  E( x 2 )  E( 2  X  E(x) )  E[ (E(x) )2 ]
Var( X )  E( x 2 )  2E( X) E(x) )  (E(x) )2
Var( X )  E( x 2 )  2  (E(x) )2  (E(x) )2
Var( X )  E( x 2 )  (E(x) )2
c) Desvio Padrão - DP(X) → É a raiz quadrada da variância.
O desvio padrão de uma variável aleatória é definido como:

23
DP(X)  Var(X)
Propriedades do Valor Esperado:

Se a e b são constantes e X uma VA, então:
1) E(a) = a
2) E(b·X) = b·E (X)
3) E(X + a) = E(X) + a
4) E(a + b·X) = a + b·E(X)
5) E(a + b·X + c·X2) = a + b·E(X) + c·E(X2)
Propriedades da Variância:
Para a e b denotando constantes e X uma VA,
1) Var(X) não pode ser negativa
2) Var (X + a) = Var(X)
3) Var (b·X) = b2·Var(X)
4) Var (a + b·X) = b2·Var(X)
Exemplos Resolvidos Sobre Variável Aleatória (VA)
Ex 01) Calcule a média e a variância e o desvio padrão utilizando as diversas fórmulas: para a VA:
X = {2, 3, 3, 4}.
Solução: primeiramente vamos montar um quadro de distribuição (variável aleatória e respectiva
probabilidade):
X P(X)
2 1/4
3 2/4 = 1/2
4 1/4
Σ=1
• Cálculo da Média:
1
E(X)  X   x = 1/4 (2 + 3 + 4) = 3 ; Ou
N
E(X)   x  P( x ) = 2(1/4) + 3(2/4) + 4(1/4) = 12/4 = 3
24
● Cálculo da Variância:
• primeiro modo:
1 1
Var(X) 
N
 (x  x)2  4 [(2  3)2  (3  3)2  (3  3)2  (4  3)2 ] = 1/4(1+0+0+1) = 2/4 =1/2 = 0,5
• segundo modo:
1 1 1
Var(X)    (x)2  (x)2  [22  3 2  3 2  4 2 ]  3 2  [4  9  9  16]  9 = 1/4(38) – 9 = 9,5-9 = 0,5
N 4 4
Observação: calcular a variância através dos dois primeiros modos só é possível se soubermos N (o
número total de vezes que todas as variáveis aparecem).
• terceiro modo: (usando a probabilidade):

1 2 1 1 1 2
E[(X  X)2 ]   (x  x)2  p(x) = [(2  3)2   (3  3)2   (4  3) 2  ] =   = 1/2
4 4 4 4 4 4
• quarto modo: (usando a probabilidade):
1 2 1 4 18 16
E[( X  X )2 ]  E( X2 )  [E(X)]2 = [22   32   42  ]  32 = [   ]  9  9,5  9 = 0,5
4 4 4 4 4 4
• Cálculo do Desvio Padrão:

DP  0,5 = 0,71
Ex 02) Com referência a distribuição de probabilidades da VA do exemplo anterior, qual o valor

esperado e a variância do número de caras obtidas no lançamento de duas moedas?
Solução: seja X o número de caras. Observe que a média é 1 (X  1) .
X P(X) (X  X ) 2 ( X  X ) 2 · P(X)
0 1/4 1 1·1/4 = 1/4
1 1/2 0 0·1/2 = 0
2 1/4 1 1·1/4 = 1/4
Σ 1 1/2 = 0,5
  E(X)   xi  P(xi ) = (0) (1/4) + (1) (1/2) + (2) (1/4) = 1
2  Var(X)  E( x   x )2   ( x  x)2  p(x) = 1 (1/4) + 0 (1/2) + 1 (1/4) = 1/2 = 0,5
2  Var(X)  E( X2 )  (E( X ))2 = [(0)2 (1/4) + (1)2 (1/2) + (2)2 (1/4)] – 12 = 0,5
25
Ex 03) Uma seguradora paga $30.000,00 em caso de acidente de carro e cobra uma taxa de $1.000,00.
Sabe-se que a probabilidade de que um carro sofra um acidente é de 3%. Quando espera a seguradora
ganhar por cada carro segurado?
Solução: Seja X: “lucro” por carro e E(X) = lucro médio por carro
X P(X) X · P(X)
1000 0,97 970
-29000 0,03 - 870
Σ=1 E(X) = Σ x · P(x) = 100
E(X) = $100,00, isto é o lucro médio por carro é de $100,00.
Ex 04) As probabilidades de venda de um determinado bem com lucro de $3.500,00 de $1.500,00 e

$500,00 ou com prejuízo de $500,00 são: 0,20; 0,35; 0,22 e 0,10 respectivamente. Qual o lucro
esperado?
x1 = 3500; x2 = 1500; x3 = 500 ; X4 = -500
P(x1) = 0,2 ; P(x2) = 0,35 ; P(x3) = 0,22 ; P(x4) = 0,10
E(X) = (3500)(0,2) + (1500)(0,35) + (500)(0,22) + (-500)(0,10) = 1.285
Ex 05) A tabela abaixo mostra a distribuição de freqüência de um teste realizado com 150 indivíduos
para avaliar uma determinada característica. Calcule o valor esperado, a variância e o desvio padrão da
variável aleatória X.
Característica X 1 2 3 4 5
Frequência f(X) 24 33 42 30 21
Solução:
Distribuição de probabilidade é:
X 1 2 3 4 5
P(X) 0,16 0,22 0,28 0,20 0,14
Tabela auxiliar para o cálculo:

X P(X) X· P(X) (X-μ)2 (X-μ)2 · P(X)
1 0,16 0,16 3,764 0,602
2 0,22 0,44 0,884 0,194
3 0,28 0,84 0,004 0,001
4 0,20 0,80 1,124 0,225
5 0,14 0,70 4,244 0,594
Σ 1,00 2,94 --- 1,616
μ = 2,94 ; σ2 = 1,616 ; σ = 1,27

26
Ex 06) O retorno mensal de certo investimento de risco é mostrado na tabela abaixo. Calcule o retorno
esperado em (%) do investimento, sua variância e seu desvio padrão.
X -5% 0% 5% 10% 15%
P(X) 0,40 0,15 0,25 0,15 0,05
E(X) = (-5)(0,40) + (0)(0,15) + (5)(0,25) + (10)(0,15) + (15)(0,05) = 1,5%

σ2 = (%)2·[(-5-1,5)2(0,40) + (0-1,5)2(0,15) + (5-1,5)2(0,25) + (10-1,5)2(0,15) + (15-1,5)2(0,05)] →
σ2 = (%)2·[18,2250+0,4594+2,1125+13,2125+8,7781] = (%)2(43,1875) = 0,00403 ; σ = 0,06344
Ex 07) Calcule a média variância e desvio padrão para cada um dos investimentos a e B e calcule a
covariância entre esses investimentos.
Retorno por cada $1.00,00
Condição Econômica P(X)
Investimento A Investimento B
Recessão 0,2 - $100,00 - $200,00
Estável 0,5 $100,00 $50,00
Expansão 0,3 $250,00 $350,00
•Para A:
E(A) = 0,2(-100) + 0,5(100) + 0,3(250) = $105,00
Var(A) = σ2A = (0,2)(-100-105)2 + (0,5)(100-105)2 + (0,3)(250-105)2 = 14.725,00 ; σA = 121,35
•Para B:
E(B) = 0,2(-100) + 0,5(100) + 0,3(250) = $90,00
Var(B) = σ2B = (0,2)(-200-90)2 + (0,5)(50-90)2 + (0,3)(350-90)2 = 37900,00 ; σB = 194,67
Cov(X,Y) = 0,2(-100-105)(-200-90) + 0,5(100-105)(50-90) + 0,3(250-105)(350-90) = 23.300,00
Ex 08) Calcule o valor esperado, a variância e o desvio-padrão do investimento A.

INVESTIMENTO A
Cenário Retorno Probabilidade
Recessão 7% 20%
Estabilidade 16% 50%
Crescimento 20% 30%
E(A) = 7% (0,20) + 16% (0,50) + 20% (0,30) = 15,4%

Var(A) = σ2A = (7% - 15,4%)2 (0,20) + (16% - 15,4%)2 (0,50) + (20% - 15,4%)2 (0,30) = 20,64(%)2
DP(A) = σA = (20,64)1/2 = 4,54%
27
Ex 09) A tabela abaixo mostra a distribuição de probabilidade, calcule: o valor esperado, a variância e
o desvio padrão.
X 0 1 2 3 4 5 6 7
P(X) 0,210 0,367 0,275 0,115 0,029 0,004 0,000 0,000
Solução:
X P(X) X · P(X) X2 X2 · P(X)
0 0,210 0,000 0 0,000
1 0,367 0,367 1 0,367
2 0,275 0,550 4 1,100
3 0,115 0,345 9 1,035
4 0,029 0,116 16 0,464
5 0,004 0,020 25 0,100
6 0,000 0,000 36 0,000
7 0,000 0,000 49 0,000
Σ 1 1,398 --- 3,066
E(X) = 1,398
σ2 = Var(X) = E[(X – E(X))2] = E[(X)2] – [E(X)]2 = 3,066 – (1,398)2 = 1,112
σ = DP = (1,112)1/2 = 1,054
Ex 10) Sejam X1, X2 e X3 os números de pizzas pequenas, médias e grandes, respectivamente,

vendidas durante o dia em uma pizzaria. Elas são variáveis aleatórias com valores esperados E(X1) =
25, E(X2) = 57 e E(X3) = 40. Os preços das pizzas pequena, média e grande são $5,50; $7,60 e $9,15.
Portanto, a receita esperada das vendas de pizzas em determinado dia será:
E(5,50·x1 + 7,60·x2 + 9,15·x3) = 5,50·E(x1) + 7,60·E(x2) + 9,15·E(x3) =
= 5,50(25) + 7,60(57) + 9,15(40) = $936,70
A receita efetiva de qualquer dia pode ser diferente desse valor, mas essa é a receita esperada.
28
Exercícios Propostos Sobre Variável Aleatória (VA)
Ex 01) Considere que o tempo t, em minutos, necessário para um funcionário processar operação,
sendo ‘T’ uma variável aleatória discreta com a sua respectiva (tabela abaixo), calcule o tempo médio
e a variância de processamento.
T 2 3 4 5 6 7
P(T = t) 0,1 0,1 0,3 0,2 0,15 0,15
Variável Aleatória Contínua
Esse tipo de variável assume um número infinito não numerável de valores distintos. Através do
histograma e possível ter uma ideia da distribuição de probabilidade associada a uma variável aleatória
continua X. Se subdividirmos o histograma em barras de largura = 1 unidade, a probabilidade P(c ≤ x
≤ d) e dada pela área abaixo do histograma entre X = c e X = d.
Seja X uma variável aleatória tal que:

a) f ( x )  0, para todo e qualquer x  R

b)  f ( x ) dx 1

Define-se para qualquer a < b em R:

b
P (a  x  b)   f ( x ) dx  1
a
A variável aleatória X e uma variável aleatória contínua e f(x) e sua função densidade de
probabilidade. Veja o exemplo abaixo.
Ex 01) Uma pesquisa revelou a seguinte distribuição de probabilidades para o aluguel de um carro em
função da sua idade.
Idade (anos) 0 |--- 1 1 |--- 2 2 |--- 3 3 |--- 4 4 |--- 5 5 |--- 6 6 |--- 7

Probabilidade 0,20 0,28 0,20 0,15 0,10 0,05 0,02
29
O histograma desta distribuição, a esquerda na figura abaixo, sugere uma curva como a que e
apresentada na figura da direita. Esta curva e a chamada “função densidade de probabilidade”.
Suponhamos que pretendemos calcular a probabilidade de que um carro alugado tenha

entre 0 e 4 anos.
De acordo com a tabela, P(0 < X < 4) = 0,20 + 0,28 + 0,20 + 0,15 = 0,83.
Observando a figura seguinte, nota-se que poderíamos obter o mesmo resultado somando as
áreas correspondentes as barras desde que estas tenham 1 unidade de largura.
A curva de densidade de probabilidade deve ser tal que a área por ela delimitada para 0  x  4 seja
igual a:
4
P(0  x  4)   f ( x ) dx  0,83
0
Poderíamos estimar o valor pretendido tomando metade do retângulo entre 0 e 4 (ver figura).
30
A função densidade de probabilidade deve satisfaze as seguiste condições:

a) tivesse um comportamento semelhante ao que e descrito acima.

b) P (    x   )   f ( x ) dx  1
0
7
No caso acima: P ( 0  x  7)   f ( x ) dx  1
0
E se pretendermos calcular P(2 < X < 3,5)?
3,5
Ou então: P ( 2  x  3,5)   f ( x ) dx  1
0
31
DISTRIBUIÇÃO CONJUNTA DE VARIÁVEIS ALEATÓRIAS
Muitas vezes o pesquisador está interessado em estudar o comportamento de mais de uma

variável em um experimento. Por exemplo, o pesquisador está interessado em verificar a distribuição
conjunta de uma variável X (salário) e da variável Y tempo de serviço em anos.
Ex 01) O quadro abaixo faz referência ao tempo de serviço (Y) e ao respectivo salário (X) de dez
operários. Determinar a distribuição conjunta de probabilidade. (exemplo do livro:?)
Operário A B C D E F G H I J
X 5 6 6 8 8 8 7 7 7 6
Y 6 5 6 4 6 6 5 6 6 5
Solução: a distribuição conjunta de probabilidade é:
Y Para X
4 5 6
X Probabilidade Marginal
5 0 0 1/10 0 + 0 + 1/10 = 1/10
6 0 2/10 1/10 0 + 2/10 + 1/10 = 3/10
7 0 1/10 2/10 0 + 1/10 + 2/10 = 3/10
8 1/10 0 2/10 1/10 + 0 + 2/10 = 3/10
Para Y
1/10 3/10 6/10 1
Probabilidade Marginal
P(X=50 , Y=4) = 0 ; P(X = 60 , Y = 5) = 2/10 (2 dentre 10 que ganham $60,00 e tem 5 anos)
Os valores esperados (médias) das variáveis X e Y são:
X P(X) X · P(X) Y P(Y) Y · P(Y)

5 1/10 5/10 4 1/10 4/10
6 3/10 18/10 5 3/10 1/10
7 3/10 21/10 6 6/10 36/10
8 3/10 24/10 Σ=1 E(Y) = 5,5
Σ = 1 E(X) = 6,8
32
•Para X
1 1
Var(X) 
N
 (x  x)2  10 [1 (5  6,8)2  3  (6  6,8)2  3  (7  6,8)2  3  (8  6,8)2 ] →
1
Var(X)   [3,24  1,92  0,12  4,32] → σ2X = 1/10 (96) = 9,6 ; DPx  9,6 = 0,9798
10
Ou:
1 3 3 3 2
E[( X  X )2 ]  E( X2 )  [E(X)]2 = Var(X)  [52   62   72   82  ] - 6,8 = 47,20 – 46,24 = 0,960
10 10 10 10
•Para Y
1 1
Var(Y) 
N
 (y  y)2 
10
[1 (4  5,5)2  3  (5  5,5)2  6  (6  5,5)2 ] →
1
Var(Y)  [2,25  0,75  1,5] → σ2Y= 1/10 (4,5) = 0,45 ; DPx  0,45 = 0,6708
10
Ou:
1 3 6 2
E[( Y  Y )2 ]  E( Y 2 )  [E(Y)]2 = Var(Y)  [42   52   62  ] - 5,5 = 30,70 – 30,25 = 0,45
10 10 10
Covariância
O grau de dispersão conjunta e de associação linear entre duas variáveis aleatórias podem ser
avaliados pela covariância e pelo coeficiente de correlação.
A covariância e a correlação são instrumentos estatísticos utilizados para verificar a dependência
entre variáveis aleatórias.
A covariância é uma medida estatística que serve para avaliar se duas séries se movem juntas.
Quando covariância é positiva, as variáveis se movem juntas (se uma aumenta a outra também
aumenta) e, quando é negativa se movem em direções opostas (se uma aumenta a outra diminui).
A covariância é uma esperança sendo ela o valor esperado da variável aleatória [
(X  E(X))  (Y  E(Y)) ].
Simbolicamente a variância é representada como:

Cov (X, Y)  E[(X  E(X))  (Y  E(Y))]
Cov (X, Y)  E[(X  X)  (Y  Y)]
Matematicamente a covariância é pode ser definida como:

1
a) Cov(X,Y)    [(X  X)  (Y  Y)] , ou:
N
33
1  X  Y  , ou:
b) Cov(X,Y) 
N 
 (X  Y)  
N 
c) Cov(X,Y) 
1
  (X  Y) 
X  Y 
1
  (X  Y)  X  Y , ou
N N N N
Demonstração:
1 N 1 N
Cov (X,Y) =   [(x  x)  (y  y)] → Cov (X,Y) =   [x  y  x  y  x  y  x  y]
N i 1 N i 1
1 N N N N 1 N N N
Cov (X,Y) = ( x  y   x  y   x  y   x  y ) → Cov (X,Y) =  (  x  y  y   x  x   y  N  x  y)
N i 1 i 1 i 1 i 1 N i 1 i 1 i 1
1 N 1 N
Cov (X,Y) =  [(  x  y)  y  N  x  x  N  y  N  x  y] → Cov (X,Y) =  [(  x  y)  2  N  x  y  N  x  y]
N i 1 N i 1
1 N 1 N
Cov (X,Y) =  [(  x  y)  N  x  y] → Cov (X,Y) =  [(  x  y)  x  y
N i 1 N i 1
● Quando se dispõe das probabilidades conjuntas P(X,Y), a covariância pode ser calculada como:
d) Cov(X,Y)  E[(X  X)  (Y  Y)]  (X  X)  (Y  Y))  P(X,Y) , ou:

e) Cov(X,Y)  E[(X   X )  (Y  Y )]   (X   X )  (Y   Y ))  P(X,Y) , ou:
f) Cov(X,Y)  E[(X  E(X))  (Y  E(Y)]  (X  E(X)) (Y E(Y)) P( X,Y)
A covariância é o somatório dos produtos de (X  E(X))  (Y  E(Y)) pelas respectivas

probabilidades conjuntas. A covariância também pode ser obtida como:
g) Cov(X,Y)  E(X  Y)   X  Y ou Cov(X,Y) = E(X·Y) – E(X) · E(Y), sendo:
E(X  Y)   (X  Y)  P( X , Y) → (valor esperado da variável aleatória (X·Y)
E(X)   X  P(X) → (valor esperado da variável aleatória (X)

E(X)   Y  P(Y) → (valor esperado da variável aleatória (Y)
Demonstração:
Cov(X,Y) = E[(X – E(X))· (Y - E(Y))] = E[(X Y – X·E(Y)) – E(X)·Y + E(X)·E(Y)]
Cov(X,Y) = E(X·Y) – E(X)·E[E(Y)] – E[E(X)]·E(Y) + E[E(X)·[E(Y)]
Cov(X,Y) = E(X·Y) – E(X)·E(Y) – E(X)·E(Y) + E(X)·E(Y)
Cov(X,Y) = E(X·Y) – E(X)·E(Y)
34
Observação: Se não existir relação linear entre as variáveis X e Y a covariância é zero.

Observação: Duas variáveis aleatórias X e Y são independentes se os resultados obtidos por X não
influenciarem os resultados obtidos por Y, e vice-versa. Se os resultados de X influenciarem os
resultados de Y, X e Y serão dependentes.
Observação: Duas variáveis independentes possuem covariância nula. Porém, quando a covariância
entre duas variáveis for nula não implicará, necessariamente que elas sejam independentes, ou seja,
pode existir uma relação não linear entre elas.
Seja a equação da covariância: Cov(X,Y) = E(X·Y) – E(X) · E(Y).

Quando a covariância entre as variáveis aleatórias X e Y nula tem-se:
0 = E(X·Y) – E(X) · E(Y) → E(X·Y) = E(X) · E(Y) ou,
X Y P(X,Y) = (X P(X)) · (Y (PY)) → P(X,Y) = P(X) · (PY))
Observação: Duas variáveis aleatórias são independentes se para todo par (xi,yi) a probabilidade
conjunta é igual ao produto das probabilidades marginais:
P(X = xi, Y= yi) = P(X = xi) · P(Y = yi)
Distribuição Conjunta – Exercícios Resolvidos
Ex 01) A partir da distribuição conjunta (abaixo) de duas variáveis aleatórias discretas X e Y, pede-se:
a) probabilidade conjunta de X = 1 e Y = 2 ; b) probabilidade marginal de X = 1
c) probabilidade condicional de Y = 2 dado que X = 1 ; d) covariância entre essas variáveis
X
0 1 2
Y
1 3/20 3/20 2/20
2 1/20 1/20 2/20
3 4/20 1/20 3/20
Solução:
X
0 1 2 P(Y) marginais Y · P(Y)
Y
1 3/20 3/20 2/20 8/20 8/20
2 1/20 1/20 2/20 4/20 8/20
3 4/20 1/20 3/20 8/20 24/20
P(X) marginais 8/20 5/20 7/20 1 E(Y) = Σ = 40/20 = 2
X · P(X) 0 5/20 14/20 E(X) = Σ = 19/20
35
• probabilidade conjunta de X = 1 e Y = 2 é P(X=1,Y=2) = 1/20.

• probabilidade marginal de X=1 é P(X=1) = 5/20.
• probabilidade condicional de Y = 2 dado que X = 1 é:
P(X  1, Y  2) 1 / 20
P(Y  2 / X  1)   = 0,2
P(X  1) 5 / 20
• cálculo da covariância - primeiro modo:
Cov (X, Y)  E[(X  E(X))  (Y  E(Y))   (X  E(X))  (Y  E(Y))  P(X, Y)
19 3 19 3 19 2
Cov (X, Y)  (0  ) (1  2)  (1  ) (1  2)  (2  ) (1  2) 
20 20 20 20 20 20
19 1 19 1 19 2 19 4
 ( 0  ) ( 2  2)  (1  ) (2  2)  (2  ) (2  2)  (0  ) (3  2) 
20 20 20 20 20 20 20 20
19 1 19 3
 (1  ) (3  2)  (2  ) (3  2) 0
20 20 20 20
• cálculo da covariância - segundo modo: usando a fórmula: Cov(X,Y) = E(XY) – E(X)·E(Y)
i) cálculo de E(XY). Deve-se para cada valor do quadro (para cada dupla de valores de X e Y)
calculamos o valor do produto XY e multiplicar pela respectiva probabilidade conjunta.
E(XY) = (0) (1) (3/20) + (1) (1) (3/20) + (2) (1) (2/20) + (0) (2) (1/20) + (1) (2) (1/20) +
+ (2) (2) (2/20) + (0) (3) (4/20) + (1) (3) (1/20) + (2) (3) (3/20) = 1,9
ii) Cálculo das médias (valores esperados):

E(X) = 0 (8/20) + 1 (5/20) + 2 (7/20) = 19/20 = 0,95
E(Y) = 1 (8/20) + 2 (4/20) + 3 (8/20) = 2
Substituindo na fórmula Cov(X,Y) = E(XY) – E(X)·E(Y), tem-se:

Cov(X,Y) = 1,9 – (0,95) (2) = 0
Ex 02) A partir da tabela abaixo calcular:

a) E(X); b) Var(X); c) σ(X); d) E(Y); e) Var(Y); c) σ(Y); d) Cov(X,Y)
Y
0 1 2 3
X
0 1/8 2/8 1/8 0
1 0 1/8 2/8 1/8
Solução:
36
Y
0 1 2 3 P(X) X · P(X) X2 · P(X)
X
0 1/8 2/8 1/8 0 4/8 0 0
1 0 1/8 2/8 1/8 4/8 4/8 4/8
2
P(Y) 1/8 3/8 3/8 1/8 1 E(X) = 0,5 E(X ) = 0,5
Y · P(Y) 0 3/8 6/8 3/8 E(Y) = 1,5
Y2 · P(Y) 0 3/8 12/8 9/8 E(Y2) = 3
P(X = 0, Y = 0) = 1/8
P(X = 0) = 4/8 e P(Y = 0) = 1/8
P(X = 0, Y = 0) ≠ P(X = 0) · P(Y = 0) = não são independentes.
a) E(X) = 0,5
b) Var(X) = E(X)2 – [E(X)]2 = 0,5 – (0,5)2 = 0,25
c) E(Y) = 1,5
d) Var(Y) = E(Y)2 – [E(Y)]2 = 3 – (1,5)2 = 0,75
e) Cov(X,Y) = E(X·Y) – E(X) · E(Y) = 1 – (0,5) · (1,5) = 0,25
E(X·Y) = (0)(0)(1/8) + (0)(1)(2/8) + (0)(2)(1/8) + (0)(3)(0) + (1)(0)(0) + (1)(1)(1/8) + (1)(2)(2/8) +

(1)(3)(1/8) = 1/8 + 4/8 + 3/8 = 8/8 = 1
Dependência entre VA:

Para verificarmos a dependência (ou independência) entre duas variáveis aleatórias X e Y, basta
verificarmos se a probabilidade conjunta de cada par de valores assumido pelas variáveis aleatórias é
igual ao produto das probabilidades marginais, para esses valores. Para que haja independência, todas
as probabilidades conjuntas deverão ser iguais ao produto das probabilidades marginais.
P (X = xi ; Y = yj) = P( X = xi) ∙ P(Y = yj), para todo xi e para todo yj.
Ex 03) Verifique se as variáveis aleatórias da distribuição conjunta abaixo são independentes.

X
1 2 P(X)
Y
1 0,15 0,29 0,44
2 0,31 0,25 0,56
P(Y = Yi) 0,46 0,54 1
Solução:
37
• P (X = 1, Y = 1) = 0,15; P (X = 1) = 0,46; P( y = 1) = 0,44

verificando: (0,46) (0,44) = 0,20 que é diferente de 0,15
• P (X = 1, Y = 2) = 0,31; P (X = 1) = 0,46; P( y = 1) = 0,56
verificando: (0,46) (0,56) = 0,26 é que diferente de 0,31
• P (X = 2, Y = 1) = 0,29; P (X = 1) = 0,54; P( y = 1) = 0,44
• P (X = 2, Y = 2) = 0,25; P (X = 1) = 0,54; P( y = 1) = 0,56
Observação: Se todos os valores de probabilidade conjunta forem iguais aos produtos das
probabilidades marginais significa que as variáveis são independentes (equação abaixo).
P(X  xi , Y  yj)  P( xi )  P( yj)
Se pelo menos um valor de probabilidade conjunta for diferente do produto das probabilidades
marginais, caracteriza dependência entre as variáveis. No exemplo todos os produtos foram diferentes.
Ex 04) Calcule a covariância entre os títulos abaixo:

Retorno do Título A Retorno do Título B
Situação da Economia
(RA) (RB)
Recessão -15% 20%
Estabilidade 35% -15%
Crescimento 55% 10%
Valor esperado do retorno do título A: E(RA) = (-15% + 35% + 55%) / 3 = 25%

Valor esperado do retorno do título B: E(RB) = (20% - 15% + 10%) / 3 = 5%
Cov(A,B) = 1/3[(-15% - 25%) (20% - 5%) + (35% - 25%) (-15% - 5%) +
+ (55% - 25%) (10% - 5%)] = - 216,667(%2)
Ex 05) Calcule: média, variância, desvio padrão para cada um dos investimentos a e B e calcule a
covariância entre esses investimentos.
Retorno por cada $1.00,00
Condição Econômica P(X)
Investimento A Investimento B
Recessão 0,2 - $100,00 - $200,00
Estável 0,5 $100,00 $50,00
Expansão 0,3 $250,00 $350,00
38
E(A) = 0,2(-100) + 0,5(100) + 0,3(250) = $105,00

E(B) = 0,2(-100) + 0,5(100) + 0,3(250) = $90,00
Var(A) = σ2 = (0,2)(-100-105)2 + (0,5)(100-105)2 + (0,3)(250-105)2 = 14.725,00 ; σ = 121,35
Var(B) = σ2 = (0,2)(-200-90)2 + (0,5)(50-90)2 + (0,3)(350-90)2 = 37900,00 ; σ = 194,67
Cov(A,B) = 0,2(-100-105)(-200-90) + 0,5(100-105)(50-90) + 0,3(250-105)(350-90) = 23.300,00
Distribuição Conjunta - Exercícios Propostos
Ex 01) Considere a seguinte distribuição conjunta de X e Y. Pede-se:

Y
-2 -1 4 5
X
1 0,1 0,2 0 0,3
2 0,2 0,1 0,1 0
a) as distribuições marginais de X e Y
b) E(X), E(Y) e E(XY) Resposta: 1,4 ; 1,0 ; 0,9
c) calcular  2 x ,  2 y ,  2 x ,  2 y Resposta: 0,24 ; 9,6 ; 0,4899 ; 3,0984

d) covariância entre X e Y Resposta: -0,5
Ex 02) Considere a seguinte distribuição conjunta de X e Y. Pede-se:

Y
0 1 2
X
0 0,10 0,20 0,20
1 0,04 0,08 0,20
2 0,06 0,05 0,07
Resposta: P(X=0) = 0,50; P(X=1) = 0,32; P(X=2) = 0,18;
Resposta: P(Y=0) = 0,20; P(Y=1) = 0,33; P(Y=2) = 0,47;
b) E(X), E(Y) e E(XY) Resposta: 1,27 ; 0,68 ; 0,86
c) covariância entre X e Y Resposta: -0,0036
d) variância de X e de Y Resposta: 0,5975 ; 0,5776
e) Desvios padrão de X e de Y Resposta: 0,7727 ; 0,76
e) verifique se as variáveis são independentes
39
Ex 03) A partir da distribuição conjunta de X e Y na tabela abaixo. Pede-se:

Y
-2 -1 -4 5
X
1 0,1 0,2 0 0,3
2 0,2 0,1 0,1 0
b) E(X), E(Y) e E(XY)
c) variância de X e de Y
d) covariância entre X e Y
Ex 04) Considere a seguinte distribuição conjunta de X e Y na tabela abaixo. Pede-se:

Y
0 1 2
X
0 0,10 0,20 0,20
1 0,04 0,08 0,08
2 0,06 0,12 0,12
b) E(X), E(Y) e E(XY)
c) variância de X e de Y
d) covariância entre X e Y
Correlação
Em diversas investigações deseja-se avaliar a relação entre duas medidas quantitativas. Por
exemplo: alturas de filhos relacionadas com as alturas dos seus pais; receita e despesa; salário e
consumo; renda e poupança, aquecimento global e desgelo; taxa de financiamento e volume de venda;
investimento em propagando e volume de venda.
Os principais propósitos para essas investigações são:

a) para verificar se os valores estão associados. (Os valores de uma medida tendem a crescer (ou
decrescer) à medida que a outra cresce?)
b) para predizer o valor de uma variável a partir de um valor conhecido da outra.
40
c) para descrever a relação entre variáveis. (dado um aumento específico numa variável, qual o
crescimento médio esperado para a segunda variável?)
A covariância não é muito utilizada para medir a associação linear entre variáveis, pois o
universo de valores que pode assumir é imenso podendo assumir valores negativos ou positivos e a sua
unidade é de difícil compressão. Para contornar essa situação estabeleceu-se o coeficiente de
correlação linear (r para amostra e  para população) para medir a associação entre variáveis. Esse
fator tem a vantagem de ser adimensional (sem unidade) situar no intervalo:  1  r  1 . Esse fator é
definido matematicamente como:
Cov (X, Y) E(XY )  E(X)  E(Y) x y

  
x  y x  y x  y
Ex 01) A partir a tabela de distribuição conjunta, calcule o coeficiente de correlação entre as variáveis
X e Y.
X
5 10 15 P(Y)
Y
5 1/10 2/10 1/10 4/10
10 2/10 3/10 1/10 6/10
P(X) 3/10 5/10 2/10 1
Sejam P(X) e P(Y) as distribuições marginais

• verificar se X e Y são “independentes”: para isto, verifique conjunta para todas as células se o
produto das probabilidades marginais é igual a probabilidade. Para a primeira célula no canto superior
esquerdo, temos P(X=5) · P(Y=5) = (3/10) (4/10) = 12/100 que é diferente de 1/10.
Desta forma, basta uma não satisfazer para constatar-se que X e Y não são independentes.
• Cálculo das Médias:

a média de X é E(X) = 5(3/10) + 10(5/10) + 15(2/10) = 9,5
A media de Y é E(Y) = 5(4/10) + 10(6/10) = 8
• Cálculo das Variâncias:

a variância de X é: E(X2) – [E(X)]2 = [52(3/10) + 102(5/10) + 152(2/10)] – 9,52 = 12,25
a variância de Y é: E(Y2) – [E(Y)]2 = [52(4/10) + 102(6/10)] – 82 = 6
41
• Cálculo da Covariância:
Cov (X, Y )  E[( X   X )  (Y   Y )]   (X   X )  (Y   Y ))  P(X, Y)
= (5 – 9,5) (5-8) (1/10) + (10 – 9,5) (5-8) (2/10) + ...+ (15 – 9,5) (10-8) (1/10) = – 1
Ou ainda:
Cov (X, Y)  E(X  Y)  E(X)  E(Y)   (X  Y)  P(X, Y)  E(X)  E(Y)
= [(5) (5) (1/10) + (5) (10) (2/10) + (5) (15) (1/10) + (10) (5) (2/10) + (5) (10) (3/10) +
+ (10) (1) (1/10)] – (9,5) (8) = – 1
• Cálculo do Coeficiente de Correlação:

Cov (X, Y) 1
 =  = - 0,1166
x  y 12,25  6
O que você não pode deixar de saber:

Observações 1: Se X e Y são variáveis aleatórias independentes, então Cov(X,Y)=0 e
consequentemente ρxy = 0.
Observações 2: Se o coeficiente de correlação entre duas variáveis for nulo (igual a zero) implica que
não existe relação linear entre as variáveis.
Observações 3: Se duas variáveis aleatórias X e Y são independentes não existe correlação entre elas,
ou seja o coeficiente de correlação entre elas é nulo. Se o coeficiente de correlação entre duas variáveis
for nulo não significa necessariamente que elas são independentes pois pode haver outro tipo de
relação que não seja linear.
Observações 4: Correlação não significa causa e efeito. Duas variáveis podem estar altamente
correlacionadas e, no entanto, não haver relação de causa e efeito entre elas.
Observações 5: Se duas variáveis possuem uma relação de causa e efeito elas estão, necessariamente,
correlacionadas.
Observações 6: Se Cov(X,Y) = 0 não implica que X e Y sejam variáveis aleatórias independentes, a
não ser que X e Y tenham distribuição normal bivariada.
Observações 5: O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição
normal.
Observações 6: Denomina-se simples a análise de correlação que envolve apenas duas variáveis.
Nesse caso, a amostra é formada por um conjunto de pares de valores.
42
Exercícios Propostos Sobre Distribuição Conjunta
01) Seja (X,Y) uma variável aleatória bidimensional discreta com a distribuição conjunta dada na
tabela abaixo. Pede-se:
a) E(X); b) Var(X); c) σ(X); d) E(Y); e) Var(Y); c) σ(Y); d) Cov(X,Y); e) ρ(X,Y)
X
-3 2 4
Y
1 0,1 0,2 0,2
3 0,3 0,1 0,1
02) Calcular o coeficiente de correlação das questões 01, 02, 03 e 04 do item anterior referente a
covariância.
43
FUNÇÕES
As funções servem para relacionar grandezas. Por grandeza entendemos tudo que pode ser
medido pesado ou contado. Observamos assim que estamos rodeados por grandezas e vivemos num
mundo de grandezas.
Em todas as ciências e no nosso cotidiano procura-se sempre saber como uma grandeza varia em
função de outra grandeza. Por exemplo:
a) qual o preço P a ser pago pela quantidade de litros (L) de combustível que um caro foi abastecido.
b) o preço P a ser pago em restaurante em função da quantidade (Q) de comida colocada no prato.
c) em uma viagem desejamos saber o tempo gasto (t) em função da velocidade (v).
d) o custo de produção (C) de um determinado produto é função da quantidade (q) de unidades
produzidas.
e) a quantidade de produtos vendidos (quantidade demandada) é uma função do preço (p) do produto.
f) pacotes turísticos vendidos para o exterior é uma função do dólar.
As funções são representadas por equações matemáticas que expressam quantitativamente como
uma grandeza varia em função de outra. Por exemplo:
a) y = 2 ∙ x. Esta equação está mencionando que a grandeza y corresponde a duas vezes a grandeza x.
b) P = 2,5 ∙ L. P é o preço pago pela quantidade de litros L colocados no tanque. O preço por cada litro
$2,50. Observe que se não colocarmos nenhum litro pagaremos: P = 2,5 ∙ 0 = $0,0. Se colocarmos um
litro, pagaremos: P = 2,5 ∙ 1 = $2,5 e assim por diante. O preço pago é uma função da quantidade de
litros.
Outro exemplo que podemos citar é a função custo total (Ct). Essa função é composta de duas
partes, a saber: a primeira é o custo fixo e a segunda é o custo variável que está ligado ao número de
unidades produzidas. A equação do custo total é representada analiticamente da seguinte forma:
Ct = a + b ∙ x
a = representa o custo fixo
b = representa o custo para produzir uma unidade
x = representa a quantidade de peças produzidas
Como exemplo dessa função, podemos citar: Ct = 80 + 2 ∙ x.
44
Sendo o custo total uma função da quantidade de peças produzidas, observe que, quanto maior a
quantidade de unidades produzidas maior o custo total.
Este tipo de função em que quando se aumenta o valor de uma grandeza o correspondente valor
da outra grandeza também aumenta é chamada de função crescente.
Uma função que relaciona a quantidade demandada e preço de uma mercadoria é denominada
função demanda. A função demanda pode ser representada como:
D=a-b∙P
a e b são valores
P representa o preço do objeto ou serviço
Como exemplo dessa função, podemos citar: D = 80 - 5 ∙ P. Nesta equação observe que, quanto maior
for o preço do produto menor será a quantidade demandada, ou seja, quando se aumenta o valor de P o
correspondente valor de D diminui. Este tipo de função em que quando se aumenta o valor de uma
grandeza o correspondente valor da outra grandeza diminui é chamada de função decrescente.
Gráficos de Funções
As funções anteriormente mostradas relacionando grandezas são denominadas funções do

primeiro grau. Uma função qualquer do primeiro grau é representada analiticamente como:
y = a ∙ x + b, sendo:
a e b são números quaisquer (constantes), podendo ser negativos ou positivos.
x é variável independente (representa uma grandeza qualquer)
y é a variável dependente (representa uma grandeza qualquer)
O termo variável significa uma grandeza que varia, assumindo diversos valores. O termo
constante significa valores fixos.
É de costume representar a relação entre as grandezas através de tabela ou de gráficos. Os

gráficos dão uma visão do comportamento de uma grandeza em relação à outra. Os gráficos nos
permitem:
a) visualizar os valores assumidos pelas grandezas bem como os valores que elas podem assumir.
b) tirar conclusões e fazer previsão de valores futuros.
45
O gráfico de uma função do primeiro grau é uma reta.

Observe graficamente (gráfico abaixo) os comportamentos de uma função crescente e de uma função
decrescente. Veja que na função crescente o valor de x aumenta e o correspondente valor de y também
aumenta. Na função decrescente, o valor de x aumente e o correspondente valor de y diminui.
A função oferta relaciona o preço e quantidade oferecida de uma mercadoria e essa função
reflete o comportamento do produtor, pois quanto mias o preço sobe, existem mais produtores
interessados em colocar no mercado quantidades cada vez maiores de seu produto, no entanto se o
preço cai a oferta diminui. A função oferta é uma função crescente, pois, na medida em que a
quantidade Q aumenta o preço P também aumenta.
46
A função demanda é uma função decrescente, pois, na medida em que a quantidade Q aumenta o
preço P diminui e vice-versa.
Interseção de Retas
Considere a função linear receita total: RT = 2.q e a função custo total: CT = 2 + q, definida no
intervalo: 0 ≤ q ≤ 4. A representação gráfica dessas duas funções está na figura abaixo. Observe que
ambas as funções são crescentes e que elas se cruzam e m um determinado ponto. Esse ponto é
chamado de interseção, pois elas se interceptam nesse ponto. Para essas duas curvas esse ponto é
denominado ponto de nivelamento (alguns autores denominam ponto de equilíbrio), ou seja, onde a
receita se nivela (equilibra) com a despesa.
Em muitos casos se está interessado em determinar as coordenadas (x,y) desse ponto. O

procedimento para a determinação desse ponto parte da observação que nesse ponto para um mesmo
valor de “qe” (quantidade de equilíbrio) a receita e a despesa têm valores iguais a “pe" (preço de
equilíbrio). O ponto de interseção pode ser determinado resolvendo o sistema de equações composto
47
pelas equações das duas retas. Se a receita é igual à despesa, então, para acharmos o valor de “qe”
basta igualar as duas equações.
Rt  2 q

Ct  2  q
No equilíbrio tem-se: Rt = Ct → 2q = 2 + q → 2q – q = 2 → q = 2 = qe
Para se determinar o valor “pe" basta substituirmos o valor de “qe” em qualquer uma das duas
equações:
Rt = 2 (2) = 4 ou
Ct = 2 + 2 = 4
assim, as coordenadas do ponto de nivelamento são: (2,4).
48
ANÁLISE DE REGRESSÃO E DE CORRELAÇÃO
Tanto as medidas de tendência central como as de dispersão são extremamente úteis na

estimação para verificação de apenas um único parâmetro de uma população. Em grande parte das
pesquisas o pesquisador está interessado em verificar o comportamento de uma variável (grandeza) em
com relação a outras, ou seja, como uma variável dependente Y varia se uma ou mais variáveis
independentes x1, x2, x3,..., xn (que supostamente influenciam Y) variarem. Como exemplo tem-se:
a) como o faturamento varia em função do lucro

b) como a taxa básica de juros varia em função do índice da bolsa
c) como o consumo varia em função da renda
d) como as vendas variam em função da publicidade e da propaganda
e) custo a produção varia em função do treinamento e dos salários dos funcionários.
Uma das preocupações para quem analisa variações entre grandezas como as exemplificadas
acima é a de criar modelos matemáticos que explicitem estruturas do fenômeno em observação, ou
seja, como uma grandeza varia em função de outras.
A análise de regressão e de correlação é uma técnica estatística que tem objetivo estudar o
comportamento entre duas ou mais variáveis relacionadas de forma não determinística. Essas análises
estudam a forma como uma variável aleatória Y (chamada variável dependente, variável resposta ou
variável explicada) se comporta na presença de outras variáveis X (chamadas variáveis independentes,
explicativas ou regressores).
A partir de amostras selecionadas de populações, a regressão e a correlação possibilitam

comprovar numericamente se tem fundamento lógico uma suposta existência de relação entre as duas
ou mais variáveis. A análise de regressão fornece como resultado uma equação matemática que
descreve o relacionamento entre variáveis como descrito acima. Esta equação é utilizada para estimar
ou predizer valores futuros de uma variável quando se conhece o valor da outra variável. A análise de
correlação mede a força, ou grau, de relacionamento entre duas variáveis; a regressão dá a equação
que descreve o relacionamento em termos matemáticos.
49
Tanto a análise regressão como a de correlação analisam dados amostrais com o intuito de
verificar como duas ou mais variáveis estão relacionadas uma e alastrar essa informação para a
população. A análise de regressão pode ter os seguintes propósitos:
a) o propósito explicativo tenta demonstrar uma relação matemática que pode indicar, mas não prova
uma relação de causa-efeito.
b) o propósito preditivo tenta estimar ou predizer valores futuros da variável dependente atribuindo
valores a(s) variável(eis) independente(s). Em áreas, como administração, economia, pesquisa médica,
agronomia e engenharias o interesse maior está na predição.
c) propósito exploratório, quando se deseja determinar e quantificar as variáveis que influenciam no

fenômeno. Em áreas como educação e psicologia, a ênfase é dada ao grau ou força do relacionamento
(correlação) – dependência de álcool e desemprego; consumo de droga e adolescência.
De forma resumida: A regressão fornece uma equação matemática que descreve o

relacionamento entre as variáveis e a correlação quantifica mede a força, ou grau de relacionamento
entre duas variáveis entre elas – covariabilidade – (não é necessário que uma variável seja dependente
e a outra independente).
Se suspeitarmos a existência uma relação de causa e efeito entre duas variáveis, os modelos de
regressão tentam explicar valores de uma variável em termos de outra. Portanto, a análise de regressão
apenas indica qual relacionamento matemático pode existir, se existir algum. Em outras palavras, nem
a regressão nem a correlação podem mostrar que uma variável tenda a "causar" certos valores de outra
variável. A explicação de uma relação causal deve ser proveniente das teorias referentes ao fenômeno
em estudo e não da estatística.
A análise de regressão é uma ferramenta que pode ser aplicada a qualquer área do conhecimento
tais como: administração, economia, agricultura, pesquisa médica etc. Algumas aplicações da análise
de regressão são:
a) nos processos de gestão de custos e preços, análise de regressão e correlação possibilita uma série de
insights úteis no processo de geração de informações e tomada de decisões.
50
b) pode-se, por exemplo, analisar o comportamento volumétrico dos custos – identificando custos
fixos e variáveis – sem, necessariamente, ser preciso efetuar uma classificação de cada gasto.
c) utilização conjunta de técnicas de regressão e correlação nas análises relativas aos orçamentos,
como, por exemplo, estimativa de vendas, custos e preços futuros.
Modelo Matemático e Modelo Estatístico

Um modelo é tido como matemático (ou determinístico) se as variáveis em questão não
dependem de valores aleatórios, como por exemplo: A área de um quadrado é obtida como o produto
da base vezes a altura ( A  b x h ).
Um modelo é estatístico (aleatório ou não determinístico) se as variáveis em questão dependem de
valores aleatórios, ou seja, estão sujeitos a erro. Por exemplo: o produto do peso pela altura de uma
pessoa de 30 anos de idade não é uma constante.
Modelos de Regressão
Os modelos e regressão expressam o relacionamento entre variáveis e vários são os possíveis
tipos de relacionamentos entre elas. A figura abaixo mostra alguns tipos de comportamento entre
variáveis.
O relacionamento pode ser do tipo linear e não linear. Um modelo é dito linear nas variáveis se
os expoentes das variáveis forem do primeiro grau. A equação representativa do modelo linear é:
Y    1X1   2 X 2   3 X 3  ...   n Xn  
Y = variável dependente (explicada, resposta, prevista: regressando, saída, efeito).
X = variável independente (explicativa, de controle, preditor, regressor, entrada, causa).
 = erro (ruído, distúrbio).
Obs.: a variável é dita explicativa por tentar explicar as variações de Y.
O modelo é dito linear simples quando envolve apenas duas variáveis. A sua representação é:
51
Y =  + b1X1 + , (equação de uma reta)
O caso mais simples do modelo linear múltiplo é o caso de uma variável dependente e duas
variáveis independentes, a sua representação é:
Y =  + b1X1 + 2X2 + , (equação de um plano)
Os modelos não lineares (múltipla) são representados por equações: exponencial, geométrica,
parabólica, hiperbólica, etc.). Esses modelos também podem ser do tipo simples quando envolve
apenas duas variáveis ou múltipla quando envolve uma variável dependente de duas ou mais variáveis
independentes.
O quadro abaixo resume os modelos de regressão.
Independentemente do modelo, em uma análise de regressão o objetivo é determinar (estimar o

valor dos parâmetros , b1, 2,... n. para que a equação (modelo) possa ser constituída. Alguns
métodos se prestam para esse propósito sendo o método dos mínimos quadrados o mais utilizado.
Existem outros métodos como os polinomiais (aproximação com polinômio), mas elas não
sempre fornecem aproximações aceitáveis.
52
(Observações Iniciais)
REGRESSÃO LINEAR SIMPLES
O estudo aqui realizado sobre Regressão Linear Simples (RLS) não aborda a problemática em
toda a sua complexidade, pelo fato de apresentar-se este material como tópico de um curso introdutório
aos Métodos Quantitativos. Os conceitos e exemplos aqui estudados dão uma boa noção do assunto,
porém, um estudo mais aprofundado escaparia aos objetivos do programa e comprometeria o
ensinamento de outros tópicos.
Em um estudo mais completo sobre Análise de Regressão Simples, os pressupostos do Modelo
(abaixo descritos) deveriam ser validados, bem como a avaliação do modelo.
Pressupostos da Análise de Regressão linear Simples
Y    x   . Equação de regressão da população

Sendo: α , β = parâmetros
ε = erro
Y  abx  e. Equação de regressão da amostra. Essa equação é obtida através da utilização de um
conjunto de pontos (x,y).
Sendo: a e b = estimativa dos parâmetros; e = erro.
O erro “e” é diferença entre o valor Yi da amostra e o valor Yi estimado pela regressão. O erro é uma
variável aleatória e é matematicamente definido como:
e  (Yi  Yi ) =
PRESSUPOPSTOS DOS MODELOS DE REGRESSÃO LINEAR SIMPLES:
• Pressuposto 1 – O relacionamento é linear entre as variáveis:

Y    x  
Y = variável explicada
X = variável explicativa
• Pressuposto 2 – O termo erro “e” tem média zero:
E(e)  0  E(Y)  E(  x  )  E(  x)  E()    x  0
• Pressuposto 3 – O termo erro “e” tem variância constante:
53
Var(e)  E(e2 )  2 (constante)

• Pressuposto 4 – Os termos erro “e” não são correlacionados, ou seja, a correlação serial é zero:
Cov(e i ,e j )  E(ei e j )  0 para i  j
• Pressuposto 5 – Os valores da variável independente X (variável explicativa) não são randômicos,

portanto não são correlacionados com o termo erro:
Cov(X,e)  E(Xe)  0
• Pressuposto 6 – (não necessário) – O erro tem distribuição normal com média zero e variância 2 :
E N(0, 2 )  Y N[(    x), 2 ]
Estimativa da variância dos erros:

n n
 (ei )2  (Yi  Yi )2
2 i 1 i 1 SQR
    , sendo
nk nk nk
n = quantidade de dados (tamanho da amostra)
k = quantidade de variáveis
ANALISE DE VARIÂNCIA PARA O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)

ANOVA
Teste de Aderência na Regressão (teste F).

SSR
p 1
F F(p 1 ; np)
SSE
np
54
AVALIAÇÃO DO MODELO DE REGRESSÃO
55
REGRESSÃO LINEAR SIMPLES (RLS)
Nos modelos de regressão linear simples procura-se determinar uma equação do tipo
Y  a  b  X . Sendo Y é a variável dependente e X a variável independente responsável pela variação
de Y.
A utilização do método dos mínimos quadrados (MMQ) permite determinar os valores dos
parâmetros “a” e “b”. São modelos matemáticos que relacionam o comportamento de uma variável Y
com outra X. Para isso suponha que se tenha coletado “n” pares de valores das variáveis:
{(x1,y1), (x2,y2), ...(xn, yn)}, desejando-se obter uma equação de Y em função de x. Passos a serem
seguidos:
a) plotar esses pares de pontos em um sistema gráfico e verificar a tendência do comportamento desses
pares de pontos. A nuvem de pontos (x,y) disposta no gráfico é chamada de diagrama de dispersão. O
Diagrama de Dispersão é uma maneira simples de se verificar a tendência de uma correlação caso ela
exista.
b) neste caso escolhe-se a regressão como sendo linear, pois, observa-se que uma reta seria a melhor
forma para representar a variação de Y em função de X (Y  F( x ) ) (gráfico abaixo).
O erro amostral é uma variável aleatória não observáve, e é estimado pelçosa resíduos, ous seja, pela
diferença entre o valor observado e o o valor estimado pela regressão.
56
c) observa-se que existe uma diferença entre o valor de Y fornecido pela equação da reta (calculado) e
o valor observado correspondente a um Xi qualquer - essa diferença é chamada de erro (em
econometria seria chamada de ruído) e representamos como ε.
O Método dos Mínimos Quadrados (MMQ) fornece o procedimento de obtenção dessa reta de
regressão de modo que esses erros sejam os mínimos possíveis.

O erro “ε” pode ser definido como a diferença entre o valor calculado ( Y ) e o valor obtido nas
observações (no experimento ou na amostra) (Y). Esse erro pode ser negativo ou positivo e
matematicamente pode ser representado como:

  YY
Y = valor observado

Y = valor calculado através da reta
e para cada ponto observado (Xi,Yi) tem-se um erro representado como:

Yi  Yi  i
O método dos mínimos quadrados (MMQ) preconiza que a soma de todos esses erros seja
mínima. Como a reta de regressão passa pelos pontos médios, a soma dos valores dos erros dos pontos
que estão acima da reta é numericamente igual à soma dos erros dos pontos que estão abaixo da reta,
porém com sinal contrário. Se efetuarmos a soma algébrica o resultado seria zero e não
57
conseguiríamos constituir equações de modo a poder obter os parâmetros da reta, ou seja, o coeficiente
angular e o coeficiente linear (intercepto). A solução encontrada foi minimizar a soma dos quadrados
dos erros.
Procedimento (formulação) para obtenção dos parâmetros da reta. Suponha que a reta seja
representada pela equação Ŷ  a  b  X , e que


 2  (Y  Y) 2
( i ) 2  [Y i  (a  b  Xi )] 2
O somatório dos quadrados dos erros é:

n n ^
 ( i )2   (Yi  Y i) 2
i1 i1
n n
 ( i )2   [Yi  (a  b  Xi)]2
i1 i1
n
Chamemos  ( i ) 2 de Qe para facilitar o desenvolvimento. Observemos que Qe depende de a e de
i 1
b. Derivando Qe em relação a e em relação a b tem-se:

 Qe
  2  ( Y  a  b  X )
a
 Qe
  2  X( Y  a  b X)
b
 Qe  Qe
Para que Qe seja mínimo devemos fazer e iguais à zero, então:
a b
0   2  ( Y  a  b  X )  ( Y  a  b  X )  0
0  2  X( Y  a  b  X)  X( Y  a  b  X)  0
Ou equivalente,
 Y  n  a  b  X (I)
 X  Y  a  X  b   X2 ( II )
O passo seguinte será resolver o sistema formado pelas equações (I) e (II) para obter as expressões
para a e para b:
58
Na equação (I) dividiremos ambos os membros por n (número de pontos) e lembrando que:
Y Y
n
b  X
 bX
n
Então:
Y 
n  a b  X
  Y  a  b  X , ou
n n n
a  Y  bX (III)
Substituindo o valor de (III) em (II) tem-se:
 X  Y  (Y  b  X)   X  b   X2
 X  Y  Y   X  b  X   X  b   X2
Y   X
 XY n
X b n
 X  b   X2
Y   2 (  X)
2
 XY   X  b    X  
n  n 
YX
 XY  n n XY  Y X
b 
(  X)2 n   X2  (  X)2
 X2 
n
Denominando:
(  X)2
Sxx   (X  X)2   X2  n
YX
Sxy   (X  X)  (Y  Y)   X  Y  n
A partir dos resultados acima os valores de “a” (intercepto) e “b” (coeficiente angular) são obtidos
como:
Sxy
b (IV)
Sxx
a  Y  bX (V)
Ŷ  a  b  X (VI)
59
Observações: Para a reta de regressão tem-se:

a) é mínima a soma dos quadrados dos desvios para a reta de regressão, menor que a de qualquer outra
reta de ajuste;
b) é igual a zero a soma algébrica dos desvios verticais entre o valor da ordenada de dada ponto da
amostra analisada e correspondente ordenada da reta estimada;
c) através da equação de regressão é possível verificar que a reta de mínimos quadrados passa pelos
pontos de coordenadas (X , Y) .
Sxy
d) o coeficiente de regressão b  mede a taxa de variação de Y em relação a X.
Sxx
Coeficiente de Correlação
O coeficiente de correlação é um número que expressa uma medida numérica do grau de relação
linear encontrada. Esse tipo de análise é muito útil em trabalhos exploratórios em várias áreas do
conhecimento, quando se procura determinar as variáveis potencialmente importantes. Para
calcularmos a correlação utilizaremos a seguinte fórmula:
Cov(X,Y)

x  y
(  X)  (  Y)
XY  n
rx,y  , ou
 2 (  X)
2   2 (  Y)
2
 X     Y  
 n   n 
n   X  Y  (  X)  (  Y)
rx,y 
[n   X2  (  X)2 ]  [n   Y 2  (  Y)2 ]
O intervalo de variação de r é:  1  rx , y  1. Então:
a) quanto mais próximo r estiver de + 1, mais próximo estarão os pontos de ajuste integral de uma reta
crescente;
b) quanto mais próximo r estiver de -1, mais próximos estarão os pontos de ajuste integral a uma reta
decrescente;
c) se r = 0, não existe nenhuma relação numérica linear para os pares de valores da amostra analisada.
60
Correlação Positiva
Quando o valor do coeficiente de correlação estiver no intervalo: 0 < r < 1.
Correlação Perfeita Positiva

Quando o coeficiente de correlação for igual a um (r = 1).
Correlação Negativa
Quando o valor do coeficiente de correlação estiver no intervalo: -1 < r < 0.
Correlação Perfeita Negativa

Quando o valor do coeficiente de correlação for igual: r = - 1.
Correlação Nula
A correlação é nula quando não há relação ente x e y. As variáveis são independentes e o r = 0.
61
Coeficiente de Correlação Correlação

r 1 Perfeita positiva
0.8  r  1 Forte positiva
0.5  r  0.8 Moderada positiva
0.1  r  0.5 Fraca positiva
0  r  0.1 Ínfima positiva
0 Nula
0.1  r  0 Ínfima negativa
0.5  r  0.1 Fraca negativa
0.8  r  0.5 Moderada negativa
1  r  0.8 Forte negativa
r  1 Perfeita negativa
Correlação Não Linear

Como anteriormente explicado, quando a correlação é zero pode existir outro tipo de relação
entre as variáveis que não linear. Os gráficos abaixo mostram outros tios de relação não linear entre
variáveis.
62
Coeficiente de Determinação (R2)
O valor de Y obtido através da equação de regressão para um determinado valor de X nem

sempre corresponde ao valor observado na tabela. Isto significa que os valores observados nem sempre
serão iguais aos valores estimados pela reta de regressão. Haverá sempre alguma diferença, e essa
diferença significa:
a) que as variações de Y não são perfeitamente explicadas pelas variações de X ou,
b) que existem outras variáveis das quais Y depende ou,
c) que os valores de X e Y obtidos de uma amostra específica apresentam distorções em relação a
realidade. Esta diferença em estatística é chamada de “erro” ou desvios.
O coeficiente de determinação mede a quantidade da variação de Y que é explicada pela variação

de X. Para determinada observação Yi, a diferença relativamente ao valor da de Y é chamada de
desvio total. Pode ser decomposta numa soma de duas parcelas: o desvio explicado pela reta de
regressão e o desvio não explicado.
Desvio Total = Desvio explicado + Desvio não explicado
Coeficiente de Determinação na Regressão Linear Múltipla
Para a regressão linear simples a equação abaixo se verifica:
 (Y  Y)2   (Y  Y)2   (Y  Y)2 , sendo:

Essa equação menciona que a: Variação total = variação explicada + variação não explicada
63
(Y  Y)2 = (SST) = soma dos quadrados totais (variação total)
(Y  Y)2 = (SQE) = soma dos quadrados dos erros (variação não explicada)
(Y  Y)2 = (SQR) = soma dos quadrados da regressão (variação explicada pela regressão)
O coeficiente R2 matematicamente é definido como:
VE var iação exp licada

R2   (definição geral)
VT var iação total
O coeficiente de determinação para a Regressão Linear Simples (RLS) pode ser calculado como:
R2 
SQR

 (Y  Y)2
SQT  (Y  Y)2
Para Regressão Linear Simples (RLS) valem as seguintes fórmulas:

VE b2  S xx b  S xy
1) R2   
VT S yy S yy
 (  X)2 
b2    X2  
 n  b2  (n   X2  (  X)2 )
2) R2  =
 2 (  Y)
2 n   Y 2  (  Y)2 )
 Y  
 n 
3) O coeficiente de determinação (R2) corresponde numericamente ao coeficiente de correlação (r)

elevado ao quadrado.
R2 = (r)2
Se R 2  r 2 → r  R2
4) O coeficiente de determinação ajustado (Ra2) é uma maneira de compensar a quantidade de

variáveis independentes e a quantidade de dados colocados em um modelo e assim ser possível
comparar com modelos semelhantes.
(n  1)
Ra2  1  (1  R2 ) 
n  k 1
n = quantidade de dados
k = quantidade de variáveis independentes
64
Observação 1: R2 é um símbolo (não é R ao quadrado).

Observação 2: o valor de r é numericamente igual a raiz quadrada do coeficiente de determinação,
porém ele terá o mesmo sinal de b (declividade da reta de regressão).
Observação 3: O valor de R2 se encontra no intervalo: 0 ≤ R2 ≤ 1.
Regressão Linear Simples (RLS) - Exercícios Resolvidos
Ex 01) Considere o conjunto de pares ordenados (X,Y) na tabela abaixo. Através do método dos
mínimos quadrados (MMQ).Pede-se:
a) gráfico de dispersão b) equação de regressão c) coeficiente de correlação e de determinação
n X Y
1 1 1
2 2 1,5
3 3 3,5
4 4 4
• gráfico de Dispersão:
• tabela auxiliar para a estimação dos parâmetros a e b.

n X Y X2 Y2 X·Y
1 1 1 1 1 1
2 2 1,5 4 2,25 3
3 3 3,5 9 12,25 10,5
4 4 4 16 16 16
Σ = 10 Σ = 10 Σ = 30 Σ = 31,5 Σ = 30,5
• cálculo das médias:
X
 X = 10/4 = 2,5; Y
 Y =10/4 = 2,5
n n
65
• cálculo de b (declividade da reta):

YX (10)(10)
 XY  n
30,5 
4
b = 5,5/5 = 1,1
(  X)2 102
 X2 
n
30 
4
• cálculo de a (intercepto):
10 10
a  Y  b X =  1,1  = - 0,25
4 4
• equação da reta: Ŷ  0,25  1,1 X

• cálculo das variações:

a tabela abaixo mostra os valores de Y estimados pela através da equação de regressão e as
variações (total, explicada e não explicada):
  
n X Y Y Y -Y ( Y - Y )2 (Y - Y ) (Y - Y )2
1 1 1 -0.25 + (1,1)1 = 0,85 - 1,65 2,7225 - 1,5 2,25
2 2 1,5 -0.25 + (1,1)2 = 1,95 - 0,55 0,3025 -1 1
3 3 3,5 -0.25 + (1,1)3 = 3,05 0,55 0,3025 1 1
4 4 4 -0.25 + (1,1)4 = 4,15 1,65 2,7225 1,5 2,25
Σ = 10 Σ = 10 Σ = 30 Σ = 6,05 Σ = 6,5
• cálculo do coeficiente de determinação (R2):

VE var iação explicada 6,05
primeiro modo: R2   = = 0,9308 = 93,08%
VT var iação total 6,5
b2  (n   X2  (  X)2 ) 1,12  (4  30  102 )

segundo modo: R2  = = 0,9308 = 93,08%
n   Y  (  Y) )
2 2
4  31,5  102
• cálculo do coeficiente de correlação (r):
n   X  Y  (  X)  (  Y)
primeiro modo: rx,y 
[n   X2  (  X)2 ]  [n   Y 2  (  Y)2 ]
4  30,5  10  10
rx,y  = 0,9648
[4  (30)  102 ]  [4  (31,5)  10 2
segundo modo: rx,y  R2 = 0,9308 2 = 0,9648
66
Ex 02) A tabela abaixo mostra a relação entre os gastos como publicidade e vendas nos últimos anos.
Os dados coletados (todos em mil reais) estão apresentados na tabela seguinte.
Y X
n
vendas (X·1.000) gastos com publicidade (X·1.000)
1 7 3
2 14 4
3 15 8
4 28 12
5 32 14
Σ = 10 Σ = 41
• Primeiro Passo: representando o gráfico de dispersão dos valores de Y em função dos valores de X.
• Segundo Passo: observe o tipo de tendência dos pontos e estabelecer a melhor função para
representar essa tendência. Observa-se que uma reta seria uma função adequada:
• Terceiro Passo: obter os coeficientes da reta de regressão (MMQ) e para isso é aconselha-se a
construção de uma tabela para auxiliar no processo.
n Y X X2 Y2 X·Y
1 7 3 9 49 21
2 14 4 16 256 64
3 15 8 64 225 120
4 28 12 144 784 336
5 32 14 196 1024 448
Σ = 96 Σ = 41 Σ = 429 Σ = 2278 Σ = 981
• cálculo de b:
YX  (41)  (96) 

 XY  981   
b n =  5  = 2,0884
(  X)2  (41)2 
 X2 
n
429   
 5 
67
• cálculo de a:
a  Y b X
Y = 96/5 = 19,2 ; X = 41/5 = 8,2

a = 19,2 – (2,0884)(8,2) = 2,0751
• equação de regressão: Y = 2,0751 + (2,0884)X

A tabela abaixo mostra os valores de Y obtidos através da amostra e da reta de regressão para os
diversos valores de X.
Y = 2,0751 + 2,0844(X) X Y
1 Y = 2,0751 + 2,0844(3) 3 7 8,31
2 Y = 2,0751 + 2,0844(4) 4 16 10,42
3 Y = 2,0751 + 2,0844(8) 8 15 18,78
4 Y = 2,0751 + 2,0844(12) 12 28 27,13
5 Y = 2,0751 + 2,0844(32) 14 32 31,13
• cálculo do coeficiente de correlação (r):

n   X  Y  (  X)  (  Y)
rx,y 
[n   X2  (  X)2 ]  [n   Y 2  (  Y)2 ]
5  (981)  (41) (96)

rx,y  = 0,9648
[5  (429)  (41)2 ]  [5  (2278)  (96)2 ]
• cálculo do coeficiente de determinação (R2):
 (  X)2   (41)2 
b2    X2   (2,0884)2  429  
2  n 
 5 
R  = = 0,9308 ou 93,08%
 2 (  Y)
2  (96)2 
 Y   2278  
 n   5 
ou: R2 = (r)2 = (0,9648)2 = 0,9308 ou 93,08%
Interpretação: noventa e três por cento das variações de Y são explicadas pela variável X.
Ex 03) A tabela abaixo mostra dados médios de popança (X) em função da renda (Y). Pede-se:
a) gráfico de dispersão ; b) equação de RLS ; c) coeficientes de correlação e de determinação
Y ($) 430 335 520 490 470 210 195 270 400 480
X ($) 30 21 35 42 37 20 8 17 35 25
68
Solução:
a) diagrama de dispersão
b) Equação e reta de regressão

Y = 117,07 + (9,74)X
Ex 04) A partir do conjunto de dados na tabela abaixo, pede-se:

a) equação de regressão linear simples através do MMQ ; b) previsão para 2006
c) coeficientes de correlação e de determinação e a interpretação de cada um deles
Ano (X) 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
SELIC (Y) 41,22 23,94 39,79 31,24 18,99 16,16 19,05 23,03 23,37 16,24 19,12
Solução:
a) Primeiro modo:
n Ano = X SELIC = Y X2 Y2 X·Y
1 1995 41,22 3.980.025 1.699,0884 82.233,90
2 1996 23,94 3.984.016 573,1236 47.784,24
3 1997 39,79 3.988.009 1.583,2441 79.460,63
4 1998 31,24 3.992.004 975,9376 62.417,52
5 1999 18,99 3.996.001 360,6201 37.961,01
6 2000 16,16 4.000.000 261,1456 32.320,00
7 2001 19,05 4.004.001 362,9025 38.119,05
8 2002 23,03 4.008.004 530,3809 46.106,06
9 2003 23,37 4.012.009 546,1569 46.810,11
10 2004 16,24 4.016.016 263,7376 32.544,96
11 2005 19,12 4.020.025 365,5744 38.335,60
Σ = 22.000 Σ = 272,15 Σ = 44.000.110 Σ = 7.521,9117 Σ = 544.093,08
69
• cálculo de Sxx, Syy e Sxy:

(  X)2 (22.000)2
Sxx   X2  n
= 44.000.110 
11
= 110
(  Y)2 (272,15)2
Syy   Y2  n
= 7.521.9117 
11
= 788,6733
XY = (22.000)(272,15)
Sxy   (X  Y)  n
544.093,08 
11
= – 206,92
• cálculo das estimativas a e b:
= 206,92 = -1,8811;
Sxy 272,15 22000
b a  Y b X=  ( 1,8811) = 3786,9227
Sxx 110 11 11
• equação de regressão: Y = 3786,9227 – (1,8811)X
• previsão:
para x = 2006 → Y = 3786,9227 – (1,8811) (2006) = 13,4361
• cálculo dos coeficientes de correlação e de determinação:

Sxx 110
R 2  b2 = (1,8811)2  = 0,4935
Syy 788,6733
Sxy 206,92
R2  b = (1,8811)  = 0,4935
Syy 788,6733
Sxy 206,92
r = = - 0,7025
Sxx  Syy 110  788,6733
r R2 = 0,4935 = - 0,7025 (tem o mesmo sinal de b)
b) Segundo modo: arbitrando o ano médio (2000) como sendo o ano zero:
n Ano = X SELIC = Y X2 Y2 X·Y
1 -5 41,22 25 1.699,0884 - 206,10
2 -4 23,94 16 573,1236 - 95,76
3 -3 39,79 9 1.583,2441 - 119,37
4 -2 31,24 4 975,9376 - 62,48
5 -1 18,99 1 360,6201 - 18,99
6 0 16,16 0 261,1456 0,00
7 1 19,05 1 362,9025 19,05
8 2 23,03 4 530,3809 46,06
9 3 23,37 9 546,1569 70,11
10 4 16,24 16 263,7376 64,96
11 5 19,12 25 365,5744 95,60
Σ=0 Σ = 272,15 Σ = 110 Σ = 7.521,9117 Σ = - 206,92
70

(  X)2 (0)2
Sxx   X2  n
 110 
11
= 110
(  Y)2 (272,15)2
Syy   Y2  n
= 7.521.9117 
11
= 788,6733
 X  Y = (0)(272,15)
Sxy   (X  Y)  n
206,92 
11
= – 206,92
= 206,92 = -1,8811;
Sxy 272 ,15
b a  Y b X=  ( 1,8811 )(0) = 24,7409
Sxx 110 11
• equação de regressão: Y = 24,7409 – (1,8811) X
• previsão:
para x = 2006 → X = 6 → Y = 24,7409 – (1,8811) (6) = 13,4543

Sxx 110
R 2  b2  ( 1,8811)2  = 0,4935
Syy 788,6733
Sxy 206,92
r = = - 0,7025
Sxx  Syy 110  788,6733
r R2 = 0,4935 = - 0,7025 (tem o mesmo sinal de b)
Observação: Quando a variável X tem o zero como valor médio os cálculos se tornam mais simples,
pois  x i é igual a zero.
(  X)2 (0)2
Sxx   X2  n
  X2  n
  X2
 X  Y 0Y
Sxy   (X  Y)  n
  (X  X)  n
  (X  Y)
a  Y b X  Y b0  Y
71
c) Terceiro modo: arbitrando o ano 1995 como sendo 1:

n Ano (X) SELIC(Y) X2 Y2 X·Y
1 1 41,22 1 1.699,0884 41,22
2 2 23,94 4 573,1236 47,88
3 3 39,79 9 1.583,2441 119,37
4 4 31,24 16 975,9376 124,96
5 5 18,99 25 360,6201 94,95
6 6 16,16 36 261,1456 96,96
7 7 19,05 49 362,9025 133,35
8 8 23,03 64 530,3809 184,24
9 9 23,37 81 546,1569 210,33
10 10 16,24 100 263,7376 162,40
11 11 19,12 121 365,5744 210,32
Σ = 66 Σ = 272,15 Σ = 506 Σ = 7.521,9117 Σ = 1.425,98

(  X)2 (66)2
Sxx   X2  n
= 506 
11
= 110
(  Y)2 (272,15)2
Syy   Y2  n
= 7.521.9117 
11
= 788,6733
 X  Y = (0)(272,15)
Sxy   (X  Y)  n
206,92 
11
= - 206,92

Sxy 206,92 272,15 66
b = = -1,8811; a  Y b X=  ( 1,8811)( ) = 36,0275
Sxx 110 11 11
• equação de regressão: Y = 36,0275 – (1,8811)X
• previsão:
para x = 2006 → X = 12 → Y = 36,0275 – (1,8811) (12) = 13,4543

Sxx 110
R 2  b2 = (1,8811)2  = 0,4935
Syy 788,6733
Sxy 206,92
r = = - 0,7025
Sxx  Syy 110  788,6733
r R2  0,4935 = - 0,7025 (tem o mesmo sinal de b)
72
Observação: A única diferença que ocorre nos três modos é apenas no valor do intercepto a.
Ex 05) A partir do conjunto de dados na tabela abaixo, pede-se:

a) a equação de regressão linear simples da taxa SELIC em função do ano. Fazer previsão para 1996.
b) os coeficientes de correlação e de determinação e a interpretação de cada um deles a partir dos seus
valores.
Ano (X) 1957 1958 1959 1960 1961 1962 1963 1934 1965
SELIC (Y) 30542 60983 96114 133041 145584 191194 174191 183707 185187
Solução:
a) Primeiro modo:
Ano (X) Produção (Y) X2 Y2 X·Y
1957 30542 3.829.849 932.813.764 59.770.694
1958 60983 3.833.764 3.718.926.289 119.404.714
1959 96114 3.837.681 9.237.900.996 188.287.326
1960 133041 3.841.600 17.699.907.681 260.760.360
1961 145584 3.845.521 21.194.701.056 285.490.224
1962 191194 3.849.444 36.555.145.636 375.122.628
1963 174191 3.853.369 30.342.504.481 341.936.933
1964 183707 3.857.296 33.748.261.849 360.800.548
1965 185187 3.861.225 34.294.224.969 363.892.455
Σ = 17649 Σ = 1.200.543 Σ = 34.609.749 Σ = 187.724.386.721 Σ = 2.355.465.882
(  X) 2 (17649 ) 2
Sxx  X 2

n
= 34609749 
9
= 60
( Y) 2 1200543
Syy  Y 2

n
= 1877243867 21 
9
= 27.579.553.960
 X  Y (17649 )(1200543 )
Sxy   (X  Y)  n
= 2355465882 
9
= 1.201.059

Sxy
b = 20.017,65; a  Y  b  X = -39.121.217,9833
Sxx
• equação de regressão: Y = -39.121.217,9833 + (20017,65)X

73
• previsão:
para o ano 1966 → Y = -39.121.217,9833 + 20017,65 (1966) = 233.481,9167

Sxx 60
R 2  b2 = (20017 ,65 ) 2  = 0,8717
Syy 27 .579 .553 .960
Sxy 1.201 .059

R2 b = (20017 ,65)  = 0,8717
Syy 27 .579 .553 .960
Sxy 1201059
r = = 0,9336
Sxx  Syy 60  27 .579 .553 .960
r  0,871746646 = 0,9336 (tem o mesmo sinal de b)
b) Segundo modo: arbitrando o ano médio (1961) como sendo o ano zero:
-4 30542 16 932.813.764 - 122.168
-3 60983 9 3718.926.289 - 182.949
-2 96114 4 9237.900.996 - 192.228
-1 133041 1 17.699.907.681 - 133.041
0 145584 0 21.194.701.056 0,00
1 191194 1 36.555.145.636 191.194
2 174191 4 30.342.504.481 348.382
3 183707 9 33.748.261.849 551.121
4 185187 16 34.294.224.969 740.748
Σ=0 Σ = 1.200.543 Σ = 60 Σ = 187.724.386.721 Σ = 1.201.059
( X) 2 (0) 2
Sxx  X 2

n
 60 
9
= 60
( Y) 2 1200543
Syy   Y2  n
= 1877243867 21 
9
= 27.579.553.960
 X  Y = 1201059 (0)(1200543 )
Sxy   (X  Y)  n

9
= 1.201.059
74
• cálculo de a e de b:
Sxy
b = 20017,65; a  Y  b  X = 133.393,6667
Sxx
• previsão:
para o ano 1966 → X = 5: Y = 133393,6667 + 20017,65(5) = 233.481,9167

Sxx 60
R 2  b2 = (20017 ,65 ) 2  = 0,8717
Syy 27 .579 .553 .960
Sxy 1.201 .059

R2 b = (20017 ,65)  = 0,8717
Syy 27 .579 .553 .960
Sxy 1201059
r = = 0,9336
Sxx  Syy 60  27 .579 .553 .960
Observação: Caso tivéssemos um número par de anos como exemplo: {1957, 1958, 1959, 1960, 1961,
1962}, pode-se arbitrar os dois anos centrais como sendo -1 e 1, ou seja, 1959 corresponde a -1 e 1960
corresponde a 1. A diferença entre um ano e outro é de duas unidades. Os correspondentes valores
seriam: {-5, -3 -1, 1, 3, 5}.
c) Terceiro modo: arbitrando o ano 1957 como sendo 1:

1 30542 1 93.2813.764 30.542
2 60983 4 3.718.926.289 121.966
3 96114 9 9.237.900.996 288.342
4 133041 16 17.699.907.681 532.164
5 145584 25 21.194.701.056 727.920
6 191194 36 36.555.145.636 1.147.164
7 174191 49 30.342.504.481 1.219.337
8 183707 64 33.748.261.849 1.469.656
9 185187 81 34.294.224.969 1.666.683
Σ = 45 Σ = 1.200.543 Σ = 285 Σ = 187.724.386.721 Σ = 7.203.774
75
(  X) 2 ( 45 ) 2
Sxx   X2  n
= 285 
9
= 60
( Y) 2 1200543
Syy  Y 2

n
= 1877243867 21 
9
= 27.579.553.960
 X  Y = 7.203 .744  (45)(1200543 ) = 1.201.059

Sxy   (X  Y)  n 9

Sxy
b = 20.017,65; a  Y  b  X = 33.305,4167
Sxx
• previsão:
para o ano 1966 → X = 10: Y = 33305,4167 + 20017,65 (10) = 233.481,9167

Sxx 60
R 2  b2 = (20017 ,65 ) 2  = 0,8717
Syy 27 .579 .553 .960
Sxy 1.201 .059

R2 b = (20017 ,65)  = 0,8717
Syy 27 .579 .553 .960
Sxy 1201059
r = = 0,9336
Sxx  Syy 60  27 .579 .553 .960
Observação: A única diferença que ocorre nos três modos é apenas no valor do intercepto a.
76
Ex 06)
SQT SSR SQE
erro
(VT) (VR) (VE)
n X Y XY X2 Y2 Y-Ym (Y-Ym)2 Yc (Yc-Ym)2 Y-Yc (Y-Yc)2
1 1 3 3 1 9 -3,20 10,24 2,30 15,21 0,70 0,49
1 2 3 6 4 9 -3,20 10,24 3,60 6,76 -0,60 0,36
1 4 7 28 16 49 0,80 0,64 6,20 0,00 0,80 0,64
1 5 6 30 25 36 -0,20 0,04 7,50 1,69 -1,50 2,25
1 8 12 96 64 144 5,80 33,64 11,40 27,04 0,60 0,36
Soma 5 20 31 163 110 247 0,00 54,80 31,00 50,70 0,00 4,10
Média 4,0 6,2
Estimações:
Sxx Syy Sxy b a r R2 S
30,000 54,800 39,000 1,300 1,000 0,962 0,925 1,169
Y = verdadeiro ípsilon; Yc = ípsilon chapéu; Ym = ípsilon médio

VT = variação total; VE = variação explicada pela regressão; VR = variação do erro ou variação não
explicada pela regressão
Observe: (Y-Ym) = (Yc-Ym) + (Y-Yc);
Observe: Σ(Y-Ym)2 = Σ(Yc-Ym)2 + Σ(Y-Yc)2; sendo:
Σ(Y-Ym)2 = VT ; Σ(Yc-Ym)2 = VR ; Σ(Y-Yc)2 = VE.
VT = VE + VR → 54,80 = 50,70 + 4,10;
VT = Syy; VE  b2  Sxx  b  Sxy
b2  Sxx b  Sxy VE
R 2  r2    ; (0,962)2 = (1,3)2·30/54,80 = (1,3)·39/54,80 = 50,70/54,80 = 0,925
Syy Syy VT
S = erro padrão (ou desvio padrão) da estimativa pela regressão:
VT  VE VR Syy  b 2  Sxx Syy  b  Sxy

S    = 1,169 ≈ 1,17
n2 n2 n2 n2
77
Regressão Linear Simples (RLS) - Exercícios Propostos
01) Os volumes de exportação em toneladas nos respectivos anos estão mostrados na tabela abaixo.
Pede–se:
a) ajustar os dados se uma reta de mínimos quadrados
b) estimar o valor das importações em 2003
c) avaliar o ano que não haverá importações.
Mês (X) 1997 1998 1999 2000 2001

Rendimento (Y) 81 79 75 69 67
02) Os dados abaixo se referem ao rendimento de um determinado capital em cada mês. Pede-se:
a) determinar a equação de regressão linear de Y em X;
b) determinar e interpretar os coeficientes de correlação e de determinação
c) estimar o valor de Y para os dois meses seguintes
Mês (X) 1 2 3 4 5 6 7
Rendimento (Y) 60 64 65 71 75 77 83
03) A tabela abaixo mostra dados de volume de exportação em toneladas nos correspondentes anos.
Pede-se:
a) A equação de regressão linear da quantidade sobre o tempo
b) os coeficientes de correlação linear e de determinação
c) A quantidade estimada para a exportação em 2010
Mês (X) 2002 2003 2004 2005 2006 2007 2008

Rendimento (Y) 70 66 59 54 48 40 43
78
REGRESSÃO LINEAR MÚLTIPLA (RLM)
Muitas vezes apenas uma variável independente não consegue explicar as variações de uma
variável dependente. Então parte-se para a tentativa de explicar as variações em função de duas ou
mais variáveis. Se suspeitarmos que uma variável dependente Y é função linear de duas ou mais
variáveis independentes, pode-se usar a Regressão Linear Múltipla para obter o equacionamento do
fenômeno.
A Regressão Linear Múltipla é semelhante à Regressão Linear Simples no objetivo e nos
conceitos. Abaixo estão mencionados alguns casos em que a regressão linear múltipla poderia ser
utilizada.
Variável Dependente Variáveis Independentes
(explicada) (explicativa)
venda atendimento, localização, serviço de troca, preço, propaganda
safra fertilizantes, irrigação, qualidade do solo
salário tempo de serviço, escolaridade, experiência
poupança renda, número de filhos
Uma relação linear entre uma variável dependente Y e duas ou mais variáveis independentes Xi
(i=1,2,3,...,n) é matematicamente representada por uma equação do tipo:
Y    1X1   2 X 2  3X 3  ...   n Xn   i , sendo:

α = termo constante
βi = taxa de variação de Y em relação à variável Xi
ε = erro aleatório em Y para a observação i.
O caso mais simples de uma regressão linear múltipla corresponde a uma relação de dependência
Y e duas variáveis independentes X1 e X2 (equação abaixo). Uma equação como esta representa um
plano no espaço tornando-se então extremamente complicada a confecção do diagrama de dispersão
sem auxílio de computador.
Y  a  b1X1  b 2X2  i
Semelhante a regressão linear simples, na regressão linear múltipla deseja-se determinar os
coeficientes βi (i=1,2,3,...,n) da variáveis independentes. Os valores de βi podem ser interpretados
como sendo a taxa de variação de Y por unidade de variação de Xi.
79
Os valores a b1 e b2 que são respectivamente os estimadores dos parâmetros α, β1 e β2 da

população são obtidos utilizando o método dos mínimos quadrados, como será demonstrado todo o
procedimento abaixo.
O somatório dos quadrados dos erros é:

n n
 ( i )2   (Yi  Yi ) 2
i1 i1
n n
 ( i )2   (Y  a  b1  X1  b2  X2 )2
i1 i1
n
Chamemos  ( i ) 2 de Qe para facilitar o desenvolvimento. Observemos que Qe depende de “a” e de
i 1
b1 e b2.
Pelo cálculo diferencial, o mínimo de Qe é obtido derivando Qe em relação a: “a”, “b1”, e “b2” e
igualando todas as derivadas a zero:
 Qe
  2   (Y  a  b1  X1  b2  X2 )  0 (i)
a
 Qe
  2   X1(Y  a  b1X1  b2 X2 )  0 (ii)
 b1
 Qe
  2   X2 (Y  a  b1  X1  b2  X2 )  0 (iii)
 b2
 Y  n  a  b1   X1  b2   X2 (iv)
 YX1  a   X1  b1   X12  b2   X1  X 2 (v)
 Y  X2  a   X2  b1   X1  X 2  b2   X 22 (vi)
Dividindo ambos os membros da equação (iv) por n tem-se:

Y 
na
 b1 
 X1  b   X2
2
n n n n
Y  a  b1  X1  b2  X2 , ou
a  Y  b1X1  b2  X2 (vii)
Substituindo o valor (vii) em (ii) tem-se:
80
 Y  X1   X1(Y  b1X1  b2  X2 )  b1   X12  b2   X1  X 2

 Y  X1   X1Y   X1b1X1   X1b2 X2  b1 X12  b2 X1  X 2
 X1Y  b  X1  b  X2
 Y  X1  n
1  X1 n
2  X1 n
 b1 X 12  b2  X 1  X 2
 X1 Y  b    X1 
2
 X1   X2  b
 Y  X1  n
1
n
 b2 
n
1  X12  b2   X1  X 2
   X1 2 
 X1 Y  b1   X 12 
  X1   X2 
 Y  X1   
 b2  X 1  X 2  
n

n
  n 
Fazendo:
SY1   Y  X1 
 Y   X1
n
  X1 2
S11   X12  n
S12  S21   X 1  X 2 
 X1 X2 , então:
n
SY1  b1  S11  b2  S12 (viii)

Substituindo (vii) na equação (ii) obter-se:
SY2  b1  S21  b2  S22 (ix)
As equações (viii) e (ix) formam um sistema de duas equações e duas incógnitas e a sua
resolução permite obter “b1” e “b2”. O valor de “a” pode ser obtido através de (vii), então:
SY1  b1  S11  b2  S12

SY2  b1  S21  b2  S22
a  Y  b1 X1  b 2 X 2
Os valores de b1 e b2 extraídos do sistema são:
SY2 SY1

S21 S11 SY2 S22
b2  ; b1    b2
S22 S1 2 S21 S21

S12 S11
81
Coeficiente de Determinação na Regressão Linear Múltipla
Para a regressão linear múltipla a equação abaixo se verifica:
 (Y  Y)2   (Y  Y)2   (Y  Y)2 , sendo:

(Y  Y)2 = (SST) = soma dos quadrados totais
(Y  Y)2 = (SQE) = soma dos quadrados dos erros
(Y  Y)2 = (SQR) = soma dos quadrados da regressão
O coeficiente de determinação para a regressão linear múltipla pode ser calculado como:
R2 
SQR

 (Y  Y)2
SQT  (Y  Y)2
O coeficiente de determinação para a regressão linear múltipla também pode ser calculado como:
b  S  b2  S Y2
R2  1 Y1 , sendo:
S YY
(  Y)2
S YY   Y 2  =  (Y  Y)2
n
• Coeficiente de determinação ajustado:

(n  1) (n  1)
Ra2  1  (1  R2 )  → Ra2  1  (1  R2 ) 
n  k 1 n  k 1
82
Regressão Linear Múltipla (RLM) - Exercícios Resolvidos
Ex 01) A tabela abaixo mostra o volume de vendas (Y) em função de gastos com TV (X1) e gasto com
jornal (X2). Através do MMQ determine a equação de regressão linear múltipla.
Y 6 12 10 7 3
X1 80 110 90 60 60
X2 120 60 60 30 180
Solução:
n Y X1 X2 Y·X1 Y·X2 X1·X2 X12 X22 Y22

1 6 80 120 480 720 9600 6400 14400 36
2 12 110 60 1320 720 6600 12100 3600 144
3 10 90 60 900 600 5400 8100 3600 100
4 7 60 30 420 210 1800 3600 900 49
5 3 60 180 180 540 10800 3600 32400 9
Σ 38 400 450 3300 2790 34200 33800 54900 338
Y
 Y  38 = 7,6; X1 
 X1  400 = 80; X2 
 X2 
450
= 90
n 5 n 5 n 5
• cálculo de SY1, SY2, S11, S22 e S12:
SY1   YX1 
 Y   X1 = 3300 
38  400
= 260
n 5
SY2   YX2 
 Y   X2 = 2790 
38  450
= - 630
n 5
(  X1)2 (400)2
S11   X12  n
= 33800 
5
= 1800
(  X2 )2 (450)2
S22   X22  = 54900  = 14400
n 5
S12  S21   X1X2 

 X1   X2 = 34200 
400  450
= - 1800
n 5
83
• cálculo de a, b1 e b2:
SY2 SY1 630 260
 
b2 
S21 S11
= 1800 1800 = - 0,0294
S22 S12 14400 1800
 
S12 S11 1800 1800
= 630  14400  (0,0294) = 0,1151

SY2 S22
b1   b 2
S21 S21 1800 1800
a  Y  b1  X1  b2  X2 = 7,6 – (0,1151)80 – (0,0294)90 = 1,0365
• equação de regressão múltipla:

Y  a  b1  X1  b 2  X 2 → Y = 1,0365+(0,1151)X1 – (0,0294)X2
Ex 02) O quadro abaixo mostra o volume de vendas Y, em função dos gastos com TV (X1) e com
jornal (X2).
n Y X1 X2 Y·X1 Y·X2 X1·X2 X12 X22 Y2
1 6 3 1 18 6 3 9 1 36
2 7 4 2 28 14 8 16 4 49
3 15 8 3 120 45 24 64 9 225
4 18 8 5 144 90 40 64 25 324
5 20 10 8 200 160 80 100 64 400
6 23 11 6 253 138 66 121 36 529
∑ 6 89 44 25 763 453 221 374 139 1563

Média 14,8333 7,3333 4,1667 127,1667
• Para o cálculo de R2:

Yc (Y - Ym)2 (Y - Yc)2 (Yc - Ym)2
5,5217 78,0278 0,2288 86,7072
7,7157 61,3611 0,5122 50,6606
15,9883 0,0278 0,9767 1,3339
16,3240 10,0278 2,8090 2,2221
20,8800 26,6944 0,7743 36,5617
22,5704 66,6944 0,1846 59,8622
Soma 89,0000 242,8333 5,4856 237,3478

VT VE VR
Y; X1; X 2 = valores médios; Y  Yc = valor de Y pela regressão; n = 6 (quantidade de dados ou

quantidade da amostra); k = 2 (variáveis independentes, x1 e x2)
84
Y
 Y  89 = 14,8333; X1 
 X1  44 = 7,3333; X2 
 X2 
25
= 4,1667
n 6 n 6 n 6
• Cálculo das variações (SY1, SY2, S11, S22, S12, Syy) e das covariâncias e variâncias:
SY1   YX1 
 Y   X1  763  89  44 = 110,3333 → Cov(Y,X1) = SY1/n = 110,3333/6 = 18,3888
n 6
SY2   YX2 
 Y   X2  453 
89  25
= 82,1667 → Cov(Y,X2) = SY1/n = 82,1667/6 = 13,6944
n 6
(  X1 )2 (44)2
S11   X12  n
 374 
6
= 51,3333 → Cov(X1,X1) = Var(X1) = 51,3333/6 = 8,5555
(  X2 )2 (25)2
S22   X22   139  = 34,8333 → Cov(X2,X2) = Var(X2) = 34,8333/6 = 5,8055
n 6
S12  S21   X1X2 

 X1   X2  221 
44  25
= 37,6667 → Cov(X1,X2) = 37,6667/6 = 6,2777
n 6
( Y)2 89
Syy   Y  2
 1563  = 242,8333 → Cov(X1,X2) = 242,8333/6 = 40,4722
n 6
• Cálculo das constantes: a , b1, b2:

SY2 SY1 82,17 110,33
- -
S S11 37,67 51,33 SY S 82,17 34,83
b2 = 21 = = 0,1679 ; b1 = 2 - 22 ×β2 = - ×0,16 = 2,0262
S22 S 34,83 37,67 S21 S21 37,67 37,67
- 12 -
S12 S11 37,37 51,33
a  Y  b1  X1  b2  X2 = 14,83 – (2,03)( 7,33) – (0,16)(4,17) = – 0,7247
• Equação de regressão linear múltipla:

Y  a  b1  X1  b2  X2 → Y = – 0,7247 + 2,0262·X1 + 0,1679·X2
• Previsão para: X1 = 9 e X2 = 7 → Y = – 0,7247 + (2,0262)9 + (0,1679)7 = $18,686
• Cálculo do coeficiente de determinação (ou de explicação) múltiplo:

VE b1  SY1 + b2  SY2 237,3478 2,0262 110,3333 + 0,1679  82,1667
R2 = = → R2 = = = 0,9774
VT Syy 242,8333 Syy
• Cálculo do coeficiente de determinação ajustado:

n -1
R2 =1- (1- R2 )( )
(n - k -1)
n = quantidade) de dados = 6; k = quantidade de variáveis independentes = 2 (x1 e x2)

6 -1
R2 =1- (1- 0,9774)( ) = 0,9624
(6 - 2 -1)
85
• Cálculo da variância e do erro padrão (desvio padrão) da estimativa:
→ Se2    5, 4856 = 1,8285

2
Variância do erro da estimativa: S 2e=  e2 =
 (Y - Y)
ˆ 2 e

n - k -1 n - k -1 n  k 1 6  2 1
Erro padrão (desvio padrão) da estimativa: S e   e2 

 (Y  Y)
ˆ 2
→ Se  1,8285 = 1,3522
n  k 1 n  k 1
A Partir da Tabela de Regressão Linear Múltipla (RLM), Obter as Equações de Regressão

Linear Simples (RLS) de:
I) Y com X1, ou seja, Y como uma função de X1 (Y= f(X1)). Y  a  b  X1 :

Sxy SY1 110,3333
b= = = = 2,1494 ; a  Y  b  X1 = 14,8333 – (2,1494)(7,3333) = – 0,9286
Sxx S11 51,3333
Y  a  b  X1 → Y = – 0,9286 + 2,1494 X1
2 b2  Sxx b  Sxy 2,1494 110,3333

R    = 0,9766 ; r  R 2  0,9766 = 0,9882
Syy Syy 242,8333
II) Y com X2, ou seja, Y como uma função de x2 (Y= f(X2)). Y  a  b  X 2 :

Sxy SY2 82,1667
b   = 2,3589 ; a  Y  b  X2 = 14,8333 – (2,3589)(4,1667) = – 9,8285
Sxx S22 34,8333
Y  a  b  X 2 → Y = – 9,8285 + 2,3589 X2
2 b2  Sxx b  Sxy 2,3589  82,1667

R    = 0,7982 ; r  R2  0, 7982 = 0,8934
Syy Syy 242,8333
86
REGRESSÃO NÃO LINEAR NAS VARIÁVEIS
Como muitos processos econômicos são mais bem explicados com funções matemáticas não
lineares, foram desenvolvidos modelos não lineares que se tornam lineares depois de uma
transformação com logaritmos naturais ln, como mostra a tabela seguinte.
Modelos Não Lineares
1) Modelo Polinomial → Y  a n  x n  a n 1  x n 1  a n  2  x n  2      a 2  x 2  v  a1  x  a 0
2) Modelo Exponencial → Y  A  eB  x
3) Modelo Exponencial → Y  A  Bx
4) Modelo Potência (Geométrico) → Y  A  XB

5) Modelo Logarítmico → Y  A  B  ln(x)
• Regressão Polinomial do Segundo Grau (Quadrática)
Uma regressão polinomial do segundo é grau deseja-se determinar um polinômio do tipo:
Y  a 0  a1  X  a 2  X 2  e
O erro existente entre os dados coletados e o modelo e:
e  Y  (a 0  a 1  X  a 2  X 2 )
De igual modo ao mostrado na regressão linear simples o somatório dos quadrados dos erros é:

 2  (Y  Y) 2
( i ) 2  [Y i  (    X i )] 2
n n
 ( i )2   (Yi  Yi ) 2
i1 i1
n n
Qe   ( i )2   [Y i  (    X i)] 2
i1 i1
n
Chamemos  ( i ) 2 de Qe para facilitar o desenvolvimento. Observemos que Qe depende de α e de β.
i 1
Derivando Qe em relação a α e em seguida em relação a β tem-se:
87
 Qe
  2   ( Y i  a 0  a1  X i  a 2  X i 2 )
 a0
 Qe
  2   [ X i  ( Y i  a 0  a1  X i  a 2  X i 2 ) ]
 a1
 Qe
  2   [ X 2 i  ( Y i  a 0  a1  X i  a 2  X i 2 ) ]
 a1
 Qe  Qe  Qe
Para que Qe seja mínimo devemos fazer ; e iguais à zero, então:
 a 0  a1 a2
As três equações abaixo formam um sistema de três equações e três incógnitas:
n  a 0   (X i ) a1   (X i 2 ) a 2   Yi
 (X i ) a 0   (X i 2 ) a1   (X i 3 ) a 2   Yi  X i
 (X i 2 ) a 0   (X i 3 ) a1   (X i 4 ) a 2   Yi  X i2
Ex 01) Regressão Quadrática (polinomial do segundo grau).
n X Y X2 X3 X∙Y X2∙Y X4 Yc (Y-Ym)2 (Yc-Ym)2 (Y -Yc)2

1 2 3 4 8 6 12 16 3,0000 1,7778 1,7778 0,0000
2 4 6 16 64 24 96 256 6,0000 2,7778 2,7778 0,0000
3 6 4 36 216 24 144 1296 4,0000 0,1111 0,1111 0,0000
Σ 12,00 13,00 56,00 288,00 54,00 252,00 1568,00 13,00 Σ 4,66667 4,66667 0,00000
Méd 4 4,3333 18,6667 SQt SQreg SQres
n=3 k=2 4,66667
SQt = soma dos quadrados totais

SQreg = soma dos quadrados da regressão
SQres = soma dos quadrados das resíduos
Y  a  b1  X  b2  X2 = = - 5,0000 - 5,2500∙X - 0,6250∙X2
a = - 5,0000 b1 = 5,2500 b2 = - 0,6250 R2 = SQreg/ SQt = 1,00 r  R2 = (1)0,5 = 1
R2a = 1 – (1 – R2) (n - 2)/[n - (k+1)] = 1 – (1 – 1) (3 - 2)/[n - (2+1)]
n = tamanho da amostra ; k = número de variáveis independentes
88
Substituindo os somatórios nas fórmulas:

( X)
2
Sxx   X2  = 56 – (12)2/3 = 8
n
S XY   X  Y 
 X  Y = 54 – (12 ∙ 13)/3 = 2
n
S XX2   X3 
 X2  X = 288 – (56 ∙ 12)/3 = 64
n
S X2 Y   X2  Y 
 X2  Y = 252 - (56 ∙ 13)/3 = 9,3333
n
( X ) 2 2
S X2 X2   X 4  = 1568 - (56)2/3 = 522,6666
n
Estimando os coeficientes “a”, “b1” “b2”:
(  X2 Y)(  XX) (  XY)(  XX2 )

b2 = = {[9,333 ∙ 8] – [2 ∙ 4]} / {[8 ∙ 522,6666] – (64)2} = 0,625
(  XX)(  X X ) (  XX )
2 2 2 2
(  X  Y)(  X2  X2 ) (  X2  Y)(  X  X2 )
b1 = = {[2∙22,6666] – [9,333∙64]}/{[8∙522,6666]–(64)2}= 5,25
(  X  X)(  X  X ) (  X  X )
2 2 2 2
a =   b1    b2  
Y X X2
 Y  b1  X  b2  X2 = (13/3) – (5,25)∙12/3 – (0,625)∙56/3 = 5,0003
n n n
8 y = -0,625x2 + 5,25x - 5
6 R² = 1
4
2
0
0 2 4 6 8
Conferir as fórmulas acima a partir dos dados abaixo:
89
Observação: Nos casos em que o somatório de X é zero a fórmulas para “a”, “b1” “b2” são:
(  Y)(  X4 ) (  X2  Y)(  X2 )
a=
n   X4  (  X2 )2
XY n   X2  Y  (  Y)(  X2 )
b1 = ; b2 =
 X2 n   X 4  (  X2 )2
Ex 02) Regressão Quadrática.
Y 3,2 3,6 4,0 4,5 4,8 5,3 6 6,5 7,5

X - 4 -3 -2 -1 0 1 2 3 4
Solução: A equação procurada é do tipo: Y  a 0  a1X  a 2 X 2
n Y X X2 X3 X4 X·Y X2·Y
1 3,2 -4 16 -64 256 -12,8 51,2
2 3,6 -3 9 -27 81 -10,8 32,4
3 4,0 -2 4 -8 16 -8,4 16,8
4 4,5 -1 1 -1 1 -4,7 4,7
5 4,8 0 0 0 0 0 0
6 5,3 1 1 1 1 5,6 5,6
7 6 2 4 8 16 12,2 24,4
8 6,5 3 9 27 81 19,8 59,4
9 7,5 4 16 64 256 32,4 129,6
Σ Σ = 47,3 Σ=0 Σ = 60 Σ=0 Σ = 708 Σ = 33,3 Σ = 324,1
90
n  a0   (X )a1   (X2 )a2   Y → 9 (a0) + 0 (a1) + 60 (a2) = 47,3
 (X)a0   (X2 )a1   (X3 )a2   X  Y → 0 (a0) + 60 (a1) + 0 (a2) = 33,3

 (X2 )a0   (X3 )a1   (X4 )a2   X2  Y → 60 (a0) + 0 (a1) + 708 (a2) = 324,1
Resolvendo o sistema para “a0” , “a1” e “a2” tem-se:

a0 = 4,844; a1 = 0,511; a2 = 0,03
• Equação:
Y = 4,844 + (0,511)X + (0,03)X2
b) cálculo do R2:
Y
 Y2
= 47,3 / 9 = 5,0222
n
n Y X (Y  Y) (Y  Y)2 Y (Y  Y)2 (Y  Y)2

1 3,2 -4 -1,9222 3,6949 3,171 -1,8512 3,4270
2 3,6 -3 -1,5222 2,3172 3,512 -1,5102 2,2808
3 4,0 -2 -1,0222 1,0449 3,905 -1,1172 1,2482
4 4,5 -1 -0,5222 0,2727 4,35 -0,6722 0,4519
5 4,8 0 -0,2222 0,0494 4,847 -0,1752 0,0307
6 5,3 1 0,2778 0,0772 5,396 0,3738 0,1397
7 6 2 0,9778 0,9560 5,997 0,9748 0,9502
8 6,5 3 1,4778 2,1838 6,65 1,6278 2,6497
9 7,5 4 2,4778 6,1394 7,355 2,3328 5,4419
Σ = 47,3 Σ = 0 Σ = 0 Σ = 16,7356 Σ = 45,1830 Σ = - 0,0170 Σ = 16,6200
 
2 var iaçâo explicada (Y  Y)2
R  = = 16,6200 / 16,7356 = 0,993 = 99,30%
var iação total 
(Y  Y)2
91
Observação 1: Se a regressão não for linear simples (RLS) o coeficiente de determinação deve ser
calculado como: variação explicada dividida pela variação total.
Observação 2: Quando a variável X tem como valor mediano o zero os cálculos se tornam um pouco
mais simples. Observe que no conjunto de equações os valores dos termos  X e  X 3 são zero e o
conjunto de equações fica simplificado para:
n  a 0   (X 2 ) a 2   Y
 (X 2 ) a1   Y  X
 (X 2 ) a1   (X 4 ) a 2   X 2  Y
92
Alguns modelos não lineares podem ser linearizados.

• Exponencial: Y  A  eB  x
Para linearizar:
Primeiro passo: Aplica-se o logaritmo (base “e”) a ambos os membros da equação
ln (Y) = ln ( A ∙ Bx ) → ln (Y) = ln (A) + b x ∙ ln (e) → ln (Y) = ln (A) + b · x
Segundo passo: Em seguida faz-se: Z = ln (Y); a = ln(A)
Resulta na equação: Z = a + b · x
Nesta última equação os parâmetros “a” e “b” são estimados (MMQ) e o valor do parâmetro “A” é
obtido calculando o antilogaritmo de “a”.
Relação Modelo Original Modelo Linearizado

Potência Y  A  xB log Y  log a  b  log( x )
Exponencial Y  A  Bx log Y  log a  x  log( b)
Regressão Não Linear (RNL) - Exercícios Resolvidos
Ex 01) Para o conjunto de dados da tabela abaixo obter:

a) o ajuste exponencial; b) o coeficiente de determinação (R2).
Y 190 210 270 330 310 370 420 470 490 520
X 9 15 19 23 26 28 33 36 39 40
Solução: A equação procurada é do tipo: Y  A  eB  X

n X ln(Y) X2 Y2 X·Y
1 9 5,2470 81 27,5313 47,2232
2 15 5,3471 225 28,5916 80,2066
3 19 5,5984 361 31,3423 106,3700
4 23 5,7991 529 33,6295 133,3791
5 26 5,7366 676 32,9083 149,1509
6 28 5,9135 784 34,9695 165,5781
7 33 6,0403 1089 36,4847 199,3284
8 36 6,1527 1296 37,8561 221,4984
9 39 6,1944 1521 38,3707 241,5818
40 6,2538 1600 39,1104 250,1532
Σ = 268 Σ = 58,2829 Σ = 8162 Σ = 341 Σ = 1594
93
• cálculo de b:
YX  (58,2829)  (268) 
 XY  n
1594  
 10 

b = = 0,0331
(  X)2  (268)2 
X 2
 8162   
n  10 
• Cálculo de a:
a  Y  bX
Y = 58,2829/10 = 2,82829 ; X = 268/10 = 26,8

a = 2,82829 – (2,0884)(26,8) = 4,9395

Desta equação obtêm-se os valores de “a” e de “b” da equação polinomial:
B = b = 0,0331
A = EXP(a) = EXP(4,9395) = e 4,9395 = 139,7027 (a = antilogaritmo de 4,9395)
• a equação procurada é: Y  139 ,7027  e 0,0331  X
94
PROGRAMAÇÃO LINEAR (PL)
A Pesquisa Operacional (PO) é uma ciência que reúne um conjunto de métodos que tem como
propósito a procura das melhores decisões que devam ser tomadas por quem lida com otimização de
processos que envolvem: transporte, materiais, finanças, sistemas de produção, recurso humanos,
matéria prima. A PO é uma ferramenta que pode ser utilizada em diversas áreas do conhecimento tais
como: administração contabilidade, engenharia, saúde economia, entre outras.
As decisões são tomadas a partir de formulações e análises de modelos matemáticos

representativos do estudo em questão. Nem sempre um modelo matemático consegue representar de
forma satisfatória todas as variáveis que influenciam no problema devido ao desconhecimento de
algumas delas ou pela dificuldade ou mesmo pela impossibilidade de representá-las. Portanto o modelo
sendo uma simplificação de uma realidade (abstração) deve-se ter cautela ao se tomar decisões a partir
de resultado extraídos dos modelos antes de verificar a sua coerência com o problema em questão. É
de suma importância para a pessoa que vai modelar em PO possuir conhecimentos de matemática e de
estatística e do assunto e da área em estudo.
Muitas empresas possuem um setor de pesquisa operacional ou contratam firmas especializadas

nessa área para tomar suas decisões ou projetarem suas atividades com dados gerados a partir de dados
fornecidos por estudos nessa área. Em suma a pesquisa operacional tem como objetivo escolher a
melhor alternativa para o problema em questão a partir da análise de um modelo representativo do
fenômeno. Esses modelos matemáticos são modelos abstraídos supostamente representativos do
problema.
Aplicabilidade e Técnicas de Solução

A pesquisa operacional é aplicada a otimização (maximização ou minimização) de problemas
envolvendo situações de:
a) controle de estoque
b) escolha da melhor alternativa entre rotas
c) determinação da receita máxima
d) determinação do custo mínimo
e) determinação da quantidade de unidades a serem produzidas de determinado produto
f) problemas de alocação
95
g) Substituição, reposição e transferência

h) Filas de espera
Para o equacionamento e busca de solução dos problemas anteriormente listados, a PO se utiliza
de técnicas matemáticas tais como:
a) Programação Linear;
b) Programação Dinâmica;
c) Programação Inteira;
d) Teoria dos Estoques;
d) Teoria das Filas;
e) Simulação;
f) Teoria dos Jogos;
g) Teoria dos Grafos;
Definições e Aplicabilidade de Algumas Técnicas de PO:
• Programação Linear → tem sido usada com sucesso na solução de problemas relativos à alocação de
pessoal, mistura de materiais, distribuição, transporte, carteira de investimento. A programação tem o
significado de planejamento e ela é dita linear porque todas as variáveis componentes do modelo são
lineares, ou seja, do primeiro grau
• Programação Dinâmica → Um problema de programação dinâmica é resolvido decompondo-o em

uma série de problemas isolados. A PD tem sido aplicada em áreas como planejamento de despesas de
publicidade, distribuição do esforço de vendas e programação de produção.
• Teoria das Filas → É uma técnica utilizada na solução de problemas relativos a congestionamento de
tráfego, máquinas de serviços sujeitas a quebra, determinação do nível de uma força de serviço,
programação do tráfego aéreo, projetos de represas, programação de produção e operação de hospitais.
• Teoria de Estoque → São técnicas e procedimentos utilizados na administração de estoques

(dimensionamento de instalações e equipamentos, armazenamento, transporte etc.
• Teoria dos Jogos → Teoria dos Jogos é o estudo das tomadas de decisões entre indivíduos quando o
resultado de cada um depende das decisões dos outros, numa interdependência similar a um jogo.
96
Já a Teoria dos Jogos estuda cenários onde existem vários interessados em otimizar os próprios
ganhos, às vezes em conflito entre si. Por exemplo, imagine que em sua empresa você tem dúvidas
sobre qual ação tomar para aumentar o seu lucro: reduzir o preço, lançar outro produto ou fazer uma
campanha de marketing?
• Teoria dos Grafos → grafo é um conjunto de pontos, chamados nós, conectados entre si por linhas
chamadas arcos (ver figura abaixo).
Com o propósito de redução de custo, as empresas de transporte procuram minimizar essas despesas
relacionando custo de transporte, condições da rodovia custo do frete etc. e procuram em função
dessas variáveis a melhor rota: “aquela que minimiza o custo”. Este problema consiste em obter o
trajeto de custo mínimo entre os vértices de um grafo que neste exemplo representam as cidades.
• Simulação → é a técnica que visa estudar (imitar) o comportamento determinados de determinadas

situações sistemas através de modelos. Essas situações podem ser ou não reais.
PL - Formulação do Modelo
Em programação linear o objetivo é otimizar (maximizar ou minimizar) uma função linear de
uma variável dependente de outras variáveis independentes. Essa função é denominada “função
objetivo” porque a variável dependente é o objetivo que se deseja otimizar.
O processo de otimização envolve situações de limitações e dependências inerentes ao próprio
problema. Essas limitações são formuladas matematicamente por um conjunto de inequações
envolvendo as variáveis independentes são chamadas de “restrições”.
A modelagem para a otimização de um problema em programação linear deve seguir alguns passos:
• Primeiro: Definir o objetivo a ser otimizado. Como exemplo tem-se: maximização do lucro,
minimização da despesa. Definir a função objetivo.
97
• Segundo: verificar e listar quais as variáveis envolvidas no processo para compor a função objetivo.
Essas variáveis são chamadas de variáveis de decisão e como exemplo tem-se: quantidades de peças
serem produzidas, disponibilidade e salário, disponibilidade de horas de fabricação, limitação de
mercado. Essas são as variáveis componentes das inequações (<, ≤, >, ≥) de restrição e todas elas
devem ser do primeiro grau.
• Terceiro: Tendo-se definido o objetivo e tendo-se conhecimento das variáveis de decisão pode-se
modelar a equação que representa a função objetivo a ser otimizada.
De forma resumida, a formulação de um modelo matemático em programação passa pelas

seguintes fases:
a) determinação das variáveis de decisão a serem quantificadas através da solução do modelo.
b) conhecimento das restrições (físicas, econômicas, materiais) do problema de modo a poder formar
as equações de restrição
c) modelagem da função objetivo que se deseja otimizar
É importante observar que em um processo de pesquisa operacional a solução do problema não

termina com a obtenção da otimização. Para identificar e/ou minimizar erros do processo ou para um
aperfeiçoamento da solução os passos abaixo devem ser seguidos:
Definição do Problema:
A definição do problema baseia-se em três aspectos principais:
• descrição exata dos objetivos do estudo;
• identificação das alternativas de decisão existentes;
• reconhecimento das limitações, restrições e exigências do sistema.
Construção do Modelo:
A escolha apropriada do modelo é fundamental para a qualidade da solução fornecida. Se o
modelo elaborado tem a forma de um modelo conhecido, a solução pode ser obtida através de métodos
matemáticos convencionais. Por outro lado, se as relações matemáticas são muito complexas, talvez se
faça necessária a utilização de combinações de metodologias.
98
Solução do Modelo:
O objetivo desta fase é encontrar uma solução para o modelo proposto. Ao contrário das outras
fases, que não possuem regras fixas, a solução do modelo é baseada geralmente em técnicas
matemáticas existentes.
No caso de um modelo matemático, a solução é obtida pelo algoritmo mais adequado, em termos
de rapidez de processamento e precisão da resposta. Isto exige um conhecimento profundo das
principais técnicas existentes. A solução obtida, neste caso, é dita "ótima".
Validação do Modelo:
Nessa etapa é necessário verificar a validade do modelo. Um modelo é válido se, levando-se em
conta sua inexatidão em representar o sistema, ele for capaz de fornecer uma previsão aceitável do
comportamento do sistema.
Um método comum para testar a validade do sistema é analisar seu desempenho com dados
passados do sistema e verificar se ele consegue reproduzir o comportamento que o sistema apresentou.
É importante observar que este processo de validação não se aplica a sistemas inexistentes, ou seja, em
projeto. Nesse caso, a validação é feita pela verificação da correspondência entre os resultados obtidos
e algum comportamento esperado do novo sistema.
Implementação da Solução:
Avaliadas as vantagens e a validação da solução obtida, esta deve ser convertida em regras
operacionais. A implementação, por ser uma atividade que altera uma situação existente, é uma das
etapas críticas do estudo. É conveniente que seja controlada pela equipe responsável, pois,
eventualmente, os valores da nova solução, quando levados à prática, podem demonstrar a necessidade
de correções nas relações funcionais do modelo conjunto dos possíveis cursos de ação, exigindo a
reformulação do modelo em algumas de suas partes.
Formulação de Modelos
O problema geral de programação linear pode ser definido por Maximizar ou Minimizar uma
função objetivo.
Função Objetivo
Z  c1x1  c 2 x 2  c3 x 3  ...  c n x n
99
a11x1  a1 2 x 2  a1 3 x 3  ...  a 1 n x n  b1

a 2 1x1  a 2 2 x 2  a 2 3 x 3  ...  a 2 n x n  b 2
  

Restrições 
  
  

a m 1x1  a m 2 x 2  a m 3 x 3  ...  a m n x n  b m
Observação: as restrições acima também podem ser do tipo: =; ≥.
Restrições: x1, x2, x3, ..., xn ≥ 0
PL – Resumo:
A PL está inserida dentro da PO e consiste de uma técnica matemática que objetiva determinar a
melhor solução de um problema de otimização condicionado a restrições (limitações) existentes. A
Programação Linear é uma ferramenta que auxilia na solução de modelos matemáticos para a
otimização dos resultados. O modelo matemático é composto de dois tipos equações, a saber: função-
objetivo e as restrições. A função objetivo é uma função que representa o lucro ou o custo e é
dependente das variáveis de decisão do problema. As restrições são as limitações características do
problema. Estas restrições podem ser tempo, material, financeira etc. Um problema de PL pode ser
solucionado de três formas:
a) Solução gráfica
b) Solução pelo método SIMPLEX (solução algébrica)
A PL é uma técnica de planejamento da PO com objetivo de apresentar uma solução ótima para
problemas em muitas áreas como: alocação de recursos e utilização de matéria-prima, transporte,
localização de instalações, composição de carteira de investimentos, redução de custos e aumento de
lucro.
PL tem o objetivo modelar e solucionar problemas de equações lineares. A construção de um

modelo de programação linear segue três passos básicos.
a) Identificação das variáveis desconhecidas (variáveis de decisão).
b) Identificação das restrições.
c) Identificação da função objetivo - função linear das variáveis de decisão.
O objetivo é otimizar (maximizar ou minimizar) a função objetivo.
100
Hipóteses em Programação Linear:

a) Proporcionalidade: todos os retornos / custos e recursos utilizados variam proporcionalmente a
variável de decisão (não há economia de escala);
b) Aditividade: o efeito total de quaisquer duas variáveis é a soma dos efeitos individuais (não há
sinergia ou efeito de substituição).
Exemplo: o custo total é a soma dos custos individuais;
c) Divisibilidade: as variáveis de decisão podem assumir valores fracionados. Se essas variáveis só
puderem assumir valores inteiros o problema é de programação inteira (PI);
d) Certeza (Determinístico): todos os parâmetros do modelo são constantes conhecidas (não são
variáveis aleatórias);
101
PL - Exercícios Resolvidos Sobre Modelagem
1) Certa empresa fabrica dois produtos P1 e P2. O lucro unitário do produto P1 é de $1.000,00 e o
lucro unitário de P2 é de $1.800,00. A empresa precisa de 20 horas para fabricar uma unidade de P1 e
de 30 horas para fabricar uma unidade de P2. O tempo anual de produção disponível para isso é de
1.200 horas. A demanda esperada para cada produto é de 40 unidades anuais de P1 e 30 unidades de
anuais de P2. Qual é o plano de produção para que a empresa maximize o seu lucro nesses itens?
Construa o modelo de programação linear para esse caso.
Resposta:
x1 → quantidade a produzir de P1
Max. Lucro = 1.000x1 + 1.800x2
Sujeito a (as): R1: 20x1 + 30x2 ≤ 1.200 ; R2: x1 ≤ 40 ; R3: x2 ≤ 30 ; x1 ≥ 0 , x2 ≥ 0
2) Para uma boa alimentação, o corpo necessita de vitaminas e proteínas. A necessidade mínima de
vitaminas é de 32 unidades por dia e de proteínas é de 36 unidades por dia. Uma pessoa tem disponível
carne e ovos para se alimentar. Cada unidade de carne contém 4 unidades de vitaminas e 6 unidades de
proteína. Cada unidade de ovo contém 8 unidades de vitaminas e 6 de proteínas. Qual a quantidade
diária de carne e ovos que deve ser consumida para suprir as necessidades de vitaminas e proteínas
com o menor custo possível? Cada unidade de carne custa $3,00 e cada unidade de ovo custa $2,50.
Resposta:
x1 → quantidade de carne a consumir por dia
x2 → quantidade de ovos a consumir no dia
Min. C = 3x1 + 2,5x2
sa: R1: 4x1 + 8x2 ≥ 32 ; R2: 6x1 + 6x2 ≥ 36 ; x1 ≥ 0 , x2 ≥ 0
3) Um sapateiro faz 6 sapatos por hora, se fizer somente sapatos, e 5 cintos por hora, se fizer somente
cintos. Ele gasta 2 unidades de couro para fabricar uma unidade sapato e 1 unidade de couro para
fabricar uma unidade de cinto. Sabendo-se que o total disponível de couro é de 6 unidades e que o
lucro unitário por sapato é de $5,00 e o do cinto é de $2,00. Pede-se: o modelo do sistema de produção
do sapateiro, se o objetivo é maximizar o seu lucro por hora.
Resposta:
x1 → nº de sapatos por hora
x2 → nº de cintos por hora
102
Max. Lucro = 5x1 + 2x2

sa: R1: 10x1 + 12x2 ≤ 60 ; R2: 2x1 + 1x2 ≤ 6 ; x1 ≥ 0 , x2 ≥ 0
4) Certa empresa fabrica 2 produtos P1 e P2. O lucro por unidade de P1 é de $100,00 e o lucro unitário
de P2 é de $150,00. A empresa necessita de 2 horas para fabricar uma unidade de P1 e 3 horas para
fabricar uma unidade de P2. O tempo mensal disponível para essas atividades é de 120 horas. As
demandas esperadas para os 2 produtos levaram a empresa a decidir que os montantes produzidos de
P1 e P2 não devem ultrapassar 40 unidades de P1 e 30 unidades de P2 por mês. Construa o modelo do
sistema de produção mensal como objetivo de maximizar o lucro da empresa.
Resposta:
Max. Lucro = 100x1 + 150x2
sa: R1: 2x1 + 3x2 ≤ 120 ; R2: x1 ≤ 40 ; R3: x2 ≤ 30 ; x1 ≥ 0 , x2 ≥ 0
5) Um vendedor de frutas pode transportar 800 caixas de frutas para sua região de vendas. Ele
necessita transportar 200 caixas de laranjas a $20,00 de lucro por caixa, pelo menos 100 caixas de
pêssego a $10,00 de lucro por caixa, e no máximo 200 caixas de tangerinas a $30,00 de lucro por
caixa. De que forma deverá ele carregar o caminhão para obter o lucro máximo? Construa o modelo do
problema.
Resposta:
x1 → quantidade de caixas de pêssego
x2 → quantidade de caixas de tangerinas
Max. Lucro = 10x1 + 30x2 + 4.000
sa: R1: x1 + x2 ≤ 600 ; R2: x1 ≥ 100 ; R3: x2 ≤ 200 ; x1 ≥ 0 , x2 ≥ 0
6) Uma empresa fabrica 2 modelos de cinto de couro. O modelo M1, de melhor qualidade, requer o
dobro do tempo de fabricação em relação ao modelo M2. Se todos os cintos fossem do modelo M2, a
empresa poderia produzir 1.000 unidades por dia. A disponibilidade de couro permite fabricar 800
cintos de ambos os modelos por dia. Os cintos empregam fivelas diferentes, cuja disponibilidade diária
é de 400 para o modelo M1 e 700 para o modelo M2. Os lucros unitários são de $4,00 para M1 e $3,00
para M2. Qual o programa ótimo de produção que maximiza o lucro total diário da empresa? Construa
o modelo do sistema descrito.
Resposta:
103
x1 → quantidade a produzir de M1
x2 → quantidade a produzir de M2
Max. Lucro = 4x1 + 3x2
sa: R1: 2x1 + x2 ≤ 1.000 ; R2: x1 + x2 ≤ 800 ; R3: x1 ≤ 400 ; R4: x2 ≤ 700 ; x1 ≥ 0 , x2 ≥ 0
7) Uma rede de televisão tem o seguinte problema: foi descoberto que o programa “A” com 20
minutos de música e 1 minuto de propaganda chama a atenção de 30.000 telespectadores, enquanto o
programa “B” com 10 minutos de música e 1 minuto de propaganda chama a atenção de 10.000
telespectadores. No decorrer de uma semana, o patrocinador insiste no uso de no mínimo, 5 minutos
para sua propaganda e que na há verba para mais de 80 minutos de música. Quantas vezes por semana
cada programa deve ser levado ao ar para obter o número máximo de telespectadores? Construa o
modelo do sistema.
Resposta:
x1 → frequência semanal do programa A
x2 → frequência semanal do programa B
Max. T = 30.000x1 + 10.000x2
Sujeito a (sa): R1: 1x1 + 1x2 ≥ 5 ; R2: 20x1 + 10x2 ≤ 80 ; x1 ≥ 0 , x2 ≥ 0
8) Uma empresa, após um processo de racionalização de produção, ficou com disponibilidade de 3

recursos produtivos, R1, R2 e R3. Um estudo sobre o uso destes recursos indicou a possibilidade de se
fabricar 2 produtos P1 e P2. Levantando os custos e consultando o departamento de vendas sobre o
preço de colocação no mercado, verificou-se que P1 daria um lucro de $120,00 por unidade e P2,
$150,00 por unidade. O departamento de produção forneceu a seguinte tabela de uso de recursos.
Produto R1 por unidade R2 por unidade R3 por unidade

P1 2 3 5
P2 4 2 3
Disponibilidade mensal 100 90 120
Que produção mensal de P1 e P2 traz o maior lucro para a empresa? Construa o modelo do sistema.
Resposta:
104
Max. Lucro = 120x1 + 150x2

sa: R1: 2x1 + 4x2 ≤ 100 ; R2: 3x1 + 2x2 ≤ 90 ; R3: 5x1 + 3x2 ≤ 120 ; x1 ≥ 0 , x2 ≥ 0
9) Um fazendeiro está estudando a divisão de sua propriedade nas seguintes atividades produtivas:
A (Arrendamento) – Destinar certa quantidade de alqueires para a plantação de cana-de-açúcar, a uma
usina local, que se encarrega da atividade e paga aluguel da terra $300,00 por alqueire por ano.
P (Pecuária) – Usar outra parte para a criação de gado de corte. A recuperação das pastagens requer
adubação (100 kg/Alq) e irrigação (100.000 litros de água/Alq) por ano. O lucro estimado nessa
atividade é de $400,00 por alqueire no ano.
S (Plantio de Soja) – Usar uma terça parte para o plantio de soja. Essa cultura requer 200 kg por
alqueire de adubos e 200.000 litros de água/Alq para irrigação por ano. O lucro estimado nessa
atividade é de $500,00 / Alqueire no ano. Disponibilidade de recursos por ano: 12.750.000 litros de
água; 14.000 kg de adubo; 100 alqueires de terra. Quantos alqueires deverá destinar a cada atividade
para proporcionar o melhor retorno? Construa o modelo de decisão.
Resposta:
x1 → alqueires para arrendamento; x2 → alqueires para pecuária; x3 → alqueires para soja
Max. Lucro = 300x1 + 400x2 + 500x3
sa: R1: x1 + x2 + x3 ≤ 100 ; R2: 100x1 + 200x3 ≤ 14.000 ; R3: 100.000x1 + 200.000x3 ≤ 12.750.000
x1 ≥ 0 , x2 ≥ 0, x3 ≥ 0
10) Uma rede de depósitos de material de construção tem 4 lojas que devem ser abastecidas com 50m 3
(loja 1), 80m3 (loja 2), 40m3 (loja 3) e 100m3 (loja 4) de areia grossa. Essa areia pode ser carregada em
3 pontos P1, P2 e P3, cujas distâncias estão no quadro (em km):
L1 L2 L3 L4
P1 30 20 24 18
P2 12 36 30 24
P3 8 15 25 20
11) O caminhão pode transportar 10m3 por viagem. Os pontos têm areia para suprir qualquer demanda.
Estabelecer um plano de transporte que minimize a distância total percorrida entre os pontos e as lojas
e supra as necessidades das lojas. Construa o modelo linear do problema.
Resposta:
x11 → número de viagens do P1 a L1 ; x12 → número de viagens do P1 a L2
x13 → número de viagens do P1 a L3 ; x21 → número de viagens do P2 a L1 etc.
105
objetivo: minimizar C
C = 30x11 + 20x12 + 24x13 + 18x14 + 12x21 + 36x22 + 30x23 + 24x24 + 8x31 + 13x32 + 25x33 + 30x34
Sujeito a (sa):
R1: x11 + x21 + x31 = 5 ; R2:x12 + x22 + x32 = 8 ; R3: x13 + x23 + x33 = 4 ; R4: x14 + x24 + x34 = 10
xij ≥ 0 , i = 1,2,3 , j=1,2,3
12) O departamento de marketing de uma empresa estuda a forma mais econômica de aumentar em
30% as vendas de seus dois produtos P1 e P2.
As alternativas são:
a) Investir em um programa institucional com outras empresas do mesmo ramo. Esse programa requer
um investimento mínimo de $3.000,00 e deve proporcionar um aumento de 3% nas vendas de cada
produto, para cada $1.000,00 investidos.
b) Investir diretamente na divulgação dos produtos. Cada $1.000,00 investidos em P1 retornam um
aumento de 4% nas vendas, enquanto que para P2 o retorno é de 10%.
A empresa dispõe de $10.000,00 para este empreendimento. Quanto deverá destinar a cada atividade?
Construa o modelo do sistema descrito.
Resposta:
x1 → quantidade em $1.000,00 para programa institucional
x2 → quantidade em $1.000,00 diretamente em P1
x3 → quantidade em $1.000,00 diretamente em P2
Objetivo minimizar o custo C: C = 1.000x1 + 1.000x2 + 1.000x3
Sujeito a (sa): R1: x1 ≥ 3 ; R2: 3x1 + 4x2 ≥ 30 ; R3: 3x1 + 10x3 ≥ 30 ; R4: x1 + x2 + x3 ≤ 10
x1 ≥ 0 , x2 ≥ 0, x3 ≥ 0
14) Uma companhia de transporte tem dois tipos de caminhões: O tipo “A” tem 2m3 de espaço
refrigerado e 3m3 de espaço não refrigerado; o tipo “B” tem 2 m3 de espaço refrigerado e 1m3 de
espaço não refrigerado. O cliente quer transportar um produto que necessitará 16 m3 de área
refrigerada e 12m3 de área não refrigerada. A companhia calcula em 1.100 litros o combustível para
uma viagem com o caminhão “A” e 750 litros para o caminhão “B”. Quantos caminhões de cada tipo
deverão ser usados no transporte do produto, com o menor consumo de combustível?
Resposta:
Caminhão Tipo A: 2 viagens
Caminhão Tipo B: 6 viagens
Gasto e combustível = 6.700 litros
106
PL - Exercícios Resolvidos Com Solução Gráfica
Ex 01) Para construir uma casa por mês uma construtora necessite de 2 pedreiros e 4 serventes. Para
construir um apartamento no mesmo intervalo de tempo, a construtora necessita de 3 pedreiros e 8
serventes. A construtora possui um 30 pedreiros e 70 serventes. A construtora obtém um lucro de
$3.000,00 na venda de cada casa e de $5.000,00 na venda de cada apartamento e toda "produção" da
construtora é vendida. Qual a quantidade de casas e apartamentos que a construtora deve construir para
que obtenha lucro máximo?
Solução: construção de uma tabela com os dados:

Casa Apartamento Disponibilidade de mão de obra
Pedreiro 2 3 30
Servente 4 8 70
Lucro (x $1.000) 3 5
Sejam:
x1 = quantidade de casas construídas;
x2 = quantidade de apartamentos construídos.
A Função Objetivo deve expressar o lucro total (LT) em função da quantidade (x 1) de casas e da
quantidade (x2) de apartamento que devem ser construídos. A função LT é:
• lucro por casa vendida = ($3.000,00)( x1)

• lucro por apartamento vendido = ($5.000,00)(x2)
• Lucro total: f(x1,x2) = Z = 3(x1) + 5(x2) (vezes $1.000,00)
Para determinadas quantidades de casa e de apartamento vendidos tem-se um lucro, porém

deseja-se saber qual o lucro máximo quando o mesmo está sujeito às restrições impostas.
• Restrições de mão de obra:

Pedreiros: Para cada casa construída a construtora necessita de 2 pedreiros e para cada
apartamento construído a construtora necessita de 3 pedreiros. A companhia só dispõe de 30 pedreiros.
Esta restrição pode ser representada como:
107
2(x1) + 3(x2) ≤ 30
Serventes: a construtora necessita de 4 serventes para cada casa construída e 8 serventes para
cada apartamento construído. A construtora só dispõe de 70 serventes contratados. Esta restrição pode
ser representada como:
4(x1) + 8(x2) ≤ 70
• Restrições de não negatividade:

Essas restrições são assim denominadas por não existir quantidades (x1) de casas ou (y1) de
apartamentos sendo negativas.
x1 ≥ 0 e x2 ≥ 0
O passo seguinte é delimitar uma região do plano (X,Y) em função das restrições estabelecidas.
A região delimitada pelas restrições define no plano um polígono convexo. A região de solução do
problema é toda região interna do polígono inclusive o contorno.
Satisfazendo as restrições, a região delimitada mostra que a maior quantidade de casas (zero
apartamento) que a construtora pode construir é 15. A região também mostra que a maior quantidade
de apartamento que a construtora pode construir (zero casa) é 9.
O passo seguinte é colocar a função objetivo dentro da região delimitada pelas restrições de modo que
a composição dos valores de x1 e de x2 produza o lucro total máximo. Isso é feito da seguinte maneira:
108
• Primeiro: estabelecer dois valores quaisquer para o lucro total

• Segundo: construir o gráfico (reta) das duas funções lucro total com os valore previamente
estabelecidos
• Terceiro: verificar a inclinação e o comportamento das retas
• Quarto: subir ou descer a reta obedecendo a mesma inclinação e colocá-la na situação mais favorável
desejada de modo que ela tenha pelo menos um ponto no contorno da região.
• Quinto: as coordenadas desse ponto constituem os valores de x1 e de x2 que otimizam a função

objetivo.
Resolvendo a Questão:
Seja a função objetivo: Z = 3(x1) + 5(x2)
• Estabelecendo inicialmente um lucro = 7,5 → 7,5 = 3(x1) + 5(x2)

obtenção de dois pontos para construir o gráfico: (0 ; 1,5) e (2,5 ; 0)
• Estabelecendo um novo valor para o lucro:

Para L = 15 → 15 = 3(x1) + 5(x2)
Tem-se que x2 é função de x1, ou seja: x2 = F(x1)
obtenção de dois pontos necessários para construir o gráfico: (0,3) e (5,0)
Se na função LT, continuássemos a atribuir valores cada vez maiores para o lucro e
construíssemos o gráfico de cada uma das situações, verificaríamos que esse procedimento iria gerar
uma família de retas paralelas e quanto maior o lucro, mais alta se encontraria a reta (maior coeficiente
linear).
Quanto maior o lucro, mais alta se encontra a reta do LT, então para se obter o lucro máximo
deve-se colocar a reta no ponto extremo da região permissível. Nessas condições a reta LT só cruzará
um ponto que se situa em um dos vértices do polígono. Esse ponto contém os valores de (x 1,x2) que
maximizam o lucro total.
A figura abaixo mostra as retas paralelas de lucro total com o ponto máximo situado à interseção
da curva de restrição de pedreiros com a curva de restrição de serventes. Esse ponto denominado de A
tem coordenadas (7,5;5) e a função objetivo nesse ponto valerá:
Z = 3(7,5) + 5(5) = 47,5

109
Ex 02) Suponha que para construir uma casa por mês uma construtora necessite de 2 pedreiros, 4
serventes e 1 carpinteiro. Para se construir um apartamento no mesmo intervalo de tempo, a mesma
construtora necessita de 3 pedreiros, 8 serventes e 3 carpinteiros. A construtora possui um efetivo total
de 30 pedreiros, 70 serventes e 20 carpinteiros contratados. A construtora obtém um lucro de
$3.000,00 na venda de cada casa popular e de $5.000,00 na venda de cada apartamento e toda
"produção" da construtora é vendida. Qual é a quantidade ótima de casas populares e apartamentos que
a construtora deve construir para que obtenha lucro máximo.
Solução: Da mesma maneira que procedemos no exemplo 1, vamos inicialmente representar este
problema em forma de tabela.
Casa Apartamento Disponibilidade de mão de obra

Pedreiro 2 3 30
Servente 4 8 70
Carpinteiro 1 3 20
Lucro (x $1.000) 3 5
A Função Objetivo é a mesma do exemplo 1:

Z = 3(x1) + 5(x2)
sendo:
x1 = quantidade de casas construídas;
x2 = quantidade de apartamentos construídos.
As inequações de restrição (injunção) são:
110
R1: 2x1 + 3x2 ≤ 30 (para pedreiros)

R2: 4x1 + 8x2 ≤ 70 (para serventes)
R3: x1 + 3x2 ≤ 20 (para carpinteiros)
Restrições inerentes (de não negatividade) são:

x1 ≥ 0 e x2 ≥ 0
Observação: não negatividade significa que não existem quantidades negativas nem de casa nem de
apartamento.
Com as cinco equações de restrição delimita-se no plano uma região de solução. Ver figura abaixo.
Através do mesmo procedimento, ou seja, atribuindo valores ao lucro total e construindo as retas
observamos que o ponto de lucro total máximo é à interseção das retas de restrição de pedreiro e
restrição de carpinteiro. A coordenada do ponto de interseção vale: (10; 3,33).
A lucro máximo é: Z = 3(10) + 5(3,33) = $46,65
111
Ex 03) Uma empresa fabrica dois produtos A e B. Cada um deste produtos requer certa quantidade de
tempo na linha de montagem e ainda mais algum para a sua finalização. Cada produto do tipo A
necessita de 5 horas na linha de montagem e de 2 horas para a finalização. Cada produto de tipo B
necessita de 3 horas na linha de montagem e de 4 horas para a finalização. Numa semana, a empresa
dispõe de 108 horas para a linha de montagem e 60 horas para a finalização. Toda a produção é
vendida. O lucro de cada produto é de $120,00 para o produto A e de $210,00 para o B. Quantas
unidades, por semana, dos produtos A e B se devem produzir, de modo a que o lucro seja máximo?
Solução: construindo uma tabela com os dados:
Montagem Finalização Lucro

A 5 2 120
B 3 4 210
Disponibilidade 108 60
Seja “x” o número de unidades que a empresa produz, por semana, do produto A e “y” o número de
unidades que a empresa produz, por semana, do produto B.
• Restrição de tempo na montagem:

O tempo necessário na linha de montagem para os dois produtos é 5x+3y horas, no total.
• Restrição de tempo na montagem:
R1: 5x + 3y ≤ 108
• Restrição de tempo na Finalização:
R2: 2x + 4y ≤ 60
• Restrição de não negatividade (inerentes):
112
x≥0 e y≥0 (não existe produção negativa)
• Equação do lucro Semana:

Cada unidade do produto A origina um lucro de $120,00 e cada unidade do produto B origina
um lucro de $210,00, assim: O lucro semanal é dado por: L = (120)x + (210)y (pretende-se maximizar
esse lucro).
Em Resumo:
• variáveis de decisão (que pretendemos determinar): x e y (número de unidades)
• objetivo (o que se pretende otimizar) maximizar o lucro: L = 120x + 210y
• Restrições (que têm de ser satisfeitas):
R1: 5x + 3y ≤ 108 ; R2: 2x + 4y ≤ 60 ; x ≥ 0 , y ≥ 0
Habitualmente escreve-se na seguinte forma:
Maximizar o lucro L: L = 120x + 210y
Sujeito a (sa): R1: 5x + 3y ≤ 108 ; R2: 2x + 4y ≤ 60 ; x ≥ 0 e y ≥ 0
Após a colocação das restrições no sistema cartesiano resultou na área hachurada ver figura abaixo.
Assim sendo a um maior valor de L/210 corresponde a um maior valor de L e assim sendo a resolução
do nosso problema consiste em encontrar a reta com declive –4/7 de maior ordenada na origem e que
tenha algum contato com o polígono.
113
Das várias retas de mesmo declive (-4/7) a que tem maior ordenada na origem e tem pontos de contato
com o domínio, é a que passa no vértice B. Este ponto é a solução do sistema. Para encontrar o valor
exato basta resolver o sistema que é composto pelas retas que intersectam o ponto B.
R1: 5x + 3y = 108 ; R2: 2x + 4y = 60
Solução: x = 18 ; y = 6
Assim para que a empresa, que produz o produtos A e B, tenha o maior lucro possível, deve produzir
semanalmente 18 unidades do produto A e 6 unidades do produto B.
O lucro máximo L é:
L = (120)18 + (210)6 = $3.420,00 semanais.
Observação 1: A partir de duas variáveis a solução gráfica se torna extremamente complicada ou

impossível.
Observação 2: Teorema: Dado um problema de programação linear, se “S” for a região admissível e
for limitada então existe um máximo e mínimo em S e cada um destes ocorre pelo menos num dos
vértices da região. Se “S” não for limitada, então pode não existir nem máximo nem mínimo. Mas se
existir ele encontra-se num vértice de “S”. Este teorema permite-nos conciliar estes resultados com o
método gráfico.
Assim no exemplo anterior, como a região admissível é limitada então a solução que procuramos
encontra-se num dos vértices da área.
114
PL - Exercícios Propostos Sobre Solução Gráfica
Ex 01) Resolva: Maximize Z = 300x1 + 500x2

Sujeito a (sa): R1: 5x1 + 10x2  400 ; x1 e x2 ≥ 0
Resposta: x1 = 80 ; x2 = 0 ; Z = 24000

Sujeito a (sa): R1: 2x1 + 4x2 ≤ 720 ; R2: 4x1 + 4x2 ≤ 880 ; x1 ≤ 260 ; x1 e x2 ≥ 0
Resposta: x1 = 220 ; x1 = 0 ; Z = 1320

Sujeito a (sa): R1: 2x1 + 4x2 ≥ 36 ; R2: 4x1 + 3x2 ≤ 140 ; R3: x1 – x2 ≥ -20 ; x1 e x2 ≥ 0
Resposta: x1 = 11,43 ; x1 = 31,43 ; Z = 191,43

Sujeito a (sa): R1: x1 + 2x2 ≥ 90 ; R2: 4x1 + 3x2 ≤ 300 ; R3: x1 – x2 ≥ -30 ; x1 e x2 ≥ 0
Resposta: x1 = 30 ; x1 = 60 ; Z = 330

Sujeito a (sa): R1: x1 + x2 ≤ 9 ; R2: 3x1 + x2 ≤ 18 ; R3: x1 ≤ 7 ; R4: x2 ≤ 6 ; x1 ≥ 0 x2 ≥ 0
Resposta: x1 = x2 = 4,5 ; Z = 22,50
Ex 06) Resolva: Maximize 2x1 + 3x2

Sujeito a (sa): R1: - x1 + 2x2 ≤ 4 ; R2: x1 + x2 ≤ 6 ; R3: x1 + 3x2 ≤ 9 ; x1 ≥ 0 e x2 ≥ 0
Resposta: x1 = 4,50 ; x2 = 1,50 ; Z = 13,50
Ex 07) Resolva graficamente: Maximize e Minimize Z = 35x1 + 40x2

Sujeito a: R1: 2x1 + 4x2 ≤ 290 ; R2: 4x1 - 3x2 ≤ 110 ; R3: x1 – x2 ≥ -30 ; R4: 3x1 + 2x2 ≥ 140 ;
x1 ≥ 0 e x2 ≥ 0
Resposta: Máx: x1 = 59,55 ; x2 = 42,73 ; Zmáx = 3.793,45
Resposta: Mín: x1 = 37,65 ; x2 = 15,53 ; Zmín = 1.858,82
Ex 08) Resolver: Minimize Z = 4x1 - 3x2

Sujeito a (sa): R1: x1 - x2 ≥ 10 ; R2: 2x1 - x2 ≥ 40 ; x1 ≥ 0 ; x2 ≥ 0
115
Resposta: x1 = 30 ; x2 = 20 ; Z = 60,00
Ex 09) Resolva: Minimize C = - x1 - 3x2
Sujeito a (sa): R1: x1 + x2 ≤ 6 ; R2: -x1 + 2x2 ≤ 8 ; x1, x2 ≥ 0
Resposta: x1 = 1,33 ; x2 = 4,67 ; C = -15,33.
Ex 10) Resolva: Minimize Z = 4x1 - 3x2

Sujeito a (sa): R1: x1 - x2 ≥ 10 ; R2: 2x1 - x2 ≤ 40 ; x1 ≥ 0 ; x2 ≥ 0
Resposta: x1 = 10 ; x2 = 0 ; Z = 40
Ex 11) Resolva: Minimize Z = 10x1 + 5x2

Sujeito a (sa): R1: 20x1 + 50x2 ≥ 200 ; R2: 50x1 + 10x2 ≥ 150 ; R3: 30x1 + 30x2 ≥ 210;
x1 ≥ 0 ; x2 ≥ 0
Resposta: x1 = 2 ; x2 = 5; Z = 45

Sujeito a (sa): R1: 1000x1 + 500x2 ≥ 10000 ; R2: 3x1 + 4x2 ≤ 60 ; R3: 100x1 + 80x2 ≤ 1600;
x1 ≥ 0 ; x2 ≥ 0
Resposta: x1 = 4 ; x2 = 12 ; Z = 104

Sujeito a (sa): R1: x1 + 2x2 ≤ 12 ; R2: 2x1 + 3x2 = 12 ; R3: 2x1 + x2 ≥ 8 ; x1 ≥ 0 ; x2 ≥ 0
Resposta: x1 = ; x2 = ; Z =
Ex 01) Uma empresa de mobiliário pretende lançar um modelo de cadeiras e de estantes. O mercado
absorve toda a produção de estantes, mas aconselha-se que a produção mensal de cadeiras não
ultrapasse as 160 unidades. Ambos os produtos são processados na unidade de estampagem (UE) e na
unidade de montagem e acabamento (UMA).
• A disponibilidade mensal em cada uma destas unidades é de: 720 horas-máquina (h·m) na UE e 880
horas-homem (h·h) na UMA.
• Cada cadeira necessita de 2 h-m na UE e de 4 h·h na UMA. • Cada estante necessita de 4 h-m na UE
e de 4 h·h na UMA. • As margens de lucro unitárias estimadas são de 6 contos para as secretárias e de
3 contos para as estantes.
• Qual o plano de produção mensal para as secretárias e estantes que maximiza a margem de lucro.
Resposta: x1 = 160 ; x2 = 60 ; Z = 1.140
116
PL - Método Simplex
O método Simplex é um algoritmo que permite resolver problemas de Programação Linear. Esse
método Simplex tem como objetivo procurar as diversas soluções de um sistema de equações de modo
a encontrar a solução ótima (maximizar lucro ou minimizar custo).
Para o processo de maximização deve-se seguir o seguinte procedimento:

a) Colocar a função objetivo na forma implícita e as desigualdades das restrições deverão ser
transformadas em igualdades com a introdução de variáveis de folga;
b) Verificar o número de equações (NE) formadas pelas restrições (exceto as de não negatividade) e a
quantidade de variáveis incluindo as de folga (NV). A diferença NV-NE representa o numero de
variáveis que devem ser eliminadas em cada uma das soluções do sistema para que ele seja compatível
e determinado, ou seja, tenha solução e seja única.
c) As variáveis eliminadas em cada solução são denominadas ‘variáveis não básicas’ (VNB) e as que
permanecem são denominadas ‘variáveis básicas’ (VB). Inicialmente as VNB são variáveis de decisão
e as VB são as variáveis de folga.
d) Colocar em uma tabela os coeficientes de todas as variáveis das equações de restrição e da função
objetivo dos itens a e b;
e) Extrair da tabela a solução básica inicial (valores de cada uma das variáveis e da função objetivo).
Lembrando que as VNB tem valor zero.
g) Verificar na tabela se existe na função objetivo alguma variável com coeficiente negativo para
entrar no sistema e melhorar o valor da função objetivo. Se não existir o problema está terminado. Se
existir mais de uma, a escolhida deverá ser a que tem o maior valor negativo.
h) Se uma variável entrar no sistema outra deverá sair para o sistema ter solução única. Esse critério é
obtido dividindo-se o termo independente de cada variável básica que se encontra em cada uma das
linhas pelo valor do coeficiente da variável que entra. A variável que tiver o menor quociente dessa
divisão deverá sair (é a que suporta menos o aumento do valor da variável que entra). Se o resultado do
quociente for negativo essa variável não sairá.
i) Com a entrada de uma variável e a saída de outra o novo quadro deverá ser modificado de modo que
em cada linha de cada variável básica o seu coeficiente tenha valor um e o coeficiente das outras
variáveis básicas que se encontrem nessa linha deverão ter valor zero. Os coeficientes das variáveis
básicas na função objetivo deverão ter valor igual a zero.
j) Retornar ao item e.
117
PL - Exercícios Resolvidos Sobre Método Simplex
Ex 01) Uma marcenaria deseja estabelecer uma programação diária de produção. A oficina produz
dois produtos: mesa e armário. A marcenaria tem limitações em dois recursos: madeira e mão-de-obra,
cujas disponibilidades diárias são mostradas na tabela a seguir.
Recurso Disponibilidade
Madeira 12 m2
Mão-de-obra 8 H.h
No processo de produção para fazer uma mesa a fábrica gasta 2m2 de madeira e 2H·h de mão-de-obra.
Para fazer um armário, a fábrica gasta 3m2 de madeira e 1H·h de mão de obra. Cada mesa dá lucro de
$4 e cada armário de $1. Encontre o programa de produção que maximize o lucro.
Solução:
As variáveis de decisão envolvidas no problema são:
x1: quantidade a produzir de mesas e x2: quantidade a produzir de armários
A função objetivo é: Lucro: Z = 4x1 + x2 (na forma explicita)
Para as restrições, a relação lógica existente é: Utilização de recurso ≤ Disponibilidade
Assim tem-se:
Madeira: 2x1 + 3x2 ≤ 12 e Mão-de-obra: 2x1 + x2 ≤ 8
x1 , x 2 ≥ 0
O modelo completo é:
Maximizar: Z = 4x1 + x2
Sujeito a: R1: 2x1 + 3x2 ≤ 12 ; R2: 2x1 + x2 ≤ 8 ; x1, x2 ≥ 0
• O objetivo é encontrar valores das variáveis x1 e x2 que otimizem Z (lucro):

Primeiro Passo:
•Colocar Z na forma implícita: Z – 4x1 – x2 = 0
•Transformar as desigualdades (restrições) em igualdades acrescentando as variáveis de folga x3 e x4:
R1: 2x1 + 3x2 + x3 = 12 ; R2: 2x1 + x2 + x4 = 8 ; x1, x2 ≥ 0
•Observe que existem duas equações e quatro variáveis, nessas condições o sistema (abaixo) é
compatível e indeterminado, ou seja, tem muitas soluções.
2 x1  3x 2  x 3  12

2 x 1  x 2  x 4  8
118
Para que tenha solução única deve-se o sistema o número de equações igual ao número de incógnitas e
para isso duas variáveis devem ser eliminadas. As variáveis que devem ser eliminadas de início são as
variáveis de decisão, no caso x1 e x2. As variáveis que foram inicialmente eliminadas são
denominadas: Variáveis Não Básicas (VNB) e as variáveis que permaneceram são denominadas
variáveis básicas (VB).
VB: x3 e x4 VNB: x1 e x2
•Construir a tabela (abaixo): Colocar os coeficientes de cada variável para cada restrição como também
os coeficientes da função objetivo Z em cada uma das linhas da tabela.
VB
Linha x1 x2 x3 x4 b
↓
L0 x3 2 3 1 0 12
L1 x4 2 1 0 1 8
L2 Z -4 -1 0 0 0
• A primeira solução é:
-variáveis não básicas estão fora do sistema e tem valor zero: x1 = 0 ; x2 = 0
- interpretando cada equação de cada linha tem-se: x3 = 12 ; x2 = 8 ; Z = 0
Z – 4x1 – x2 + 0x3 + 0x4 = 0 → Z = 0 + 4x1 + x2 – 0x3 – 0x4
Segundo Passo:
•Z pode ser melhorado, pois x1 e x2 que compõem Z estão de fora e uma dessas duas variáveis deve
entrar e se tornar uma variável básica. A que deve entrar é a que contribui mais para o aumento do
valor de Z que no caso é a variável x1, pois o valor que essa variável assumir será multiplicado por 4.
Se uma variável entra outra deve sair para que o sistema tenha solução única. A atual variável básica
que deve sair será aquela que tiver o menor quociente entre o termo “b” e o coeficiente da variável que
entra.
Para x3: 12/2 =6
Para x4: 8/2 = 4 → x4 sai
• Construir uma nova tabela com as variáveis básicas atualizadas (x3 e x1) de modo que:
Em cada linha o coeficiente da respectiva VB seja 1 (um) e das outras VB seja 0 (zero) e o coeficientes
das VNB podem assumir qualquer valor.
119
• De início deve-se atender a observação acima para a variável que entra (x 1). Observe que seu valor é
2 e deve ser 1 e o valor de x3 nessa linha deve ser zero e essa condição já é atendida.
Para que o coeficiente de x2 na L4 seja 1 deve-se dividir a L1 por dois, ou seja: L4 = L1/2
• Na L0 que será a L3 o coeficiente de x3 já é 1 mas o coeficiente de x1 não é zero. Essa condição pode
ser atendida usando a linha modificada da variável quem entrou x1. L3 = 2L4 – L0
• Os coeficientes das variáveis básicas na função objetivo Z devem ser zero. Observe que o coeficiente
de x3 já é zero, mas o de x1 não é. Essa condição pode ser atendida com o uso da equação da variável
básica que entrou x1. L5 = 4L1 + L2
VB
Linha x1 x2 x3 x4 b
↓
L3 x3 0 -2 -1 1 -4
L4 x1 1 1/2 0 1/2 4
L5 Z 0 1 0 2 16
• Observe que a segunda solução é:

Variáveis não básicas estão fora do sistema e tem valor zero: x2 = 0 ; x4 = 0
• Interpretando cada equação de cada linha tem-se: x3 = 4 ; x1 = 4 ; Z = 16
• Com a entrada se x1 o valor de Z passou para 16
• O valor de Z não pode mais ser melhorado, pois os coeficientes de todas as variáveis que compõem Z
são todos positivos o zero e Z tem a seguinte forma:
Z + 0x1 + x2 + 0x3 + 2x4 = 16 → Z = 16 + 0x1 – x2 + 0x3 – 2x4 → Z = 16 – x2 – 2x4.
Observe que se x2 e x4 que estão de fora entrassem diminuiriam o valor de Z, pois seus coeficientes na
forma explicita são negativos.
Exemplo 02) Maximizar Z = 3x1 + 5x2

Sujeito à: R1: 2x1 + 4x2 ≤ 10 ; R2: 6x1 + x2 ≤ 20 ; R3: x1 - 4x2 ≤ 30 ; x1, x2 ≥ 0
Solução:
Primeiro Passo:
•Igualar a Função Objetivo a zero: Z - 3x1 - 5x2 = 0
•Acrescentar variáveis de folga nas restrições.
R1: 2x1 + 4x2 + x3 = 10 ; R2: 6x1 + x2 + x4 = 20 ; R3: x1 - x2 + x5 = 30
120
Segundo Passo: Construir a tabela:

Construir uma tabela contendo os coeficientes da função objetivo e das restrições.
VB
Linha x1 x2 x3 x4 x5 b
↓
L0 x3 2 4 1 0 0 10
L1 x4 6 1 0 1 0 20
L2 x5 1 -1 0 0 1 30
L3 Z -3 -5 0 0 0 0
•Variáveis básicas (VB) (fazem parte do sistema): x3 ; x4 ; x5

•Variáveis não básicas (VNB) (estão fora do sistema): x1 ; x4 (são iguais a zero)
•Primeira solução: x1 = 0; x2 = 0; x3 = 10; x4 = 20; x5 = 30; Z = 0
•Variável que entra:
o valor de Z pode ser melhorado com a entrada de x2 e de x1, porém x2 contribui mais.
•Variável que sai:
para x3: 10/4 = 2,5 (significa que x3 suporta o valor de x2 aumentar até 2,5)
para x4: 20/1 = 20 (significa que x4 suporta o valor de x2 aumentar até 20)
para x5: 30/-1 = -30 (significa que x5 suporta o valor de x2 aumentar de -30 até infinito)
conclusão: x3 é a que suporta menos, portanto deve sair
Terceiro Passo: Construir outra tabela:

VB
↓
L4 x2 0,5 1 0,25 0 0 2,5 L4 = L0/4
L5 x4 5,5 0 -0,25 1 0 17,5 L5 = L1 – L4
L6 x5 1,5 0 0,25 0 1 32,5 L6 = L4 + L2
L7 Z -0,5 0 1,25 0 0 12,5 L7 = 5L4 + L3
•Segunda solução: x1 = 0; x2 = 2,5; x3 = 0; x4 = 17,5; x5 = 32,5; Z = 12,5 (com a entrada de x2, Z

passou para 12,5)
•Variável que entra:
o valor de Z pode ser melhorado com a entrada de x1.
•Variável que sai:
para x2: 2,5/0,5 = 5 (significa que x2 suporta o valor de x1 aumentar até 2,5)
para x4: 17,5/5,5 = 3,18 (significa que x4 suporta o valor de x1 aumentar até 3,18)
para x5: 32,5/1,5 = 21,67 (significa que x5 suporta o valor de x1 aumentar até 21,67)
121
conclusão: x4 é a que suporta menos, portanto deve sair
Quarto Passo: Construir outra tabela:

VB
↓
L8 x2 0 1 0,27 -0,09 0 0,91 L8 = L4 - (1/2)L9
L9 x1 1 0 -0,05 0,18 0 3,18 L9 = L5/5,5
L10 x5 0 0 0,32 -0,27 1 27,73 L10 = L6 – (1,5)L9
L11 Z 0 0 1,23 0,09 0 14,09 L11 = L7 + (1/2)L9
Todos os coeficientes das variáveis que fazem parte da função objetivo Z na linha L11 são positivos,
significa que nenhuma dessas variáveis contribui para o aumento de Z e o problema está terminado. A
solução final é:
x2 = 0,91 ; x1 = 3,18 ; x5 = 27,73 ; x4 = 0 ; x3 = 0 ; Z = 14,09.
Ex 03) Maximizar a função objetivo Z sob as restrições R1, R2 e R3. (questão retirada do livro:
Pesquisa Operacional – Livro de Ermes)
Maximizar Z: Z = 2x1 + 4x2 + 6x3 (a função Z se encontra na forma explícita)

Restrições:
R1: x1 + x2 + x3 ≤ 100 ; R2: 2x1 – x2 – 5x3 ≤ 50 ; R3: 3x1 + x3 ≤ 200 ; x1 ≥ 0; x2 ≥ 0; x3 ≥ 0
Primeiro Passo:
• Escreve-se Z na forma implícita (abaixo).
Z - 2x1 - 4x2 - 6x3 = 0
Observação: Os coeficientes negativos das variáveis da função Z na forma implícita correspondem a
positivos na forma explícita (forma inicialmente dada).
• Acrescenta-se as variáveis de folga nas inequações (R1), (R2) e (R3) para transformá-las e equações.
R1: x1 + x2 + x3 + x4 = 100 ; R2: 2x1 – x2 – 5x3 + x5 = 50 ; R3: 3x1 + x3 + x6 = 200
x1 ≥ 0; x2 ≥ 0; x3 ≥ 0; x4 ≥ 0; x5 ≥ 0; x6 ≥ 0
Segundo Passo:
• Construção da tabela auxiliar colocando os coeficientes das variáveis e o termo independente b.
• Escolher inicialmente como variáveis básicas as variáveis de folga.
122
• Observe no sistema que em cada linha a respectiva variável básica deve ter coeficiente igual a 1. As
outras variáveis básicas nesta mesma linha deve ter coeficeinte igual a zero. As variáveis não básicas
não tem importância os seus coeficientes.
• A função Z deve estar escrita em função das variáveis não básicas.
• O sistema abaixo atende esses requisitos.
Linha x1 x2 x3 x4 x5 x6 b
L0 Z -2 -4 -6 0 0 0 0
L1 x4 1 1 1 1 0 0 100
L2 x5 2 -1 5 0 1 0 50
L3 x6 3 0 1 0 0 1 200
Solução básica inicial: x1 = 0; x2 = 0; x3 = 0; x4 = 100; x5 = 50; x6 = 200 ; Z = 0
Verificar se esta solução é ótima:

• A função Z já se encontra escrita em função das variáveis não básicas (x1, x2 e x3)
• O sinal negativo (seriam positivos na forma inicial) dos coeficientes das variáveis de Z significa que
se elas fizerem parte dessa função ajudarão a aumentar o valor de Z.
• A variável que deve entrar é x3 pois ela contribui para Z com 6 vezes o seu valor.
• O menor quociente entre o termo independente e o coeficiente da variável que entra, indica a variável
que deve sair.
para x4: 100/1 = 100
para x5: 50/51 = 10
para x6: 200/1 = 200
Logo, x5 deve sair.
Terceiro Passo:
Constõe-se outra tabela com as novas variáveis básicas e resolve-se o sistema de modo a atender os
requisitos do segundo passo.
Linha x1 x2 x3 x4 x5 x6 b operações
L4 Z 2/5 - 26/5 0 0 6/5 0 60 6L6 + L0
L5 x4 3/5 6/5 0 1 -1/5 0 90 L1 - L6
L6 x3 2/5 -1/5 1 0 1/5 0 10 L2 / 5
L7 x6 13/5 1/5 0 0 -1/5 1 190 L3 - L6
123
• Solução segunda: x1 = 0; x2 = 0; x3 = 10; x4 = 90; x5 = 0; x6 = 190; Z = 60

Observe que Z melhorou com a entrada de x3.
• Essa solução não é otima, pois o sinal de negativo de x2 na função Z (positivo na função é negativo,
então x2 contribui para o aumento de Z.
• x2 é a variável que entra
• O menor quociente entre o termo independente e o coeficiente da variável que entra, indica a variável
que deve sair.
para x4: 100/1 = 90/(6/5) = 25
para x3: 50/51 = 10/(-1/5) = -50 (x3 não é afetado com o acréscimo de x2)
Observação: o sinal negativo em -50 em problemas como este em que as variáveis não podem assumir
vaores negativos significa que a variável x2 assumindo valores a partir de -50 até infinito que não afeta
x3 .
para x6: 190/(1/5) = 900
Logo, x4 deve sair.
Quarto Passo:
Constõe-se outra tabela com as novas variáveis básicas e resolve-se o sistema de modo a deixar em
cada linha apenas uma variável básica com coeficiente igual a 1 e a função Z escrita em termos das
variáveis não básicas.
Linha x1 x2 x3 x4 x5 x6 b operações
L8 Z 3 0 0 26/6 1/3 0 450 (26/5) L9 + L4
L9 x2 1/2 1 0 5/6 -1/6 0 75 L5 (5/6)
L10 x3 1/2 0 1 1/6 1/6 0 25 (1/5) L9 + L6
L11 x6 25/10 0 0 -1/6 -1/6 1 175 (-1/5) L9 + L6
Solução terceira: x1 = 0; x2 = 75; x3 = 25; x4 = 0; x5 = 0; x6 = 175; Z = 450
A função Z do sistema imediatamente acima está escrita implicitamente como:

Z + (3)x1 + (0)x2 + (0)x3 +(26/6)x4 + (1/3)x5 + (0)x6 = 450
ou
Z + 3x1 + (26/6)x4 + (1/3)x5 = 450
124
Observe que Z está escrita em função das variáveis-não-básicas x1, x4, e x5. As variáveis básicas tem
coeficiente zero. Os coeficientes positivos das variáveis-não-básicas de Z na forma implicita
significam que se as variáveis fizerem parte da função Z irão diminuir o seu valor.
Essa observação é facilmente vista quando escrevemos Z explicitamente (abaixo):
Z = 450 – x1 – 26/6x4 – 1/3x5

Conclusão: a teceira solução é a ótima!..
Ex 04) Pelo método simplex, maximizar: Z = 4x1 + x2. Sujeito a:

R1: 2x1 + 3x2 ≤ 12 ; R2: 2 x1 + x2 ≤ 8 ; x1, x2 ≥ 0
a) Incluir as variáveis de folga para transformar uma desigualdade em uma igualdade:

Maximizar: Z = 4x1 + x2. Sujeito a:
R1: 2x1 + 3x2 + f1 = 12 ; R2: 2x1 + x2 + f2 = 8 ; x1, x2, f1, f2 ≥ 0
Colocar a função Z = 4x1 + x2 como: Z - 4x1 - x2 = 0. O conjunto de equações fica:

Z - 4x1 - x2 = 0
R1: 2x1 + 3x2 + f1 = 12 ; R2: 2x1 + x2 + f2 = 8 x1, x2, f1, f2 ≥ 0
Escolher como variáveis básicas (VB): f1 e f2

Escolher como variáveis não básicas (VNB): x1 e x2
Montar uma tabela para com os coeficientes das variáveis:
Linha Base x1 x2 f1 f2 b
L1 f1 2 3 1 0 12
L2 f1 2 1 0 1 8
L3 Z -4 -1 0 0 0
• Solução básica inicial → a solução inicial para o problema será sempre obtida fazendo as variáveis
originais do modelo (no caso x1 e x2) iguais a zero e achando o valor das demais.
x1 = x2 = 0 (variáveis não básicas)
f1 = 12; f2 = 8; Z = 0
b) Observa-se no quadro acima que se a variável x1 (que está de fora) entrar melhora o valor de Z. Se
x1 entra alguma deve sair:
125
Para saber quem deve sair, divide-se o termo b de cada linha pelo coeficiente da variável que entra:
Linha 1) 12/2 = 6; Linha 2) 8/2 = 4
Quanto maior o valor de x1 maior o valor de Z. Observa-se que a variável f2 é a que suporta o menor
valor de x1, logo ela deve sair:
c) As variáveis básicas agora são: f1 e x1 e as não básicas são: f2 e x2.
O coeficiente da VB de cada linha da tabela deve ter valor igual a 1 e as outras VB que se
encontram na mesma linha deve ter coeficiente igual a zero. A função Z deve estar escrita em função
das VNB:
10) Para fazer x1 igual a um na primeira linha:
Dividir a segunda linha por 2 (L2 atual = L2 / 2)
L1 f1 2 3 1 0 12
L2 x1 1 1/2 0 1/2 4
L3 Z -4 -1 0 0 0
20) Para fazer x1 igual a zero na primeira linha:

Multiplicar a segunda linha da tabela anterior (-2) e somar com a primeira linha do mesmo quadro,
colocando o resultado na primeira linha (L1 atual = L1 - 2L2)
L1 f1 0 2 1 -1 4
L2 x1 1 1/2 0 1/2 4
L3 Z -4 -1 0 0 0
30) Para Z ficar em função das VNB

Multiplicar a segunda linha da tabela anterior por (4) e somar com a terceira linha da mesma tabela:
colocando o resultado na terceira linha (L3 atual = L3 + 4L2)
L1 f1 0 2 1 -1 4
L2 x1 1 1/2 0 1/2 4
L3 Z 0 1 0 2 16
Como os coeficientes das variáveis na função Z são todos positivos nenhum contribui para o aumento
de Z, logo essa solução é a solução ótima:
Solução Ótima:
126
x1 = 4; x2 = 0; f1 = 4; f2 = 0 e Z = 16
Ex 05) Pelo método simplex, maximizar: Z = x1 + 2x2. Sujeito a:

R1: x1 ≤ 2 ; R2: x2 ≤ 2 ; R3: x1 + x2 ≤ 3 ; x1, x2 ≥ 0
• Incluir as variáveis de folga para transformar uma desigualdade em uma igualdade:

Maximizar: Z = x1 + 2x2. Sujeito a:
R1: x1 + x3 = 2
R2: x2 + x4 = 8
R3: x1 + x2 + x5 ≤ 3
x1, x2, x3, x4, x5 ≥ 0
• Colocar a função Z = x1 + 2x2 como: Z - x1 - 2x2 = 0. O conjunto de equações fica:

Z - x1 - 2x2 = 0
R1: x1 + x3 = 2
R2: x2 + x4 = 8
R3: x1 + x2 + x5 ≤ 3
x1, x2, x3, x4, x5 ≥ 0
Escolher como variáveis básicas (VB): x3, x4, x5

Escolher como variáveis não básicas (VNB): x1 e x2
Montar uma tabela para com os coeficientes das variáveis:
L1 x3 1 0 1 0 0 2
L2 VB x4 0 1 0 1 0 2
L3 x5 1 1 0 0 1 3
L4 Z -1 -2 0 0 0 0
• Solução básica inicial → a solução inicial para o problema será sempre obtida fazendo as variáveis
originais do modelo (no caso x1 e x2) iguais a zero e achando o valor das demais.
x3 = 2; x4 = 2; x5 = 3 (variáveis básicas)
Z=0
127
• Observa-se no quadro acima que se a variável x2 (quê está de fora) entrar melhora o valor de Z. Se x2
entra alguma deve sair:
Para saber quem deve sair, divide-se o termo b de cada linha pelo coeficiente da variável que entra:
Testando x3 (linha 1) → 2/0 = infinito (não sai)
Testando x4 (linha 2) → 2/1 = 2
Quanto maior o valor de x2 maior o valor de Z. Observa-se que a variável x4 é a que suporta o menor
valor de x2, logo ela deve sair:
C) As variáveis básicas agora são: {x2; x3; x5} e as não básicas são: {x1; x4}.
O coeficiente da VB de cada linha da tabela deve ter valor igual a 1 e as outras VB que se encontram
na mesma linha deve ter coeficiente igual a zero. A função Z deve estar escrita em função das VNB:
Procedimentos:
L3 atual = - L2 + L3
L4 atual = 2 L2 + L4
L1 x3 1 0 1 0 0 2
L2 VB x2 0 1 0 1 0 2
L3 x5 1 0 0 -1 1 1
L4 Z -1 0 0 2 0 4
• Solução básica:
x3 = 2; x2 = 2; x5 = 1 (variáveis básicas)
Z=4
A variável não básica x1 se fizer parte da equação Z contribui para seu aumento, se x1 entrar alguma
tem de sair e sairá a que suportar o menor valor de x1:

Testando x2 (linha 2) → 2/0 = infinito
x5 deve sair
128
• O novo quadro será:

L1 atual = - L3 + L1
L4 atual = L3 + L4
L1 x3 0 0 1 1 -1 1
L2 x2 0 1 0 1 0 2
VB
L3 x1 0 0 0 -1 1 1
L4 Z 0 0 0 1 1 5
• Solução básica:
x3 = 1; x2 = 2; x1 = 1 (variáveis básicas) ; Z = 5
Ex 06) Maximizar: Z = 2x1 + 3x2

Restrições: R1: -x1 + 2x2 ≤ 4; R2: x1 + x2 ≤ 6; R3: x1 + 3x2 ≤ 9; x1 e x2 ≥ 0
VB
Linha x1 x2 x3 x4 x5 b variável sai
↓
L0 x3 -1 2 1 0 0 4 4/2 = 2 sai x3
L1 x4 1 1 0 1 0 6 6/1 = 6
L2 x5 1 3 0 0 1 9 9/3 = 3
L3 Z -2 -3 0 0 0 0 entra x2
L4 x2 -0,5 1 0,5 0 0 2 2/(-0,5) = - 4 L4 = L0/2

L5 x4 1,5 0 -0,5 1 0 4 4/1,5=2,6 L5 = L1-L4
L6 x5 2,5 0 -1,5 0 1 3 3/2,5=1,2 L6 = L2-3L4 sai x5
L7 Z -3,5 00 1,5 0 0 6 L7 = 3L4+L3 entra x1
L8 x2 0 1 0,2 0 0,2 2,6 2,6/0,2=13,0 L8 = 0,5L4+L10

L9 x4 0 0 0,4 1 -0,6 2,2 2,2/0,4=5,5 L9 = L5-1,5L10 sai x4
1,2/(-0,6) = -2,0
L10 x1 1 0 -0,6 0 0,4 1,2 L = L6/2,50
(negativo não sai) 10
L11 Z 0 0 -0,6 0 1,4 10,2 L11 = (3,5)L10+L7 entra x3
L12 x2 0 1 0 -0,5 0,5 1,5 L12 = L8 - (0,2)L13

L13 x3 0 0 1 2,5 -1,5 5,5 L13 = L9/0,40
L14 x1 1 0 0 1,5 -0,5 4,5 L14 = L10+(0,60)L13
L15 Z 0 0 0 1,5 0,5 13,5 L15 = L11+(0,6)L13
129
Ex 07) Maximizar: Z = 10x1 + 12x2

Restrições: R1: x1 + x2 ≤ 100; R2: 2x1 + 3x2 ≤ 270; x1 e x2 ≥ 0
VB
Linha x1 x2 x3 x4 b variável sai
↓
L0 x3 1 1 1 0 100 100/1 = 100
L1 x4 2 3 0 1 270 270/3 = 90 sai x4
L2 Z -10 -12 0 0 0 entra x2
L3 x3 1/3 0 1 -1/3 10 10/(1/3) = 30 L3 = L0-L4 sai x3

L4 x2 2/3 1 0 1/3 90 90/(2/3) = 135 L4 = L1/3
L5 Z -2 0 0 4 1080 L5 = L2+12L4 entra x1
L6 x1 1 0 -3 -1 30 L6 = L3/(1/3)
L7 x2 0 1 -2 1 70 L7 = L4 -2L3
L8 Z 0 0 6 2 1140 L6 = L5 + 2L6
Ex 08) Maximizar: Z = 2x1 + 3x2 + 4x3

Restrições: R1: x1 + x2 + x3 ≤ 100; R2: 2x1 + x2 ≤ 210; R3: x1 ≤ 80; x1; x2 ; x3 ≥ 0
VB
Linha x1 x2 x3 x4 x5 x6 b variável sai
↓
L0 x4 1 1 1 1 0 0 100 100/1 = 100 sai x4
L1 x5 2 1 0 0 1 0 210 210/0 = ∞ (não sai)
L2 x6 1 0 0 0 0 1 800 80/0 = ∞ (não sai)
L3 Z -2 -3 -4 0 0 0 0 entra x3
L4 x3 1 1 1 1 0 0 100 L4 = L0
L5 x5 2 1 0 0 1 0 210 L5 = L1
L6 x6 1 0 0 0 0 1 80 L6 = L2
L7 Z 2 1 0 4 0 0 400 L7 = L3 + 4L4
Ex 09) Uma refinaria destila óleo cru, proveniente de duas fontes: Arábia Saudita e Venezuela, e
produz três produtos: gasolina, querosene e lubrificantes. Os óleos têm diferentes composições
químicas e fornecem diferentes quantidades de destilados por barril processado. Cada barril da Arábia
dá 0,3 barril de gasolina, 0,4 de querosene e 0,2 de lubrificante. Para o barril proveniente da Venezuela
estas quantidades são respectivamente: 0,4; 0,2 e 0,3. Em ambos os casos há 10% de resíduos. Os
óleos diferem em custo e disponibilidade. A refinaria pode comprar até 9000 barris da Arábia a $20,00
o barril e até 6000 barris da Venezuela a $15,00 o barril. Contratos da refinaria com distribuidores
130
exigem que ela produza 2000 barris por dia de gasolina, 1500 de querosene e 500 de lubrificantes.
Como cumprir os contratos gastando o mínimo?
Solução:
Formulação do Problema: As variáveis de decisão são obviamente as quantidades de óleo cru a
serem adquiridas da Arábia Saudita e Venezuela. Sejam estas variáveis x1 e x2 em número barris/dia,
respectivamente. Os dados deste problema podem ser esquematicamente escritos na Tabela V.
Quantidade de óleo cru Quant. ser produzida
Gasolina 0,3 0,4 2000
Querosene 0,4 0,2 1500
Lubrificantes 0,2 0,3 500
Compra possível 9000 6000
Custo 20 15
Minimizar: C = 20x1 +15x2 sujeito as restrições:

R1: 0,3x1 + 0,4x2 ≥ 2000 (gasolina)
R2: 0,4x1 + 0,2x2 ≥ 1500 (querosene)
R3: 0,2x1 + 0,3x2 ≥ 500 (lubrificante)
R4: x1 ≤ 9000 (Arábia Saudita)
R5: x2 ≤ 6000 (Venezuela)
x1 , x 2 ≥ 0 (não negatividade)
A solução ótima é: x1 = 2000, x2 = 3500 a um custo mínimo de US$92.500,00. Tente resolvê-lo.
Ex 10) Uma microempresa monta 4 tipos de microcomputadores (A, B, C, D). O computador A dá à

empresa um lucro de $195,00 enquanto os computadores B, C e D têm lucros de $165,00; $215,00 e
$250,00, respectivamente. Os micros necessitam de 0,8; 1,4; 1,1; e 1,6 horas/unidade, respectivamente.
A empresa utiliza uma quantidade de espaço de estocagem para cada tipo de microcomputador A, B,
C, e D de 0,9; 1,35; 1,25 e 0,8m3/unidade, respectivamente. O gasto semanal em matéria prima
(componentes) é de $1450,00; $1200,00; $1100,00 e $1500,00 por unidade do tipo A, B, C e D. As
disponibilidades destes recursos são: 293 horas de trabalho por semana; 240m3 de galpão para
estocagem e de $380.000,00 para aquisição dos componentes semanais (matéria prima).
Tipo de PC A B C D Disponibilidade
Lucro ($/un) 195 165 215 250 ---
trabalho (horas/un) 0,8 1,4 1.1 1,6 293 (horas/semana)
3
Espaço p/ estocagem (m /un) 0,9 1,35 1,25 0,8 240 (m3)
Matéria prima ($/un) 1450,00 1200,00 1100,00 1500,00 380.000,00 ($/semana)
131
Ex 11) Alocação de Recursos: Uma fábrica produz dois tipos de produtos: Standard e Luxo. Cada
modelo Standard requer 4 horas de corte e 2 horas de polimento; cada Luxo requer de 2 horas de corte
e 5 horas de polimento. A fábrica possui 2 cortadoras e 3 polidoras. Sabendo-se que a semana de
trabalho da fábrica é de 40 horas e que cada modelo Standard dá um lucro de $3,00 e cada modelo
Luxo $4,00 e que não há restrições de demanda, pede-se qual deve ser a produção da fábrica que
maximize o lucro.
Solução:
Z = 3x1 + 4x2
SA: R1 = 4x1 + 2x2 ≤ 80 ; R2 = 2x1 + 5 X2 ≤ 120 ; x1 e x2 ≥ 0
Resposta: x1 = 10 ; x2 = 20 ; Z = $110,00
Ex 12) Um fazendeiro tem 200 unidades de área de terra, onde planeja cultivar trigo, arroz e milho. A
produção esperada é de 1.800kg por unidade de área plantada de trigo, 2.100kg por unidade de área
plantada de arroz e 2.900kg por unidade de área plantada de milho. Para atender o consumo interno de
sua fazenda, ele deve plantar pelo menos 12 unidades de área de trigo, 16 unidades de área de arroz e
20 unidades de área de milho. Ele tem condições de armazenar no máximo 700.000kg. Sabendo que o
trigo dá um lucro de 0,20$/kg, o arroz 0,15$/kg e o milho 0,11$/kg, quantas unidades de área de cada
produto ele deve plantar para que seu lucro seja o maior possível?
Z = 360x1 + 315x2 + 319x3
SA: R1 = x1 + x2 + x3 ≤ 200 ; R2 = 1,8x1 + 2,1x2 + 2,9x3 ≤ 700;
R1 ≥ 12 ; R2 ≥ 16 ; R3 ≥ 20 ; x1 e x2 ≥ 0
Resposta: x1 = 164 ; x2 = 16 ; x3 = 20 ; Z = $70,460
PL - Exercícios Propostos Sobre Simplex
132
Séries Temporais (ST) – Exercícios Resolvidos

Ex 01) Avaliação da tendência através do método das média móveis (MM). (ex pg 144 - livro Jairo
Simon).
Ano 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
Dados 63,2 71,9 58,5 72,8 78,3 75,6 77,4 70,8 73,4 71,5 71,7 75,6
1 2 3 4 5 6
X Y X Y
Ano Dados SM de 3 anos MM de 3 anos Ano MM de 3 anos
1969 63,2 ― ― ― ―
1970 71,9 193,6 64,53 1970 64,53
1971 58,5 203,2 67,73 1971 67,73
1972 72,8 209,6 69,87 1972 69,87
1973 78,3 226,7 75,57 1973 75,57
1974 75,6 231,3 77,10 1974 77,10
1975 77,4 223,8 74,60 1975 74,60
1976 70,8 221,6 73,87 1976 73,87
1977 73,4 215,7 71,90 1977 71,90
1978 71,5 216,6 72,20 1978 72,20
1979 71,7 218,8 72,93 1979 72,93
1980 75,6 ― ― ― ―
• Regressão para curva de tendência linear com dados brutos (colunas 1 e 2).
100
80
60
40
20
0
• Regressão para curva de tendência linear com dados da média móvel (MM) (colunas 1 e 6). Observe
que os dados estão suavizados (amplitude das oscilações em torno da reta são menores).
100
80
60
y = 0,6632x - 1237,5
40
20
0
133
Ex 02) Determinação da curva de tendência pelo Método dos Mínimos Quadrados (MMQ). (ex pg 145
- livro Jairo Simon).
Dados para regressão linear simples (MMQ)
1 2 3 4 5 6 7 8
n X Y XY X2 Yc (Y - Ym)2 (Yc - Ym)2
1 -4 3,2 -12,80 16 3,04 4,2253 4,93
2 -3 3,6 -10,80 9 3,59 2,7409 2,77
3 -2 4,2 -8,40 4 4,15 1,1142 1,23
4 -1 4,7 -4,70 1 4,70 0,3086 0,31
5 0 5,2 0,00 0 5,26 0,0031 0,00
6 1 5,6 5,60 1 5,81 0,1186 0,31
7 2 6,1 12,20 4 6,37 0,7131 1,23
8 3 6,6 19,80 9 6,92 1,8075 2,77
9 4 8,1 32,40 16 7,48 8,0909 4,93
Σ 0 47,30 33,30 60 --- 19,12 18,48
Méd 0 5,26 --- --- --- --- ---
Observe que a média de X está centrada no zero e as formulas para a e para b ficam simplificadas.
a = ΣY/n = (47,30) / (9) = 5,26; b = (ΣXY) / (ΣX2) = (33,30) / (60) = 0,55;
R2 = Σ(Yc-Ym)2 / Σ(Y-Ym)2 = (18,48) / (19,12) = 0,96
•Curva de tendência linear (MMQ)
9
8
7
6
5
4
3 y = 0,555x + 5,2556
2 R² = 0,9665
1
0
-6 -4 -2 0 2 4 6
134
Dados para regressão quadrática (não linear) (MMQ)

 
n X Y X2 X·Y X2·Y X4
Y (Y  Y)2 (Y  Y)2
1 -4 3,20 16 -12,80 51,20 256 3,30 4,2253 3,8195
2 -3 3,60 9 -10,80 32,40 81 3,66 2,7409 2,5555
3 -2 4,20 4 -8,40 16,80 16 4,07 1,1142 1,4064
4 -1 4,70 1 -4,70 4,70 1 4,54 0,3086 0,5131
5 0 5,20 0 0,00 0,00 0 5,07 0,0031 0,0360
6 1 5,60 1 5,60 5,60 1 5,65 0,1186 0,1550
7 2 6,10 4 12,20 24,40 16 6,29 0,7131 1,0694
8 3 6,60 9 19,80 59,40 81 6,99 1,8075 2,9978
9 4 8,10 16 32,40 129,60 256 7,74 8,0909 6,1785
Σ= 0 36,37 28 14,60 146,80 196 --- 19,1222 18,7310
Méd = 0 4,04 --- --- --- --- --- --- ---
2
a
 Y X   X2 Y X = 5,07;
4
b1 
 XY = 0,56;
n x  (  X2 )
4 2
 X2
n X2 Y   Y  X  (Yc  Ym )
2 2
b2  = 0,03; R2  = 0,98
 (Y  Ym )
2 2
n x  (  X2 )
4
•Curva de tendência quadrática (MMQ)
9
8
7
6
5
2
4 y = 0,0285x + 0,555x + 5,0658
R² = 0,9795
3
2
1
0
-6 -4 -2 0 2 4 6
135
Ex 03) Construir a média móvel de 3 anos e as equações de Tendência linear e quadrática. Fazer
previsão para os anos de 1981 e 1983. (ex pg 154 – livro Jairo Simon.)
1 2 3 4 5 6 7
n Ano Ano Dados Soma Móvel Média Móvel MM de 3 anos
X X Y 3 anos 3 anos Y
1 1970 -4 121 ― ― ―
2 1971 -3 147 418 139,33 139,33
3 1972 -2 150 477 159,00 159,00
4 1973 -1 180 515 171,67 171,67
5 1974 0 185 565 188,33 188,33
6 1975 1 200 600 200,00 200,00
7 1976 2 215 665 221,67 221,67
8 1977 3 250 725 241,67 241,67
9 1978 4 260 ― ― ―
• Curva de tendência linear para dados sem tratamento colunas 3 e 4 da tabela.
300
250
200
150
y = 16,917x + 189,78
100 R² = 0,9778
50
0
-6 -4 -2 0 2 4 6
• Curva de tendência quadrática para dados sem tratamento colunas 3 e 4 da tabela.
300
250
200
150
y = 0,3972x2 + 16,917x + 187,13
100 R² = 0,9806
50
0
-6 -4 -2 0 2 4 6
136
Dados de média móvel para regressão linear simples

1 2 3 4 5 8 9 10
 
n X Y = MM X·Y X2
Y (Y  Y)2 (Y  Y)2
1 -3 139,33 -418,00 9 139,45 56,5281 54,75
2 -2 159,00 -318,00 4 155,90 147,5775 81,96
3 -1 171,67 -171,67 1 172,36 615,7750 650,52
4 0 188,33 0,00 0 188,81 1720,7133 1760,45
5 1 200,00 200,00 1 205,26 2824,7257 3411,73
6 2 221,67 443,33 4 221,71 5597,2565 5604,38
7 3 241,67 725,00 9 238,17 8989,8491 8338,40
Σ= 0 1321,67 460,67 28 --- 19952,43 19902,19
Média 0 146,85 --- --- --- --- ---
a = ΣY/n = 1321,67 /7 = 188,81; b = ΣXY/ΣX2 = 460,67/28 = 16,45;

R2 = Σ(Yc-Ym)2 / Σ(Y-Ym)2 = 19902,19 / 19952,43 = 0,99
•Curva de tendência linear para com os dados da média móvel colunas 2 e 3.
300
250
200
150 y = 16,452x + 188,81
100 R² = 0,9934
50
0
-4 -2 0 2 4
Dados de média móvel para regressão quadrática (não linear)
n X Y X2 X·Y X2·Y X4
Y (Y  Y)2 (Y  Y)2
1 -3 139,33 9 -418 1254 81 141,63 56,53 27,22
2 -2 159,00 4 -318 636 16 155,90 147,58 81,96
3 -1 171,67 1 -171,66 171,66 1 171,05 615,78 585,44
4 0 188,33 0 0 0 0 187,06 1720,71 1616,98
5 1 200,00 1 200 200 1 203,95 2824,73 3260,47
6 2 221,67 4 443,33 886,66 16 221,71 5597,26 5604,38
7 3 241,67 9 725 2175 81 240,35 8989,85 8741,76
Σ = 0 1321,67 28 460,66 5323,33 196 Σ = 19952,43 19918,19
Méd = 0 146,85 --- --- --- --- --- --- ---
137
2
 Y X   X2 Y X = 187,06;  XY = 16,45;
4
a b1 
n x  (  X2 )
4 2
 X2
n X2 Y   Y  X  (Yc  Ym )
2 2
b2  = 0,44; R2  = 0,998
 (Y  Ym )
2 2
n x  (  X2 )
4
•Curva de tendência quadrática (MMQ)
300
250
200
150
y = 0,4365x2 + 16,452x + 187,06
100 R² = 0,9955
50
0
-4 -2 0 2 4
Previsão para 1980: X = 6

Linear: Y = 188,81 + 16,45(6) = 287,52
Quadrática: Y 187,06 + 16,45(6) + 0,436(6)2 = 301,492
ST – Exercícios Propostos
Porcentagem da Média
Mês 1980 1981 1982
Jan 205 186 212
Fev 200 178 199
Mar 220 212 138
Abr 264 225 256
Mai 259 248 278
Jun 277 273 285
Jul 264 264 271
Ago 254 267 265
Set 239 249 247
Out 241 253 270
Nov 234 246 266
Dez 304 312 334
138
Porcentagem da Tendência (Ano e valores trimestrais)

Ano I II II IV
1980 2 3 5 2
1981 2 3 6 3
1982 3 4 7 4
1983 3 5 8 5
Porcentagem da Média Móvel

Anos Dados
80-I 18
II 27
III 33
IV 13
81-I 11
II 15
III 14
IV 9
82-I 13
II 23
III 21
IV 19
83-I 16
II 25
III 31
IV 10
FIM
139

Academico - Campi I e IV - 2018-2 - Republicado

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Academico - Campi I e IV - 2018-2 - Republicado

Загружено:

Авторское право:

Доступные форматы

Notas de aula – Professor Azamor Cirne

UNIVERSIDADE FEDERAL DA PARAÍBA

ESTE MATERIAL, AINDA EM DESENVOLVIMENTO, NÃO SUBSTITUI A

PROFESSOR: AZAMOR CIRNE DE AZEVEDO FILHO

De um modo geral a disciplina de Métodos Quantitativos Aplicados À Contabilidade tem como

PESQUISA CIENTÍFICA E ESTATÍSTICA

Fases do planejamento de pesquisa

b) Avaliação da informação existente:

Relação entre a Pesquisa Científica e a Estatística

Método: é um meio mais eficaz para atingir determinada meta.

Ciência: Investigação racional ou estudo da natureza, direcionado à descoberta da verdade. Tal

Métodos Científicos: destacamos o método experimental e o método estatístico.

• Método Experimental → Neste tipo de pesquisa o investigador analisa o problema, constrói

• Método Estatístico → A estatística é um método que se aplica ao estudo dos fenômenos

Fases do Método Estatístico

I – Coleta de Dados → pode ser direta ou indireta.

A Estatística pode ser definida como:

• Estatística Inferencial (Indutiva) → É a parte da estatística que trata da análise, interpretação e

Algumas definições úteis:

•Amostra → É um subconjunto de membros selecionados de uma população

Relação Entre Amostra e População

n = número de elementos da amostra N = número de elementos da população

TIPOS DE VARIÁVEIS (DADOS)

Variável é o que se investiga, ou seja, é o objeto da pesquisa. As variáveis podem ser

MEDIDAS EM UMA DISTRIBUIÇÃO

No estudo de uma distribuição é importante conhecer algumas medidas em função de suas

a) Medidas de Tendência Central

a) Média Para Dados não Tabelados: é a média é a média aritmética simples

f (xi) = frequência simples ou absoluta (quantidade de vezes em o valor aparece)

Ex 02) Seja o conjunto de dados da tabela abaixo

A média dos salários da companhia é:

50  500  50  600  1  20000

• Amostragem A: {1, 2, 5, 10, 10, 18, 19}

• Amostragem B: {8, 8, 9, 10, 11, 12, 12}

• Amostragem C: {5, 6, 8, 10, 12, 14, 15}

b) Medidas de Variabilidade (Dispersão)

As principais medidas de variabilidade (dispersão) são:

SQD = soma dos quadrados os desvios.

melhor qualidade da variância populacional  2 pela variância da amostra.

Em Resumo: Caracterizar um conjunto de dados por medidas de posição é inadequado, pois

Ex 01) Sejam os seguintes conjuntos de dados:

• para a amostra M → S  2,5  1,58

• para a amostra N → S  10  3,16

O desvio padrão pode ser interpretado como:

Gráficos de distribuição de freqüência

Várias são as formas dos gráficos de uma distribuição de frequências.

i) Variância e Desvio Padrão (DP para população):

ii) Variância e Desvio Padrão (DP) para amostra:

i) Variância e Desvio Padrão (DP) para população:

ii) Variância e Desvio Padrão (DP) para amostra:

VARIÁVEL ALEATÓRIA (VA)

Muitos experimentos aleatórios produzem resultados não numéricos. Antes de analisá-los, é

Variável aleatória Discreta

Ex 01) E: lançamento de duas moedas e X uma variável aleatória:

A distribuição de probabilidade está representada abaixo:

P(X = x i) = P(A i), i = 1, 2,..., n

Valor Esperado (Esperança), Variância e Desvio Padrão de uma VA

A esperança matemática (expectância, ou média ou ainda valor esperado) da variável aleatória X é

b) Variância Var(x) → É a medida que dá o grau de dispersão (ou de concentração) de probabilidade

c) VAR(X)  E[(x  x)2 ]   (x  x)2  P( x )

d) Var( X )  E[( x  x )2 ]  E( x2 )  [E(x)]2

c) Desvio Padrão - DP(X) → É a raiz quadrada da variância.

O desvio padrão de uma variável aleatória é definido como: