You are on page 1of 58

ANÁLISE DE REGRESSÃO

(Statistical Graphics System 6.0)

Modelos Teste “F”

Especificação de Linearizações
modelos
Modelo Linear Regressão
múltipla
simples

Teste “t” Bibliografia

http://pessoal.educacional.com.br/pricardo
“O que se deve fazer depende muito do que se deve crer e,
em tudo o que não depende das primeiras necessidades na
natureza, nossas opiniões são a regra de nossas ações”
(Jean-Jacques Rousseau).
MODELO ECONOMÉTRICO
 Representação abstrata e simplificada da
realidade, de natureza matemática
(apesar de estocástica e não
determinística), estruturada de forma tal
que permita compreender, explicar e
controlar o funcionamento total ou
parcial de determinado aspecto de um
fenômeno econômico (naquilo que é
relevante), aí incluídas matérias de
“Economia do Setor Público” (despesas
governamentais, por exemplo).
DEFINIÇÃO DE MODELO
NUM SENTIDO ESTRITO
 “É uma representação formal de idéias
ou conhecimentos acerca de um
fenômeno. Essas idéias - chamadas
teorias - expressam-se por um conjunto
de hipóteses sobre os elementos essenciais
do fenômeno e das leis que o regem, as
quais geralmente se traduzem sob a
forma de um sistema de equações
matemáticas” (Edmond Malinvaud).
POR QUE O USO DE
MODELOS
ECONOMÉTRICOS?
 Porque “permite a investigação das
consequências lógicas das hipóteses,
consideradas através de sua contrastação
com os resultados da experiência. Dessa
forma, conhece-se melhor a realidade e
pode-se, em consequência, atuar, com
mais eficácia, sobre ela” (Edmond
Malinvaud ).
ESTRUTURA DE UM
MODELO
ECONOMÉTRICO
- VARIÁVEIS;

- RELAÇÕES ou EQUAÇÕES;

- PARÂMETROS ou COEFICIENTES;

- TERMO ALEATÓRIO ou
PERTURBAÇÕES ALEATÓRIAS.
VARIÁVEIS
 São fatores singulares dos fenômenos
econômicos (ou magnitudes sujeitas a
alterações); classificam-se em: a) explicadas
(ou dependentes, endógenas ou variáveis-
efeito); b) explicativas (ou independentes,
exógenas, de causa).
 Obs.: o conjunto das variáveis explicativas
mais o termo constante (coeficiente linear
ou intercepto) são denominados regressores.
RELAÇÕES ou EQUAÇÕES

 Descrevem o mecanismo que aciona os


elementos singulares de um fenômeno
econômico.
PARÂMETROS ou
COEFICIENTES
 São magnitudes que permanecem
constantes no âmbito de um fenômeno
concreto.
TERMO ALEATÓRIO
 É a expressão de um grande número de
pequenas causas, que produzem um
desvio em relação ao que a variável
dependente deveria ser, se a relação fosse
determinística; indicando: variáveis
omitidas; imprevisibilidade do
comportamento humano; variação do
comportamento entre indivíduos; erros
de medidas da variável dependente e
especificação imperfeita das relações.
REQUISITOS PARA A
ESPECIFICAÇÃO DE MODELOS
 Delimitação do fenômeno;
 identificação das variáveis;
 estabelecimento das relações;
 definição da finalidade do modelo.
Observação: é a etapa do trabalho econométrico que envolve:
a) determinação das variáveis dependente e explicativa(s); b)
expectativa a priori dos sinais e da magnitude dos parâmetros;
e c) a forma funcional (linear ou não linear).
Análise de regressão
utilizando-se do
- “Statgraphics” -

Statistical Graphics System


Version 6.0
MODELO LINEAR
SIMPLES
APLICAÇÃO PRÁTICA
Despesas com propaganda, Vendas, unidades (Y)
R$ mil (X) Obs: variável dependente,
Obs.: variável independente, explicada ou aleatória.
explicativa ou de controle.

1.5 120
5.5 190
10 240
3 140
7.5 180
5 150
13 280
4 110
9 210
12.5 220
15 310
Probabilidade de
acerto quanto à
conclusão que se
vá chegar.
Apresentação do resultado da regressão
Coeficiente
Coeficiente
angular
linear
Coeficiente de
determinação
^ 2
Y = 88,4131 + 13,6914 X ; R = 89,33%
(6,30293) (8,68032) “t” calculado

[14,0273] [1,57729]
Erros-padrão dos estimadores
0 - nula
entre 0 e 0,3 - fraca
2
entre 0,3 a 0,6 - média
É a raiz quadrada de R
entre 0,6 a 0,9 - forte
entre 0,9 a 0,99 - fortíssima
1 - perfeita
CÁLCULO DA ELASTICIDADE-PROPAGANDA

d(Y) X(médio)
Ep = -------- . ---------
d (X) Y(médio)
Desse modo, a partir da equação estimada e dos valores médios de Y
e X, calcula-se a elasticidade-propaganda, qual seja:

7,8182
Ep = 13,6914 . ---------- = 0,5477
195,4545
O que significa uma Ep de 0,5477?

Trata-se de uma oferta (vendas) inelástica,


pois |Ep|< 1. Isso significa que, para cada 1%
de aumento (ou diminuição) nas despesas com
propaganda, a quantidade vendida sofrerá um
aumento (ou redução) da ordem de 0,5477%,
mantidos constantes os demais fatores.
Teste “ t ” de Student
(para existência de regressão)
Tem por finalidade testar a
significância do(s) parâmetro(s)
estimado(s) do modelo, o que
equivale ao teste do efeito
individual da(s) variável(eis)
explicativa(s) e do termo
constante. A variável “ t ” é
definida para cada um dos
parâmetros estimados.
TESTE “t” (bilateral)
Deve-se colocar à prova as seguintes hipóteses:
Com deter-
minado ris-
Ho (probanda): b = zero co (nível de
significân-
Teste bilateral cia), não há
Ha (alternativa): b = zero regressão.

Em saindo a região crítica (“t” calculado maior, em mó-


dulo, que o “t” tabelado), rejeita-se Ho, e se conclui que
há regressão, para “n -k -1” graus de liberdade, sendo “k”
o número de variáveis explicativas.
E a probabilidade de acerto quanto à
conclusão que se tenha chegado?

É extraída pelo nível de significância (probabilidade de vir a


cometer-se erro do tipo I, ou seja, rejeitar erroneamente uma
Ho verdadeira), que representa o risco. A diferença “1 - nível
de significância” nos dá a probabilidade de acerto quanto
à conclusão que se tenha chegado.

Obs.: segundo Jan Kmenta, em Econometria, o critério de fixar o nível


de significância a 1% ou a 5% deve ser recomendado.
Uso da distribuição “t”

Nível de significância de 5%;escolhendo-se a variável “t” com 9 graus


de liberdade (n = 11). Tomando-se o “t calculado” = 8,68032, tem-se:

Ver região crítica (aceitação de Há) e a região de aceitação de Ho na


p. 101 do livro Estatística Aplicada, bem como tabela da p. 265.

| 8,68032 | > 2,2622, rejeita-se Ho, concluindo-se


com um risco de 5% que há regressão.
Teste “t” (bilateral)

Região Região
crítica crítica
Região de
aceitação
2,5 % RA 2,5 %

-2,2622 2,2622
Teste “t” unilateral
É utilizado quando a hipótese alternativa (Há) prevê a existência de
efeito positivo ou negativo (de acordo com a teoria sob exame). Em
sendo o teste unilateral, a única diferença é que ao detectar o “t-tabela-
do” na Distribuição “t” de Student, deve-se obtê-lo na coluna do dobro
do nível de significância previamente explicitado; ou seja, considerando
o coeficiente angular obtido (+ 13,6914), poder-se-ia ter as seguintes hi-
póteses (de acordo com a teoria em prova):

Ho (probanda): b = zero
Teste unilateral
(ao dobro de “”)
Ha (alternativa): b > zero
Em saindo a região crítica (“t” calculado maior do que o “t” tabelado), rejeita-se Ho, e
se conclui que há regressão, para “n -k -1” graus de liberdade, sendo “k” o número de
variáveis explicativas do modelo formulado.
Teste “t” (unilateral)

Região de Região
aceitação de crítica
Ho

RA

1,8331
Teste “ F ”
Mede o grau de viabilidade do
conjunto das variáveis do
modelo, isto é, testa a
hipótese de que a(s)
variável(eis) explicativa(s)
exerce(m) “conjuntamente”
efeito significativo sobre a
variável dependente Y.
Quadro de análise de variância
(QAV)
A forma de realizarmos o teste da existência de
regressão é a utilização da análise das variâncias, ou
seja, estudar o comportamento das variações totais,
explicadas e residuais. Este teste é compactado no
chamado Quadro de Análise da Variância (QAV).
Teste “F”
O chamado teste “F”, em que se compara um valor calculado com a
tabela de distribuição “F”, sendo o “F” da tabela identificado a par-
tir do número de graus de liberdade da variação explicada pela regres-
são e da variação não explicada; isto é, para o teste da hipótese nula (ou
da não existência de regressão). O “F” calculado é obtido a partir da re-
lação entre a variação explicada dividida por “k” graus de liberdade
(sendo “k” o número de variáveis explicativas do modelo), e a variação
não explicada dividida por “n -k -1” (sendo “n” o número de observações
da série). O “F” calculado então é comparado com o “F” da tabela (esta
para um determinado nível de significância) ou “F” crítico, obedecendo-
se à seguinte regra de decisão:
a)“F” calc. > ou = ao “F” crítico  rejeitar Ho (há regressão);

b)“F” calc. < do que o “F” crítico  aceitar Ho (sem regressão)


Q . A . V.
n-2
(*) (**)
(var. explicada)
(var. residual)
G.L
(var. total)

(*) - soma de quadrados; n-1


(**) - quadrados médios.
Região
Região de crítica
aceitação de Ho

RA 5%

5,12 F (1,9)
5%
Teste “t” ou teste “F”?
Uma das desvantagens do teste “F” é que num caso de regressão
múltipla (com 2 ou mais variáveis), a conclusão reflete um teste
conjunto, embora seja possível que uma ou mais das variáveis
independentes introduzidas no modelo não seja significativa, isto é,
não possua, de fato, regressão com a variável dependente, o que
significa que a manutenção da variável não contribui para melhorar
o grau de explicação da regressão. O chamado teste “t” (de Student),
costuma, portanto, ser mais usado para teste da hipótese nula,
já que permite o teste separado de cada parâmetro.
REGRESSÕES QUE SE
TORNAM LINEARES
POR TRANSFORMAÇÃO
FUNÇÃO POTÊNCIA
(ou CURVA GEOMÉTRICA; ou
LOGARÍTMICA; ou
POTENCIAL;
ou “MULTIPLICATIVE”)
Forma original:
b
Y=a.X
FORMA LINEARIZADA POR
TRANSFORMAÇÃO

Ln Y = Ln a + b Ln X

Com as seguintes
Y>0
restrições e
X>0
FUNÇÃO EXPONENCIAL
(ou “EXPONENTIAL”)

Forma original:
bX
Y=a.e
FORMA LINEARIZADA POR TRANSFORMAÇÃO

Ln Y = Ln a + b X
FUNÇÃO HIPÉRBOLE
(ou HIPERBÓLICA; ou
RECÍPROCA II; ou
“RECIPROCAL”)
Forma original:

Y = 1 / (a + b X)
FORMA LINEARIZADA POR
TRANSFORMAÇÃO

1/Y = a + b X

Y0
Com a seguinte
restrição
REGRESSÃO LINEAR
MÚLTIPLA
APLICAÇÃO PRÁTICA
Vendas Gastos Gastos com
com TV jornal
(Y) (X) (Z)

6 3 1
7 4 2
15 8 3
18 8 5
20 10 8
23 11 6
Q.A.V.
G.L.
(*) k (**)
(var. explicada)
(var. residual)
(var. total) n-k-1

d
(*) - soma de quadrados;
(**) - quadrados médios.
Teste “F”
(para a existência de regressão)

Região de Região
aceitação de crítica
Ho

RA

F (2,3)
9,55
5%
AUTOCORRELAÇÃO SERIAL

É um problema caracterizado pela dependência temporal dos valores


sucessivos dos resíduos, ou seja, os resíduos são correlacionados en-
tre si. Quando os resíduos são autocorrelacionados, as estimativas de
mínimos quadrados ordinários dos parâmetros não são eficientes, isto
é, não apresentam variância mínima, além de seu erro-padrão ser vie-
sado, o que conduz a testes e intervalos de confiança incorretos.
Se a autocorrelação for positiva, os erros-padrões serão subestimados
e, conseqüentemente, os valores da estatística t superestimados. Se
a autocorrelação for, ao contrário, negativa, os erros-padrões serão
superestimados e o valor de t, subestimado. Portanto, a autocorrela-
ção positiva é a mais danosa, porque existirá, no caso do teste t, o ris-
co de rejeitar-se a hipótese probanda (Ho) de ausência de efeito, quan-
do se deveria aceitá-la.
TESTE DE DURBIN-WATSON

Utilizado para verificar o pressuposto básico do modelo de


regressão linear de não haver autocorrelação entre os resíduos.
A hipótese a ser testada (Ho) é a de ausência de autocorrelação
dos resíduos; portanto, para que o modelo satisfaça este pres-
suposto, deve aceitar a hipótese “Ho”(ausência de autocorrelação).
DURBIN e WATSON definiram dois números (“dI” e “du”) que
delimitam regiões críticas do teste ao longo de uma reta que en-
globa valores críticos de 0,2 e 4, conforme o nível de significân-
cia (), o número de observações (n) e o número de variáveis in-
dependentes (k). O valor de “d” varia de 0 a 4 , indicando nenhu-
ma correlação quando está na vizinhança de 2 (região III), auto-
correlação positiva quando abaixo de “dI” e autocorrelação nega-
tiva quando acima de “4 - dI”.
Como fazer o teste?
O valor calculado da estatística para teste de Durbin-Watson (d) é
comparado com os limites inferior (dI) e superior (du) de valores
tabelados por Durbin e Watson (tabela de valores críticos da estatís-
tica de Durbin-Watson).

Rejeita-se Ho e
a hipótese
Autocorrelação
alternativa
III
II Aceita-se “Ho” IV
Não Ausência de Não
I Conclusivo Autocorrelação Conclusivo V
0 dI du 2 4 - du 4 - dI 4
E na tabela dos pontos de
significância de J. Durbin e G.
S. Watson?

 Como d = 3,07101 ; para um nível de


significância de 5% , é só obter os valores
de “dI” e “du”, dados k e n. Fácil; não?
REFLEXÃO

“Quando os homens fracassam, o que lhes


faltou não foi inteligência: foi paixão”
(Struther Burt).

REFERÊNCIAS
BIBLIOGRÁFICAS (para o aluno de graduação, em curso noturno)
MATOS, Orlando Carneiro de. Econometria básica - teoria e aplicações.
São Paulo, Atlas, 1997; e
FONSECA, Jairo Simon da, et al. Estatística aplicada.São Paulo,
Atlas, 1989.
UFA;
ACABOU!!!
OBRIGADO
PELA
PACIÊNCIA.