Академический Документы
Профессиональный Документы
Культура Документы
Passamos ento para o modelo de regresso linear mltipla (MRLM): [Funo Regresso da Populao] Naturalmente, o valor observado da varivel dependente para a i-sima observao; o termo
Xji o valor observado da varivel explicativa Xj para a i-sima observao; e ui o termo de perturbao aleatrio para a i-sima observao. Finalmente, independente e o coeficiente de regresso associado varivel explicativa Xj.
Esta a forma analtica de apresentarmos a funo regresso da populao (FRP). No entanto, poderemos represent-la de uma forma mais compacta recorrendo notao matricial1.
Notar que esta formulao matricial representa o caso geral quando temos o MRLM com termo independente. Tal como no caso do MRLC, a estimao do vector por OLS parte da condio de , temos
que a soma dos quadrados dos resduos ei2 dada pela seguinte notao matricial:
Assim, para minimizar ei2, obtemos a seguinte frmula2 para os estimadores de OLS:
A soma dos quadrados totais (SQT), Yi2, dada pela seguinte matriz:
Notar ainda que para se poder obter estimativas para os coeficientes de regresso necessrio que se verifique [H5] no mbito do MRLM isto significa que a caracterstica da matriz das variveis explicativas seja inferior s n observaes da amostra. Ou seja:
Alm de [H5] ter que se verificar, para se poder estimar os coeficientes de regresso do modelo exige-se ainda que no se verifique qualquer tipo de combinao linear entre variveis explicativas. Perante a existncia de co-linearidade entre colunas da matriz X
dos seguintes modelos no E-Views (com os dados do ficheiro Andy): Modelo 1: Y c X XX Modelo 4: Y c X P X+P x Modelo 2: Y c X P XP Modelo 5: Y c X P X+P x Modelo 3: Y c X ln(X)
CASOS PARTICULARES Depois de termos introduzido o MRLM de uma forma genrica, o prximo passo debruarmo-nos sobre 4 casos particulares. 1) [MRLM sem termo independente]
Neste caso a matriz X no ter a primeira coluna, porque este modelo no tem termo independente:
Nesta situao, onde no existe termo independente, sabemos que ei2 0, pelo que SQT SQE + SQR 2) R2 [0,1].
[MRLS]
Este o caso particular em que a varivel dependente explicada apenas por uma varivel, pelo que a matriz X apresenta apenas 2 colunas (uma delas para o termo independente e a outra para a varivel Xi.
3)
4)
Tal como no 2 caso, no existindo termo independente, sabemos que ei2 0, pelo que SQT SQE + SQR R2 [0,1].
Aps a apresentao destes 4 casos particulares, o prximo passo ser focar medidas como a estimativa da varincia dos termos de perturbao e a estimativa da varincia dos coeficientes de regresso, e ainda o coeficiente de determinao R2.
[NOTA: as covarincias entre os termos de perturbao podem ser facilmente encontradas atravs do E-Views: estimation output/covariance matrix.]
SQE =
TESTES DE HIPTESES CONJUNTAS SOBRE OS COEFICIENTES: TESTE F No mbito do MRLS, fazamos testes para apenas um coeficiente de regresso. Agora, no MRLM, os testes de hipteses podero envolver mais do que um coeficiente de regresso, e podem envolver mais do que uma restrio. 1. Teste de significncia global da regresso3 (TSG) Modelo: H0: H1: (a regresso no globalmente significativa) (a regresso globalmente significativa)
2. Teste de melhoria do ajustamento pela introduo de uma ou mais variveis explicativas adicionais (TMA) Por exemplo, TMA pela introduo das variveis explicativas X3 e X4: H0: H1: (no existe melhoria do ajustamento)
M=2
No caso de, por exemplo, um TMA pela introduo de X3: H0: H1: (no existe melhoria do ajustamento)
M=1
3. Teste sobre combinaes lineares de coeficientes de regresso Modelo: de regresso igual unidade. H0:
M=1
H1:
3
Devemos agora perceber que o teste F um teste de hipteses que envolve a estimao de 2 modelos: o modelo restrito e o modelo no restrito. A estatstica de F dada pela seguinte expresso4:
O valor de F crtico calculado no E-Views pela introduo do comando: QFDIST (1-, m, n ku).
Regra de deciso:
No mbito dos testes F torna-se importante saber escrever a expresso tanto do modelo restrito (R), como do modelo no restrito (U). Para efeitos de exemplificao, utilizamos os 3 testes anteriormente apresentados. No caso do teste 1, temos:
Quando os modelos R e U tm a mesma varivel dependente, podemos utilizar uma frmula alternativa para determinar a estatstica de F:
Resoluo do Exerccio 4 (1) Estimao dos modelos no E-Views; (2) Testar a significncia global (TSG) no modelo
No E-Views, para obter automaticamente a estatstica de F: aceder ao modelo no restrito/view/coeficient diagnostics/wald test/c(2)=0, c(3)=0, c(4)=0.
No caso do TSG, e s neste caso, temos no E-Views o valor da estatstica de F em F-Statistic e o valor do p-value em Prob (FStatistic).
Podemos concluir, com um nvel de significncia de 5%, e com base na informao estatstica disponvel, pela significncia global da regresso. Assim, conclui-se que as variveis explicativas conjuntamente se relacionam linearmente, de forma estatisticamente significativa com a varivel dependente.
Sob H0,
Como Fc = 3,972 < 46,9279 ento rejeitamos H0 para um nvel de significncia de 5%.
R:
Sob
Como Pode-se concluir, para um nvel de significncia de 5%, e com base na informao estatstica disponvel, pela significncia da melhoria do ajustamento pela introduo das variveis explicativas Ai e Ai2, ou seja, pode concluir-se que o ajustamento 3 melhor que o ajustamento 1.
U: R:
Sob
Como Fc = 7 (ou P-value = 0), para um nvel de significncia de 5% e perante a informao estatstica disponvel, podemos concluir que
5
4=
1).
(7) Testar:
U: R: Fobs = 40,93799 P-value = 0 < 5%, logo rejeita-se para um nvel de significncia de 5%. .
no modelo 2.
(9) Interpretao das estimativas do modelo 4 =109,7190 o valor estimado de Si quando as restantes variveis explicativas so nulas. = - 7,64. Estima-se que um aumento dos preos em 1USD, numa determinada
cidade, induz uma diminuio das vendas em 7,64 milhares de USD, ceteris paribus.
P-value F = P-value t.
Ento, temos que os interpretar no seu conjunto. . Estima-se que uma variao na publicidade em 1 milhar de USD induz uma variao estimada nas vendas de milhares de
Quando a varivel dummy assume o valor 0 designado por categoria base. Havendo mais do que uma varivel dummy, a categoria base aquela em que todos os Di = 0. Iremos analisar as variveis dummy atravs do exemplo dos salrios em funo do gnero (carregar os dados salrios). Iremos acompanhar o exemplo dos salrios recorrendo ao exerccio 5. Modelo: Onde ,
assume o valor 1 se esse trabalhador for do sexo masculino e assume o valor 0 se esse trabalhador for do sexo feminino. Nesse caso, para interpretarmos os parmetros da regresso no podemos recorrer s derivadas, porque a varivel dummy uma varivel discreta. Recorremos ento aos valores esperados:
corresponde ao salrio mdio mensal de uma mulher, em - corresponde ao salrio mdio mensal de um homem,
mdios, em EUR, de um homem e de uma mulher. Face ao exposto, frequente calcular-se um teste para verificar se existe discriminao salarial quanto ao gnero. Ento para testar se existe discriminao:
Naturalmente, se se
Sabendo que a varivel dummy assume apenas o valor 1 ou o valor 0, como podemos representar graficamente este problema? Assumindo
D1
Podemos facilmente constatar que e que tambm definir a varivel dummy do seguinte modo:
Vamos agora estimar o modelo acima exposto, com os dados salrios: = 337,2543 Estima-se que o salrio mdio mensal das mulheres de 337,2543. = 337,2543 + 213,46 = 550,7143 Estima-se que o salrio mdio mensal dos homens seja de 550,7143. = 213,46 Estima-se que a diferena entre o salrio mdio mensal de um homem e de uma mulher seja de 213,46. Testar a hiptese de existir discriminao salarial com base no gnero. Como a questo no diz a favor de quem a discriminao, fazemos um TSI:
Como p-value = 0 < 5%, ento (para um nvel de significncia de 5%) face informao estatstica disponvel conclui-se pela existncia de discriminao salarial com base no gnero. Vamos prosseguir a nossa anlise de variveis dummy introduzindo 2 novos modelos a este exerccio: (A2)
= 1,
Nas estatsticas descritivas de Y vamos a Sample e colocamos como condio D=1 para considerar apenas os homens.
Questo: ser que podemos estimar um modelo que considere estas duas variveis dummy em simultneo? (Ex: seco anterior: inversa , i.e., ). Como j foi dito na . Vimos tambm que para esta frmula dos . Neste caso, temos k=3 e n=2, logo existe indefinida. Assim, a regra seguinte fundamental:
estimadores de OLS ser vlida, era condio obrigatria verificar-se que existia a matriz combinao linear e a matriz
Se tivermos 2 atributos (ex: masculino ou feminino), s podemos utilizar no modelo uma varivel dummy ou, se usarmos 2 variveis dummys temos que construir o modelo sem termo independente.
Por conseguinte, muito importante perceber que apesar do modelo A3 no ter termo independente, possvel calcularmos e interpretarmos o coeficiente de determinao R2 (apesar de na matria para o primeiro teste termos dito que este coeficiente de determinao apenas fazia sentido interpretar em modelos com termo independente). Com efeito, neste caso: ei
1
Sem estimar os novos modelos no E-Views, obter as estimativas do modelo A2 e A3: Sabemos que = 1,
Ento, substituindo esta expresso no modelo A1, temos: , Se compararmos esta expresso com A2 retiramos que: as estimativas para o modelo A2. Quanto ao modelo A3, podemos chegar s estimativas dos seus parmetros atravs do clculo dos valores esperados: e assim obtemos
Os modelos com variveis dummy em que apenas contemplam uma varivel explicativa so designados de modelos de anlise da varincia. Os modelos com variveis dummy e que contemplem mais do que uma varivel explicativa so designados de modelos de anlise de covarincia. At agora apresentamos o tipo de modelo com variveis dummy mais simples, sem qualquer varivel explicativa. Iremos, de seguida, abordar casos particulares de modelos com variveis dummy, constatando que existe um conjunto de modelos possveis de serem construdos.
CASOS PARTICULARES 1. MRLM com uma varivel explicativa quantitativa e uma varivel dummy na forma aditiva.
Que tipo de interpretaes podemos fazer deste modelo? Sob a hiptese clssica [H1]: E(ui) = 0:
da mulher com o mesmo nmero de anos de experincia, i.e., mantendo tudo o mais constante (neste caso, mantendo X constante). Ento, graficamente:
Y
Temos, portanto, 2 rectas com o mesmo declive mas com diferentes ordenadas na origem. Este modelo pressupe que a eventual discriminao salarial se mantm constante com o nmero de anos de experincia profissional, na medida em que no grfico anterior a distncia entre a recta azul (salrio mdio mensal estimado dos homens) e a recta vermelha (salrio mdio mensal estimado das mulheres) sempre constante e dada por Estimar o modelo: .
Interpretao das estimativas: - Estima-se que o salrio mdio de um trabalhador do sexo feminino sem experincia profissional seja de Estima-se que o salrio mdio mensal de um trabalhador do sexo masculino sem experincia profissional seja de - Estima-se que, para o mesmo nmero de anos de experincia profissional (mantendo X constante), a diferena entre o salrio mdio mensal de um homem e de uma mulher seja de 229,3482.
- Para trabalhadores do mesmo sexo (mantendo Di constante), estima-se que o salrio mdio mensal aumente em 12,837 por cada ano adicional de experincia profissional.
2. MRLM com uma varivel explicativa quantitativa e uma varivel dummy na forma multiplicativa
Ora, que tipo de interpretao poder agora fazer-se a este modelo? Sob [H1]: E(ui) = 0:
Como poderemos reparar graficamente, o diferencial entre o salrio dos homens e dasmulheres depende, neste modelo, do nmero de anos de experincia.
Y
Neste modelo em particular, temos rectas com a mesma ordenada na origem mas com diferentes declives. Admitindo que , este modelo postula que a diferena entre os salrios mdios dos trabalhadores do sexo masculino e do sexo feminino tende a agravar-se (favoravelmente para os do sexo masculino) com o nmero de anos de experincia. O modelo diz tambm que no h discriminao salarial pelo gnero para indivduos sem experincia profissional.
Estimao do modelo:
Interpretao das estimativas: : Estima-se que o salrio mdio mensal de um trabalhador (homem ou mulher), sem experincia profissional, seja de aproximadamente 335,485 . Como interpretar as estimativas dos betas? O efeito de X sobre Y vai agora depender do caso em que se trata de uma mulher ou de um homem:
: Caso das mulheres
A interpretao a dar a estas estimativas , ento, a seguinte: a influncia de um ano adicional de experincia no salrio do trabalhador , neste modelo, diferente consoante o gnero do trabalhador. Assim, no caso de uma mulher, estima-se que o salrio mensal aumente aproximadamente 2 com mais um ano de experincia. No caso de um homem, estima-se que esse ano adicional de experincia trar 2,189 + 17,4 de salrio adicional. Relativamente diferena salarial: : estima-se que entre 2 trabalhadores de sexo diferente, se tiverem um ano de experincia, o salrio mdio mensal do homem seria superior ao de uma mulher em 17,40782; mas se tivessem 3 anos de experincia (ambos), ento essa diferena seria multiplicada por um factor 3 (ou seja, a diferena salarial acentua-se quanto maior forem os anos de experincia em causa, tal como facilmente concluimos na anlise grfica anterior). Testar a existncia de discriminao salarial a favor dos homens:
Sob H0,
Como a estatstica de t pertence regio crtica, rejeita-se a hiptese nula para Conclui-se, portanto, que para um nivel de significncia de 5%, e face informao estatstica disponvel, existe discriminao salarial a favor dos trabalhadores do sexo masculino.
3. MRLM com uma varivel explicativa quantitativa e uma varivel dummy na forma aditiva e na forma multiplicativa8:
Aqui devemos ter em ateno que no se tivssemos mais uma varivel explicativa, por exemplo Z i, deveramos formular o modelo do seguinte modo:
Como podemos comprovar pela representao grfica anterior, este modelo corresponde situao em que a estimao das duas rectas no obedece a qualquer tipo de restrio quanto igualdade dos declives ou das ordenadas na origem , portanto, o modelo mais flexvel. Como formular o teste da existncia de discriminao salarial quanto ao gnero: Trata-se de um TMA pela introduo de e
Estima-se que, para trabalhadores sem experincia profissional ( ), e de gnero diferente, os do sexo feminino tm um salrio mdio mensal de 235, enquanto os do sexo masculino de 403. Estima-se que a diferena entre o salrio mdio mensal entre o sexo masculino e o sexo feminino (ambos sem experincia profissional, i.e., , seja de aproximadamente 168. No que respeita interpretao a dar aos betas, i.e., ao efeito de X sobre Y, tal como no modelo anterior, ir depender da situao em que se trate de mulher ou de homem: (no caso de mulher: no caso de homem: )
Assim, estima-se que por cada ano adicional de experincia profissional, o salrio mdio mensal aumenta aproximadamente 9; se for um homem esse aumento ser de aproximadamente 15. a diferena estimada entre o acrscimo do salrio mensal (de um homem e de uma mulher com o mesmo nmero de anos de experincia), por cada ano adicional de experincia. Imaginemos agora que temos o objectivo de estimar este modelo separadamente, ou seja, estimar o modelo apenas com observaes de elementos do sexo feminino e estimar outro modelo apenas com observaes de elementos do sexo masculino. No primeiro caso, fazemos quick/estimate equation/y c x; if Di = 0. No segundo caso fazemos quick/estimate equation/y c x; if Di = 1. Uma nota adicional para referir que,
nesta situao, como temos amostras diferentes, SQT, SQR e R2 so diferentes. De facto, SQR = SQRF + SQRM . Testar a existncia de discriminao salarial:
U: R: Sob H0,
Como
Exemplo Prtico da aula Vamos supor que pretendamos explicar os salrios em funo da regio geogrfica. Poderamos, para tal, criar as seguintes variveis dummy:
Podemos agora construir um modelo que contemple 2 destas variveis explicativas, ou ento com estas 3 variveis mas sem termo independente. Optando pela primeira opo, temos o seguinte modelo:
(categoria base)
Se fizermos Sul Norte = (diferena salarial da regio sul face regio norte). E, da mesma forma, fazendo Centro Norte = (diferena salarial da regio centro face regio do norte). Algumas relaes que podemos retirar deste modelo:
Ora, como dissemos anteriormente, uma outra opo para explicar os salrios em funo das 3 regies geogrficas seria incorporar no ajustamento as 3 variveis dummy, mas sem termo independente:
Neste caso, apesar de no termos termo independente, podemos calcular e interpretar com significado o coeficiente de determinao R2, j que = 0. Por outro lado, tambm se verificar que a equao da regresso da amostra passa pelo ponto mdio de cada varivel explicativa:
Resoluo do Exerccio 6 (1) Algumas estatsticas descritivas: : em 12 semanas apenas se verificou cupo, de entre um total de 124 semanas. : em 33 das 124 semanas apenas se verificou exposio privilegiada. : em 7 das 124 semanas verificou-se, simultaneamente, cupo e exposio privilegiada. : 72 o nmero de semanas em que no se verificou nenhum dos fenmenos anteriores ( a categoria base).
(2) Estimar os modelos: Modelo A: quick/estimate equation/S c P C Modelo B: quick/estimate equation/S c P C D DC Exemplo da representao matricial para o modelo A:
Como
, rejeita-se
para
Ento, para um nvel de significncia de 5%, e face informao estatstica disponvel, conclui-se pela significncia global da regresso, i.e., que as variveis explicativas conjuntamente se relacionam de forma linear e de forma estatisticamente significativa com a varivel dependente. No modelo B:
Sob H0,
Como o p-value = 0,9554 > 5%, ento rejeita-se a hiptese nula para . Isto , para este nvel de significncia, e com base na informao estatstica disponvel, conclui-se que a varivel preo no estatisticamente significativa.
(5) a) Para se testar a hiptese de o acrscimo nas vendas numa semana em que h simultaneamente exposio privilegiada e oferta de um cupo ser igual ao que ocorre se houver apenas exposio privilegiada, teremos que recorrer ao modelo B, pois o que tem em considerao a varivel DCt:
U:
Podemos concluir, com um nvel de significncia de 5%, e com base na informao estatstica disponvel, que o acrscimo nas vendas de uma semana quando h exposio privilegiada e oferta de cupo em simultneo, diferente de uma semana em que apenas existe exposio privilegiada. b) Para se testar a hiptese de o acrscimo nas vendas numa semana em que h simultaneamente exposio privilegiada e oferta de um cupo ser igual ao que ocorre se houver apenas oferta de cupo, seguimos a metodologia da questo anterior, obtendo agora o seguinte teste:
Podemos assim concluir, com um nvel de significncia de 5%, e com base na informao estatstica disponvel, que o acrscimo nas vendas de uma semana quando h exposio privilegiada e oferta de cupo em simultneo, diferente de uma semana em que apenas existe oferta de cupo.
(6) Ser que o ajustamento B prefervel ao ajustamento A? Claramente, esta questo conduz-nos a um teste de melhoria de ajustamento pela introduo das variveis e .
Para um nivel de significncia de 1%, e face informao estatstica disponivel, o ajustamento B prefervel ao ajustamento A.
Nesta seco levantam-se essencialmente 4 grandes questes: - Ser possvel verificar (testar) se estas hipteses so vlidas? - Que factores podem dar origem violao destas hipteses? - Quais as consequncias de estimarmos modelos com o mtodo OLS quando estas hipteses no se verificam? - Como proceder quando as hipteses clssicas falham?
1. HIPTESE [H0]: O MODELO EST CORRECTAMENTE ESPECIFICADO Sempre que no se verifica a hiptese [H0], diz-se que estamos perante erros de
especificao. Esta hiptese clssica poder ser violada em 5 casos distintos: i) Omisso de variveis explicativas relevantes; ii) Incluso de variveis explicativas irrelevantes; iii) A forma funcional incorrecta; iv) Os parmetros do modelo (coeficientes de regresso) no so constantes.
31 MTODOS ECONOMTRICOS E DE PREVISO Quanto primeira situao omitem-se variveis explicativas relevantes podemos dar o seguinte exemplo. Suponhamos que o verdadeiro modelo (desconhecido) contempla 5 variveis explicativas, mas o modelo que acabamos por estimar apenas considerada 4 dessas variveis (i.e., uma dessas variveis, apesar de relevante para explicar a varivel dependente, no foi considerada no ajustamento). Ora, quando esta situao acontece, os estimadores de OLS dos coeficientes das outras variveis explicativas sero: - No cntricos e no consistentes se a varivel omitida e as variveis includas no modelo forem correlacionadas; - Cntricos mas no consistentes se a varivel omitida e as variveis includas no modelo no forem correlacionadas. Em qualquer destas situaes, temos que o estimador de OLS do termo independente no cntrico. Tambm, em qualquer caso, a inferncia estatstica ser totalmente invlida com base nos dados que tivermos. Relativamente segunda situao incluso de variveis explicativas irrelevantes tem-se que os estimadores de OLS dos coeficientes associados s variveis explicativas se mantm a centricidade e a consistncia, mas no tm varincia mnima (excepto se a varivel irrelevante no tiver qualquer tipo de correlao com as demais variveis explicativas). Naturalmente, e tal como na situao anterior, a inferncia estatstica no vlida. Quanto terceira situao que pode gerar a violao da hiptese [H0] forma funcional incorrecta esta uma situao que ocorre quando assumimos, na construo do modelo, que a varivel dependente depende linearmente das variveis explicativas (quando, na verdade, a relao pode ser quadrtica, cbica, exponencial, etc). Notar que, ao usarmos uma forma funcional linear - quando ela na realidade quadrtica os estimadores de OLS sero enviesados e inconsistentes dos coeficientes de regresso e, no limite, podero retirar totalmente o sentido atribudo s interpretaes das estimativas obtidas. Finalmente, o 4 tipo de erro que origina a violao de [H0] assumir que os coeficientes de regresso so constantes para o perodo, quando efectivamente assim no . A consequncia desta situao exactamente igual anterior, a assuno de forma funcional incorrecta. No seguimento do que foi esclarecido, iremos agora apresentar 2 testes que permitiro verificar a ocorrncia do tipo de erro iii) e do tipo de erro iv).
2. Estimar uma regresso auxiliar cuja varivel dependente exactamente a mesma do modelo original, , sem termo independente, as mesmas variveis explicativas do modelo original, e
32 MTODOS ECONOMTRICOS E DE PREVISO ainda um conjunto de P-1 novas variveis explicativas que correspondem a potncia de ordem 2 a P dos valores estimados de Y obtidos no passo 1:
3. Procedemos ao teste de melhoria do ajustamento pela introduo das novas P-1 variveis explicativas: (a forma funcional linear adequada; modelo correctamente especificado) (a forma funcional inadequada; modelo incorrectamente especificado) 4. Se o valor observado da estatstica de teste exceder o valor crtico, rejeita-se a hiptese nula (ou se o p-value for inferior ao nvel de significncia adoptado). Entretanto, devemos saber que o E-Views executa automaticamente o teste RESET. No modelo original/view/stability tests/Ramsey Reset test/ordem mxima da potncia das variveis explicativas includas na regresso auxiliar 1 por defeito. Aps executar o comando, o EViews exibe o resultado da estimao do modelo auxiliar e o valor do p-value para o teste RESET Prob. F(m, T-K).
Estimamos este modelo e vamos a information output/proc/make residual series guardamos como e. Depois, e sabendo que , criamos a varivel Sest = S e.
Aplicao do teste RESET no exerccio 4 modelo B. Assumimos P=2. Modelo original: Estimamos este modelo e guardamos a srie de resduos a ele associada como e. Em seguida, e sabendo que , criamos a varivel: Sest = S e. Estimamos a regresso auxiliar
p-value: 0,386 > Para um nvel de significncia de 5%, e com base na informao estatstica disponvel, conclui-se que o modelo est correctamente especificado a forma funcional do modelo original a adequada. No E-Views: modelo original/view/stability diagnostics/ramsey reset test/P-1=1.
A operacionalizao do teste CHOW a seguinte: 1. Dividir a amostra em 2 sub-amostras de acordo com informao prvia quanto a factos extraordinrios que possam provocar as diferenas nos coeficientes de regresso (sries temporais) ou caractersticas particulares de um sub-grupo de indivduos (dados seccionais)10. 2. Estimar 3 modelos com as mesmas variveis: - O primeiro e o segundo devem ser estimados cada um com as sub-amostras respectivas; - O terceiro modelo estimado com a amostra completa E apura-se, para os 3 modelos, a soma dos quadrados dos resduos. 3. O teste formulado da seguinte forma: (existe permanncia de estrutura dos coeficientes de regresso) (no existe permanncia de estrutura dos coeficientes de regresso) Onde:
Seguindo o procedimento habitual, quando a estatstica do teste CHOW for superior ao FC, rejeita-se a hiptese nula para o nvel de significncia adoptado.
10
No caso de sries temporais a representao grfica das sries pode sugerir o ponto adequado de parties da amostra.
Aplicao do teste CHOW ao ficheiro salrios Utilizamos o MRLS para este caso. (existe permanncia de estrutura dos coeficientes de regresso) (no existe permanncia de estrutura dos coeficientes de regresso)
Como
, rejeita-se
para
Podemos ento concluir, com um nvel de significncia de 5%, e com base na informao estatstica disponvel, pela diferena do comportamento da varivel salrio para indivduos do sexo masculino relativamente a indivduos do sexo feminino, i.e., verifica-se alterao de estrutura dos coeficientes de regresso. E sendo assim, no deveramos ter estimado este modelo com as 90 observaes, j que estamos a violar a primeira hiptese clssica, nomeadamente o facto de os coeficientes de regresso terem que ser constantes para todos os elementos da amostra. Notar que poderemos tambm executar este teste CHOW automaticamente no E-Views: workfile/proc/sort current page/sort key:d1/ascending. Depois, se formos informao contida na varivel d1 percebemos que a quebra na amostra ocorre ao 41 elemento. Assim, vamos depois ao modelo estimado/view/stability diagnostics/chow breakpoint test/breakpoint date: 41. depois aberta 1 janela com a informao da estatstica do e ainda o valor do p-value.
Alternativa ao teste CHOW O teste GUJARATI Tal como o teste anterior, o teste GUJARATI tem por base a diviso da amostra em duas sub-amostras. Neste caso, o teste executado atravs da utilizao de uma varivel dummy:
- Modelo no restrito:
(existe permanncia de estrutura dos coeficientes de regresso) (no existe permanncia de estrutura dos coeficientes de regresso) Claramente, este teste resume-se a um teste de melhoria de ajustamento (TMA) pela introduo das variveis . A vantagem deste teste GUJARATI que, detectando que no existe permanncia de estrutura dos coeficientes de regresso, possvel detectar (testar) onde que a alterao da estrutura ocorreu. [Utilizar o exemplo dos salrios e verificar que o Fobs exactamente igual ao .]
2. HIPTESE [H1]: E(u) = 0 As consequncias da violao de [H1] variam consoante o valor esperado do termo de perturbao diferente de zero e varivel na amostra ou se diferente de zero mas constante para as vrias observaes. Neste sentido, no caso do modelo com termo independente: - Se , ento as propriedades dos estimadores dos coeficientes associados s variveis explicativas do modelo mantm-se, mas no as do estimador do termo independente. Ou seja, todos os estimadores continuam a ser estimadores cntricos e consistentes, excepo de , que ser um estimador enviesado e inconsistente; - Se , ento os estimadores de todos os coeficientes de regresso sero enviesados e inconsistentes.
3. HIPTESE [H2]: Como j estudamos anteriormente, o modelo clssico de regresso linear impe que as varincias dos termos de perturbao sejam iguais para todos os elementos observados a hiptese de homoscedasticidade. Quando esta hiptese violada estamos na presena de heteroscedasticidade, tendo ento . Devemos desde j notar que ser apenas a varincia dos termos de perturbao que ser alterada na matriz das varincias e covarincias, i.e., as covarincias entre termos de perturbao permanecero nulas, j que a hiptese [H3] continua a verificar-se. Temos ento que: Em Homoscedasticidade Em Heteroscedasticidade
Uma questo que se coloca a de saber quais as fontes de heteroscedasticidade. (1) Em primeiro lugar, a experincia emprica diz que mais frequente tal problema ocorrer em dados seccionais do que em dados temporais (embora tambm nestes possa ocorrer). Facilmente se apontaro exemplos de heteroscedasticidade em dados seccionais. Um caso tpico quando, por exemplo, se desenvolve um modelo que explique o consumo em funo de vrios niveis de rendimento. No caso de termos uma grande heterogeneidade de famlias possvel que isso cause heteroscedasticidade. De facto, a disperso em torno da mdia do consumo tende a ser maior quanto maior o nivel de rendimento, j que as famlias com baixos rendimentos tm menor flexibilidade no consumo, estando sujeitas de grosso modo a bens essenciais; j as famlias de rendimentos elevados tendero a apresentar maior flexibilidade na aplicao do rendimento no consumo. De forma semelhante, se pensarmos no exemplo dos salrios em funo do nmero de anos de experincia profissional, quanto maior for esse grau de formaao maior ser a variabilidade dos salrios e, portanto, estaremos tambm perante
heteroscedasticidade. Um outro exemplo que seja fonte de heteroscedasticidade a dimenso das empresas: quanto maior a dimenso da empresa, maior ser a variabilidade dos seus investimentos, por exemplo. (2) Uma segunda fonte de heteroscedasticidade a manipulao de dados. A utilizao de dados agrupados ou agregados tambm uma possvel fonte de heteroscedasticidade. Por exemplo, imaginemos que queremos estudar o comportamento das vendas em funo da despesa publicitria.:
Pretendiamos saber o comportamento para as 6 empresas. Contudo, o instituto de estatstica diz-nos que no nos pode fornecer, apenas nos dandos os dados agregados. Por exemplo: Sectores de Actividade Sector I: Sector II: Sector III: Nmero de empresas 1 2 3
Perante esta situao teriamos que recorrer a 1 modelo transformado tal como:
Quando assim pode-se comprovar que a varincia de cada termo de perturbao ser diferente:
E assim, com heteroscedasticidade, temos: Ou seja, se o nmero de empresas fosse igual para cada sector, ento j teramos homoscedasticidade.
Apontadas as vrias fontes de heteroscedasticidade, quais so as principais consequncias de fazermos 1 anlise com heteroscedasticidade? 1 Os estimadores dos coeficientes de regresso acabam por manter a centricidade e a consistncia; 2 Os estimadores dos coeficientes de regresso no apresentam varincia mnima na classe dos estimadores lineares e cntricos (i.e., no so BLUE o teorema de GaussMarkov j no se aplica); 3- A inferncia estatstica conduzida da forma habitual no vlida.
MTODOS DE DETECO DE HETEROSCEDASTICIDADE Os mtodos de deteco de heteroscedasticidade baseiam-se na anlise dos resduos de estimao por OLS. Notar antes de mais que oss resduos de estimao no so termos de perturbao (a heteroscedasticidade refere-se s varincias dos termos de perturbao, no dos resduos). Os resduos podem ser tomados como proxy dos termos de perturbao (principalmente em grandes amostras) porque os estimadores de OLS mantm a consistncia na presena de heteroscedasticidade. MTODOS INFORMAIS Os mtodos informais no so mais do que uma inspeco visual dos resduos de estimao por OLS.
Homoscedasticidade
Exemplos de Heteroscedasticidade:
MTODOS FORMAIS Existe Heteroscedasticidade? O Teste de White Modelo Exemplo: Passo 1: Estimar o modelo original por OLS e obter a srie de resduos estimados, . Passo 2: Estimar uma regresso auxiliar, em que a varivel explicada o quadrado dos resduos de estimao e inclui ( excepo de eventuais redundncias): i) Termo independente; ii) Todas as variveis explicativas do modelo original; iii) Os quadrados das variveis explicativas do modelo original; iv) Os produtos cruzados das variveis explicativas do modelo original. Assim, teremos para o nosso exemplo a seguinte regresso auxiliar:
Passo 3: Obter o coeficiente de determinao R2 da regresso auxiliar. Passo4: Proceder ao seguinte teste:
Obtemos a srie de resduos e gravamos com o nome resid. Depois estimamos a regresso auxiliar: estimate equation/resid^2 c price advert price^2 advert^2 price*advert Obtemos
Como ento no se pode dizer, para um nvel de significncia de 5%, e com base na amostra diponvel, conclui-se pela no existncia de heteroscedasticidade dos termos de perturbao do modelo original. Nota: O E-Views executa automaticamente o teste de White. Bastar para tal fazer: modelo original/view/residual diagnostics/heteroscedasticity tests/White. Podiamos aqui ver que prob. Chi-Square(5) = p-value.
Para construirmos a regresso auxiliar temos que saber que variveis explicativas vamos utilizar e tomar em considerao que algumas variveis so redundantes:
S vamos considerar as variveis assinaladas porque as restantes so redundantes. Obtemos em seguida a srie dos resduos e gravamos a srie.
Como heteroscedasticidade.
, ou seja concluimos
pela existncia de
MTODOS DE ESTIMAO SOB HETEROSCEDASTICIDADE Admite-se que no modelo em anlise o nico problema o da desigual varincia dos termos de perturbao, i.e., as restantes hipteses clssicas so verificadas. Temos ento:
, ou
A: Supondo que so conhecidas as varincias das perturbaes so conhecidas (i.e., a matriz conhecida) Hiptese pouco realista. Se a matriz conhecida, podemos estimar o modelo atravs de 2 mtodos diferentes (conduzem a resultados idnticos). 1. Mtodo de Mnimos Quadrados Generalizados (GLS) sobre o Modelo Original (MO) Este mtodo de estimao apropriado porque , logo trata-se de 1 estimador BLUE. No E-Views: quick/estimate equation/modelo original/options/type: variance/weight series: colocamos a parte varivel do padro de heterostecedasticidade. 2. Mtodo OLS sobre o Modelo Transformado (MT) A ideia desta soluo transformar o MO de forma a repor a hiptese de homoscedasticidade. Desta forma, os termos de perturbao do MT verificam todas as hipteses clssicas e a aplicao do mtodo OLS a esse MT permitir obter estimadores de com as propriedades habituais.
Ento, o que iremos agora provar que o termo de perturbao do MT, dado por , verifica as hipteses clssicas: o [H1]: o [H2]: o [H3]:
de notar que a transformao operada na passagem do MO para o MT no afecta qualquer outra hiptese clssica e repe a hiptese de homoscedasticidade. Assim, verificadas no MT as hipteses clssicas, pode naturalmente aplicar-se o mtodo OLS sobre o MT, e portanto o estimador BLUE. Note-se tambm que o MT permite estimar os coeficientes de regresso do MO porque os 2 modelos tm exactamente os mesmos coeficientes de regresso Em suma, as alteraes no MT so as seguintes: deixa de ser a varivel dependente e esta passa a ser
- Deixa de existir termo independente; - Em geral, temos k variveis explicativas variveis explicativas do MO; - Reposio da hiptese de homoscedasticidade. Uma nota final para atendermos ao facto de que a interpretao das estimativas realizada usando as estimativas obtidas no MT mas com a respectiva e adequada correspondncia com o MO. , , que so diferentes das
B: Supondo desconhecidas as varincias dos termos de perturbao (i.e., a matriz desconhecida). Na prtica, na generalidade das situaes, o padro de heteroscedasticidade que nos vinha sendo dado pela matriz desconhecido, e haver que operar com uma matriz estimada ou encontrar uma outra soluo, tal como o procedimento de White que veremos mais frente. B1) um estimador consistente de .
2. Mtodo OLS sobre o Modelo Transformado (MT) A ideia consiste em dividir ambos os membros da equao por o MT. Exemplo: MO: Para transformarmos este modelo, dividimos ento cada membro da equao por obtendo: MT: , e estimar por OLS
B2) No possvel estimar Este o caso tpico em que no se dispe de conhecimento razovel sobre o padro de heteroscedasticidade e se est perante a impossibilidade de se encontrar um estimador consistente de .
11
Reparar que a nica coisa que muda face ao mtodo GLS, anteriormente exposto, que se passa a considerar o estimador da matriz em vez da prpria matriz .
Confrontado com esta situao, White props um estimador consistente da matriz de varincias e covarincias dos estimadores de OLS dos coeficientes de regresso, i.e., um estimador consistente de e embora no resolvendo o problema de heteroscedasticidade, repe a validade da inferncia estatstica em amostras de grande dimenso. O Procedimento de White Parte-se do reconhecimento de que, presena de heteroscedasticidade, os estimadores OLS de mantm a centricidade e a consistncia, mas a inferncia estatstica perde a sua validade. O procedimento de White no resolve o referido problema, mas repe a validade da inferncia estatstica. Basicamente, o que este procedimento faz estimar por OLS o MO, sendo agora a matriz de estimada por12:
Depois,
Assim, quando se proceder inferncia estatstica, podemos utilizar o mtodo OLS. Contudo, teremos sempre que tornar o modelo original consistente com a existncia de heteroscedasticidade. Para tal, executamos o comando no E-Views: no modelo estimado/estimate/options/coefficient covariance matrix white.
12
Recordar que, como vimos no inicio da matria, quando h verificao de todas as hipteses clssicas,
QUESTO 1 TSI:
Sob
desconhecido,
Como p-value = 0,0030 inferior estatstica observada, ento para um nvel de significncia de 5% e com base na informao estatstica disponvel, conclumos pela significncia individual da rea do terreno para explicar o preo de venda de cada habitao.
QUESTO 2 Ser que os termos de perturbao do modelo so heteroscedsticos? Se forem, ento podemos desde j dizer que no poderamos ter estimado o modelo como o fizemos na questo 1, nem ter procedido inferncia estatstica que fizemos.
Podemos recorrer ento ao mtodo formal para testar se existe ou no heteroscedasticidade; falamos portanto no teste de White. Teste de White: tests/white: modelo original/view/residual diagnostics/heteroskedasticity
Sob
Para um nvel de significncia de 5%, e face informao estatstica disponvel, os termos de perturbao so heteroscedsticos. Assim, no poderamos ter resolvido a questo 1 da forma que fizemos.
QUESTO 3 As estimativas obtidas pelo procedimento de White, robustas presena de heteroscedasticidade, podem ser determinadas executando o comando: no modelo estimado/estimate/options/coef.covariance matrix white:
QUESTO 4 Testar novamente a significncia individual da varivel AT faz todo o sentido porque, como j se referiu, o TSI que foi feito na primeira questo no tem validade, pois estvamos na presena de heteroscedasticidade e no utilizamos 1 modelo consistente com este problema. Ento, o teste que agora se far ter em conta a estatstica de White (que assimptoticamente pode ser aproximada distribuio normal) e no a estatstica observada da distribuio T de Student. TSI:
Sob
Assim, para um nvel de signifcncia de 5% e face informao estatstica disponvel, conclui-se que a varivel AT no estatisticamente significativa para explicar o preo de uma habitao. Note-se que tambm pelo p-value = 0,0955 (inferior ao nvel de significncia) chegamos mesma concluso.
QUESTO 5 O que agora estamos a admitir que se conhece o padro de heteroscedasticidade. Como vimos nas aulas, uma hiptese era estimar o modelo por GLS. No entanto, o que aqui se pede aplicar o mtodo OLS sobre o MT (i.e., a outra alternativa quando se conhece o padro de heteroscedasticidade). Padro de heteroscedasticidade: ( . Ora, seguindo o procedimento de transformao do modelo original, vamos dividir os membros da sua equao pelo factor .
portanto, est reposta a hiptese de homoscedasticidade. Podemos, com este MT, proceder inferncia estatstica sem qualquer problema. Este MT est corrigido da heteroscedasticidade, ao contrrio do modelo com o procedimento de White, que apenas valida a inferncia estatstica. Estimao do MT:
QUESTO 6 A ideia testar se existe ou no heteroscedasticidade no MT. Como se trata do MT (por definio corrigido de heteroscedasticidade) o que se pretende confirmar o que foi postulado na questo anterior. Teste de White: modelo transformado/view/residual diagnostics/heteroskedasticity tests/white:
Sob
Em vez de compararmos com o valor crtico, podemos ver que p-value = 0,5892 (inferior ao nvel de significncia de 5%). Assim, para um nvel de significncia de 5%, e com base na informao estatstica disponvel, conclumos que os termos de perturbao do MT so homocedsticos.
QUESTO 7
QUESTO 8 Pretende-se que se proceda ao teste RESET, o que mais no do que o teste que se faz para se saber se a forma funcional do modelo ou no a correcta viola ou no a hiptese [H0]? Assumindo P=1, temos a seguinte regresso auxiliar:
Sob
Ento, com m nvel de significncia de 5%, e face informao estatstica disponvel, conclumos que o modelo 2 est correctamente especificiado.
Sob
QUESTO 10 TSG:
logo para este nvel de significncia e com base na informao estatstica disponvel, conclui-se que a regresso globalmente significativa.
QUESTO 11 Pretende-se saber a rea de habitao influencia ou no significativamente o preo da habitao (no modelo 2). Ser, portanto, necessrio realizarmos um TMA pela introduo das variveis e .
Assim, para um nvel de significncia de 5%, e com base na informao estatstica disponvel, podemos dizer que o modelo 2 prefervel ao modelo restrito que no inclui aquelas 2 variveis.
QUESTO 12 Nesta questo coloca-se em causa a permanncia de estrutura dos coeficientes de regresso, pelo que teremos que proceder ao teste Chow. O primeiro passo ver qual a disposio dos dados desta varivel dummy e, eventualmente orden-los. Assim fazemos, nomeadamente executando o comando workfile/proc/sort current page/sort key/col ascending. Detectamos que a alterao ocorre em n=28.
Sob
4. HIPTESE [H3]: AUTO CORRELAO A hiptese de ausncia de auto-correlao (AC) estabelece que nula a covarincia entre perturbaes aleatrias, ou seja:
Ento, existir AC das perturbaes aleatrias quando houver pelo menos 2 perturbaes distintas cuja covarincia seja diferente de 0, ou seja:
Quando isto acontece, ento sabemos que pelo menos alguns dos elementos da matriz no so nulos:
Portanto, j no poderemos dizer que a matriz uma matriz escalar, pois agora apenas sabemos que uma matriz simtrica e definida positiva. Os elementos fora da diagonal principal representam os coeficientes de correlao linear entre as perturbaes aleatrias.
Quais as possveis fontes de AC? - Erros de especificao. Trata-se de situaes em que existe omisso de variveis explicativas relevantes e a escolha inadequada da forma funcional. Contudo, esta a falsa AC, porque o modelo que est mal especificado. - Manipulao de dados; - AC propriamente dita neste tipo de AC que nos vamos focar. A AC ocorre mais frequentemente, embora no exclusivamente, nas amostras de natureza temporal ou cronolgica. Por exemplo, observaes do mesmo indivduo em
momentos ou perodos sucessivos so muitas vezes influenciadas por factores que exibem alguma persistncia ao longo do tempo. A dependncia do passado , portanto, uma manifestao de AC. E quais so ento as consequncias de AC ao nvel das propriedades dos estimadores de OLS? Tal como na presena de heteroscedasticidade, os estimadores de OLS so cntricos e consistentes, mas no so de varincia mnima (no so BLUE). Podemos continuar a estimar o modelo pelo mtodo de OLS, no entanto a inferncia estatstica no vlida. A inferncia estatstica no vlida porque a varincia dos estimadores de OLS agora dada por: e no por Vamos ento ter que conhecer um pouco mais os processos aleatrios, de modo a podermos utilizar padres de AC, e assim ultrapassar o problema de no conhecermos a matriz .
PADRES/PROCESSOS DE AUTO-CORRELAO 1. O termo de perturbao todas as hipteses clssicas). o o o (i.e., o termo de perturbao verifica
Mais concretamente, iremos focar o nosso estudo nos processos auto-regressivos de primeira ordem:
Iremos focar o nosso estudo apenas nos processos AR(1), em que a varivel definida segundo a sua prpria expresso reportada a um instante precedente mais uma inovao no prprio perodo:
Quando o termo de perturbao segue um processo AR(1), ento o seu valor actual pode escrever-se como uma combinao linear das realizaes passadas, isto :
Ou seja, apercebemo-nos de que o processo AR(1) tem memria infinita, j que a perturbao do perodo corrente uma soma ponderada das inovaes passadas e da inovao presente, sendo os pesos das inovaes passadas cada vez menores quanto mais longnquo for o passo. Se assim , podemos ento chegar ao nosso objectivo de desvendar a matriz correspondente a um termo de perturbao que segue um processo do tipo AR(1):
Por outras palavras, quando um termo de perturbao segue um processo AR(1), a matriz de varincias e covarincias tem apenas 2 parmetros: e . Por outro lado, conhecendo a matriz das varincias e covarincias do termo de perturbao, podemos apresentar as propriedades estatsticas destes processos AR(1):
MTODOS DE DETECO DE AC
MTODOS INFORMAIS Estes mtodos informais consistem em procedimentos meramente sugestivos, mas no conclusivos, da presena de AC. Basicamente consistem em procedimentos de inspeco grfica dos resduos de estimao por OLS do modelo em estudo, j que os resduos de estimao imitam o comportamento dos termos de perturbao. Uma vez que o modelo tem termo independente, sero nulas a soma e a mdia dos resduos. Portanto, haver resduos de sinal positivo e de sinal negativo. Na ausncia de problemas de AC, ser de esperar que resduos de um e de outro sinal se sucedam de forma casual, sem qualquer padro aparente. Havendo AC, ser de esperar a verificao de um de dois padres: i) AC positiva (caso mais frequente em economia). frequente em situaes de AC positiva encontrarem-se longas sequncias de valores do mesmo sinal. ii) AC negativa (caso menos frequente em economia). a tendncia para a alternncia do sinal de resduos consecutivos. Alguns grficos ilustrativos:
Figura 1: Ausncia de AC
Figura 2: AC Positiva
Figura 3: AC Negativa
MTODOS FORMAIS Existe Auto-Correlao dos termos de perturbao? O Teste de Durbin-Watson (DW) Algo fundamental que deve ser desde j apreendido que o teste DW s pode ser aplicado se se verificar todo 1 conjunto de condies, a saber: 1- Deteco de AC que sejam geradas por processos AR(1). Caso se estejam perante processos como MA, AR(2), etc. o teste pode falhar. 2- O modelo contm termo independente; 3- As variveis explicativas no so aleatrias.
4 Na amostra no existam hiatos (falhas) na sequncia das observaes. A amostra deve consistir em observaes respeitantes a perodos consecutivos, sem quebras ou interrupes que retirem comparabilidade s sucessivas diferenas. Destas 4 condies, sempre que nos coloquem em causa a aplicabilidade do teste DW, se nada nos for dito, assumimos a primeira condio, i.e., que a eventual AC gerada por processos AR(1).
Operacionalizao do teste DW: Passo 1: Estimar por OLS o modelo em estudo e obter os respectivos resduos de estimao.
Ora, sabendo que DW depende do estimador de , sendo que -1 < < 1, ento tambm estar dentro do intervalo [-1;1]. E assim, podemos saber quais so os limites inferiores e superiores da estatstica de DW:
Atentemos agora no seguinte grfico, que traduz uma relao fundamental entre a estatstica de DW e o estimador do coeficiente de correlao dos termos de perturbao.
Se a estimativa do coeficiente de correlao for negativa o que sugere a presena de AC negativa - ento DW pertence ao intervalo [2,4]. Se a estimativa do coeficiente de correlao for positiva o que sugere presena de AC positiva ento DW pertence ao intervalo [0,2]. No caso em que a estimativa do coeficiente de correlao nula, ento a situao sugere a ausncia de AC (e DW aproximadamente igual a 2). Perante esta relao, deve ficar bem claro que: - Quando DW < 2, ento testamos a existncia de AC positiva; - Quando DW > 2, ento testamos a existncia de AC negativa.
Passo 3: Com recursos s tabelas, obter os valores do limite inferior d L e do limite superior dU, do intervalo que contm o valor crtico da estatstica de teste. Para determinar nas tabelas estes limites, temos que recorrer aos valores de T (nmero de perodos observados, K=K-1, e o nvel de significncia .
Passo 4: (i) Testar a existncia de AC positiva de primeira ordem do tipo AR(1), quando DW < 2
Regra de deciso: - Se DW < dL: rejeitar positiva. , em favor de e concluir pela existncia de AC
- Se dL < DW < dU: indeterminada e o teste inconclusivo; - Se DW > dU: no rejeitar e concluir pela inexistncia de AC do tipo AR(1)
(ii) Testar a existncia de AC negativa de primeira ordem do tipo AR(1), quando DW > 2
Regra de deciso: - Se DW < 4 dU: no rejeitar e concluir pela inexistncia de AC do tipo AR(1).
- Se 4 dU < DW < 4 dL: indeterminada e o teste inconclusivo; - Se DW > 4 dL: rejeitar negativa. em favor de : e concluir pela existncia de AC
Aplicao Prtica do Teste DW - Modelo: As condies de aplicabilidade dos testes DW so verificadas, pois assume-se que a eventual existncia de AC gerada por processos AR(1); o modelo tem termo independente; a varivel explicativa no aleatria; assume-se que no existem falhas na sequncia das observaes da amostra em anlise. Como a estatstica DW est contida no intervalo [2,4] ento testamos AC negativa. Nota: Qual o valor de ? Sabendo que
tal que:
Como DW = 2,99 > 4 dL = 2,727, ento rejeitamos para e assim concluimos pela existncia de AC negativa dos termos de perturbao deste modelo.
- Modelo: As condies de aplicabilidade do teste DW so verificadas, tal como se enunciou para o caso anterior. Como a estatstica observada de DW est contida no intervalo [0,2] ento iremos testar AC positiva.
, retiramos que:
Como DW = 1,99 > dU = 1.656, ento conclui-se para este nvel de significncia, e com base na informao estatstica disponvel, que no existe AC do tipo AR(1) dos termos de perturbao deste modelo.
Existe Auto-Correlao dos termos de perturbao? O Teste de Breusch-Godfrey Vimos anteriormente que o teste DW exige todo um conjunto de condies de aplicabilidade. Iremos aqui destacar uma dessas limitaes, nomeadamente o facto do teste DW apenas permitir testar a existncia de AC que seguem um processo AR (1), i.e., entre duas realizaes sucessivas de . Face a esta situao, o teste de Breusch-Godfrey permite testar a existncia de AC de qualquer ordem p, nomeadamente, permite testar a hiptese de seguir um processo AR(p), isto :
Passo 1: Estimar por OLS este modelo original e obter a srie de resduos.
Depois, seguindo o procedimento habitual, se o valor observado da estatstica de teste exceder o valor crtico, rejeita-se , o que constitui evidncia estatstica da existncia de AC nos termos de perturbao. Finalmente, refira-se que o E-Views executa automaticamente este teste de BreuschGodfrey: modelo original/view/residual diagnostics/serial correlation LM test/lags to include: p = p 1.
MTODOS DE ESTIMAO NA PRESENA DE AUTO-CORRELAO Havendo auto-correlao entre os termos de perturbao, ento a inferncia estatstica invlida, logo existe a necessidade de encontrarmos formas que permitam estimar o modelo em estudo e proceder inferncia estatstica. A) A matriz conhecida, i.e., o valor de conhecido, pois j vimos anteriormente que a matriz dependia agora apenas deste parmetro, quando a AC gerada por processos AR(1). A soluo ser transformar o modelo original num modelo em que os termos de perturbao no sejam auto-correlacionados. E, estando esse MT corrido de AC, poder ser depois perfeitamente estimado pelo mtodo OLS e pode-se fazer inferncia estatstica. A transformao feita atravs do mtodo das diferenas generalizadas de primeira ordem. O mtodo das diferenas generalizadas de primeira ordem aplicado do seguinte modo: Partindo de um modelo original:
Sabendo que
: :
Assim, esta transformao assegura que o novo termo de perturbao verifique as hipteses clssicas, pelo que o modelo est corrigido de AC, podendo ser estimado por OLS e podendo ser feita inferncia estatstica.
Entretanto, existem 3 aspectos importantes a destacar aps fazermos a estimao do modelo assim transformado: 1 Perdemos uma observao; 2 A estimativa do termo independente dada pelo E-Views refere-se a e no a Assim, para se determinar o valor de , temos que calcular a seguinte expresso: .
3 A estimativa do desvio padro do termo de perturbao dada pelo E-Views [S.E. of Regression] refere-se a e no a , como pretendemos. Ento, para determinarmos o valor de , temos que calcular a seguinte expresso:
No sendo conhecido o coeficiente de correlao entre as observaes do termo de perturbao, , o que se faz na prtica recorrer-se a estimadores consistentes de , para que os estimadores de OLS sejam assimptoticamente BLUE
Obtendo-se uma estimativa para , o que se faz substituir esse valor no MT anterior (obtido pelo mtodo das primeiras diferenas generalizadas) para se chegar a um modelo corrigido de AC. Que mtodos existem para se obter consistente: i) ; ? Existem 3 vias para estimar de forma
ii) Mtodo de Cochrane-Orcutt: este mtodo consiste em estimar por OLS o modelo original, obtendo a srie de resduos e estimando em seguida a seguinte equao:
iii) Mtodo NLS: um mtodo que determina directamente todos os coeficientes de regresso do modelo original, no sendo necessria qualquer substituio da estimativa de no MT pelas primeiras diferenas generalizadas. Executa-se o seguinte comando no E-Views: estimate equation/y c x AR(1) No entanto, ser sempre necessrio ter em conta que:
AR(1) =
C) O valor de
Poderemos aceitar as estimativas de OLS dos coeficientes de regresso, uma vez que os respectivos estimadores mantm a centricidade e a consistncia na presena de autocorrelao). Utilizar-se- um estimador consistente da matriz de varincias e covarincias dos termos de perturbao que reponha a validade da inferncia estatstica estimador de Newey-West. Notar que o estimador de Newey-West repe a validade da inferncia estatstica tanto para o caso de AC como no caso de Heteroscedasticidade, pelo que no que a este ltimo caso diz respeito, tanto possvel recorrer ao procedimento de White como ao procedimento de Newey-West. [Newey-West um procedimento que repe a validade da inferncia estatstica para todos os casos] No E-Views: modelo original/equation estimation/options/coefficient covariance matrix/HAC (Newey West).
Para analisar o comportamento da srie dos resduos de estimao ao longo do tempo, temos que criar uma varivel T (de tempo) e depois construir um grfico com a srie de resduos ao longo do tempo. Seja T = trend(2004M12).
Este comportamento da srie dos resduos nada nos permite concluir em termos de AC.
QUESTO 2 Em primeiro lugar, deve-se referir que se verificam as condies de aplicabilidade do teste (pressuposto: eventual AC gerada por processo do tipo AR(1)). Estatstica de DW = 1,276 < 2, pelo que iremos testar a existncia de AC positiva.
Como DW < , ento, para um nvel de significncia de %, e com base na informao estatstica disponvel, conclui-se que existe AC positiva dos termos de perturbao do modelo.
Regresso auxiliar:
=7,185575 ] Ento, para um nvel de significncia de 5%, e face informao estatstica disponvel, conclui-se pela existncia de AC dos termos de perturbao do modelo original. Nota: No E-Views: modelo original/view/residual diagnostics/serial correlation LM test/lags to include: p=2
Sabendo que
b) Supe-se agora que no se conhece a correlao dos termos de perturbao. b.1) A partir do valor da estatstica de DW:
Interpretao das estimativas? estima-se que quando a carga fiscal aumente em 1%, o preo do combustvel aumente em cerca de 0,89%, ceteris paribus. como no faz sentido interpretar logaritmos, calculamos a exponencial de , isto , 0,8. E assim, estima-se que o preo do combustvel seria de 0,8/litro, quando a carga fiscal de 1/litro e quando o preo do petrleo de 1/barril. NOTA: Se quisssemos verificar se neste modelo transformado existia AC, no poderamos recorrer ao teste DW, porque existem variveis explicativas aleatrias (usamos valores estimados da correlao dos termos de perturbao), pelo que apenas poderamos recorrer ao teste de BG.
b.2) Este mtodo consiste em estimar por OLS o modelo original, obtendo a srie de resduos e estimando em seguida a seguinte equao:
. Substituindo no
b.3) Mtodo NLS: [no necessrio substituir o valor da estimativa de este mtodo d directamente as estimativas dos coeficientes de regresso.
no MT pois
QUESTO 5 O que podemos dizer que existe alguma disparidade nas estimaes dos parmetros. De facto, quanto maior for a amostra, mais prximos estaro os parmetros neste caso, como temos apenas 40 observaes, percebe-se porque existe essa disparidade.
QUESTO 6 O procedimento de Newey-West torna vlida a inferncia estatstica tanto no caso de heterocedasticidade como de homocedasticidade. No E-Views: modelo original/equation estimation/options/coefficient covariance matrix/HAC (Newey West).
TSI: log(FISC)
Sob
Como a estatstica observada pertence regio crtica, para o nvel de significncia de 5%, e com base na informao estatstica disponvel, conclumos que a varivel log(FISC) estatisticamente significativa para explicar log(COMB).
Conceito de Estacionaridade: uma srie diz-se estacionria se tem mdia, varincia e covarincias constantes. Tipologia das sries temporais estacionrias: 1) Rudo Branco (White Noise) 2) No Rudo Branco: i) AR; ii) MA; iii) ARMA
Uma srie temporal identificada como um rudo branco um processo sem estrutura discernvel, isto : o o o
Uma varivel segue um processo auto-regressivo AR(p) se o seu valor corrente depende apenas dos valores que a varivel assumiu no passado (nos perodos passados) e de uma perturbao aleatria de espectro branco:
Estes processos AR tm memria infinita. O valor actual dos depende de todos os seus valores passados. A influncia do passado decresce, portanto, com a distncia que o separa do presente. Exemplo para o caso AR(1):
Uma varivel segue um processo de mdia mvel, MA(q), se o seu valor corrente depende apenas dos valores correntes e passados de uma perturbao aleatria de espectro branco:
Um processo de mdias mveis uma combinao linear de termos de perturbao, como se pode constatar. Os processos de mdias mveis tm memria finita, que se estende por um nmero de perodos igual ao da ordem do processo. Assim, para um processo MA(1), est correlacionado com mas com mais nenhum outro. Exemplo para o caso MA(1):
Os processos ARMA (p, q) so uma combinao de um processo AR(p) com um processo MA(q). segue um processo ARMA(p, q) se o seu valor corrente depende linearmente dos seus prprios valores passados bem como de uma combinao do valor corrente e dos valores passados de uma varivel aleatria de espectro branco: ,
IDENTIFICAO DO PROCESSO O nosso objectivo ser ento saber identificar o processo que melhor capta as caractersticas da srie temporal, e assim prever comportamentos futuros adequadamente. Para tal, vamos ter que atender a critrios de informao disponibilizados pelo E-Views: Akakie, Schwarz e Hannan-Quinn. So critrios de seleco de processos que atendem a duas das suas caractersticas (a soma dos quadrados dos resduos e o nmero de
parmetros). Neste sentido, o modelo que melhor descreve a srie temporal ser aquele que minimiza a SQR e o nmero de parmetros do modelo. Portanto, o objectivo ser escolher o modelo com o menor valor possvel do critrio de informao.
RESOLUO DO EXERCCIO 9 QUESTO 1: Havendo suspeita que os modelos ARMA (p, q) podem caracterizar o comportamento da srie dos preos de habitao, iremos seleccionar de entre os vrios modelos disponveis at (p=2, q=2) aquele que melhor se adequa aos dados disponveis. O critrio que iremos escolher ser, por exemplo, o critrio de Akaike. Seja .
Depois, estimamos cada um destes modelos no E-Views, de modo a obter a seguinte tabela: q\p 0 1 2 0 3.116024 3.086352 2.972583 1 3.064508 2.985245 2.965257 2 2.950966 2.961237 2.968493
O menor valor possvel, que minimiza o critrio Akaike, o processo ARMA(2,0) = AR(2).
QUESTO 2 Antes de procedermos previso para estes 3 modelos alternativos, refira-se que se por ventura o modelo escolhido para se fazer previso tivesse sido um rudo branco, ento:
a) Supondo que
13
Ora, para fazermos previso temos que trabalhar com o modelo ajustado, i.e., o modelo estimado. No entanto, algo muito importante tem de ser chamado ateno, devido a uma particularidade dos modelos auto-regressivos, AR. que, para estes modelos, da forma como estimamos na alnea anterior, ns no obtemos mas sim . [Nota: os restantes parmetros estimados so os correctos]. Ento, para obtermos o valor de temos que calcular:
Entretanto, podemos estimar os modelos AR de uma forma que o E-Views nos indica correctamente todos os valores dos parmetros, inclusive de . Ento, nesta alnea a), para estimar o modelo:
13
Notar que sempre que se diz que um termo de perturbao segue as hipteses clssicas (HC) significa que se verificam as seguintes condies: 1. 2. 3.
Tendo este modelo ajustado, podemos ento fazer previso para meses futuros. Devemos, para tal, ter em conta que o ltimo perodo da amostra 2007M05, ou seja, o perodo t. Previso para 2007M06:
Seguindo a mesma lgica: Previso para 2007M09: 0.709014 Previso para 2007M10: 0.713014 Previso para 2007M11: 0.683794 Previso para 2007M12: 0.680076 Devemos saber que o E-Views faz previses automaticamente, e devemos prever tambm desta forma para confirmar se aqueles clculos esto correctos. O procedimento o seguinte: Sem seleccionarmos nenhuma informao: workfile/proc/structure size current page/frequency: Start Date: colocamos o primeiro perodo de previso: neste caso 2007M06 End Date: colocamos o ltimo perodo de previso: neste caso 2007M12
Em seguida vamos ao modelo que estimamos para podermos fazer as previses/proc/forecast: forecast sample:2007M06 2007M12. [forecast name = previso] Finalmente, em workfile foi criada a varivel previso com os valores da previso que pretendamos.
Seguindo a mesma lgia, obtemos: Previso para 2007M08: 0.635992 Previso para 2007M09: 0.635992 Previso para 2007M10: 0.635992 Previso para 2007M11: 0.635992 Previso para 2007M12: 0.635992
Um bom previsor do resduo de estimao zero porque a soma dos resduos de estimao zero.
Como se pode constatar, estes processos de mdias mveis tm memria finita, assumindo a partir de certo perodo o mesmo valor (que o valor de )
Previso para 2007M06: Da mesma forma, fazemos a previso para os restantes meses (confirmar sempre pelo comando automtico do E-Views).