Вы находитесь на странице: 1из 91

Curso Regular de Estatstica Aula 17

Prof Vtor Menezes

AULA 17: Regresso linear simples e anlise de


varincia da regresso

1. CORRELAO LINEAR ENTRE VARIVEIS ALEATRIAS................................................................... 2


2. REGRESSO LINEAR ........................................................................................................................ 8
2.1. Entendendo a relao verificada na populao.................................................................................... 8
2.2. Estimadores dos parmetros do modelo de regresso ........................................................................ 10
2.3. Hipteses do modelo ........................................................................................................................... 13
2.4. Visualizando os desvios....................................................................................................................... 13
2.5. Igualdades envolvendo somatrio ....................................................................................................... 19
2.6. Calculando a reta de regresso .......................................................................................................... 20
2.7. Reta de regresso passando pela origem ............................................................................................ 39
3. ANLISE DE VARINCIA DA REGRESSO ...................................................................................... 41
3.1. Somas de quadrados ........................................................................................................................... 41
3.2. Quadrados mdios e estatstica F ....................................................................................................... 44
3.3. Coeficiente de determinao ............................................................................................................... 45
4. INFERNCIA SOBRE AS ESTIMATIVAS DOS PARMETROS(*) ....................................................... 62
4.1. Varincia da estimativa de Y .............................................................................................................. 67
4.2. Erro de previso.................................................................................................................................. 68
5. QUESTES APRESENTADAS EM AULA .......................................................................................... 72
6. GABARITO ..................................................................................................................................... 90

Prof. Vtor Menezes www.estrategiaconcursos.com.br 1


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

1. CORRELAO LINEAR ENTRE VARIVEIS ALEATRIAS

Na aula 5 estudamos a correlao linear entre dois conjuntos de dados. Muito bem,
podemos estender este conceito para duas variveis aleatrias.
Para melhor entendimento, vamos lembrar do Exemplo trabalhado naquela aula.
Um grupo de quatro alunos estudou junto para as provas finais. Feitas as provas, eles
obtiveram se seguintes notas:
Aluno Nota de matemtica Nota de fsica
() ()
1 2 6
2 6 7
3 8 7
4 10 8
Mdia 6,5 7
Calcule o coeficiente de correlao linear entre as notas de fsica e matemtica.
[Observao: isto no questo de concurso. Serve s para nos familiarizarmos com a
frmula. Ento, podem usar calculadora]

Resoluo:
As notas em fsica e matemtica guardam certa relao linear. Vamos calcular o coeficiente
de correlao para vermos a intensidade da relao linear existente entre elas.

Aluno       ( ) ( ) ( ) ( )


1 2 6 -4,5 -1 4,5 20,25 1
2 6 7 -0,5 0 0 0,25 0
3 8 7 1,5 0 0 2,25 0
4 10 8 3,5 1 3,5 12,25 1
TOTAL 8 35 2

Aplicando a frmula:
  ( ) ( )
=
 ( )  ( )
8
= 0,956
35 2
Veja que o coeficiente de correlao bem prximo de 1. Ou seja, existe intensa relao
linear entre as notas de fsica e matemtica.
Naquele exerccio tnhamos os valores das notas de cada aluno, em duas provas as notas
de matemtica e de fsica (valores de X e Y). Dava para calcular as mdias em cada prova (
X e Y ). E, a partir destes valores, conseguimos calcular o coeficiente de correlao.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 2


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

S que s vezes estamos interessados em ver se duas variveis aleatrias esto linearmente
relacionadas. Quando temos variveis aleatrias, que podem assumir diversos valores, onde
h o fator chance (probabilidade), o coeficiente de correlao muda um pouquinho.
Quando trabalhamos com variveis aleatrias falamos em esperanas. E a frmula do
coeficiente de correlao fica:
(, )
=
! "

Relembrando:
(, ) a covarincia entre X e Y.
o desvio padro da varivel aleatria.
Na verdade a frmula acima bem parecida com aquela estudada no incio do tpico de
correlao (aula 5)
A frmula que vimos podia ser escrita da seguinte maneira:

[(X ) ( )]
n

i X Yi Y
1
i =1

(X ) (Y )
n n
2
n
2
i X i Y
i =1
i =1

n n
Na primeira parte da frmula, temos uma mdia. a mdia dos produtos X X Y Y . ( ) ( )
Quando temos variveis aleatrias, esta mdia substituda pela esperana. a esperana
de ( X X ) (Y Y ) . E esta esperana, como vimos na aula 7, justamente a covarincia
entre X e Y.
Na segunda parte da frmula temos a diviso pelos desvios padro de X e Y, o que
mantido na frmula para a correlao entre variveis aleatrias.
Com estas alteraes, a frmula fica:
cov( X , Y )
r=
X Y

Questo 1 BACEN 2009 [CESGRANRIO]


Sejam duas variveis aleatrias X e Y com varincias finitas e no zero. O coeficiente de
correlao entre essas duas variveis
(, )
$=
! "

Onde:
$: coeficiente de correlao linear entre X e Y:
cov(X,Y) = covarincia entre X e Y.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 3


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

! e " so, respectivamente, desvio padro de X e desvio padro de Y.


Considerando essas informaes, analise as proposies a seguir.
I - Se a e b so constantes,
1
(, ) = )*' (' + () ' *' () + (  *' (),
2'(
II Se $ = 1,
 
- + .
! "

torna-se no estocstica

III Se cov(X,Y) = 0, ento $ = 0 e X e Y so estocasticamente independentes.


(So) correta(s) APENAS a(s) proposio(es)
(A) I.
(B) II
(C) I e II.
(D) I e III.
(E) II e III.

Resoluo:
Antes de resolvermos a questo, precisamos estudar uma propriedade da covarincia.
Sejam X e Y duas variveis. Sejam a e b duas constantes.
Quando queremos calcular a covarincia
(', )
temos o seguinte.
Sempre que multiplicamos uma das variveis por uma constante, esta constante pode sair
da covarincia, multiplicando. Logo:
(', ) = ' (, )
Analogamente:
(, () = ( (, )
E, por fim:
(', () = ' (, () = ' ( (, )

Por analogia, isso tambm vale para a diviso.


Isto porque dividir por k o mesmo que multiplicar por 1/k.
Assim:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 4


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

  1
 - , . = (, )
' ( '(

Visto isso, vamos questo:

Item I.
Foi dada a seguinte expresso:
1
)*' (' + () ' *' () + (  *' (),
2'(
Aplicando a frmula da varincia da soma:
1
= )*' (') + *' (() + 2(', () ' *' () + (  *' (),
2'(
Quando multiplicamos uma varivel por uma constante, a varincia multiplicada pela
constante ao quadrado.
1
= )' *' () + (  *' () + 2(', () ' *' () + (  *' (),
2'(
Simplificando os termos de sinal contrrio:
1
= )' *' () + (  *' () + 2(', () ' *' () + (  *' (),
2'(
Ficamos com:
1
)2(', (),
2'(
Quando multiplicamos uma varivel por uma constante, a covarincia fica multiplicada por
esta constante:
1
)2 ' (, (),
=
2'(
Quando multiplicamos uma varivel por uma constante, a covarincia fica multiplicada por
esta constante:
1
)2 ' ( (, ),
=
2'(
Simplificando 2ab do numerador e do denominador:
1
= )2 ' ( (, ),
2'(
= (, )
Item correto.

Item II.
Estocstico sinnimo de aleatrio. O item est nos dizendo que a soma

Prof. Vtor Menezes www.estrategiaconcursos.com.br 5


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

 
- + .
! "

no aleatria.
Para simplificar os comentrios, seja Z tal que:
 
/=- + .
! "

Neste caso, tomamos a varivel X e dividimos por uma constante ( ! ). Tomamos a varivel Y
e dividimos por outra constante ( " ).
Desde que temos uma combinao de duas variveis aleatrias, em princpio, o resultado
(=Z) tambm ser aleatrio.
Vamos calcular a varincia de Z
Se a varincia for nula, porque Z no varia. Ou seja, sempre constante. Neste caso, de
fato no ser aleatrio.
Se a varincia for diferente de 0, porque Z varia. E como depende de duas variveis
aleatrias, Z tambm ser uma varivel aleatria.
 
*(/) = * - + .
! "

Aplicando a frmula da varincia da soma:


   
*(/) = * - .+*- . + 2 - , .
! " ! "

Quando dividimos uma varivel por uma constante, a varincia dividida pela constante ao
quadrado:
*() *()  
*(/) = 
+ 
+ 2 - , .
! " ! "

Quando dividimos uma varivel por uma constante, a covarincia fica dividida pela mesma
constante.
*() *() 2 
*(/) = 
+ 
+  -, .
! " ! "

Quando dividimos uma varivel por uma constante, a covarincia fica dividida pela mesma
constante.
*() *() 2
*(/) = + + (, )
!
 
! " "

No primeiro termo da soma, temos a varincia de X, dividida pela prpria varincia de X.


Quando o numerador igual ao denominador, o resultado 1.
*() 2
*(/) = 1 + + (, )
!

" "

No segundo termo da soma, temos a varincia de Y dividida pela varincia de Y. Novamente,


o resultado 1.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 6


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

2
*(/) = 1 + 1 + (, ) (equao I)
! "

O item disse que:


$ = 1
Aplicando a frmula do coeficiente de correlao:
7(, )
$=
! "
7(, )
1 =
! "

(, ) = ! " (equao II)

Substituindo II em I:
2
*(/) = 1 + 1 + ( ! ")
! "

*(/) = 1 + 1 2
*(/) = 0
Ou seja, Z no tem disperso, Z no varia. Logo, Z uma constante. Realmente no algo
aleatrio.
Item correto.

Item III.
O item afirma duas coisas:
- se a covarincia nula, o coeficiente de correlao nulo
- o resultado final que X e Y so independentes.
De fato, sempre que a covarincia for nula, a correlao tambm ser nula.
Basta ver que:
7(, )
$=
! "

Se o numerador for nulo (covarincia nula), o resultado da frao (=$) tambm ser nulo.
A primeira parte da frase est correta.
Quanto segunda parte, ela est errada.
Vimos na aula 7 que o fato de a covarincia ser nula no garante variveis independentes.
Item errado.
Gabarito: C

Prof. Vtor Menezes www.estrategiaconcursos.com.br 7


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

2. REGRESSO LINEAR

Na correlao linear, estvamos interessados em ver se duas variveis X e Y tinham uma


relao linear forte ou no.
Pois bem, considerem que X e Y tenham uma relao linear forte. Ou seja, a relao entre
ambas quase uma reta. Neste caso, que reta seria essa? Qual a reta que melhor descreve a
relao linear entre X e Y?
justamente isso que a regresso linear vai nos dizer.

2.1. Entendendo a relao verificada na populao

Sejam X e Y duas variveis. Um modelo de regresso linear que as relaciona da seguinte


forma:
Yi = + X i + i
Neste modelo, e so constantes e uma varivel aleatria de mdia zero.
Mas o que significa este modelo?
Para entender melhor, vamos a um exemplo. Vamos dar valores.
Sejam X e Y duas variveis aleatrias que modelam duas caractersticas de uma populao.
Poderiam ser peso e altura dos indivduos de um pas. Ou ento lucro bruto e gastos com
propaganda de empresas de um dado setor. Ou qualquer outra coisa. Considere o seguinte
modelo de regresso:
Yi = 5 + 2 X i + i , onde tem desvio padro igual a 2.
Neste modelo, = 5 e = 2 . E uma varivel aleatria de mdia zero e desvio padro
igual a 2.
O que significa o modelo?
Para ver seu significado, vamos considerar o caso em que X igual a 1.
Quando X vale 1, o valor de Y fica:
Y = 5+ 2+ = 7+
Y igual a 7 mais alguma coisa.
Quando X for igual a 1, Y uma varivel aleatria que assume valores ao redor de 7. Y uma
varivel aleatria de mdia 7 e desvio padro igual a 2 ( o mesmo desvio padro da
varivel ).
Simulei no Excel 40 valores para uma varivel aleatria normal de mdia 7 e desvio padro
igual a 2.

Quadro 1 Amostra de 40 valores de Y quando X vale 1

Prof. Vtor Menezes www.estrategiaconcursos.com.br 8


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

6,593141232 9,006039634 7,529331787 8,790447066


7,852422253 7,316731652 5,709223237 1,517279637
7,371164634 8,337094106 8,492395516 4,537325404
7,192761653 7,710131408 4,163608098 6,193114621
9,048459033 7,557574931 6,200254493 7,898396375
7,347612528 6,111238398 7,921807047 7,114042863
7,86536918 4,804578704 6,595492192 7,695790475
10,32428016 6,267005594 6,12221455 6,72314475
7,59146052 6,939884906 7,191285009 6,939555013
8,697223503 6,689966794 8,674250951 7,633455534
Podemos considerar que a populao de onde retiramos os 40 valores acima tem mdia 7 e
desvio padro igual a 2.
Ou seja, podemos considerar que existe uma populao de valores de Y correspondente a X
igual a 1. Esta populao tem mdia 7 e desvio padro igual a 2.

Quando X for igual a 2, Y fica:


Y = 5 + 2 2 + = 9 +
Agora Y igual a 9 mais alguma coisa. Esse alguma coisa a varivel aleatria , de
mdia zero e desvio padro igual a 2.
Portanto, Y uma varivel aleatria de mdia 9 e desvio padro igual a 2. Assim, quando X
for igual a 2, temos outra populao de valores Y, desta vez com mdia 9. Um exemplo de
amostra dessa segunda populao, tambm com 40 valores, seria:

Quadro 2 Amostra de 40 valores de Y quando X vale 2


6,53861127 9,678841758 10,18699647 12,04425824
6,235802132 9,645271814 7,816967558 7,710536605
6,628522819 11,58429767 7,855252513 7,904572561
8,955476207 10,5235668 10,29363849 6,979009116
12,78643385 7,361538895 9,911730171 8,295251334
9,423242246 6,951347174 8,884513449 9,189919391
8,588672066 8,72768786 12,15872381 9,237865804
9,438625799 10,71337193 8,195035187 9,452390476
3,332867904 13,24592769 9,393588155 6,613649783
7,937743916 10,38333066 9,099585603 9,034490197

O mesmo vale quando X for igual a qualquer outro valor.


Nosso modelo Yi = 5 + 2 X i + i representa simultaneamente inmeras populaes de
valores de Y. Para cada valor de X, ns temos uma populao de valores de Y de tal modo
que sua mdia igual a 5 + 2 X .

Prof. Vtor Menezes www.estrategiaconcursos.com.br 9


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Os valores de Y variam em torno deste valor mdio graas varivel , aleatria. Podemos
pensar que Y e X guardam uma relao quase linear. A relao s no perfeitamente linear
devido presena dessa varivel , que representa todas as demais interferncias no valor
de Y que no so explicadas pela varivel X.
A varivel pode ser vista como o erro que se comete quando se aproxima a relao entre
X e Y por uma reta. Muitas vezes acaba sendo chamada, realmente, de erro.
Assim, se o modelo de regresso Yi = 5 + 2 X i + i representar adequadamente o conjunto
formado por todas as populaes de valores de Y, sabemos que, para cada valor de X, temos
como calcular a mdia da correspondente populao de valores de Y.
Repetindo: a relao entre X e Y praticamente uma reta. Os pares ordenados (X,Y) s no
se comportam exatamente como uma reta por causa da varivel aleatria .
Deste modo, os pares ordenados (X,Y) vo se situar em torno da reta Yi = 5 + 2 X i

Considere que X assuma apenas os valores 1, 2, 3, 4, 5. Considere ainda que o modelo


Yi = 5 + 2 X i + i (onde tem desvio padro igual a 2) descreva bem a populao de
valores de Y.
Podemos pensar que esta populao , na verdade, dividida em 5 populaes menores.
Uma para o caso em que X igual a 1. Outra para o caso em que X igual a 2. E assim por
diante, at X igual a 5.
Abaixo detalhamos as cinco populaes de valores de Y:
X = 1 Y tem mdia 7 e desvio padro igual a 2.
X = 2 Y tem mdia 9 e desvio padro igual a 2.
X = 3 Y tem mdia 11 e desvio padro igual a 2.
X = 4 Y tem mdia 13 e desvio padro igual a 2.
X = 5 Y tem mdia 15 e desvio padro igual a 2.
Ok. Ento nosso modelo representa adequadamente toda a populao (composta pelas
cinco sub-populaes acima). Ou seja, tendo acesso a toda a populao, podemos verificar
que, para cada valor de X, os valores de Y correspondentes giram em torno da reta dada por
Y = 5 + 2X

2.2. Estimadores dos parmetros do modelo de regresso

Continuemos com o modelo de regresso do exemplo anterior. Sabemos que na populao,


verifica-se que X e Y se relacionam por:
Yi = 5 + 2 X i + i

Ou seja, os pares ordenados ( X i , Yi ) giram em torno da reta Yi = 5 + 2 X i graas varivel


aleatria i .

Prof. Vtor Menezes www.estrategiaconcursos.com.br 10


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Entretanto, comum que no tenhamos acesso a toda a populao. Conhecemos apenas


uma amostra. Ora, se temos acesso apenas a uma amostra, como saber qual a reta que
representa adequadamente a relao existente na populao inteira?
Suponha que fizemos uma amostragem de 42 pares de valores de (X,Y), conforme tabela
abaixo:

Quadro 3 Amostra com 42 pares (X,Y)


Y X Y X Y X
7,063739369 2 13,00534171 3 9,94831727 3
11,95962905 5 9,82060755 2 12,55329724 4
10,86307743 2 5,144500964 1 14,78463119 5
9,717082904 3 12,88447035 5 10,67968811 3
10,06782671 2 14,46402381 4 5,624151428 3
14,90233153 4 9,778894668 3 8,989367058 2
9,246338915 2 7,114699575 2 17,07556754 5
12,38290526 4 10,05856893 3 11,80226689 3
15,98044467 3 15,58187542 5 12,87295011 4
6,626939124 2 9,415041267 2 8,836479018 3
11,73251019 3 9,513621757 2 4,243240553 1
14,69927599 4 9,472612778 3 5,20115496 1
12,31403234 4 12,09695304 3 14,88629319 5
5,7256837 2 15,04573598 4 11,74230544 3
O problema que geralmente surge na regresso linear o seguinte. No sabemos qual a
reta que representa adequadamente toda a populao. Neste exemplo que estamos
trabalhando, se conhecssemos toda a populao, saberamos que ela pode ser
representada por Yi = 5 + 2 X i . Entretanto, se no conhecermos toda a populao, no
temos como saber que a reta Yi = 5 + 2 X i representa a relao entre as variveis
estudadas.
Ou ainda: no sabemos que os pares ordenados vo se situar em torno da reta Yi = 5 + 2 X i .
O que pretendemos justamente determinar qual a reta em torno da qual os pontos (X, Y)
esto situados. Isto, baseando-nos apenas na amostra do Quadro 3.
Um mtodo para encontrar a melhor reta de regresso chamado de mtodos de mnimos
quadrados. A funo de primeiro grau que pretendemos encontrar da forma:
Yi = a + bX i

Onde a uma estimativa de , b uma estimativa de e Y uma estimativa de Y .


diferena entre Y e sua estimativa, chamamos desvio. O desvio dado por:
e = Y Y
Pelo mtodo de mnimos quadrados, tentamos obter uma reta de tal modo que a soma dos
quadrados dos valores de e (desvio) seja mnima.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 11


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

possvel demonstrar que os valores de a e b (estimadores de e ), obtidos a partir da


considerao de que a soma dos quadrados dos desvios seja mnima, so:

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

a = Y bX
Ou seja, a partir dos valores de X e Y pertencentes amostra, obtemos os valores de a e b
descritos acima. A partir deles, construmos a reta Yi = a + bX i .
Executando este procedimento no excel para a amostra do Quadro 3, obtemos:
a = 3,71
b = 2,33
O grfico abaixo representa os resultados obtidos:

Figura 1 Regresso linear entre variveis X e Y

Os pontos em azul escuro so os dados observados na amostra. So os pares ordenados


correspondentes amostra do Quadro 3. A reta laranja corresponde reta real. a reta
que representa a populao inteira. Trata-se da reta Yi = 5 + 2 X i .
S que esta reta ns no conhecemos. No conhecemos toda a populao. Estamos
procurando por uma reta que simbolize a relao entre X e Y. O ideal seria chegar realmente
na reta laranja, que representa adequadamente toda a populao.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 12


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Contudo, tendo disponvel apenas uma amostra de 42 pares (X,Y), a reta de regresso que
calculamos, de tal forma que os desvios de estimativa cometidos se comportem segundo a
condio de mnimos quadrados, foi a reta azul.

2.3. Hipteses do modelo

Agora, alguns comentrios adicionais, que ficaram implcitos ao longo do exemplo.


O modelo de regresso linear faz algumas consideraes. So elas:
E ( i ) = 0

V ( i ) = 2

cov( i , j ) = 0 , para i j

Na primeira considerao, temos que o erro (varivel aleatria ) tem mdia zero. Esta
condio um pouco mais fcil de entender.
Basta imaginar a situao em que a varivel erro no tem mdia zero. Significa que j se
espera que, em mdia, se cometa um erro diferente de zero. J se sabe que a regresso tem
um vis (que pode ser positivo ou negativo). Ou seja, o modelo no est muito adequado.
melhor reformular o modelo.
A segunda considerao nos diz que a varincia do erro constante. Este fato denominado
homocedasticia. Isto foi utilizado quando dissemos que havia cinco populaes de valores
de Y (com mdias 7, 9, 11, 13 e 15). Em todas elas, o desvio padro era o mesmo (portanto,
a varincia tambm). Isto s possvel se a varivel tiver varincia constante. Ou seja, se
ela tiver sempre a mesma varincia, independente de qual o valor de X.
A terceira condio nos diz que os erros cometidos no so correlacionados.

Pergunta: Professor, preciso me preocupar com estas hipteses?


Resposta: no, em concursos abertos a candidatos de todas as reas, no h maiores
cobranas sobre tais hipteses. O exerccio simplesmente diz que elas foram atendidas e
pronto. Nosso trabalho s aplicar as frmulas para achar a e b . S as mencionei porque,
se a questo falar qualquer coisa a respeito, a vocs no precisam ficar preocupados,
achando que uma coisa de outro mundo. s calcular normalmente os coeficientes a e
b, e pronto.

2.4. Visualizando os desvios

Considere o diagrama de disperso abaixo, relacionando peso e altura de um certo grupo de


indivduos.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 13


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Figura 2 Diagrama de disperso peso x altura


Considere que esta seja apenas uma amostra contendo pesos e alturas para um certo
nmero de pessoas pesquisadas. Vimos que o coeficiente de correlao indica que existe
certa relao linear para as variveis peso e altura.
Na regresso linear, estamos interessados em saber que relao essa. Encontrar a funo
de primeiro grau que representa a relao entre peso e altura.

Seja Y o peso. Seja X a altura.


O modelo de uma regresso linear simples :
Yi = + X i + i
Relembrando. Neste modelo, e so constantes. Assim, se o modelo fosse apenas
Yi = + X i , a teramos efetivamente uma funo de primeiro grau. A relao entre peso
e altura seria exatamente uma reta. Mas no o que acontece. A relao no exatamente
uma reta.
Estamos considerando que, alm da componente linear + X i , o valor do peso ainda
depende de uma parcela aleatria. Trata-se da varivel aleatria .
Esta varivel aleatria que responsvel pelo fato dos pontos se dispersarem em torno da
reta que representa a relao linear entre X e Y. Reta esta que ns estamos querendo
determinar. A varivel aleatria pode ser vista como um erro em torno da reta de
regresso.

Suponha que a reta laranja da figura abaixo seja a reta de regresso (ou seja, a reta que
representa a relao linear existente na populao de valores (X,Y)).

Prof. Vtor Menezes www.estrategiaconcursos.com.br 14


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Figura 3 Reta de regresso

Considere que a equao da reta de regresso seja:


Y = 100 X 106
E esta reta ns no conhecemos, pois no temos acesso a toda a populao. Ns queremos
justamente encontrar esta reta, a partir da amostra fornecida.
Vamos nos fixar na reta Y = 100 X 106
Vamos tomar o valor de altura igual a 1,86m.

Figura 4 Reta de regresso: destaque para X = 1,86

Vamos calcular Y para o caso em que X = 1,86 m


Y = 100 X 106
Y = 186 106 = 80
O peso correspondente 80 ( Y = 80 ). Assim, a reta de regresso passa pelo ponto (1,86;
80).

Prof. Vtor Menezes www.estrategiaconcursos.com.br 15


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Para a nossa amostra (pontos azuis da figura acima), observe que h diversos valores de
peso para a altura igual a 1,86.
Assim, no nosso grupo de pessoas pesquisadas, h cinco com altura de 1,86m. Uma delas
tem peso 70,67 kg. A outra tem 71,01 kg (estes dois primeiros valores esto sobrepostos na
figura acima). Uma terceira tem 79,91 kg. A quarta tem 76,79 kg. E a quinta tem 83,69.
Com nosso modelo de regresso linear, queremos dizer que, para cada valor de X (altura),
os valores de Y correspondentes (peso) giram em torno da reta de regresso. Deste modo,
considerando todas as pessoas com altura 1,86 m, elas tm, em mdia, um peso de 80 kg.
Para uma dada amostra, obteremos pontos que no necessariamente ficam sobre a reta de
regresso. Eles podem perfeitamente cair fora da reta de regresso por causa de um erro
aleatrio ( ). De fato, para o exemplo acima, nenhuma das cinco pessoas com altura de
1,86 tinha peso exatamente igual a 80 kg. A reta de regresso s nos informa valores
mdios, em torno dos quais giram os valores da populao.
Dizendo de outro modo: o que a reta de regresso indica, no caso de X = 1,86 que, se
tivssemos acesso a toda a populao de pessoas com 1,86 m de altura, o peso de tais
pessoas teria mdia 80 kg e varincia igual a 2 .
Assim, quando a altura (= X) vale 1,86, os valores de peso giram em torno de 80. No caso
desta amostra, eles foram iguais a 70,67; 71,01; 79,91 76,79; 83,69. Os valores de peso
esto dispersos em torno de 80 kg.
Quando afirmamos que a varivel tem varincia constante, queremos dizer que, se
pudssemos analisar toda a populao de pessoas com altura de 1,86 m, os pesos destas
pessoas teria mdia 80 kg e varincia 2 .
Mudemos de ponto. A reta de regresso passa pelo ponto (1,90; 84). Ou seja, Y = 84 kg
quando X = 1,90 m.
Assim, quando X = 1,90 m, temos que os valores de Y vo girar em torno de 84 kg. Eles
estaro dispersos em torno de 84 kg, tambm com varincia 2 (pois a varincia
considerada constante). Tendo acesso toda a populao de pessoas com altura 1,90 m,
verificaramos que o peso destas pessoas tem mdia 84 kg e varincia 2 .
E assim por diante. Ou seja, para qualquer valor de X que adotarmos, os valores de Y
correspondentes tero varincia 2 e mdia dada pela reta de regresso.
O problema que, em geral, temos acesso apenas a uma amostra. No conhecemos a real
reta de regresso. No conhecemos a reta laranja da Figura 3. Neste caso, tentaremos
encontrar uma reta que, considerando apenas a amostra que temos disposio, seja a
melhor estimativa para a reta real de regresso. Para tanto, voltemos ao nosso diagrama de
disperso.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 16


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Figura 5 Retas para representar a relao linear

Desenhei duas retas (uma verde e uma vermelha) que poderiam representar a relao linear
entre peso e altura. Qual delas escolher? A verde? A vermelha? Nenhuma? Ser que existe
outra reta que representa melhor a relao linear entre peso e altura?
Lembrem-se de que estamos procurando, a partir da amostra conhecida (valores dos pontos
azuis da figura acima), encontrar uma estimativa para a reta de regresso.

O mtodo que estamos estudando para encontrar a melhor reta de regresso chamado de
mtodos de mnimos quadrados. A funo de primeiro grau que pretendemos encontrar
da forma:
Yi = a + bX i

Onde a uma estimativa de , b uma estimativa de e Y uma estimativa de Y .


Suponhamos que a reta vermelha da Figura 5 seja a reta que representa melhor a relao
linear, obtida a partir do mtodo de mnimos quadrados. Ela a nossa reta calculada, a
partir da amostra.
Como obt-la? Basta pegar os valores de X e Y da amostra e calcular:

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

a = Y bX

Prof. Vtor Menezes www.estrategiaconcursos.com.br 17


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Figura 6 Reta de regresso obtida por mnimos quadrados

Lembrem-se de que a reta laranja (Figura 3) a reta de regresso que ns no conhecemos


e que representa adequadamente a populao. A reta vermelha da Figura 6 a reta obtida,
a partir dos valores pesquisados (pontos azuis da mesma Figura 6), numa tentativa de
aproximar a real reta de regresso (reta laranja). Elas podem ser iguais ou no.
Vamos identificar todos os elementos a que temos nos referido. Para tanto, vamos nos
concentrar no ponto em que a altura vale 1,98 (ponto destacado, na Figura 6, com o crculo
vermelho).
Na figura abaixo, temos apenas este ponto:

Figura 7 Ponto (1,98; 97,41) e reta obtida por mnimos quadrados

Para a altura 1,98 m (X=1,98), o peso obtido de 97,41 kg. Este o valor de Y.
X = 1,98 Y = 97,41
Para este valor de X (1,98) nossa reta de regresso calculada (reta vermelha) indica que a
estimativa do valor de Y 92,90 kg.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 18


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Ou seja, a estimativa de Y :
Y = 92,90
diferena entre Y e sua estimativa, chamamos desvio. O desvio, neste caso, fica:
e = Y Y = 97,41 92,90 = 4,51
Pelo mtodo de mnimos quadrados, tentamos obter uma reta de tal modo que a soma dos
quadrados dos valores dos desvios seja mnima.
Repetindo: possvel demonstrar que os valores de a e b (estimadores de e ), obtidos
a partir da considerao de que a soma dos quadrados dos desvios seja mnima, so:

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

a = Y bX
Ou seja, a partir dos valores de X e Y da amostra, obtemos os valores de a e b descritos
acima. A partir deles, construmos a reta Yi = a + bX i , que a reta vermelha da Figura 6.

2.5. Igualdades envolvendo somatrio

Para resolver alguns problemas de regresso linear, pode ser til conhecer algumas
igualdades envolvendo somatrios, resumidas no quadro abaixo:

Quadro 4 Igualdades envolvendo somatrio

Transformaes importantes:

[(X ) ( )]
n n

i X Yi Y = ( X i Yi ) n X Y
i =1 i =1

(X ) = (X ) n X
n n
2 2
X
2
i i
i =1 i =1

(Y Y ) = (Y ) nY
n n
2 2 2
i i
i =1 i =1

Alguns livros tentam simplificar um pouco a escrita. Para tanto, eles representam por letra
minscula a diferena entre uma varivel e sua mdia.
Exemplo:
8 =  
9 =  

Prof. Vtor Menezes www.estrategiaconcursos.com.br 19


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Com isso, as transformaes do quadro acima podem ser reescritas:


 

: 8 9 = :   ;
 
 

: 8  = :   ; 
 
 

: 9  = :   ; 
 

E as frmulas para ' e ( ficam:


89
(=
8
' =  (

2.6. Calculando a reta de regresso

At aqui dei resultados prontos, s para que pudssemos entrar em contato com os
conceitos envolvidos na regresso. Agora vamos, de fato, fazer contas.
Para praticar, vamos calcular a reta de regresso para o caso dos quatro alunos que fizeram
as provas de fsica e matemtica (exemplo utilizado no tpico de correlao). Vamos
considerar que estes 4 alunos so uma amostra de um conjunto maior de estudantes que se
submeteram tal prova.
As notas desses alunos so:
Aluno Nota de matemtica Nota de fsica
(X ) (Y )
1 2 6
2 6 7
3 8 7
4 10 8
Mdia 6,5 7
Estamos supondo que a populao de notas de fsica da qual foram tiradas as notas acima
pode ser descrita segundo o seguinte modelo:
Yi = + X i + i
Ou seja, estamos supondo que existe uma relao entre as notas de matemtica e fsica. A
parcela um erro aleatrio. Engloba todas outras variveis (distintas da nota em
matemtica) que influenciam na nota de fsica.
A partir destes valores de notas, construmos o quadro abaixo:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 20


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Aluno X Y XX Y Y (X X ) (Y Y ) (X X ) (Y Y )
2 2

1 2 6 -4,5 -1 4,5 20,25 1


2 6 7 -0,5 0 0 0,25 0
3 8 7 1,5 0 0 2,25 0
4 10 8 3,5 1 3,5 12,25 1
TOTAL 8 35 2
Vamos calcular os coeficientes a e b .

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

8
b= 0,23
35
a = Y bX
8
a =7 6,5 5,51
35
E a reta de regresso estimada (calculada) fica:
Y = 5,51 + 0,23 X
Repare que no sabemos se esta a real reta de regresso. Mas, a partir dos valores de
nossa amostra, esta a nossa estimativa para a reta de regresso. uma reta tal que a
soma dos quadrados dos desvios mnima. Lembrando que o desvio corresponde
diferena entre valor observado ( Y ) e sua estimativa ( Y ).
A tabela abaixo mostra os valores estimados da nota de fsica, dados os valores da nota de
matemtica.
Aluno Nota de matemtica Nota de fsica Nota de fsica estimada
(X ) observada (Y ) ()
Y
1 2 6 5,97
2 6 7 6,89
3 8 7 7,34
4 10 8 7,80
Plotando estes valores num grfico, ficamos com:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 21


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Figura 8 Reta de regresso estimada

A reta em vermelho tal que a soma dos quadrados dos desvios em relao s notas de
fsica realmente obtidas mnima. a nossa reta estimada (calculada).
O modelo de regresso :
Yi = + X i + i
Como no temos acesso populao inteira, no sabemos quais os valores de e .
Temos condies apenas de estim-los (obtendo a e b )
Com isso, a reta de regresso estimada :
Yi = a + bX i
Ou seja, a e b so estimadores para e . So estimadores no viciados. Isto porque,
obedecidas algumas condies (aquelas que indicamos anteriormente: E ( i ) = 0 ;
V ( i ) = 2 e cov( i , j ) = 0 , para i j ), possvel demonstrar que:
E (b) = e
E (a) =

Questo 2 PETROBRAS 2008/2 [CESGRANRIO]


Na estimativa de uma regresso linear, o problema da heterocedasticidade ocorre quando
(A) os dados so transversais.
(B) h autorrelao dos resduos.
(C) h correlao positiva entre as variveis independentes.
(D) a varincia dos erros no constante.
(E) as variveis independentes so negativas.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 22


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Resoluo.
Vimos que uma das hipteses do modelo que a varincia dos erros seja constante
(homocedasticia). Se a varincia dos erros no constante, temos a heterocedasticidade.
Gabarito: D

Questo 3 BACEN 2006 [FCC]


Uma empresa, com finalidade de determinar a relao entre gastos anuais com propaganda
(X), em R$ 1.000,00 e o lucro bruto anual (Y), em R$ 1.000,00, optou por utilizar o modelo
linear simples Yi = + X i + i , em que Yi o valor do lucro bruto auferido no ano i e i o
erro aleatrio com as respectivas hipteses consideradas para a regresso linear simples (
e so parmetros desconhecidos). Considerou, para o estudo, as seguintes informaes
referentes s observaes nos ltimos 10 anos da empresa:
10 10 10 10

Yi = 100 ;
i =1
X i = 60 ;
i =1
X i Yi = 650 ; ( X i )2 = 400 ; (Yi )2
i =1 i =1
= 1080

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que, caso
haja um gasto anual com propaganda de 80 mil reais, a previso do lucro bruto anual, em
mil reais, ser de:
a) 84
b) 102,5
c) 121
d) 128,4
e) 158

Resoluo.
As hipteses que o enunciado disse que foram obedecidas so aquelas que indicamos
anteriormente - E ( i ) = 0 ; V ( i ) = 2 e cov( i , j ) = 0 , para i j .

Para calcular a previso, precisamos encontrar os valores de a e b do modelo de


regresso.

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

b=
(X Y ) n X Y
i i

(X ) n X
2 2
i

Prof. Vtor Menezes www.estrategiaconcursos.com.br 23


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

650 10 6 10
b=
400 10 6 2
650 600 50
b= = = 1,25
400 360 40
E o valor de a fica:
a = Y bX
100 60
a= 1,25 = 10 7,5 = 2,5
10 10
Portanto, o modelo de regresso :
Yi = a + bX i

Yi = 2,5 + 1,25 X i

Quando X i = 80 , a estimativa do lucro bruto fica:

Yi = 2,5 + 1,25 80 = 102,5


Gabarito: B.

Outra questo bem parecida:

Questo 4 BACEN 2006 [FCC]


Uma empresa, com finalidade de determinar a relao entre gastos anuais em pesquisa e
desenvolvimento (X), em milhares de reais, e o acrscimo anual nas vendas (Y), tambm em
milhares de reais, optou por utilizar o modelo linear simples Yi = + X i + i , em que Yi
o acrscimo nas vendas no ano i e i o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples ( e so parmetros desconhecidos).
Considerou, para o estudo, as seguintes informaes referentes s observaes nos ltimos
10 anos da empresa:
10 10 10 10

Y
i =1
i = 160 ; X
i =1
i = 100 ; X i Yi = 1900 ; (X )
i =1
i
2
= 1200 ; (Y )
i =1
i
2
= 3060

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, obteve-se, para
um determinado gasto em pesquisa e desenvolvimento, uma previso de acrscimo nas
vendas no valor de 19 mil reais. O valor que se considerou para o gasto com pesquisa e
desenvolvimento, em mil reais, foi:
a) 14
b) 13,75
c) 13,0

Prof. Vtor Menezes www.estrategiaconcursos.com.br 24


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

d) 12,4
e) 12,0

Resoluo.
Para calcular a previso, precisamos encontrar os valores de a e b do modelo de
regresso.

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

b=
(X Y ) n X Y
i i

(X ) n X
2 2
i

1.900 10 16 10 300
b= = = 1,5
1.200 10 10 2 200
E o valor de a fica:
a = Y bX
160 100
a= 1,5 = 16 15 = 1
10 10
Portanto, o modelo de regresso :
Yi = a + bX i

Yi = 1 + 1,5 X i

Quando Yi = 19 , o valor de X i :

19 = 1 + 1,5 X i
18
Xi = = 12
1,5

Gabarito: E.

Questo 5 SEFAZ SP 2006 [FCC]


Em um determinado pas, deseja-se determinar a relao entre a renda disponvel (Y), em
bilhes de dlares, e o consumo (C), tambm em bilhes de dlares. Foi utilizado o modelo
linear simples Ci = + Yi + i , em que Ci o consumo no ano i, Yi o valor da renda
disponvel no ano i e i o erro aleatrio com as respectivas hipteses para a regresso
linear simples, e so parmetros desconhecidos, cujas estimativas foram obtidas

Prof. Vtor Menezes www.estrategiaconcursos.com.br 25


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

atravs do mtodo dos mnimos quadrados. Para obteno desta relao considerou-se
ainda as seguintes informaes colhidas atravs da observao nos ltimos 10 anos:
10 10 10 10 10

C i = 90 ,
i =1
Yi = 100 ,
i =1
Yi Ci = 1.100 ,
i =1
Yi = 1.250 ,
i =1
2
C
i =1
i
2
= 1.010

Para o clculo do coeficiente de correlao de Pearson (r), usou-se a frmula:


cov(Y , C )
r= em que cov(Y , C ) a covarincia entre Y e C, DP(Y ) o desvio
DP ( y ) DP (C )
padro de Y e DP(C ) o desvio padro de C.
Ento:
a) obtendo para um determinado ano uma previso para o consumo de 10 bilhes de
dlares, significa que a renda disponvel considerada foi de 12,5 bilhes de dlares.
b) o valor da estimativa encontrado para o parmetro igual a 0,4
c) o valor da estimativa encontrado para o parmetro igual a 10.
d) o coeficiente de explicao r2 correspondente 64%.
e) utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que,
em um ano, caso a renda disponvel seja igual a 15 bilhes de dlares, o consumo ser igual
a 13 bilhes de dlares.

Resoluo.
Vamos encontrar os valores de a e b.

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

b=
(X Y ) n X Yi i

(X ) n X
2 2
i

S que aqui, no lugar de X temos Y. E no lugar de Y temos C.

b=
(Y C ) nCY
i i

(Y ) nY
2 2
i

1.100 10 9 10 200
b= = = 0,8
1.250 10 10 2 250
Assim, a estimativa para o parmetro igual a 0,8. A letra B est errada.

a = Y bX
S que aqui, em vez de X temos Y e em vez de Y temos C.
a = C bY

Prof. Vtor Menezes www.estrategiaconcursos.com.br 26


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

a = 9 0,8 10 = 1
A estimativa do parmetro igual a 1. A letra C est errada.

Se para um determinado ano a previso de consumo for de 10 bilhes, ento a renda


considerada foi:
C = a + bY
10 = 1 + 0,8Y

Y=
(10 1) = 11,25
0,8
A letra A tambm est errada.

Caso a renda disponvel seja de 15 bilhes, o consumo ser:


C = a + bY
C = 1 + 0,8 15 = 13
A letra E est correta.
Gabarito: E.

Questo 6 TCE/MG 2007 [FCC]


Um estudo realizado em uma empresa sobre a relao entre o lucro bruto anual (Y), em
milhares de reais, e os gastos anuais com propaganda (X), tambm em milhares de reais,
indica que uma boa opo a utilizao do modelo linear simples Yi = + X i + i , em que
Yi o lucro bruto no ano i, X i representa os gastos com propaganda no ano i, i o
erro aleatrio com as respectivas hipteses consideradas para a regresso linear e e
so parmetros desconhecidos. por meio do mtodo dos mnimos quadrados obteve-se o
valor de 150 para a estimativa do parmetro , considerando as seguintes informaes
obtidas pelas observaes nos ltimos 10 anos:
10 10

Yi = 2.500
i =1
X
i =1
i = 400

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, caso a empresa
almeje obter em um determinado ano um lucro bruto de 450 mil reais, deve apresentar um
total de gastos com propaganda, em mil reais, de:
a) 60
b) 80
c) 120
d) 160
e) 200

Prof. Vtor Menezes www.estrategiaconcursos.com.br 27


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Resoluo.
Podemos calcular as mdias de X e Y.
10

Y i
2.500
Y= i =1
= = 250
10 10
10

X i
400
X = i =1
= = 40
10 10
Sabemos que a estimativa de dada por:
a = Y bX
150 = Y b X
150 = 250 b 40 b = 2,5
A reta de regresso fica:
Yi = a + bX i

Yi = 150 + 2,5 X i
Para obter um lucro de 450 mil reais, temos:
450 = 150 + 2,5 X i X i = 120
Gabarito: C.

Questo 7 SEAD/PM Santos/2005 [FCC]


Para resolver questo seguinte, considere que foi realizado um estudo em um pas com a
finalidade de se determinar a relao entre a Renda Disponvel (Y), em milhes de dlares, e
o consumo (C), tambm em milhes de dlares.
Sabe-se que foi utilizado o modelo linear simples Ci = a + bYi + ei , em que Ci o consumo
no ano i, Yi a renda disponvel no ano i e ei o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples.
Este estudo apresentou as seguintes informaes colhidas atravs da observao nos
ltimos 10 anos:
10 10 10 10 10
= 800 = 1.000 = 83.600 = 105.000 = 67.240
2 2
C
i =1
i Y
i =1
i Y C
i =1
i i Y
i =1
i C
i =1
i

A equao da reta ajustada pelo mtodo dos mnimos quadrados encontrada foi:
a) C i = 20 + 0,60 Yi

b) C i = 10 + 0,70 Yi

Prof. Vtor Menezes www.estrategiaconcursos.com.br 28


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

c) C i = 8 + 0,72 Yi

d) C i = 6 + 0,74 Yi

e) C i = 4 + 0,76 Yi

Resoluo.
Ns temos representado os parmetros do modelo por e . E representamos suas
estimativas por a e b .
Pois bem, neste exerccio os parmetros esto sendo chamados de a e b . Vamos chamar
suas estimativas de a e b .
Outra mudana nos nomes a que segue. Geralmente chamamos a varivel independente
de X e a dependente de Y. Aqui elas foram trocadas, respectivamente, por Y e C.

b =
[(Y Y ) (C C )]
i i

(Y Y )
2
i

b =
(Y C ) n Y C
i i

(Y ) nY
2 2
i

83.600 10 100 80
b = = 0,72
105.000 10 100 2
E com isso j d para marcar a letra C.

De todo modo, vamos encontrar a estimativa de a


a = C bY = 80 0,72 100 = 8
A reta de regresso fica:
C i = 8 + 0,72 Yi
Gabarito: C.

Questo 8 TJ PAR 2009 [FCC]


Em uma determinada empresa realizado um estudo sobre a relao entre os gastos com
publicidade, em R$ 1.000,00, e o acrscimo no faturamento anual, em R$ 1.000,00. Foi
escolhido para anlise o modelo linear simples Yi = + Xi + i, sendo que Yi o acrscimo
no faturamento do ano i, Xi representa os gastos com publicidade no ano i e i o erro
aleatrio com as respectivas hipteses consideradas para a regresso linear simples ( e
so parmetros desconhecidos ). Para obteno das estimativas de e utilizou-se o
mtodo dos mnimos quadrados com base nas informaes dos ltimos 10 anos da
empresa, ou seja:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 29


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

10 10 10 10 10
= 180 ; = 100 ; = 1.912 ; = 1.080 ; = 3.440
2 2
Y
i =1
i X
i =1
i X Y
i =1
i i X
i =1
i Y
i =1
i

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que se a
empresa almejar um acrscimo no faturamento, em um determinado ano, de R$ 25.000,00
dever apresentar, neste perodo, um total em gastos com publicidade de
(A) R$ 20.000,00.
(B) R$ 18.000,00.
(C) R$ 17.000,00.
(D) R$ 16.000,00.
(E) R$ 15.000,00.

Resoluo:
Vamos mais rapidamente?
1912 1800
b= = 1,4
1080 1000
a = 18 1,4 10 = 4
Modelo:
Y = 4 + 1,4 X
25 = 4 + 1,4 X X = 15
Gabarito: E

Questo 9 TJ PI 1009 [FCC]


Considere que foi obtido atravs do mtodo dos mnimos quadrados o ajustamento do
modelo Yi = + X i + i , em que i corresponde a i-sima observao, e so
parmetros desconhecidos e i o erro aleatrio, com as respectivas hipteses consideradas
para a regresso linear simples. Foi utilizada uma amostra aleatria com 100 pares de
observaes (Xi, Yi), i = 1, 2, 3, . . . , 100; obtendo-se para a estimativa de o valor de 2,5. O
valor da mdia das observaes Xi foi igual a 30 e de Yi igual a 100.
O valor encontrado da estimativa de foi igual a
(A) 70.
(B) 50.
(C) 40.
(D) 25.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 30


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

(E) 20.

Resoluo:
' =  ( 
' = 100 2,5 30
' = 100 75 = 25
Gabarito: D

Questo 10 TJ PI 1009 [FCC]


Considere que foi obtido atravs do mtodo dos mnimos quadrados o ajustamento do
modelo Yi = + X i + i , em que i corresponde a i-sima observao, e so
parmetros desconhecidos e i o erro aleatrio, com as respectivas hipteses consideradas
para a regresso linear simples. Foi utilizada uma amostra aleatria com 100 pares de
observaes (Xi, Yi), i = 1, 2, 3, . . . , 100; obtendo-se para a estimativa de o valor de 2,5. O
valor da mdia das observaes Xi foi igual a 30 e de Yi igual a 100.
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que para
um valor estimado de 115 para Y, o valor correspondente de X
(A) 24.
(B) 36.
(C) 46.
(D) 48.
(E) 52.

Resoluo:
No exerccio anterior vimos que a estimativa de = 25.
Assim, a reta obtida pelo mtodo dos mnimos quadrados fica:
> = ' + (
Para Y estimado em 115, temos:
115 = 25 + 2,5
115 25 = 2,5
90
= = 36
2,5
Gabarito: B

Prof. Vtor Menezes www.estrategiaconcursos.com.br 31


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 11 SEFAZ SP 2009 [FCC]


O grfico abaixo demonstra a evoluo da receita tributria anual no estado de So Paulo
desde 1999, com os valores arrecadados em bilhes de reais.

Para estimar a receita tributria em um determinado ano com base no comportamento


sugerido pelo grfico, adotou-se o modelo Yt = + t + t ; t = 1, 2, 3 ..., sendo Yt = ln(RTt )
Yt = ln (RTt), em que RTt a receita tributria no ano (1998+t) em bilhes de reais e ln o
logaritmo neperiano ( ln e = 1). e so parmetros desconhecidos e t o erro aleatrio
com as respectivas hipteses consideradas para o modelo de regresso linear simples.
Utilizando o mtodo dos mnimos quadrados, com base nas observaes de 1999 a 2008,
obteve-se para a estimativa de o valor de 0,12, sabendo-se que:
10

Y t = 39,0
t =1

A previso da receita tributria para 2009, em bilhes de reais, em funo da equao


obtida pelo mtodo dos mnimos quadrados igual a
(A) e4,58
(B) e4,56
(C) e4,44
(D) e4,32
(E) e4,20

Resoluo:
A mdia de Y pode ser calculada a partir do somatrio fornecido:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 32


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

39
 = = 3,9
10
A mdia de t igual a 5,5 (mdia dos nmeros naturais de 1 at 10).
? = 5,5
Logo:
' =  ( ?
' = 3,9 0,12 5,5
' = 3,24
Portanto:
> = ' + (?
> = 3,24 + 0,12 11 = 4,56
Sabemos que:
 = ln(DE )
Logo:
DE = F "GG
Portanto, a estimativa da receita tributria ser:
F H,IJ
Gabarito: B

Questo 12 MP RO 2005 [CESGRANRIO]


Considere os dados amostrais de um estudo da relao entre o nmero de anos que os
candidatos a empregos em um determinado banco comercial estudaram ingls na faculdade
e as notas obtidas em um teste de proficincia nessa lngua.

Com base nessas informaes, a reta de mnimos quadrados que melhor explica a relao
entre o nmero de anos de estudo e a nota do teste de ingls igual a:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 33


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

(A) y = 1,33 + 3,56x


(B) y = 2,25 + 1,32x
(C) y = 6,97 + 3,56x
(D) y = 35,32 + 10,9x
(E) y = 254,56 + 13,3x

Resoluo.
Nas questes anteriores, o enunciado sempre fornecia diversos somatrios, para facilitar o
trabalho braal. Isto no aconteceu nesta questo. Ou seja, para calcular a reta de
regresso, precisaramos fazer todas as contas na mo, o que toma muito tempo.
Talvez por este motivo a questo apresente alternativas muito diferentes entre si.
Observem que, para qualquer valor de x entre 2 e 5, y no supera 10. J podemos descartar
as alternativas C, D, E, que prevem valores altos para y (muito superiores a 10), mesmo
quando x baixo.
Para se ter uma idia, considere a letra E. Se fizermos x igual a 1, y ser aproximadamente
igual a 270, algo totalmente incompatvel com a tabela fornecida.
Ficamos entre as alternativas A e B. Para escolher entre ambas, vamos trabalhar com os
valores extremos de x. Quando x igual a 2, as retas das letras A e B prevem os seguintes
valores para y:
Letra A: 8,45
Letra B: 4,89
Observem que o valor da Letra B muito mais prximo dos valores que y realmente
assume, quando x igual a 2. J d para marcar letra B.
Se voc ainda ficar em dvida, pode fazer o mesmo teste para x igual a 5. Neste caso, as
estimativas seriam:
Letra A: 19,13
Letra B: 8,85
Novamente, a estimativa da letra B foi bem melhor.
Gabarito: B

Questo 13 PETROBRAS 2008 [CESGRANRIO]


A tabela abaixo mostra as demandas que ocorreram numa determinada produo.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 34


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Com base nos conceitos de Regresso Linear Simples, quantas unidades compem a
demanda para julho?
(A) 4.000
(B) 5.000
(C) 6.000
(D) 7.000
(E) 8.000

Resoluo.
Outra questo que no forneceu somatrios. A vantagem agora que os nmeros
envolvidos so pequenos (isto no evita o trabalho braal, mas pelo menos deixa as contas
um pouquinho mais tranqilas).
Vamos dar nmeros para os meses do ano (1 para janeiro, 2 para fevereiro, e assim por
diante).
Para facilitar ainda mais nossos clculos, vamos indicar a demanda em mil unidades.
X Y XY
1 11 11
2 21 42
3 17 51
4 14 56
5 7 35
6 5 30
total 21 75 225
Temos:

X i = 21

= 1 + 4 + 9 + 16 + 25 + 36 = 91
2
X i

XY = 225
21
X = = 3,5
6

Prof. Vtor Menezes www.estrategiaconcursos.com.br 35


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

75
Y= = 12,5
6
Logo:

b=
[(X X ) (Y Y )]
i i

(X X )
2
i

b=
XY n X Y =
225 6 3,5 12,5
= 2,14
X nX
2 2
91 6 3,5 2

a = Y bX
a = 12,5 + 2,14 3,5 = 20
Deste modo, quando X = 7 , a estimativa da demanda fica:
Y = 20 2,14 7 = 5,02
Gabarito: B

Questo 14 SEFAZ MG 2005 [ESAF]


Considere o modelo de regresso linear
Yi = + X i + , i = 1, 2, ..., 25

Onde os Yi representam observaes da varivel resposta Y, os X i representam


observaes da varivel exgena X, e os i so erros no correlacionados com distribuio
comum normal com mdia zero e varincia 9. Em repetidas amostras do modelo, dado X i ,
assinale a opo que d a proporo esperada de observaes de Y que diferem em valor
absoluto de sua mdia por no mximo 1,5. Em sua resposta faa uso da tabela da funo de
distribuio (X ) da normal padro dada abaixo.

X (X )
0,40 0,655
0,50 0,691
1,00 0,841
1,50 0,933
a) 0,650
b) 0,950
c) 0,933
d) 0,382
e) 0,975

Prof. Vtor Menezes www.estrategiaconcursos.com.br 36


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Resoluo.
Para um dado valor X i , Yi dado por:

Yi = + X i +
A esperana de Yi fica:
E (Yi ) = E ( + X i + ) = E ( ) + E ( X i ) + E ( )
Como a esperana de igual a zero e os demais termos so constantes, ficamos com:
E (Yi ) = + X i
Isto equivale a dizer que a mdia de Y est justamente sobre a reta de regresso.

Para um dado valor de X i , a varincia de Yi fica:

Yi = + X i +

V (Yi ) = V ( ) + V ( X i ) + V ( )
A varincia de igual a 9 (dada no exerccio). Os demais termos so constantes (varincia
zero).
V (Yi ) = V ( ) = 9
Isto equivale a dizer que a varincia de Y, para um valor de X dado, igual varincia da
varivel .
Assim, a varivel Yi gira em torno de sua mdia com varincia 9. Como o exerccio disse que
tem distribuio normal, os valores de Yi giram em torno de sua mdia segundo uma
distribuio normal de varincia 9.
Gostaramos de saber o percentual de valores de Y que est a uma distncia de, no mximo,
1,5 da mdia. Precisaramos consultar a tabela de reas da varivel normal para o valor
+ X i + 1,5.
Contudo, a tabela fornecida no exerccio s para a varivel reduzida (= padro).
Precisamos utilizar a varivel reduzida:
Yi E (Yi )
Z=

Sabemos que a varincia 9.
2 =9 =3
+ X i + 1,5 + X i 1,5
Z= = = 0,5
3 3
Portanto, consultamos a tabela para o valor 0,5.
Da tabela, temos que 69,10% dos valores de Z so menores ou iguais a 0,5.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 37


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Portanto, 30,90% dos valores so superiores a 0,5. Como a varivel normal tem funo
densidade de probabilidade simtrica, 30,90% dos valores so inferiores a -0,5.

Figura 9 rea verde: percentual de valores da varivel Z entre -0,5 e 0,5

Resulta que 38,2% dos valores esto entre -0,5 e 0,5.


A proporo esperada de valores de Z que distam no mximo 0,5 de sua mdia igual a
38,2%.
O mesmo se aplica aos valores de Y que lhes so correspondentes. 38,2% dos valores de Y
distam no mximo 1,5 de sua mdia.
Gabarito: D.

Questo 15 MPOG 2006 [ESAF]


Com o objetivo de estimar-se o modelo Y = + X, foi retirada uma amostra com cinco
pares de observaes (X,Y), obtendo-se os seguintes resultados:

Desse modo,
a) Y = 2 2X
b) Y = 2 2X
c) Y = 2X
d) Y = 2 + 2X

Prof. Vtor Menezes www.estrategiaconcursos.com.br 38


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

e) Y = 2 + 2X

Resoluo:

=
(X Y ) n X Y
i i
=
140 5 3 8 140 120 20
= = =2
(X ) n X 55 5 3 2 55 45
2
2 10
i

= Y bX = 8 23 = 2

Assim, Y = + X=2+2x
Gabarito: D

2.7. Reta de regresso passando pela origem

H outro modelo de regresso ligeiramente diferente do que vimos at aqui, em que se faz
com que a reta passe pela origem. Este segundo modelo usado em casos excepcionais,
quando h alguma razo terica que nos indique ser esse o modelo mais adequado.
Vamos ver como ficaria este segundo modelo, por meio do exerccio a seguir.

Questo 16 TCU/2008 [CESPE]


Uma agncia de desenvolvimento urbano divulgou os dados apresentados na tabela
a seguir, acerca dos nmeros de imveis ofertados (X) e vendidos (Y) em determinado
municpio, nos anos de 2005 a 2007.

Ano Nmero de imveis


Ofertados (X) Vendidos (Y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
Considerando as informaes do texto, julgue o item subseqente.
A estimativa do valor do coeficiente da reta de regresso Y = X , em que Y representa o
nmero esperado de imveis vendidos para uma quantidade X de imveis ofertados,
superior a 0,23 e inferior a 0,26.

Resoluo.
Seja a a estimativa de . Seja Y a estimativa de Y . Dados os valores de X , as estimativas
de Y ficam:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 39


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Y = aX
O desvio fica:
e = Y Y
e = Y aX
Somando os quadrados de todos os desvios, num conjunto de n observaes:
2
e 2
= (Y aX )

E queremos achar o valor de a que minimiza esta soma. possvel demonstrar que a
estimativa de a que minimiza a soma dos quadrados dos desvios dada por:

a=
( XY )
(X ) 2

Reta de regresso passando pela origem


Modelo: Y = X +
A estimativa de dada por:

a=
( XY )
(X ) 2

Esta a frmula que temos que usar.


Ano X Y X Y X2
2005 1.500 100 150.000 2.250.000
2006 1.750 400 700.000 3.062.500
2007 2.000 700 1.400.000 4.000.000
TOTAL 5.250 1200 2.250.000 9.312.500

a=
( XY )
(X ) 2

2.250.000
a= 0,242
9.312.500
Item correto.
Gabarito: certo

Questo 17 MP RONDNIA 2005 [CESGRANRIO]


No modelo de regresso Y = X + , o estimador de mnimos quadrados de :

Prof. Vtor Menezes www.estrategiaconcursos.com.br 40


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Resoluo.
Aqui, o coeficiente de angular da reta de regresso est sendo chamado de (quando, no
exerccio anterior, foi chamado de ).
Trata-se de aplicao direta da frmula estudada.
Gabarito: C

3. ANLISE DE VARINCIA DA REGRESSO

Um teste de hipteses muito comum aquele que testa a hiptese nula de que o
coeficiente da reta de regresso nulo. Caso a hiptese nula seja verdadeira, temos que
a reta de regresso horizontal.
Relembrando o significado da reta de regresso. Para cada valor de X ns temos uma sub-
populao de valores de Y, com mdia dada pela reta de regresso e varincia 2 .
Se a reta horizontal, ento todas as sub-populaes tero a mesma mdia.
Aula passada ns vimos uma ferramenta para testar se a mdia de diferentes populaes
so iguais entre si. Esta ferramenta era a anlise de varincia.
Como testar a hiptese de ser igual a zero equivale a testar a hiptese de as varais
populaes tm a mesma mdia, ento podemos usar a anlise de varincia para isso.
Vamos ver como fica.

3.1. Somas de quadrados

Quando utilizamos a regresso linear, obtemos Yi , que uma estimativa para Y . A


diferena entre estas duas grandezas o desvio.
ei = Yi Yi
Rearranjando os termos:
Yi = ei + Yi

Prof. Vtor Menezes www.estrategiaconcursos.com.br 41


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Subtraindo Y dos dois lados:


Yi Y = ei + Yi Y
Elevando ao quadrado:

(Y Y ) = (e + Y Y )
i
2
i i
2

(Y Y ) = e + (Y Y ) + 2 e (Y Y )
i
2
i
2
i
2
i i

Somando as parcelas acima para todos os valores de i:

) = e + (Y Y )
(Yi Y
2
i
2
i
2
[ (
+ 2 ei Yi Y )]
possvel demonstrar que [e (Y Y )] = 0 .
i i

Portanto:

(Y i Y ) = e + (Y Y )
2
i
2
i
2

E o que que temos a em cima? Temos somas de quadrados.


Cada uma destas parcelas recebe um nome especial:

(Y )
2
i Y soma de quadrados total (S.Q.Total)


2
e i soma de quadrados dos resduos (S.Q.Resduos)

(Y Y )
2
i soma de quadrados do modelo de regresso (S.Q.Regresso)
corresponde Soma de quadrado de tratamentos, vista na aula passada.
Portanto:
SQTotal = SQ Re gressao + SQ Re siduos
possvel demonstrar que:
SQ Re gressao = b X X Y Y [( )( )]
Onde b a estimativa do coeficiente angular da reta de regresso.

Resumo das somas de quadrados


SQTotal = SQ Re gressao + SQ Re siduos

SQ Re gressao = b X X Y Y [( )( )]

Prof. Vtor Menezes www.estrategiaconcursos.com.br 42


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Vamos calcular cada um destes valores para aqueles 4 alunos que fizeram as provas de fsica
e matemtica.
Aluno Nota de matemtica Nota de fsica
(X ) (Y )
1 2 6
2 6 7
3 8 7
4 10 8
Mdia 6,5 7

Nesta aula fizemos o modelo de regresso linear para, a partir das notas de matemtica,
estimar as notas de fsica. O resultado foi:

Aluno Nota de matemtica Nota de fsica Nota de fsica estimada


(X ) (Y ) Y()
1 2 6 5,97
2 6 7 6,89
3 8 7 7,34
4 10 8 7,80

A partir dos valores acima, podemos montar o quadro abaixo:


Nota de fsica Nota de fsica estimada (
e 2 = Y Y )2
(Y Y )
2
(Y Y )
2

(Y ) Y ()
6 5,97 0,0009 1,0609 1
7 6,89 0,0121 0,0121 0
7 7,34 0,1156 0,1156 0
8 7,80 0,04 0,64 1
TOTAL 0,1686 1,8286 2

Da ltima linha da tabela, temos:


SQTotal = 2
SQ Re gressao = 1,8286
SQ Re siduos = 0,1686
Note que:

(Yi Y ) = e + (Y Y )
2
i
2
i
2

Ou ainda:
SQTotal = SQ Re gressao + SQ Re siduos

Prof. Vtor Menezes www.estrategiaconcursos.com.br 43


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Na verdade, substituindo os valores, obtemos:


2 = 1,9972
A diferena se deve aos arredondamentos (os valores apresentados para as notas de fsica
estimada esto arredondados).

3.2. Quadrados mdios e estatstica F

A anlise de varincia, aplicada reta de regresso, serve para testar a hiptese de que
igual a zero.
Vimos que, para cada valor de X, ns temos uma populao de valores de Y que gira em
torno da reta de regresso. Caso a reta seja horizontal, todas as populaes de valores de Y
giraro em torno do mesmo valor. Todas elas tero a mesma mdia.
Logo, as somas de quadrados de desvios, acima definidas, podem ser usadas para testar a
hiptese de que o coeficiente igual a zero.
A hiptese nula ( = 0 ) nada mais que supor que a reta de regresso horizontal. Ou
seja, a hiptese de que todas as sub-populaes de Y provm, na verdade, de uma nica
populao (ou seja, apresentam mesma mdia e mesma varincia). E vimos na aula passada
que a anlise de varincia pode ser utilizada justamente para isso. Basta calcular a
estatstica F, com base nos quadrados mdios.
No caso da regresso linear, temos:

(Y )
2
i Y SQTotal n 1 graus de liberdade

SQ Re siduos n 2 graus de liberdade


2
e i

(Y Y )
2
i SQ Re gressao 1 grau de liberdade

E os quadrados mdios ficam assim.


SQTotal
Quadrado mdio total: QMTotal =
n 1
SQ Re siduos
Quadrado mdio dos desvios: QM Re siduos =
n2
SQ Re gressao
Quadrado mdio do modelo de regresso: QM Re gresso =
1

Para o caso dos alunos que fizeram as provas de fsica e matemtica, temos:
2 2
QMTotal = =
4 1 3

Prof. Vtor Menezes www.estrategiaconcursos.com.br 44


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

0,1686
QM Re siduos = = 0,0843
42
1,8286
QM Re gressao = = 1,8286
1
E a estatstica F fica:
QM Re gressao 1,8286
F _ teste = = = 21,71
QM Re siduos 0,0842

3.3. Coeficiente de determinao

As somas de quadrados servem para definir uma grandeza conhecida como coeficiente de
determinao da regresso linear.
Ele dado por:
SQ Re gressao
r2 =
SQTotal
Esta grandeza, no caso do modelo Yi = + X i + i , igual ao quadrado do coeficiente de
correlao linear, estudado na aula passada.
Se a soma dos quadrados dos resduos for pequena, de tal forma que r 2 se aproxime de 1,
isto significa que as diferenas entre os valores observados ( Yi ) e a mdia ( Y ) so quase
totalmente explicados pela reta de regresso.
Se a soma dos quadrados dos resduos for grande, de tal forma que r 2 se aproxime de zero,
isto significa que a reta de regresso pouco explica sobre as diferenas entre os valores
observados e a mdia. Ou seja, perca de tempo ficar calculando reta de regresso se ela
um estimador ruim.
Como o coeficiente de correlao (r) assume valores entre -1 e 1, ento o coeficiente de
determinao (r2) assume valores entre 0 e 1.

Questo 18 BACEN 2006 [FCC]


Uma empresa, com finalidade de determinar a relao entre gastos anuais com propaganda
(X), em R$ 1.000,00 e o lucro bruto anual (Y), em R$ 1.000,00, optou por utilizar o modelo
linear simples Yi = + X i + i , em que Yi o valor do lucro bruto auferido no ano i e i o
erro aleatrio com as respectivas hipteses consideradas para a regresso linear simples (
e so parmetros desconhecidos). Considerou, para o estudo, as seguintes informaes
referentes s observaes nos ltimos 10 anos da empresa:
10 10 10 10

Yi = 100 ;
i =1
X i = 60 ;
i =1
X i Yi = 650 ; ( X i )2 = 400 ; (Yi )2 = 1080
i =1 i =1

Prof. Vtor Menezes www.estrategiaconcursos.com.br 45


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Montando o quadro de anlise de varincia, tem-se que:


a) a variao explicada, fonte de variao devido regresso, apresenta um valor igual a 80;
b) dividindo a variao residual pela variao total, obtemos o correspondente coeficiente
de determinao;
c) o valor da estatstica F necessria para o teste da existncia de regresso igual ao
coeficiente da diviso da variao explicada pela variao residual
d) a variao residual apresenta um valor igual a 17,5
e) a variao total apresenta um valor igual a 62,5.
[Observao: considere que voc j sabe que os coeficientes a e b so dados por: a = 2,5 ;
b = 1,25 , conforme clculos da Questo 3]

Resoluo.
Em vez de utilizar o termo soma de quadrados, a questo est utilizando variao.
Assim, fazendo a correspondncia dos termos da questo com aqueles que ns vimos:
- Soma de quadrados total: variao total
- Soma de quadrados dos resduos: variao residual
- Soma de quadrados da regresso: variao explicada (ou seja, a parte da variao total
que explicada pelo modelo de regresso).
A variao total fica:

(
SQTotal = Yi Y )2

Utilizando a transformao que vimos:

(
SQTotal = Yi Y ) = Y
2
i
2
nY
2

SQTotal = 1.080 10 10 2 = 80
Portanto a letra E est errada.

A variao explicada (=variao do modelo = Soma de Quadrados da Regresso) fica:

[(
SQ Re gressao = b X X Y Y )( )]
Utilizando as transformaes vistas:
S Re gressao = b ( ( XY ) n X Y )
S Re gressao = b ( ( XY ) n X Y )

SQ Re gressao = 1,25 (650 10 6 10 ) = 1,25 50 = 62,5


Deste modo, a letra A est errada.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 46


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

A varincia residual (=Soma de Quadrados de Resduos) igual a:


SQ Re siduos = SQTotal SQ Re gresso = 80 62,5 = 17,5
E a letra D est correta.

Vamos checar a alternativa B.


Vimos que:
SQ Re gressao
r2 =
SQTotal
SQ Re siduos
A letra B pretende dizer que r 2 = , o que est errado.
SQTotal
Por fim, vejamos a letra C. A estatstica F dada por:
QM Re gressao SQ Re gressao / 1
F _ teste = =
QM Re siduos SQ Re siduos /( n 2)
SQ Re gressao
A alternativa C est errada, pois afirma que a estatstica F dada por ,
SQ Re siduos
ignorando as divises pelos graus de liberdade.
Gabarito: D.

Questo 19 SEAD/PM SANTOS 2005 [FCC]


Para resolver questo seguinte, considere que foi realizado um estudo em um pas com a
finalidade de se determinar a relao entre a Renda Disponvel (Y), em milhes de dlares, e
o consumo (C), tambm em milhes de dlares.
Sabe-se que foi utilizado o modelo linear simples C i = a + bYi + ei , em que Ci o consumo
no ano i, Yi a renda disponvel no ano i e ei o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples.
Este estudo apresentou as seguintes informaes colhidas atravs da observao nos
ltimos 10 anos:
10 10 10 10 10

Ci = 800
i =1
Yi = 1.000
i =1
Yi Ci = 83.600
i =1
Yi = 105.000
i =1
2
C
i =1
i
2
= 67.240

O coeficiente de correlao r de Pearson entre as variveis Y e C obtido pela frmula:


cov(C , Y )
r= em que:
DP (Y ) DP(C )
Cov(C,Y) a covarincia entre C e Y;
DP(Y) o desvio padro de Y

Prof. Vtor Menezes www.estrategiaconcursos.com.br 47


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

DP(C) o desvio padro de C.


Tem-se que o valor do correspondente de determinao r 2 igual a:
a) 60%
b) 72%
c) 76%
d) 80%
e) 90%

Resoluo:
Ns temos representado os parmetros do modelo por e . E representamos suas
estimativas por a e b .
Pois bem, neste exerccio os parmetros esto sendo chamados de a e b . Vamos chamar
suas estimativas de a e b .

SQTotal = Ci C ( )
2

(C ) nC
n
2 2
= i
i =1

Portanto:

(C ) nC
n
2
SQTotal = = 67.240 10 80 2 = 3.240
2
i
i =1

SQ Re gressao = b ( (YC ) n Y C )
SQ Re gressao = b (83.600 10 100 80)

L na Questo 7 ns vimos que b = 0,72


Logo:
SQ Re gressao = 0,72 (83.600 10 100 80 ) = 2.592
Por fim, chegamos a:
SQ Re gressao
r2 =
SQTotal
2.592
r2 = = 0,80
3.240
Gabarito: D

Prof. Vtor Menezes www.estrategiaconcursos.com.br 48


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 20 TCE RO 2005 [CESGRANRIO]


Avaliaes de terrenos baseiam-se, geralmente, em modelos de regresso linear nos quais o
preo de venda uma funo de algumas variveis tais como o tamanho do terreno, suas
condies e localizao. Uma amostra de terrenos comercializados no ltimo ms coletou
dados sobre o preo da venda, em R$ 1 000,00, o tamanho do terreno, em m2, e a distncia
ao centro da cidade, em km. Primeiramente obteve-se o modelo com apenas a varivel
tamanho do terreno, X1, como explicativa do preo de venda. Os principais quantitativos
relativos a esse modelo foram calculados como:

Considerando o quadro acima, os valores de X, Y e Z, respectivamente, so:


(A) 2826, 121 e 3,65E-07
(B) 2178, 121 e 0,77
(C) 2178, 36 e 0,77
(D) 648, 36 e 60,5
(E) 32,4, 18 e 34,1

Resoluo.
O quadrado mdio dos resduos igual a 36 (dado no enunciado).
SQ Re siduos
QM Re siduos = = 36
18
SQ Re siduos = 18 36 = 648
Logo:
X = 648
Com isso j podemos marcar a letra D.
O quadrado mdio dos resduos 36 (dado no enunciado). Portanto, Y = 36.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 49


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

A soma de quadrados total de 2826 (dado enunciado). Portanto, a soma de quadrados da


regresso :
SQ Re gressao = SQTotal SQ Re siduos
SQ Re gressao = 2826 648 = 2178
A estatstica F fica:
QM Re gressao SQ Re gressao / 1 2178
F _ teste = = = = 60,5
QM Re siduos 36 36
Gabarito: D

Questo 21 CAPES 2008 [CESGRANRIO]

O Coeficiente de Correlao Linear de Pearson entre os desempenhos de determinados


alunos em duas avaliaes nacionais igual a 0,844. Nesse caso, conclui-se que a proporo
da variabilidade nos resultados de uma das avaliaes explicada pela relao linear entre
elas
(A) 15,6%
(B) 39,4%
(C) 71,2%
(D) 84,4%
(E) 91,8%

Resoluo.
O coeficiente de determinao o quadrado do coeficiente de correlao.
r 2 = 0,844 2 = 0,712
Gabarito: C

Prof. Vtor Menezes www.estrategiaconcursos.com.br 50


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 22 PETROBRAS 2008 [CESGRANRIO]


Um modelo de regresso linear simples de Y em X, com uma varivel explicativa e o termo
constante, foi estimado com 32 observaes, gerando um r2 de 0,25. No teste de validade
do modelo, o F-calculado ou F-observado igual a
(A) 10
(B) 11
(C) 12
(D) 13
(E) 14

Resoluo.
SQ Re gressao
r2 =
SQTotal
SQ Re gressao
0,25 =
SQTotal
SQ Re gressao = SQtotal 0,25
Lembrando que:
SQTotal = SQ Re gressao + SQ Re siduos
Logo:
SQ Re siduos = 0,75 SQTotal
A estatstica F fica:

QM Re gressao SQ Re gressao / 1 0,25 SQtotal


F _ teste = = = = 10
QM Re siduos SQ Re siduos /(32 2) 0,75 SQTotal / 30
Gabarito: A

Questo 23 BNDES 2008/2 [CESGRANRIO questo adaptada]


Um experimento foi realizado com o objetivo de estimar o preo de uma ao, dado o seu
valor patrimonial, ambos em reais.
Uma amostra de aes negociadas recentemente forneceu dados sobre o preo e o valor
patrimonial por ao. Aplicou-se o modelo de regresso linear simples Y = + X + .
Alguns resultados da tabela da anlise da varincia, obtida a partir dos dados dessa amostra,
esto apresentados a seguir.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 51


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Julgue os itens abaixo:


I O coeficiente de determinao mostra que o modelo proposto explica aproximadamente
63% da variabilidade total.
II O valor da estatstica Fcalculado 100, e a concluso do teste que a varivel valor
patrimonial significativa, isto , deve-se rejeitar a hiptese nula H 0 : = 0 .

Resoluo.
Primeiro item.
SQ Re gressao = QM Re gressao / 1
SQ Re gressao = 56.000
O coeficiente de determinao fica:
SQ Re gressao 56.000
r2 = = = 0,63
SQTotal 88.480
Portanto, 63% da variao explicada pela reta de regresso. Ou seja, o modelo de
regresso explica 63% da variabilidade total. O primeiro item est certo.
Segundo item.
SQ Re siduos = SQTotal SQ Re gressao
SQ Re siduos = 88.480 56.000 = 32.480
A estatstica F fica:
QM Re gressao SQ Re gressao / 1 56.000
F _ teste = = = = 100
QM Re siduos SQ Re siduos /(60 2) 32.480 / 58
O segundo item tambm est certo.
Gabarito: Certo, certo

Embora esta informao no tenha sido necessria para resolver a questo, vamos falar
sobre o Fsig, que aparece na tabela.
O valor de Fsig nada mais que o valor descritivo do teste de hipteses para = 0 . Ou seja,
a probabilidade de uma varivel com distribuio F, com 1 grau de liberdade no
numerador e 58 no denominador, assumir valores maiores que 100 (que a estatstica
teste).

Prof. Vtor Menezes www.estrategiaconcursos.com.br 52


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 24 SEFAZ SP 2009 [ESAF]


Uma amostra aleatria simples (X1, Y1), (X2, Y2), ..., (Xn, Yn) de duas variveis aleatrias X e Y
forneceu as seguintes quantidades:

(X )
n
2
i X = 414
i =1

(Y )
n
2
i Y = 359
i =1

(X )
n

i X Yi = 345
i =1

Calcule o valor mais prximo do coeficiente de determinao da regresso linear de Y em X.


a) 0,88
b) 0,92
c) 0,85
d) 0,80
e) 0,83

Resoluo:
No caso do modelo usual de regresso linear, o coeficiente de determinao igual ao
quadrado do coeficiente de correlao.
Aqui a questo explora outra igualdade envolvendo somatrios.
O numerador da frmula do coeficiente de correlao :

[(X ) ( )]
n

i X Yi Y
i =1

Fazendo a multiplicao, ficamos com:

[(X ) ( ) ]
n

i X Yi X i X Y
i =1

Separando o somatrio da diferena em diferena de somatrios:

[( ) ] [( ) ]
n n
= X i X Yi X i X Y
i =1 i =1

A mdia de Y constante e pode sair do somatrio:

[( ) ] [( )]
n n
= X i X Yi Y X i X
i =1 i =1

A soma dos desvios em relao mdia de X igual a zero:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 53


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

[( ) ]
n
= X i X Yi Y 0
i =1

[( ) ]
n
= X i X Yi
i =1

Logo, outra frmula para o coeficiente de correlao seria:

[(X ) ]
n

i X (Yi )
r= i =1

(X ) (Y Y )
n n
2 2
i X i
i =1 i =1

E, para esta frmula, o enunciado j deu todas as contas prontas:


345
r=
414 359
Elevando o coeficiente ao quadrado:
345 345
r2 =
414 359
Fazendo a primeira diviso, temos:
345
r 2 = 0,83
359
O 0,83 est sendo multiplicado por um nmero menor que 1. Toda vez que multiplicamos
um nmero por outro que seja menor que 1, o nmero original diminui. Logo, a resposta
procurada ser menor que 0,83. A nica opo a letra D.
Gabarito: D

Questo 25 FUNASA 2009 [CESGRANRIO]


O estatstico de uma indstria de produtos dermatolgicos deseja estudar a relao
existente entre a satisfao do cliente (Y), em uma escala de 0 a 100, a sua idade (X1), em
anos, e o nvel de ansiedade (X2), em ndice. Para isso, foram selecionados 46 pacientes.
Primeiramente estudou-se a relao entre a satisfao do paciente e a sua idade.
a) Considerando o modelo de regresso Y = b0 + b1 X 1 + , determine os valores de A e B
da tabela da ANOVA.

Resoluo.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 54


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

QM Re gressao A
F _ calculado = = A = 67 36 = 2412
QM Re siduos 67
SQTotal SQ Re gressao = SQ Re siduos
5363 2412 = B
B = 2951
Obs: para esta questo, aberta, no consta o gabarito oficial no site da banca. Se vocs
acharem algum erro na minha resoluo, s falar.

Questo 26 BACEN 2001 [ESAF]


Um profissional da rea de recursos humanos est interessado em avaliar o efeito do tipo
de firma no salrio inicial de uma secretria. Neste contexto tomou uma amostra aleatria
de cinco secretrias iniciantes em cada um de trs tipos de firma, anotando o salrio em
reais por ms. O investigador postula que o salrio 9 K da j-sima secretria da isima firma
obedece o modelo linear 9 K = L + = + M K , i=1, 2, 3; j=1 ...5. Nesta expresso representa
uma mdia populacional, i o efeito fixo da firma i e os ij so erros no correlacionados
com distribuio normal, mdia zero e varincia constante. Neste contexto obtm a tabela
de anlise de varincia seguinte:

Assinale a opo que d o valor da estatstica F necessria para testar a hiptese de que os
efeitos das firmas sejam iguais.
a) 2,25
b) 3,00
c) 0,37
d) 0,73
e) 1,28

Resoluo:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 55


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Primeiro calculamos os quadrados mdios, dividindo as somas de quadrados pelos graus de


liberdade:
Fonte GL SQ QM (=SQ/GL)
Modelo 2 18050 9025
Resduos 12 48144 4012
A estatstica F igual relao entre o quadrado mdio do modelo e o quadrado mdio dos
resduos:
9025
N= 2,25
4012
Gabarito: A

Questo 27 PREFEITURA RJ 2010 [ESAF]


A partir de uma amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se

:  = 440


:  = 286


: ( ) = 850


: ( ) = 1.690


: ( )( ) = 1.105


Obtenha a reta de regresso linear de Y em X.


RQ = 13 + 0,65
a) 
RQ = 13 + 1,3
b) 
RQ = 20 + 0,65
c) 
RQ = 20 + 2
d) 
RQ = 13 + 1,3
e) 

Resoluo:
O coeficiente b da reta de regresso :
( )( ) 1.105
(= = = 1,3
( ) 850
O coeficiente a dado por:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 56


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

' =  (
286 440
'= 1,3
22 22
' = 13 1,3 20
' = 13
O que resulta em:
RQ = 13 + 1,3

Gabarito: E

Questo 28 PREFEITURA RJ 2010 [ESAF]


Com os dados da questo anterior, calcule o valor mais prximo do coeficiente de
determinao R2 da regresso linear de X em Y.
a) 0,65
b) 0,81
c) 0,85
d) 0,91
e) 0,88

Resoluo:
Primeiro calculamos a soma de quadrados total (SQT):

VWE = : ( ) = 1.690


Agora calculamos a soma de quadrados do modelo de regresso (SQM):



VWX = ( : ( )( )


VWX = 1,3 1.105 = 1.436,5


O coeficiente de determinao dado pela relao entre as duas somas de quadrado acima
calculadas:
1.436,5
D = = 0,85
1.690
Gabarito: C

Questo 29 SEFAZ MG 2005 [ESAF]


Suponha que no exista associao linear entre duas variveis X e Y e que um nmero de
observaes suficientemente grande de pares (X,Y) esteja disponvel para o estudo da

Prof. Vtor Menezes www.estrategiaconcursos.com.br 57


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

regresso linear de Y em X. Assinale a opo que corresponde, nesse caso,


aproximadamente, ao quadrado mdio do erro.
a) 0.
b) Quadrado do coeficiente de correlao amostral entre X e Y.
c) Quadrado mdio da regresso.
d) 1.
e) Varincia das observaes do atributo Y.

Resoluo:
Sabemos que o coeficiente de correlao linear entre as variveis nulo, pois no existe
relao linear. Assim:
=0
O coeficiente de determinao o quadrado do coeficiente de correlao linear. Logo,
tambm vale zero:
D = 0
Mas tal coeficiente igual diviso entre a soma de quadrados do modelo de regresso
(SQM) e a soma de quadrados total (SQT):
VWX
0= VWX = 0
VWE
Sabemos ainda que a soma de quadrados total (SQT) igual soma dos quadrados dos
desvios (SQD) mais a soma dos quadrados do modelo de regresso (SQM):
VWE = VWX + VWZ
VWE = 0 + VWZ
VWZ = VWE
Queremos calcular o quadrado mdio dos desvios, ou dos resduos. Vamos chamar de QMD.

Ele dado pela soma dos quadrados dos desvios (SQD), dividido por n 2, que o
respectivo nmero de graus de liberdade.
VWZ
WXZ =
;2
VWE
WXZ =
;2
([ )
WXZ =
;2
Observe que a expresso acima quase igual varincia amostral de Y. A varincia amostral
de Y igual a:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 58


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

([ )
\" =
;1

Contudo, para n muito grande, dividir por n 2 ou por n 1 d praticamente no


mesmo. Assim, o quadrado mdio dos desvios praticamente igual varincia de Y.
Gabarito: E

Questo 30 SEFAZ SP 2009 [ESAF]


Uma amostra aleatria simples (X1, Y1), (X2, Y2), ..., (Xn, Yn) de duas variveis aleatrias X e Y
forneceu as seguintes quantidades:

(X )
n
2
i X = 414
i =1

(Y )
n
2
i Y = 359
i =1

(X )
n

i X Yi = 345
i =1

Calcule o valor mais prximo do coeficiente de determinao da regresso linear de Y em X.


a) 0,88
b) 0,92
c) 0,85
d) 0,80
e) 0,83

Resoluo:
No caso do modelo usual de regresso linear, o coeficiente de determinao igual ao
quadrado do coeficiente de correlao.
Aqui a questo explora outra igualdade envolvendo somatrios.
O numerador da frmula do coeficiente de correlao :

[(X ) ( )]
n

i X Yi Y
i =1

Fazendo a multiplicao, ficamos com:

[(X ) ( ) ]
n

i X Yi X i X Y
i =1

Separando o somatrio da diferena em diferena de somatrios:

[(X ) ] [( ) ]
n n
= i X Yi X i X Y
i =1 i =1

Prof. Vtor Menezes www.estrategiaconcursos.com.br 59


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

A mdia de Y constante e pode sair do somatrio:

[(X ) ] [( )]
n n
= i X Yi Y X i X
i =1 i =1

A soma dos desvios em relao mdia de X igual a zero:

[(X ) ]
n
= i X Yi Y 0
i =1

[(X ) ]
n
= i X Yi
i =1

Logo, outra frmula para o coeficiente de correlao seria:

[(X ) ]
n

i X (Yi )
r= i =1

(X ) (Y Y )
n n
2 2
i X i
i =1 i =1

E, para esta frmula, o enunciado j deu todas as contas prontas:


345
r=
414 359
Elevando o coeficiente ao quadrado:
345 345
r2 =
414 359
Fazendo a primeira diviso, temos:
345
r 2 = 0,83
359
O 0,83 est sendo multiplicado por um nmero menor que 1. Toda vez que multiplicamos
um nmero por outro que seja menor que 1, o nmero original diminui. Logo, a resposta
procurada ser menor que 0,83. A nica opo a letra D.
Gabarito: D

Questo 31 SERPRO 2001 [ESAF]


A Cia. X presta servio de manuteno preventiva nos computadores que vende. Em 18
chamadas para realizao de servios de manuteno foram observados os pares (xi , yi)
onde xi representa o nmero de mquinas examinadas na chamada e yi o tempo gasto, em
horas, na visita de inspeo. A tais observaes ajusta-se o modelo linear E( yi ) = + xi,
com o uso de mnimos quadrados ordinrios, sob a hiptese de erros com mdia zero,
homoscedsticos, no correlacionados e com os xi fixos (determinsticos). Foram obtidas as
seguintes estatsticas para o ajuste:

:  = 51

Prof. Vtor Menezes www.estrategiaconcursos.com.br 60


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

:  = 18

:   = 76

' = 0,5
(=1
As constantes a e b so as estimativas de mnimos quadrados de e , respectivamente.
Assinale a opo correspondente estimativa no-viezada da varincia residual.
a) 3,6
b) 4,7
c) 1,0
d) 0,7
e) 1,2

Resoluo:
Primeiro calculamos a mdia de Y e a mdia de X:
 18
 = = =1
18 18
' =  ( 
0,5 = 1 1 
 = 0,5

Agora calculamos a soma de quadrados total:

VWE = :( ) = :   ;  = 76 18 1 = 58

Em seguida, calculamos a soma de quadrados do modelo de regresso:

VWX = ( :( )( ) =

1 :  ;  

= 1 51 18 0,5 1
= 51 9 = 42

A soma de quadrados dos desvios igual diferena entre SQT e SQM:


VWZ = VWE VWX = 58 42 = 16
O quadrado mdio dos desvios fica:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 61


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

VZW 16
WXZ = = =1
; 2 18 2
Gabarito: C

4. INFERNCIA SOBRE AS ESTIMATIVAS DOS PARMETROS(*)

(*)Esse tpico tem relao custo/benefcio muito ruim, e raramente cobrado. mais a
cara de provas mais avanadas. Ento, para concursos comuns de rea fiscal, sugiro pular o
tpico.

Dentro do modelo geral de regresso linear, se assumirmos que os valores de X so fixos, e


utilizando as hipteses listadas na pgina 13, podemos chegar ao seguinte:

*() =
;

*(() =
8 
1  
*(') = ] + ^ 
; 8 
 (, () = 0
 
(', () =
8 
Vamos dar uma noo de onde vm alguns desses resultados, mas a leitura no
obrigatria. Voc pode tranquilamente ficar s com os resultados acima.
Supondo que os Xi so fixos, dados, temos:
 | = = + ` + M
*( | ) = *(=) + *(` ) + *(M) = 0 + 0 + 


Ou seja, a varincia de Y igual a . Lembrando que trata-se da disperso em torno da reta
de regresso.
Alm disso:
 +  + + 
 =
;
Aplicando a varincia dos dois lados:

+ 
+ + 
;  
*() = = =
; ; ;
Que o primeiro resultado apresentado.

A frmula de b :

Prof. Vtor Menezes www.estrategiaconcursos.com.br 62


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

8 
(=
8 
Detalhando isso:
8  8  8b b
(= + + +
8  8  8 
8  8  8 
*(() = * ] + + + ^
8 8
  8 
8 *( ) 8 *( ) 8 *( )
*(() = + +
( 8  ) ( 8  ) ( 8  )
8  8  8 
*(() = + +
( 8  ) ( 8  ) ( 8  )
8  
*(() =
( 8  )

*(() =
8 
Este foi o segundo resultado apresentado.
Sabemos tambm que:
' =  ( 
*(') = *() +   *(() 2  (, ()
Agora precisaramos j saber que a covarincia acima indicada nula. Vamos supor que j
temos esse resultado. Continuando:
*(') = *() +   *(() 0


*(') = +  
; 8 
1  
*(') = ] + ^ 
; 8 
Que o terceiro resultado apresentado.
Bom, vamos parar por aqui, j tivemos uma noo de onde vm os resultados mais
importantes.
Muito bem. Quando fazemos uma amostragem e obtemos um conjunto de n pares
ordenados (X,Y), no sabemos o valor de  . Ento substitumos por seu estimador, que a
soma dos quadrados dos resduos.
\  = WX. DF\
E a podemos estimar as varincias de ' e de (, assim:
\
\  (() =
8 

Prof. Vtor Menezes www.estrategiaconcursos.com.br 63


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

 (')
1  
\ =] + ^ \
; 8 
Podemos usar as varincias acima para testar hipteses e determinar intervalos de
confiana sobre = e `
Assim:
' ?c \(') < = < ' + ?c \(')
( ?c \(() < ` < ( + ?c \(()
Onde ?c o valor da distribuio T correspondente ao nvel de confiana estabelecido.
Como o quadrado mdio dos resduos tem ; 2 graus de liberdade, usamos a distribuio
T com dois graus de liberdade.

Para testar a hiptese de que = = =c , temos:


= =c
?=
\(')
E para testar a hiptese de que ` = `c, temos:
` `c
?=
\(()

Questo 32 BACEN 2002 [ESAF].


Observaes ( X i , Yi ) de duas variveis econmicas satisfazem o modelo linear
Yi = + X i + i onde os X i so constantes, e so os parmetros desconhecidos e os
i so erros normais no diretamente observveis, no correlacionados com mdia nula e
mesma varincia 2 . Deseja-se testar a hiptese H0: 0 contra a hiptese alternativa HA:
< 0 . O mtodo de mnimos quadrados aplicado em uma amostra de tamanho 18
produziu o modelo ajustado:
Y = 2 2,12 X
Sendo o desvio padro do coeficiente b estimado em 1. Assinale a opo que d o valor
probabilstico (p-valor) do teste de hiptese H0 contra a hiptese HA. Use a tabela da funo
de distribuio da varivel t de Student dada a seguir.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 64


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Graus de X F(X)
liberdade
15 1,341 0,900
15 1,753 0,950
15 2,131 0,975
16 1,337 0,900
16 1,746 0,950
16 2,120 0,975
17 1,333 0,900
17 1,740 0,950
17 2,110 0,975
18 1,330 0,900
18 1,734 0,950
18 2,101 0,975

a) 0.533
b) 0.440
c) 0.630
d) 0.438
e) 0.300

Resoluo.
O teste mais comum sobre o valor de consiste na hiptese de que =0. Caso rejeitemos
esta hiptese nula, conclumos que h regresso de X sobre Y. Este procedimento serve para
verificarmos a qualidade do modelo de regresso.
J vimos um modo de fazer isso. Foi por meio da anlise de varincia da regresso,
utilizando a relao entre o quadrado mdio da regresso e o quadrado mdio dos resduos.
Pois bem, existe outra forma de faz-lo, que acabamos de estudar. Para o teste de ,
tambm podemos utilizar a distribuio T, com n 2 graus de liberdade.
A questo no pediu para fazermos o teste completo. Precisamos apenas calcular o p-valor.
J vimos, na aula de teste de hipteses, que o p-valor a probabilidade de obtermos valores
to extremos quanto a estatstica teste. A estatstica teste que estudamos naquela aula,
quando no se conhece a varincia do parmetro, foi:
X
t _ teste =
sX

No numerador temos a estimativa ( X ) e o parmetro ( ) . No denominador o desvio


padro da estimativa.
Aqui a mesma coisa. S muda que b a estimativa. E o parmetro estimado .

Prof. Vtor Menezes www.estrategiaconcursos.com.br 65


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

A estatstica teste fica:


b
t _ teste =
sb
O valor de que se pretende testar 0. O valor de b obtido foi -2,120 (fornecido no
enunciado).
A varincia de b 1 (fornecido no enunciado). Portanto:
2,120 0
t _ teste = = 2,120
1
Consultando a tabela para o valor 2,120 (e 16 graus de liberdade), obtemos 97,5%.
Portanto, 97,5% dos valores de t so menores ou iguais a 2,120.
Ou seja, 2,5% so maiores que 2,120.
Devido simetria da densidade de t, 2,5% so menores que -2,120.
Portanto, a probabilidade de obtermos valores to extremos quanto a estatstica teste (ou
seja, valores menores ou iguais -2,120) de 2,5%.
Gabarito: C.

Questo 33 INEP 2008 [CESGRANRIO]


Em um modelo de regresso linear simples, um intervalo de confiana de 95,0% obtido para
o coeficiente angular foi (0,24 ; 1,68). Com esse resultado s se pode concluir que
(A) o intercepto igual a zero.
(B) o coeficiente angular negativo.
(C) a relao entre as variveis no linear.
(D) a varivel dependente assume valores negativos.
(E) no existe relao linear entre as duas variveis.

Resoluo.
Utilizando-se a distribuio T com n 2 graus de liberdade tambm possvel determinar
intervalos de confiana para .
A questo j forneceu o intervalo de confiana pronto. J sabemos que, com confiana de
95%, est entre 0,24 e 1,68. Observem que um intervalo que contempla valores
prximos de zero (tanto negativos quanto positivos). Valores positivos para indicam
relao direta. Valores negativos para indicam relao inversa. Ora, se a amostra no
capaz nem de nos dar uma maior segurana quanto ao sinal de (se positivo ou negativo),
isso um forte sinal de que no existe relao linear entre as variveis estudadas. Por isso, a
alternativa E est correta.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 66


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Vejamos os erros das demais alternativas.


A letra A fala em intercepto. Intercepto nada mais que o ponto em que a reta de
regresso corta o eixo y. Seria o valor de . Saber apenas o intervalo de confiana para
no ajuda em nada na determinao do valor de .
A alternativa B afirma que o coeficiente angular negativo. Como j dissemos, no temos
segurana nem quanto ao sinal de .
A afirmativa C nos diz que a relao entre as variveis no linear. Bom, caso seja
realmente zero, isso significa que no h relao linear. Mas no significa que exista outro
tipo de relao (como quadrtica, exponencial, logartmica etc).
A afirmativa D diz que a varivel dependente assume apenas valores negativos. No h
qualquer informao sobre os valores assumidos pelas variveis em questo (seja a
dependente ou independente).
Gabarito: E

4.1. Varincia da estimativa de Y

Considere que dado um valor, e , e queremos estimar o valor correspondente de Y. A


estimativa, pela reta de regresso, ser:
>e = ' + (e
Substituindo o valor de ':
>e = ( () + (e
>e =  + ((e )
Aplicando a varincia dos dois lados:
*(>e ) = *() + *f((e )g + 2 (e ) (, ()
*(>e ) = *() + *f((e )g + 2 (e ) 0
*(>e ) = *() + (e ) *(()
 
*(>e ) = + (e )
; 8 
Se no conhecemos o valor de  , substitumos por sua estimativa, que corresponde ao
quadrado mdio dos resduos (\  ). Nesse caso, a estimativa da varincia de >e ser:
\ \
\(>e ) = 
+ (e )

; 8 
1 (e )
\(>e ) = \  ] + ^
; 8 
Lembrando que >e a estimativa do valor de Y, quando X vale e . Tal valor cai sobre a reta
de regresso calculada. Ou seja, uma estimativa da esperana de Y, quando X vale e .

Prof. Vtor Menezes www.estrategiaconcursos.com.br 67


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Em outras palavras: aqui estamos trabalhando com o preditor do valor esperado (>e )

4.2. Erro de previso

Uma vez calculado o valor >e , correspondente estimativa de Y quando X vale e , podemos
querer estudar o erro cometido nesta previso que estamos fazendo.
O erro corresponde diferena entre o verdadeiro valor e (uma observao individual) e
sua previso >e .
F = e >e
Desde que as duas variveis acima so independentes, a varincia do erro de previso ser a
soma das varincias. O resultado final ser:
1 (e )
*(F) = 
]1 + + ^
; 8 
Claro, se no soubermos o valor de 
, substitumos por \  , seu estimador:
1 (e )
\(F) = \  ]1 + + ^
; 8 
A podemos estabelecer intervalos de confiana para a nossa previso, assim:
>e ?c \(F)
Onde ?c o valor da distribuio T, com ; 2 graus de liberdade, para o nvel de confiana
estabelecido.

Vejam que agora no estamos mais considerando o valor esperado. Estamos considerando
uma determinada observao individual (e ), que tambm tem uma disperso em torno da
reta.
Disso surge um resultado interessante.
A varincia do erro do preditor (observao individual) muito similar varincia do valor
esperado. S o que muda de um caso para o outro que somamos o valor  . No fundo,
quando consideramos uma observao individual, estamos adicionando a varincia da
prpria observao individual, que se dispersa em torno da reta real de regresso.
Vejamos uma questo a respeito.

Questo 34 APS 2002 [ESAF]


A varincia do coeficiente ? foi estimada em 0,25. O erro mdio quadrtico da regresso
vale 1.

Assinale a opo correta.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 68


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

a) O preditor da observao individual de Y , quando X = 3, vale 3 e tem varincia 1,05.


b) O preditor do valor esperado de Y , quando X = 3, vale 3 e tem varincia 1,05.
c) As variveis aleatrias  e ? tem correlao distinta de zero.
d) O preditor do valor esperado de Y , quando X = 3, vale 3 e tem varincia 1.
e) O preditor da observao individual de Y, quando X = 3, vale 3 e tem varincia 1.

Resoluo:
Reparem que o enunciado no estabeleceu diferena entre os smbolos para as realizaes
de Y e seus preditores.
Mantendo a simbologia do enunciado, vamos usar "Y", de agora em diante, como o preditor
da varivel dependente, dado pela reta de regresso.

Vamos usar a seguinte notao:


9 =  
8 =  
Quatro das cinco alternativas se referem a predies para X = 3.
Duas delas falam em preditor do valor esperado e as outras duas falam em preditor da
observao individual. Vamos comear com o preditor do valor esperado.

Quando X = 3, o valor esperado para "Y" dado pela reta de regresso calculada.
  = ?( )
 2 = 0,5 (3 1)
 2 = 0,5 2  = 3
O preditor do valor esperado 3.

Alm disso, se considerarmos todas as amostras possveis, teremos o seguinte. A reta de


regresso calculada muda de uma amostra para outra. Ou seja, a reta de regresso
calculada varia. Os valores esperados de Y, para dado X, variam. Temos uma varivel
aelatria que apresenta a seguinte varincia:
1 (e )

] + ^
; 8 
Onde:
"n" o tamanho da amostra
Xk o valor de X para o qual se deseja calcular o preditor do valor esperado de Y
Os demais termos foram definidos no enunciado

Prof. Vtor Menezes www.estrategiaconcursos.com.br 69


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes


Como no conhecemos , substitumos por seu estimador, que o erro mdio quadrtico,
e que vale 1.
1 (e )
1] + ^
; 8 

S que no sabemos quanto vale a soma dos quadrados dos desvios para X.

j 0,25. Essa varincia calculada do seguinte


Mas sabemos que a varincia estimada de ?
modo:

*(?) =
8 

Como no conhecemos , substitumos por seu estimador (1), obtendo a varincia
estimada de ?:
1
0,25 =
8 
8  = 1
=4
0,25
Agora podemos voltar onde tnhamos parado:
1 (e )
1] + ^
; 8 
Substituindo os valores dados no enunciado:
1 (3 1)
= +
2 8 
Substituindo a soma de quadrados dos desvios para X:
1 (3 1)
= + = 1,05
2 4

Resumindo, o preditor do valor esperado de Y (para X = 3) igual a 3 e tem varincia 1,05.

Gabarito: B
Vejam que a alternativa "d" erra ao trazer varincia 1 (em vez de 1,05).

Agora vamos analisar o preditor da observao individual de Y, quando X = 3.

Nesse caso, a nica mudana ocorre na varincia. Isso porque, alm de considerarmos que a
reta de regresso poderia mudar de amostra para amostra, temos que considerar tambm a
prpria disperso de Y em torno da reta. Y varia em torno da reta com varincia  .

Prof. Vtor Menezes www.estrategiaconcursos.com.br 70


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Deste modo, quando nos referirmos varincia do preditor de uma observao individual, a
frmula da varincia fica:
1 (e )
\  ]1 + + ^
; 8 
1 (3 1)
]1 + + ^1
20 4
= 2,05
A varincia passa para 2,05. Da o erro das alternativas "a" e "e".

Quanto alternativa "c", a covarincia entre as variveis aleatrias elencadas nula.

Questo 35 SEFAZ MG 2005 [ESAF]


Considere o modelo de regresso linear
 = = + ` + M
[ = 1, 2, 3, , ;
Onde os  representam observaes da varivel resposta l, os  representam observaes
da varivel exgena , = e ` so parmetros desconhecidos e os M so erros no
correlacionados com mdia nula e varincia constante. Parte da tabela de anlise de
varincia dada abaixo. Sabe-se que a mdia dos valores da varivel exgena 30 e que a
soma dos quadrados de seus desvios relativos a essa mdia 1.000. Assinale a opo que d
o valor da varincia do preditor de  correspondente a  = 40

a) 41,4
b) 05,4
c) 30,5
d) 30,2
e) 20,2

Resoluo:
Seja 
a varincia constante dos termos M
O estimador de  igual ao quadrado mdio dos resduos (s2 = QMRes), que por sua vez
igual diviso entre a soma de quadrados dos resduos e o respectivo nmero de graus de
liberdade:
648
\ = = 36
18

Prof. Vtor Menezes www.estrategiaconcursos.com.br 71


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Seja >e o preditor de e = 40

A varincia do preditor individual fica:


1 (m )
]1 + + ^ 
; 8 
A soma dos quadrados dos desvios de X em relao sua mdia igual a 1.000. Ficamos
com:
1 (m )
]1 + + ^ 
; 1.000

O nmero de graus de liberdade total igual a: 1 + 18 = 19. Esse nmero, por sua vez,
corresponde a , onde "n" o tamanho da amostra.
; 1 = 19 ; = 20
Agora substitumos esse resultado no clculo da varincia do preditor:
1 (m )
]1 + + ^ 
20 1.000

A mdia de X vale 30 e e = 40:


1 (40 30)
]1 + + ^ 
20 1.000

Finalmente, substitumos por sua estimativa \  :


1 (40 30)
]1 + + ^ 36
20 1.000
= (1 + 0,05 + 0,1) 36 = 41,4
Gabarito: A

5. QUESTES APRESENTADAS EM AULA

Questo 1 BACEN 2009 [CESGRANRIO]


Sejam duas variveis aleatrias X e Y com varincias finitas e no zero. O coeficiente de
correlao entre essas duas variveis
(, )
$=
! "

Onde:
$: coeficiente de correlao linear entre X e Y:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 72


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

cov(X,Y) = covarincia entre X e Y.


! e " so, respectivamente, desvio padro de X e desvio padro de Y.
Considerando essas informaes, analise as proposies a seguir.
I - Se a e b so constantes,
1
(, ) = )*' (' + () ' *' () + (  *' (),
2'(
II Se $ = 1,
 
- + .
! "

torna-se no estocstica

III Se cov(X,Y) = 0, ento $ = 0 e X e Y so estocasticamente independentes.


(So) correta(s) APENAS a(s) proposio(es)
(A) I.
(B) II
(C) I e II.
(D) I e III.
(E) II e III.
Questo 2 PETROBRAS 2008/2 [CESGRANRIO]
Na estimativa de uma regresso linear, o problema da heterocedasticidade ocorre quando
(A) os dados so transversais.
(B) h autorrelao dos resduos.
(C) h correlao positiva entre as variveis independentes.
(D) a varincia dos erros no constante.
(E) as variveis independentes so negativas.
Questo 3 BACEN 2006 [FCC]
Uma empresa, com finalidade de determinar a relao entre gastos anuais com propaganda
(X), em R$ 1.000,00 e o lucro bruto anual (Y), em R$ 1.000,00, optou por utilizar o modelo
linear simples Yi = + X i + i , em que Yi o valor do lucro bruto auferido no ano i e i o
erro aleatrio com as respectivas hipteses consideradas para a regresso linear simples (
e so parmetros desconhecidos). Considerou, para o estudo, as seguintes informaes
referentes s observaes nos ltimos 10 anos da empresa:
10 10 10 10

Yi = 100 ;
i =1
X i = 60 ;
i =1
X i Yi = 650 ; ( X i )2 = 400 ; (Yi )2
i =1 i =1
= 1080

Prof. Vtor Menezes www.estrategiaconcursos.com.br 73


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que, caso
haja um gasto anual com propaganda de 80 mil reais, a previso do lucro bruto anual, em
mil reais, ser de:
a) 84
b) 102,5
c) 121
d) 128,4
e) 158
Questo 4 BACEN 2006 [FCC]
Uma empresa, com finalidade de determinar a relao entre gastos anuais em pesquisa e
desenvolvimento (X), em milhares de reais, e o acrscimo anual nas vendas (Y), tambm em
milhares de reais, optou por utilizar o modelo linear simples Yi = + X i + i , em que Yi
o acrscimo nas vendas no ano i e i o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples ( e so parmetros desconhecidos).
Considerou, para o estudo, as seguintes informaes referentes s observaes nos ltimos
10 anos da empresa:
10 10 10 10

Yi = 160 ;
i =1
X i = 100 ;
i =1
X i Yi = 1900 ; ( X i )2
i =1
= 1200 ; (Y )
i =1
i
2
= 3060

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, obteve-se, para
um determinado gasto em pesquisa e desenvolvimento, uma previso de acrscimo nas
vendas no valor de 19 mil reais. O valor que se considerou para o gasto com pesquisa e
desenvolvimento, em mil reais, foi:
a) 14
b) 13,75
c) 13,0
d) 12,4
e) 12,0
Questo 5 SEFAZ SP 2006 [FCC]
Em um determinado pas, deseja-se determinar a relao entre a renda disponvel (Y), em
bilhes de dlares, e o consumo (C), tambm em bilhes de dlares. Foi utilizado o modelo
linear simples Ci = + Yi + i , em que Ci o consumo no ano i, Yi o valor da renda
disponvel no ano i e i o erro aleatrio com as respectivas hipteses para a regresso
linear simples, e so parmetros desconhecidos, cujas estimativas foram obtidas
atravs do mtodo dos mnimos quadrados. Para obteno desta relao considerou-se
ainda as seguintes informaes colhidas atravs da observao nos ltimos 10 anos:
10 10 10 10 10

C i = 90 ,
i =1
Yi = 100 ,
i =1
Yi Ci = 1.100 ,
i =1
Yi = 1.250 ,
i =1
2
C
i =1
i
2
= 1.010

Prof. Vtor Menezes www.estrategiaconcursos.com.br 74


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Para o clculo do coeficiente de correlao de Pearson (r), usou-se a frmula:


cov(Y , C )
r= em que cov(Y , C ) a covarincia entre Y e C, DP(Y ) o desvio
DP ( y ) DP (C )
padro de Y e DP(C ) o desvio padro de C.
Ento:
a) obtendo para um determinado ano uma previso para o consumo de 10 bilhes de
dlares, significa que a renda disponvel considerada foi de 12,5 bilhes de dlares.
b) o valor da estimativa encontrado para o parmetro igual a 0,4
c) o valor da estimativa encontrado para o parmetro igual a 10.
d) o coeficiente de explicao r2 correspondente 64%.
e) utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que,
em um ano, caso a renda disponvel seja igual a 15 bilhes de dlares, o consumo ser igual
a 13 bilhes de dlares.

Questo 6 TCE/MG 2007 [FCC]


Um estudo realizado em uma empresa sobre a relao entre o lucro bruto anual (Y), em
milhares de reais, e os gastos anuais com propaganda (X), tambm em milhares de reais,
indica que uma boa opo a utilizao do modelo linear simples Yi = + X i + i , em que
Yi o lucro bruto no ano i, X i representa os gastos com propaganda no ano i, i o
erro aleatrio com as respectivas hipteses consideradas para a regresso linear e e
so parmetros desconhecidos. por meio do mtodo dos mnimos quadrados obteve-se o
valor de 150 para a estimativa do parmetro , considerando as seguintes informaes
obtidas pelas observaes nos ltimos 10 anos:
10 10

Yi = 2.500
i =1
X
i =1
i = 400

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, caso a empresa
almeje obter em um determinado ano um lucro bruto de 450 mil reais, deve apresentar um
total de gastos com propaganda, em mil reais, de:
a) 60
b) 80
c) 120
d) 160
e) 200
Questo 7 SEAD/PM Santos/2005 [FCC]
Para resolver questo seguinte, considere que foi realizado um estudo em um pas com a
finalidade de se determinar a relao entre a Renda Disponvel (Y), em milhes de dlares, e
o consumo (C), tambm em milhes de dlares.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 75


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Sabe-se que foi utilizado o modelo linear simples Ci = a + bYi + ei , em que Ci o consumo
no ano i, Yi a renda disponvel no ano i e ei o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples.
Este estudo apresentou as seguintes informaes colhidas atravs da observao nos
ltimos 10 anos:
10 10 10 10 10

Ci = 800
i =1
Yi = 1.000
i =1
Yi C i = 83.600
i =1
Yi = 105.000
i =1
2
C
i =1
i
2
= 67.240

A equao da reta ajustada pelo mtodo dos mnimos quadrados encontrada foi:
a) C i = 20 + 0,60 Yi

b) C i = 10 + 0,70 Yi

c) C i = 8 + 0,72 Yi

d) C i = 6 + 0,74 Yi

e) C i = 4 + 0,76 Yi
Questo 8 TJ PAR 2009 [FCC]
Em uma determinada empresa realizado um estudo sobre a relao entre os gastos com
publicidade, em R$ 1.000,00, e o acrscimo no faturamento anual, em R$ 1.000,00. Foi
escolhido para anlise o modelo linear simples Yi = + Xi + i, sendo que Yi o acrscimo
no faturamento do ano i, Xi representa os gastos com publicidade no ano i e i o erro
aleatrio com as respectivas hipteses consideradas para a regresso linear simples ( e
so parmetros desconhecidos ). Para obteno das estimativas de e utilizou-se o
mtodo dos mnimos quadrados com base nas informaes dos ltimos 10 anos da
empresa, ou seja:

10 10 10 10 10

Yi = 180 ;
i =1
X i = 100 ;
i =1
X iYi = 1.912 ;
i =1
X i = 1.080 ;
i =1
2
Y
i =1
i
2
= 3.440

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que se a
empresa almejar um acrscimo no faturamento, em um determinado ano, de R$ 25.000,00
dever apresentar, neste perodo, um total em gastos com publicidade de
(A) R$ 20.000,00.
(B) R$ 18.000,00.
(C) R$ 17.000,00.
(D) R$ 16.000,00.
(E) R$ 15.000,00.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 76


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 9 TJ PI 1009 [FCC]


Considere que foi obtido atravs do mtodo dos mnimos quadrados o ajustamento do
modelo Yi = + X i + i , em que i corresponde a i-sima observao, e so
parmetros desconhecidos e i o erro aleatrio, com as respectivas hipteses consideradas
para a regresso linear simples. Foi utilizada uma amostra aleatria com 100 pares de
observaes (Xi, Yi), i = 1, 2, 3, . . . , 100; obtendo-se para a estimativa de o valor de 2,5. O
valor da mdia das observaes Xi foi igual a 30 e de Yi igual a 100.
O valor encontrado da estimativa de foi igual a
(A) 70.
(B) 50.
(C) 40.
(D) 25.
(E) 20.
Questo 10 TJ PI 1009 [FCC]
Considere que foi obtido atravs do mtodo dos mnimos quadrados o ajustamento do
modelo Yi = + X i + i , em que i corresponde a i-sima observao, e so
parmetros desconhecidos e i o erro aleatrio, com as respectivas hipteses consideradas
para a regresso linear simples. Foi utilizada uma amostra aleatria com 100 pares de
observaes (Xi, Yi), i = 1, 2, 3, . . . , 100; obtendo-se para a estimativa de o valor de 2,5. O
valor da mdia das observaes Xi foi igual a 30 e de Yi igual a 100.
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que para
um valor estimado de 115 para Y, o valor correspondente de X
(A) 24.
(B) 36.
(C) 46.
(D) 48.
(E) 52.
Questo 11 SEFAZ SP 2009 [FCC]
O grfico abaixo demonstra a evoluo da receita tributria anual no estado de So Paulo
desde 1999, com os valores arrecadados em bilhes de reais.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 77


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Para estimar a receita tributria em um determinado ano com base no comportamento


sugerido pelo grfico, adotou-se o modelo Yt = + t + t ; t = 1, 2, 3 ..., sendo Yt = ln(RTt )
Yt = ln (RTt), em que RTt a receita tributria no ano (1998+t) em bilhes de reais e ln o
logaritmo neperiano ( ln e = 1). e so parmetros desconhecidos e t o erro aleatrio
com as respectivas hipteses consideradas para o modelo de regresso linear simples.
Utilizando o mtodo dos mnimos quadrados, com base nas observaes de 1999 a 2008,
obteve-se para a estimativa de o valor de 0,12, sabendo-se que:
10

Y t = 39,0
t =1

A previso da receita tributria para 2009, em bilhes de reais, em funo da equao


obtida pelo mtodo dos mnimos quadrados igual a
(A) e4,58
(B) e4,56
(C) e4,44
(D) e4,32
(E) e4,20
Questo 12 MP RO 2005 [CESGRANRIO]
Considere os dados amostrais de um estudo da relao entre o nmero de anos que os
candidatos a empregos em um determinado banco comercial estudaram ingls na faculdade
e as notas obtidas em um teste de proficincia nessa lngua.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 78


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Com base nessas informaes, a reta de mnimos quadrados que melhor explica a relao
entre o nmero de anos de estudo e a nota do teste de ingls igual a:
(A) y = 1,33 + 3,56x
(B) y = 2,25 + 1,32x
(C) y = 6,97 + 3,56x
(D) y = 35,32 + 10,9x
(E) y = 254,56 + 13,3x
Questo 13 PETROBRAS 2008 [CESGRANRIO]
A tabela abaixo mostra as demandas que ocorreram numa determinada produo.

Com base nos conceitos de Regresso Linear Simples, quantas unidades compem a
demanda para julho?
(A) 4.000
(B) 5.000
(C) 6.000
(D) 7.000
(E) 8.000

Prof. Vtor Menezes www.estrategiaconcursos.com.br 79


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 14 SEFAZ MG 2005 [ESAF]


Considere o modelo de regresso linear
Yi = + X i + , i = 1, 2, ..., 25

Onde os Yi representam observaes da varivel resposta Y, os X i representam


observaes da varivel exgena X, e os i so erros no correlacionados com distribuio
comum normal com mdia zero e varincia 9. Em repetidas amostras do modelo, dado X i ,
assinale a opo que d a proporo esperada de observaes de Y que diferem em valor
absoluto de sua mdia por no mximo 1,5. Em sua resposta faa uso da tabela da funo de
distribuio ( X ) da normal padro dada abaixo.

X (X )
0,40 0,655
0,50 0,691
1,00 0,841
1,50 0,933
a) 0,650
b) 0,950
c) 0,933
d) 0,382
e) 0,975
Questo 15 MPOG 2006 [ESAF]
Com o objetivo de estimar-se o modelo Y = + X, foi retirada uma amostra com cinco
pares de observaes (X,Y), obtendo-se os seguintes resultados:

Desse modo,
a) Y = 2 2X
b) Y = 2 2X
c) Y = 2X
d) Y = 2 + 2X
e) Y = 2 + 2X
Questo 16 TCU/2008 [CESPE]
Uma agncia de desenvolvimento urbano divulgou os dados apresentados na tabela

Prof. Vtor Menezes www.estrategiaconcursos.com.br 80


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

a seguir, acerca dos nmeros de imveis ofertados (X) e vendidos (Y) em determinado
municpio, nos anos de 2005 a 2007.

Ano Nmero de imveis


Ofertados (X) Vendidos (Y)
2005 1.500 100
2006 1.750 400
2007 2.000 700
Considerando as informaes do texto, julgue o item subseqente.
A estimativa do valor do coeficiente da reta de regresso Y = X , em que Y representa o
nmero esperado de imveis vendidos para uma quantidade X de imveis ofertados,
superior a 0,23 e inferior a 0,26.
Questo 17 MP RONDNIA 2005 [CESGRANRIO]
No modelo de regresso Y = X + , o estimador de mnimos quadrados de :

Questo 18 BACEN 2006 [FCC]


Uma empresa, com finalidade de determinar a relao entre gastos anuais com propaganda
(X), em R$ 1.000,00 e o lucro bruto anual (Y), em R$ 1.000,00, optou por utilizar o modelo
linear simples Yi = + X i + i , em que Yi o valor do lucro bruto auferido no ano i e i o
erro aleatrio com as respectivas hipteses consideradas para a regresso linear simples (
e so parmetros desconhecidos). Considerou, para o estudo, as seguintes informaes
referentes s observaes nos ltimos 10 anos da empresa:
10 10 10 10

Y
i =1
i = 100 ; X
i =1
i = 60 ; X i Yi = 650 ; (X )
i =1
i
2
= 400 ; (Y )
i =1
i
2
= 1080

Montando o quadro de anlise de varincia, tem-se que:


a) a variao explicada, fonte de variao devido regresso, apresenta um valor igual a 80;
b) dividindo a variao residual pela variao total, obtemos o correspondente coeficiente
de determinao;

Prof. Vtor Menezes www.estrategiaconcursos.com.br 81


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

c) o valor da estatstica F necessria para o teste da existncia de regresso igual ao


coeficiente da diviso da variao explicada pela variao residual
d) a variao residual apresenta um valor igual a 17,5
e) a variao total apresenta um valor igual a 62,5.
[Observao: considere que voc j sabe que os coeficientes a e b so dados por: a = 2,5 ;
b = 1,25 , conforme clculos da Questo 3]
Questo 19 SEAD/PM SANTOS 2005 [FCC]
Para resolver questo seguinte, considere que foi realizado um estudo em um pas com a
finalidade de se determinar a relao entre a Renda Disponvel (Y), em milhes de dlares, e
o consumo (C), tambm em milhes de dlares.
Sabe-se que foi utilizado o modelo linear simples C i = a + bYi + ei , em que Ci o consumo
no ano i, Yi a renda disponvel no ano i e ei o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples.
Este estudo apresentou as seguintes informaes colhidas atravs da observao nos
ltimos 10 anos:
10 10 10 10 10

Ci = 800
i =1
Yi = 1.000
i =1
Yi Ci = 83.600
i =1
Yi = 105.000
i =1
2
C
i =1
i
2
= 67.240

O coeficiente de correlao r de Pearson entre as variveis Y e C obtido pela frmula:


cov(C , Y )
r= em que:
DP (Y ) DP(C )
Cov(C,Y) a covarincia entre C e Y;
DP(Y) o desvio padro de Y
DP(C) o desvio padro de C.
Tem-se que o valor do correspondente de determinao r 2 igual a:
a) 60%
b) 72%
c) 76%
d) 80%
e) 90%
Questo 20 TCE RO 2005 [CESGRANRIO]
Avaliaes de terrenos baseiam-se, geralmente, em modelos de regresso linear nos quais o
preo de venda uma funo de algumas variveis tais como o tamanho do terreno, suas
condies e localizao. Uma amostra de terrenos comercializados no ltimo ms coletou
dados sobre o preo da venda, em R$ 1 000,00, o tamanho do terreno, em m2, e a distncia
ao centro da cidade, em km. Primeiramente obteve-se o modelo com apenas a varivel

Prof. Vtor Menezes www.estrategiaconcursos.com.br 82


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

tamanho do terreno, X1, como explicativa do preo de venda. Os principais quantitativos


relativos a esse modelo foram calculados como:

Considerando o quadro acima, os valores de X, Y e Z, respectivamente, so:


(A) 2826, 121 e 3,65E-07
(B) 2178, 121 e 0,77
(C) 2178, 36 e 0,77
(D) 648, 36 e 60,5
(E) 32,4, 18 e 34,1
Questo 21 CAPES 2008 [CESGRANRIO]

O Coeficiente de Correlao Linear de Pearson entre os desempenhos de determinados


alunos em duas avaliaes nacionais igual a 0,844. Nesse caso, conclui-se que a proporo
da variabilidade nos resultados de uma das avaliaes explicada pela relao linear entre
elas
(A) 15,6%
(B) 39,4%

Prof. Vtor Menezes www.estrategiaconcursos.com.br 83


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

(C) 71,2%
(D) 84,4%
(E) 91,8%
Questo 22 PETROBRAS 2008 [CESGRANRIO]
Um modelo de regresso linear simples de Y em X, com uma varivel explicativa e o termo
constante, foi estimado com 32 observaes, gerando um r2 de 0,25. No teste de validade
do modelo, o F-calculado ou F-observado igual a
(A) 10
(B) 11
(C) 12
(D) 13
(E) 14
Questo 23 BNDES 2008/2 [CESGRANRIO questo adaptada]
Um experimento foi realizado com o objetivo de estimar o preo de uma ao, dado o seu
valor patrimonial, ambos em reais.
Uma amostra de aes negociadas recentemente forneceu dados sobre o preo e o valor
patrimonial por ao. Aplicou-se o modelo de regresso linear simples Y = + X + .
Alguns resultados da tabela da anlise da varincia, obtida a partir dos dados dessa amostra,
esto apresentados a seguir.

Julgue os itens abaixo:


I O coeficiente de determinao mostra que o modelo proposto explica aproximadamente
63% da variabilidade total.
II O valor da estatstica Fcalculado 100, e a concluso do teste que a varivel valor
patrimonial significativa, isto , deve-se rejeitar a hiptese nula H 0 : = 0 .
Questo 24 SEFAZ SP 2009 [ESAF]
Uma amostra aleatria simples (X1, Y1), (X2, Y2), ..., (Xn, Yn) de duas variveis aleatrias X e Y
forneceu as seguintes quantidades:

(X )
n
2
i X = 414
i =1

(Y )
n
2
i Y = 359
i =1

Prof. Vtor Menezes www.estrategiaconcursos.com.br 84


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

(X )
n

i X Yi = 345
i =1

Calcule o valor mais prximo do coeficiente de determinao da regresso linear de Y em X.


a) 0,88
b) 0,92
c) 0,85
d) 0,80
e) 0,83

Questo 25 FUNASA 2009 [CESGRANRIO]


O estatstico de uma indstria de produtos dermatolgicos deseja estudar a relao
existente entre a satisfao do cliente (Y), em uma escala de 0 a 100, a sua idade (X1), em
anos, e o nvel de ansiedade (X2), em ndice. Para isso, foram selecionados 46 pacientes.
Primeiramente estudou-se a relao entre a satisfao do paciente e a sua idade.
a) Considerando o modelo de regresso Y = b0 + b1 X 1 + , determine os valores de A e B
da tabela da ANOVA.

Questo 26 BACEN 2001 [ESAF]


Um profissional da rea de recursos humanos est interessado em avaliar o efeito do tipo
de firma no salrio inicial de uma secretria. Neste contexto tomou uma amostra aleatria
de cinco secretrias iniciantes em cada um de trs tipos de firma, anotando o salrio em
reais por ms. O investigador postula que o salrio 9 K da j-sima secretria da isima firma
obedece o modelo linear 9 K = L + = + M K , i=1, 2, 3; j=1 ...5. Nesta expresso representa
uma mdia populacional, i o efeito fixo da firma i e os ij so erros no correlacionados
com distribuio normal, mdia zero e varincia constante. Neste contexto obtm a tabela
de anlise de varincia seguinte:

Prof. Vtor Menezes www.estrategiaconcursos.com.br 85


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Assinale a opo que d o valor da estatstica F necessria para testar a hiptese de que os
efeitos das firmas sejam iguais.
a) 2,25
b) 3,00
c) 0,37
d) 0,73
e) 1,28
Questo 27 PREFEITURA RJ 2010 [ESAF]
A partir de uma amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se

:  = 440


:  = 286


: ( ) = 850


: ( ) = 1.690


: ( )( ) = 1.105


Obtenha a reta de regresso linear de Y em X.


RQ = 13 + 0,65
a) 
RQ = 13 + 1,3
b) 
RQ = 20 + 0,65
c) 

Prof. Vtor Menezes www.estrategiaconcursos.com.br 86


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

RQ = 20 + 2
d) 
RQ = 13 + 1,3
e) 
Questo 28 PREFEITURA RJ 2010 [ESAF]
Com os dados da questo anterior, calcule o valor mais prximo do coeficiente de
determinao R2 da regresso linear de X em Y.
a) 0,65
b) 0,81
c) 0,85
d) 0,91
e) 0,88
Questo 29 SEFAZ MG 2005 [ESAF]
Suponha que no exista associao linear entre duas variveis X e Y e que um nmero de
observaes suficientemente grande de pares (X,Y) esteja disponvel para o estudo da
regresso linear de Y em X. Assinale a opo que corresponde, nesse caso,
aproximadamente, ao quadrado mdio do erro.
a) 0.
b) Quadrado do coeficiente de correlao amostral entre X e Y.
c) Quadrado mdio da regresso.
d) 1.
e) Varincia das observaes do atributo Y.
Questo 30 SEFAZ SP 2009 [ESAF]
Uma amostra aleatria simples (X1, Y1), (X2, Y2), ..., (Xn, Yn) de duas variveis aleatrias X e Y
forneceu as seguintes quantidades:

(X )
n
2
i X = 414
i =1

(Y )
n
2
i Y = 359
i =1

(X )
n

i X Yi = 345
i =1

Calcule o valor mais prximo do coeficiente de determinao da regresso linear de Y em X.


a) 0,88
b) 0,92
c) 0,85
d) 0,80
e) 0,83

Prof. Vtor Menezes www.estrategiaconcursos.com.br 87


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 31 SERPRO 2001 [ESAF]


A Cia. X presta servio de manuteno preventiva nos computadores que vende. Em 18
chamadas para realizao de servios de manuteno foram observados os pares (xi , yi)
onde xi representa o nmero de mquinas examinadas na chamada e yi o tempo gasto, em
horas, na visita de inspeo. A tais observaes ajusta-se o modelo linear E( yi ) = + xi,
com o uso de mnimos quadrados ordinrios, sob a hiptese de erros com mdia zero,
homoscedsticos, no correlacionados e com os xi fixos (determinsticos). Foram obtidas as
seguintes estatsticas para o ajuste:

:  = 51

:  = 18

:   = 76

' = 0,5
(=1
As constantes a e b so as estimativas de mnimos quadrados de e , respectivamente.
Assinale a opo correspondente estimativa no-viezada da varincia residual.
a) 3,6
b) 4,7
c) 1,0
d) 0,7
e) 1,2

Questo 32 BACEN 2002 [ESAF].


Observaes ( X i , Yi ) de duas variveis econmicas satisfazem o modelo linear
Yi = + X i + i onde os X i so constantes, e so os parmetros desconhecidos e os
i so erros normais no diretamente observveis, no correlacionados com mdia nula e
mesma varincia 2 . Deseja-se testar a hiptese H0: 0 contra a hiptese alternativa HA:
< 0 . O mtodo de mnimos quadrados aplicado em uma amostra de tamanho 18
produziu o modelo ajustado:
Y = 2 2,12 X
Sendo o desvio padro do coeficiente b estimado em 1. Assinale a opo que d o valor
probabilstico (p-valor) do teste de hiptese H0 contra a hiptese HA. Use a tabela da funo
de distribuio da varivel t de Student dada a seguir.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 88


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Graus de X F(X)
liberdade
15 1,341 0,900
15 1,753 0,950
15 2,131 0,975
16 1,337 0,900
16 1,746 0,950
16 2,120 0,975
17 1,333 0,900
17 1,740 0,950
17 2,110 0,975
18 1,330 0,900
18 1,734 0,950
18 2,101 0,975

a) 0.533
b) 0.440
c) 0.630
d) 0.438
e) 0.300
Questo 33 INEP 2008 [CESGRANRIO]
Em um modelo de regresso linear simples, um intervalo de confiana de 95,0% obtido para
o coeficiente angular foi (0,24 ; 1,68). Com esse resultado s se pode concluir que
(A) o intercepto igual a zero.
(B) o coeficiente angular negativo.
(C) a relao entre as variveis no linear.
(D) a varivel dependente assume valores negativos.
(E) no existe relao linear entre as duas variveis.
Questo 34 APS 2002 [ESAF]
A varincia do coeficiente ? foi estimada em 0,25. O erro mdio quadrtico da regresso
vale 1.

Assinale a opo correta.


a) O preditor da observao individual de Y , quando X = 3, vale 3 e tem varincia 1,05.
b) O preditor do valor esperado de Y , quando X = 3, vale 3 e tem varincia 1,05.
c) As variveis aleatrias  e ? tem correlao distinta de zero.
d) O preditor do valor esperado de Y , quando X = 3, vale 3 e tem varincia 1.
e) O preditor da observao individual de Y, quando X = 3, vale 3 e tem varincia 1.

Prof. Vtor Menezes www.estrategiaconcursos.com.br 89


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

Questo 35 SEFAZ MG 2005 [ESAF]


Considere o modelo de regresso linear
 = = + ` + M
[ = 1, 2, 3, , ;
Onde os  representam observaes da varivel resposta l, os  representam observaes
da varivel exgena , = e ` so parmetros desconhecidos e os M so erros no
correlacionados com mdia nula e varincia constante. Parte da tabela de anlise de
varincia dada abaixo. Sabe-se que a mdia dos valores da varivel exgena 30 e que a
soma dos quadrados de seus desvios relativos a essa mdia 1.000. Assinale a opo que d
o valor da varincia do preditor de  correspondente a  = 40

a) 41,4
b) 05,4
c) 30,5
d) 30,2
e) 20,2

6. GABARITO

1 c
2 d
3 b
4 e
5 e
6 c
7 c
8 e
9 d
10 b
11 b
12 b
13 b
14 d
15 d

Prof. Vtor Menezes www.estrategiaconcursos.com.br 90


Curso Regular de Estatstica Aula 17
Prof Vtor Menezes

16 certo
17 c
18 d
19 d
20 d
21 c
22 a
23 certo certo
24 d
25 -
26 a
27 e
28 c
29 e
30 d
31 c
32 c
33 e
34 b
35 a

Prof. Vtor Menezes www.estrategiaconcursos.com.br 91